A Eleonora
Sandro Salsa
Equazioni a derivate parziali Metodi, modelli e applicazioni
2a edizione
Sandro Salsa Dipartimento di Matematica Politecnico di Milano
ISBN 978-88-470-1645-3 DOI 10.1007/978-88-470-1646-0
e-ISBN 978-88-470-1646-0
L’immagine di copertina “A Twig in the Stream, with capillary waves ahead of it and gravity waves behind it” é modificata da Tucker VA (1971) Waves and Water Beatles. Physics Teacher (9) 10-14, 19. In Siegel LA: Mathematics applied to continuum mechanics. New York: Dover Publications Inc. 1987
© Springer-Verlag Italia 2010 Quest’opera è protetta dalla legge sul diritto d’autore e la sua riproduzione è ammessa solo ed esclusivamente nei limiti stabiliti dalla stessa. Le fotocopie per uso personale possono essere effettuate nei limiti del 15% di ciascun volume dietro pagamento alla SIAE del compenso previsto dall’art. 68. Le riproduzioni per uso non personale e/o oltre il limite del 15% potranno avvenire solo a seguito di specifica autorizzazione rilasciata da AIDRO, Corso di Porta Romana n. 108, Milano 20122, e-mail
[email protected] e sito web www.aidro.org. Tutti i diritti, in particolare quelli relativi alla traduzione, alla ristampa, all’utilizzo di illustrazioni e tabelle, alla citazione orale, alla trasmissione radiofonica o televisiva, alla registrazione su microfilm o in database, o alla riproduzione in qualsiasi altra forma (stampata o elettronica) rimangono riservati anche nel caso di utilizzo parziale. La violazione delle norme comporta le sanzioni previste dalla legge. L’utilizzo in questa publicazione di denominazioni generiche, nomi commerciali, marchi rgistrati, ecc. anche se non specificatamente identificati, non implica che tali denominazioni o marchi non siano protetti dalle relative leggi e regolamenti. Layout copertina: Beatrice B., Milano Impaginazione: PTP-Berlin, Protago TEX-Production GmbH, Germany (www.ptp-berlin.eu) Stampa: Grafiche Porpora, Segrate (MI) Stampato in Italia Springer-Verlag Italia S.r.l., Via Decembrio 28, I-20137 Milano Springer-Verlag fa parte di Springer Science+Business Media (www.springer.com)
Prefazione
L’esigenza di scrivere un libro di testo di introduzione alle Equazioni a Derivate Parziali è maturata durante i corsi di Metodi Matematici per l’Ingegneria e di Equazioni a Derivate Parziali, tenuti dall’Autore presso il Politecnico di Milano. La principale finalità dei corsi era confrontare gli allievi con un percorso didattico che, da un lato, li abituasse ad una sinergia di metodologie teoriche e modellistiche nell’affrontare un dato problema, dall’altro li fornisse di solide basi teoriche per l’utilizzo di tecniche di approssimazione numerica, sviluppate in altri corsi coordinati con questi. Ne è scaturito un libro diviso in due parti. La prima, dal Capitolo 2 al 5, ha un carattere elementare e l’obiettivo di sviluppare aspetti fenomenologici e modellistici, idealmente raggruppati nelle tre macro-aree, diffusione, propagazione e trasporto, onde e vibrazioni. Si è cercato di evidenziare, ove possibile, idee, connessioni e aspetti concreti, a volte sacrificando un po’ di rigore nell’esposizione. Quando se ne presenta l’opportunità, vengono introdotti i metodi classici di risoluzione di un problema, come la separazione di variabili o l’uso della trasformata di Fourier. I prerequisiti per questa prima parte sono una buona conoscenza del calcolo differenziale ed integrale, multidimensionali, delle equazioni differenziali ordinarie, delle serie di Fourier e dei primi elementi di calcolo delle probabilità (per parte dei Capitoli 2 e 3). La seconda parte, dal capitolo 6 al 9, è dedicata all’analisi di problemi soprattutto lineari ed alla loro formulazione variazionale o debole. Si sviluppano così i metodi di Analisi Funzionale negli spazi di Hilbert, con una “brochure di sopravvivenza” su Distribuzioni e spazi di Sobolev, fondamento dei metodi numerici di approssimazione del tipo Galerkin ed in particolare degli elementi finiti. In questa parte si fa uso sistematico della misura e dell’integrazione secondo Lebesgue, almeno nei suoi aspetti basilari (definizioni, proprietà principali, teoremi della convergenza dominata e di Fubini), richiamati in Appendice B.
Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
VI
Prefazione
Il testo “Modellistica Numerica per Problemi Differenziali ” di A. Quarteroni si presenta come un importante e naturale avanzamento verso le tecniche di approssimazione numerica. Questa seconda edizione mantiene obiettivi e finalità didattiche della prima e si presenta significativamente arricchita da un considerevole numero di esercizi posti alla fine di ogni capitolo. Per i più complessi è indicato un suggerimento o la risposta. Soluzioni e complementi si trovano nel testo “ Equazioni a Derivate Parziali, Complementi ed Esercizi ” di S. Salsa e G. Verzini. Tutti i capitoli sono stati riveduti ed alcuni sono stati ampliati come indicato sotto. Il Capitolo 1 costituisce una breve introduzione ai concetti generali relativi alle equazioni a derivate parziali. Le Sezioni finali contengono richiami di alcune nozioni e teoremi di uso costante, su topologia negli spazi euclidei, serie (di funzioni, di Fourier) e formule di integrazione per parti multidimensionali. Il Capitolo 2 è dedicato all’equazione di diffusione o del calore e ad alcune sue varianti con termini di trasporto e reazione. Oltre agli aspetti classici, viene sottolineata la connessione con semplici processi stocastici, come la passeggiata aleatoria ed il moto Browniano. Nelle sezioni finali, un’applicazione alla Finanza Matematica esemplifica la sinergia tra aspetti modellistici, deterministici e probabilistici mentre un modello di diffusione non lineare in mezzi porosi ed uno di diffusione e reazione logistica (inseriti in questa edizione) presentano tipici fenomeni legati alle diverse non linearità. Nel Capitolo 3 si considera l’equazione di Laplace/Poisson. Si descrivono le principali proprietà delle funzioni armoniche, sottolineando la connessione con aspetti probabilistici legati al moto Browniano. La seconda parte del capitolo è incentrata sulla rappresentazione di una funzione in termini di potenziali di Green, Newtoniani, di semplice e doppio strato, dei quali si esaminano le principali proprietà. Il Capitolo 4 è dedicato alle equazioni del prim’ordine, in particolare alle leggi di conservazione. Il metodo delle caratteristiche e la nozione di soluzione integrale sono sviluppati attraverso un semplice modello di traffico. Si introducono così i concetti di onde di rarefazione e d’urto. L’ultima parte è riservata al metodo delle caratteristiche per equazioni quasilineari e completamente non lineari, in due variabili. Il Capitolo 5 è rivolto agli aspetti fondamentali e classici della propagazione di onde. Si passa dalle vibrazioni trasversali di una corda alla classica formula di d’Alembert, dalle onde sonore alla formula di Kirchhoff e al principio di Huygens. Nella sezione finale l’attenzione è rivolta a fenomeni di dispersione, presentati attraverso un modello per onde superficiali in acqua profonda e analizzati col metodo della fase stazionaria. Il Capitolo 6 introduce gli strumenti di Analisi Funzionale necessari ad una corretta formulazione variazionale dei più comuni problemi associati ad equazioni da derivate parziali di tipo ellittico, parabolico ed iperbolico. I risultati principali sono i teoremi di Lax-Milgram, dell’Alternativa di Fredholm e
Prefazione
VII
l’analisi spettrale degli operatori compatti autoaggiunti. Data la natura astratta di questi risultati, uno sforzo particolare è stato fatto per inquadrarne e motivarne la presentazione. Il Capitolo 7 costituisce un breve introduzione alla teoria delle distribuzioni di L. Schwarz e agli spazi di Sobolev più comuni. Un po’ più di enfasi, rispetto alla prima edizione, è data al problema delle tracce. Nel Capitolo 8 gli strumenti di Analisi Funzionale introdotti nei capitoli precedenti vengono utilizzati per la formulazione variazionale di problemi al contorno per equazioni ellittiche. Si parte dall’equazione di Poisson, per poi arrivare ad equazioni generali in forma di divergenza. Sono state inserite applicazioni della teoria ad alcune equazioni semilineari, al sistema di Stokes e a semplici problemi di controllo. Il Capitolo 9 è dedicato alla formulazione debole di problemi iniziali/al bordo per operatori parabolici e per l’equazione delle onde. È stata infine inserita una nuova Appendice con alcuni rudimenti di Analisi Dimensionale ed il cosiddetto Teorema Pi, di Buckingham. I Capitoli sono suddivisi in Sezioni e le Sezioni in paragrafi. L’ordine di presentazione degli argomenti riflette inevitabilmente le convinzioni dell’Autore, ma nella prima parte esso può essere cambiato senza compromettere la comprensione. Solo il Paragrafo 3.3.6 (Capitolo 3, Sezione 3, paragrafo 6) presuppone la conoscenza della Sezione 2.6 (Capitolo 2, Sezione 6). La seconda parte può essere trattata in modo praticamente indipendente dalla prima, ma occorre prestare maggiore attenzione all’ordine degli argomenti. In particolare, il Capitolo 6, le Sezioni 7.1, 7.2 e le Sezioni da 7.5 a 7.8 sono propedeutiche al Capitolo 9, mentre la Sezione 7.9 è funzionale al Capitolo 9. Durante la stesura della prima edizione del testo ho potuto beneficiare di commenti e suggerimenti da parte di numerosi colleghi e studenti ai quali sono riconoscente. Tra i colleghi, desidero ringraziare Donato Michele Cifarelli, Leonede De Michele, Maurizio Grasselli, Daniela Lupo, Edie Miglio, Stefano Micheletti, Kevin Payne, Lorenzo Peccati, Fausto Saleri, Alessandro Veneziani e, in modo particolare, Alfio Quarteroni. Tra gli studenti (a quel tempo), ringrazio Lucia Mirabella e Ludovico Zaraga, del corso di Laurea in Ingegneria Matematica. Per la seconda edizione, Michele di Cristo, Carlo Sgarra, Fausto Ferrari, Andrea Manzoni e soprattutto Roberto Argiolas, Cristina Cerutti, Anna Grimaldi-Piro e Gianmaria Verzini sono stati preziosi nel migliorare sia l’esposizione che i contenuti. Con vero piacere, desidero infine ringraziare Francesca Bonadei, di Springer per aver incoraggiato e seguito con la sua profonda competenza la stesura della nuova edizione. Milano, febbraio 2010
Sandro Salsa
Indice
1
Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Modelli matematici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Equazioni a derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Problemi ben posti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.4 Notazioni e nozioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.5 Serie di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.6 Domini regolari e Lipschitziani . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.7 Formule di integrazione per parti . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2
Diffusione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 L’equazione di diffusione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Introduzione e prime proprietà . . . . . . . . . . . . . . . . . . . . . . 2.1.2 La conduzione del calore . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Problemi ben posti (n = 1) . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.4 Un esempio elementare. Il metodo di separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.5 Problemi in dimensione n > 1 . . . . . . . . . . . . . . . . . . . . . . . 2.2 Principi di massimo e questioni di unicità . . . . . . . . . . . . . . . . . . . 2.3 La soluzione fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Soluzione fondamentale (n = 1) . . . . . . . . . . . . . . . . . . . . . 2.3.2 La distribuzione di Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Soluzione fondamentale (n > 1) . . . . . . . . . . . . . . . . . . . . . 2.4 Passeggiata aleatoria simmetrica (n = 1) . . . . . . . . . . . . . . . . . . . 2.4.1 Calcoli preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4.2 La probabilità di transizione limite . . . . . . . . . . . . . . . . . . 2.4.3 Dalla passeggiata aleatoria al moto Browniano . . . . . . . . 2.5 Diffusione, trasporto e reazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.1 Passeggiata aleatoria con deriva (drift) . . . . . . . . . . . . . . . 2.5.2 Inquinante in un canale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.5.3 Passeggiata aleatoria con deriva e reazione . . . . . . . . . . . .
19 19 19 21 23 26 34 37 42 42 46 49 51 51 55 56 60 60 63 66
X
Indice
2.6 Passeggiata aleatoria multidimensionale . . . . . . . . . . . . . . . . . . . . 67 2.6.1 Il caso simmetrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 2.6.2 Passeggiata con deriva e reazione . . . . . . . . . . . . . . . . . . . . 71 2.7 Un esempio di diffusione e reazione (n = 3) . . . . . . . . . . . . . . . . . 71 2.8 Il problema di Cauchy globale (n = 1) . . . . . . . . . . . . . . . . . . . . . . 77 2.8.1 Il caso omogeneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 2.8.2 Esistenza della soluzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 2.8.3 Il caso non omogeneo. Metodo di Duhamel . . . . . . . . . . . 81 2.8.4 Principio di massimo globale. Unicità . . . . . . . . . . . . . . . . 84 2.9 Un’applicazione alla finanza matematica . . . . . . . . . . . . . . . . . . . . 87 2.9.1 Un modello di evoluzione per il prezzo . . . . . . . . . . . . . . . 88 2.9.2 L’equazione di Black-Scholes . . . . . . . . . . . . . . . . . . . . . . . . 91 2.9.3 Le soluzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 2.9.4 Strategia di copertura (self-financing strategy) . . . . . . . . 99 2.10 Due modelli non lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 2.10.1 Diffusione non lineare. Equazione dei mezzi porosi . . . . . 101 2.10.2 Reazione non lineare. Equazione di Fischer . . . . . . . . . . . 104 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 3
Equazione di Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 3.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 3.2 Problemi ben posti. Unicità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 3.3 Funzioni armoniche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 3.3.1 Funzioni armoniche nel discreto . . . . . . . . . . . . . . . . . . . . . 120 3.3.2 Proprietà di media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 3.3.3 Principi di massimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 3.3.4 Il problema di Dirichlet in un cerchio. Formula di Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 3.3.5 Disuguaglianza di Harnack e teorema di Liouville . . . . . . 134 3.3.6 Una soluzione probabilistica per il problema di Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 3.3.7 Ricorrenza e moto Browniano . . . . . . . . . . . . . . . . . . . . . . . 139 3.4 Soluzione fondamentale e potenziale Newtoniano . . . . . . . . . . . . 140 3.4.1 La soluzione fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . 140 3.4.2 Il potenziale Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 3.4.3 Formula di scomposizione di Helmholtz . . . . . . . . . . . . . . 145 3.5 La funzione di Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 3.5.1 Potenziali (domini limitati) . . . . . . . . . . . . . . . . . . . . . . . . . 149 3.5.2 La funzione di Green per il problema di Dirichlet . . . . . . 151 3.5.3 Formula di rappresentazione di Green . . . . . . . . . . . . . . . . 154 3.5.4 La funzione di Neumann . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 3.6 Unicità in domini illimitati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 3.6.1 Problemi esterni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 3.7 Potenziali di superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 3.7.1 Il potenziale di doppio strato . . . . . . . . . . . . . . . . . . . . . . . 161
Indice
XI
3.7.2 Il potenziale di strato semplice . . . . . . . . . . . . . . . . . . . . . . 166 3.7.3 Cenno alle equazioni integrali della teoria del potenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 4
Leggi di conservazione scalari ed equazioni del prim’ordine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 4.1 Leggi di conservazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 4.2 Equazione lineare del trasporto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 4.2.1 Inquinante in un fiume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 4.2.2 Sorgente distribuita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 4.2.3 Estinzione e sorgente localizzata . . . . . . . . . . . . . . . . . . . . . 181 4.2.4 Caratteristiche inflow e outflow . . . . . . . . . . . . . . . . . . . . . 183 4.3 Traffico su strada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 4.3.1 Un modello di dinamica del traffico . . . . . . . . . . . . . . . . . . 185 4.3.2 Il metodo delle caratteristiche . . . . . . . . . . . . . . . . . . . . . . . 187 4.3.3 Coda al semaforo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189 4.3.4 Traffico crescente con x . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 4.4 Soluzioni integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 4.4.1 Riesame del metodo delle caratteristiche . . . . . . . . . . . . . . 196 4.4.2 Definizione di soluzione integrale . . . . . . . . . . . . . . . . . . . . 199 4.4.3 Condizione di Rankine-Hugoniot . . . . . . . . . . . . . . . . . . . . 202 4.4.4 Condizione di entropia. Problema di Riemann . . . . . . . . . 205 4.4.5 Soluzioni nel senso della viscosità . . . . . . . . . . . . . . . . . . . . 209 4.4.6 L’equazione di Burgers con viscosità . . . . . . . . . . . . . . . . . 213 4.5 Equazioni quasilineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 4.5.1 Caratteristiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 4.5.2 Il problema di Cauchy (I) . . . . . . . . . . . . . . . . . . . . . . . . . . 217 4.5.3 Il metodo degli integrali primi . . . . . . . . . . . . . . . . . . . . . . . 226 4.5.4 Moto di fluidi nel sottosuolo . . . . . . . . . . . . . . . . . . . . . . . . 228 4.6 Equazioni generali del prim’ordine . . . . . . . . . . . . . . . . . . . . . . . . . 230 4.6.1 Strisce caratteristiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 4.6.2 Il problema di Cauchy (II) . . . . . . . . . . . . . . . . . . . . . . . . . . 233 4.6.3 Ottica geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
5
Onde e vibrazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 5.1 Concetti generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 5.1.1 Tipi di onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 5.1.2 Velocità di gruppo e relazione di dispersione. . . . . . . . . . . 247 5.2 Onde trasversali in una corda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 5.2.1 Derivazione del modello . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 5.2.2 Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 5.3 L’equazione delle onde unidimensionale . . . . . . . . . . . . . . . . . . . . . 254 5.3.1 Condizioni iniziali e al bordo . . . . . . . . . . . . . . . . . . . . . . . . 254
XII
Indice
5.3.2 Separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . . 256 5.4 La formula di d’Alembert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 5.4.1 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 5.4.2 Soluzioni generalizzate e propagazione delle singolarità . 265 5.4.3 Soluzione fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269 5.4.4 L’equazione non omogenea. Metodo di Duhamel . . . . . . . 271 5.4.5 Effetti di dispersione e dissipazione . . . . . . . . . . . . . . . . . 272 5.5 Equazioni lineari del secondo ordine . . . . . . . . . . . . . . . . . . . . . . . 275 5.5.1 Classificazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275 5.5.2 Caratteristiche e forma canonica . . . . . . . . . . . . . . . . . . . . 278 5.6 Sistemi iperbolici a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . 282 5.7 Equazione delle onde (n > 1) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 5.7.1 Soluzioni speciali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 5.7.2 Problemi ben posti. Unicità . . . . . . . . . . . . . . . . . . . . . . . . . 290 5.8 Due modelli classici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 5.8.1 Piccole vibrazioni di una membrana elastica . . . . . . . . . . 293 5.8.2 Onde sonore nei gas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 5.9 Il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 5.9.1 Soluzione fondamentale in dimensione n = 3 e principio di Huygens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302 5.9.2 Formula di Kirchhoff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 5.9.3 Il problema di Cauchy in dimensione n = 2 . . . . . . . . . . . 308 5.9.4 Equazione non omogenea. Potenziali ritardati . . . . . . . . . 310 5.10 Onde d’acqua lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 5.10.1 Un modello per onde di superficie . . . . . . . . . . . . . . . . . . . 312 5.10.2 Adimensionalizzazione e linearizzazione . . . . . . . . . . . . . . 316 5.10.3 Onde lineari in acqua profonda . . . . . . . . . . . . . . . . . . . . . . 318 5.10.4 Interpretazione della soluzione . . . . . . . . . . . . . . . . . . . . . . 321 5.10.5 Comportamento asintotico . . . . . . . . . . . . . . . . . . . . . . . . . . 322 5.10.6 Il metodo della fase stazionaria . . . . . . . . . . . . . . . . . . . . . . 324 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 6
Elementi di analisi funzionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 6.1 Motivazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 6.2 Spazi normati, metrici e topologici. Spazi di Banach . . . . . . . . . 339 6.3 Spazi di Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346 6.4 Ortogonalità e proiezioni negli spazi di Hilbert . . . . . . . . . . . . . . 351 6.4.1 Il Teorema di Proiezione . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 6.4.2 Basi ortonormali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 6.5 Operatori lineari. Spazio duale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361 6.5.1 Operatori lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361 6.5.2 Funzionali e spazio duale . . . . . . . . . . . . . . . . . . . . . . . . . . . 364 6.5.3 Aggiunto di un operatore limitato . . . . . . . . . . . . . . . . . . . 368 6.6 Problemi variazionali astratti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 370 6.6.1 Forme bilineari. Teorema di Lax-Milgram . . . . . . . . . . . . . 370
Indice
XIII
6.6.2 Minimizzazione di funzionali quadratici . . . . . . . . . . . . . . 375 6.6.3 Approssimazione e metodo di Galerkin . . . . . . . . . . . . . . . 377 6.7 Compattezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379 6.7.1 Compattezza e convergenza debole . . . . . . . . . . . . . . . . . . 379 6.7.2 Criteri di compattezza in C Ω e in L2 (Ω) . . . . . . . . . . 381 6.7.3 Convergenza debole e compattezza . . . . . . . . . . . . . . . . . . 382 6.7.4 Operatori compatti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386 6.8 Teorema dell’Alternativa di Fredholm . . . . . . . . . . . . . . . . . . . . . . 388 6.8.1 Alternativa per problemi variazionali astratti . . . . . . . . . 388 6.8.2 Teorema dell’Alternativa di Fredholm . . . . . . . . . . . . . . . . 394 6.9 Spettro di un operatore compatto autoaggiunto . . . . . . . . . . . . . 396 6.9.1 Risolvente e spettro (reale) di un operatore lineare continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 396 6.9.2 Operatori compatti autoaggiunti . . . . . . . . . . . . . . . . . . . . 399 6.9.3 Applicazione ai problemi variazionali astratti . . . . . . . . . 404 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407 7
Distribuzioni e spazi di Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411 7.1 Distribuzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411 7.1.1 Considerazioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . 411 7.1.2 Funzioni test e mollificatori . . . . . . . . . . . . . . . . . . . . . . . . . 413 7.1.3 Le distribuzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 416 7.2 Calcolo differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 7.2.1 Derivata nel senso delle distribuzioni . . . . . . . . . . . . . . . . . 420 7.2.2 Gradiente, divergenza, rotore, Laplaciano . . . . . . . . . . . . . 423 7.3 Moltiplicazione, composizione, divisione . . . . . . . . . . . . . . . . . . . . 426 7.3.1 Moltiplicazione. Regola di Leibniz . . . . . . . . . . . . . . . . . . . 426 7.3.2 Composizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427 7.3.3 Divisione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 7.3.4 Convoluzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 430 7.4 Trasformata di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432 7.4.1 Distribuzioni temperate . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432 7.4.2 Trasformata di Fourier in S (Rn ) . . . . . . . . . . . . . . . . . . . . 435 7.4.3 Formula di sommazione di Poisson. Trasformata del pettine di Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 438 7.4.4 Trasformata di Fourier in L2 (Rn ) . . . . . . . . . . . . . . . . . . . 439 7.5 Spazi di Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 440 7.5.1 Una costruzione astratta . . . . . . . . . . . . . . . . . . . . . . . . . . . 440 7.5.2 Lo spazio H 1 (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441 7.5.3 Lo spazio H01 (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446 7.5.4 Duale di H01 (Ω) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 447 7.5.5 Gli spazi H m (Ω), m > 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . 450 7.5.6 Regole di calcolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451 7.5.7 Trasformata di Fourier e spazi di Sobolev . . . . . . . . . . . . . 452
XIV
Indice
7.6 Approssimazioni con funzioni regolari ed estensioni . . . . . . . . . . 453 7.6.1 Approssimazioni locali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453 7.6.2 Estensioni e approssimazioni globali . . . . . . . . . . . . . . . . . 454 7.7 Tracce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 458 7.7.1 Tracce di funzioni in H 1 (Ω) . . . . . . . . . . . . . . . . . . . . . . . . 458 7.7.2 Tracce di funzioni in H m (Ω) . . . . . . . . . . . . . . . . . . . . . . . 462 7.7.3 Spazi di tracce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463 7.8 Compattezza e immersioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 7.8.1 Teorema di Rellich . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 7.8.2 Disuguaglianze di Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . 467 7.8.3 Disuguaglianze di Sobolev in Rn . . . . . . . . . . . . . . . . . . . . 468 7.8.4 Immersione di Sobolev in domini limitati . . . . . . . . . . . . . 470 7.9 Spazi dipendenti dal tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 471 7.9.1 Funzioni a valori in spazi di Hilbert . . . . . . . . . . . . . . . . . . 471 7.9.2 Spazi di Sobolev dipendenti dal tempo . . . . . . . . . . . . . . . 473 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476 8
Formulazione variazionale di problemi ellittici . . . . . . . . . . . . . . 479 8.1 Equazioni ellittiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 479 8.2 Tipi di soluzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 481 8.3 Formulazioni variazionali per l’equazione di Poisson . . . . . . . . . . 483 8.3.1 Condizioni di Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 484 8.3.2 Condizioni di Neumann . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486 8.3.3 Autovalori e autofunzioni dell’operatore di Laplace . . . . 489 8.3.4 Un risultato di stabilità asintotica . . . . . . . . . . . . . . . . . . . 491 8.4 Equazioni generali in forma di divergenza . . . . . . . . . . . . . . . . . . . 493 8.4.1 Problema di Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 494 8.4.2 Problema di Neumann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 500 8.4.3 Problema di Robin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 8.4.4 Problema misto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 503 8.5 Principi di massimo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505 8.6 Questioni di regolarità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 508 8.7 Alcune applicazioni della teoria . . . . . . . . . . . . . . . . . . . . . . . . . . . 515 8.7.1 Uno schema iterativo per equazioni semilineari . . . . . . . . 515 8.7.2 Equilibrio di una piastra . . . . . . . . . . . . . . . . . . . . . . . . . . . 518 8.7.3 Il sistema di Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 520 8.8 Un problema di controllo ottimo . . . . . . . . . . . . . . . . . . . . . . . . . . . 525 8.8.1 Struttura del problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525 8.8.2 Esistenza e unicità della coppia ottima . . . . . . . . . . . . . . . 527 8.8.3 Moltiplicatori di Lagrange e condizioni di ottimalità . . . 528 8.8.4 Un algoritmo iterativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 530 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 532
9
Formulazione debole per problemi di evoluzione . . . . . . . . . . . . 541 9.1 Equazioni paraboliche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541
Indice
XV
9.2 Equazione di diffusione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 542 9.2.1 Problema di Cauchy-Dirichlet . . . . . . . . . . . . . . . . . . . . . . . 542 9.2.2 Il metodo di Faedo-Galerkin (I) . . . . . . . . . . . . . . . . . . . . . 545 9.2.3 Soluzione del problema approssimato . . . . . . . . . . . . . . . . 546 9.2.4 Stime dell’energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 547 9.2.5 Esistenza, unicità e stabilità . . . . . . . . . . . . . . . . . . . . . . . . 551 9.2.6 Problema di Cauchy-Neumann . . . . . . . . . . . . . . . . . . . . . . 554 9.2.7 Regolarità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 556 9.3 Equazioni generali in forma di divergenza . . . . . . . . . . . . . . . . . . . 558 9.3.1 Formulazione debole dei principali problemi . . . . . . . . . . . 558 9.3.2 Il metodo di Faedo-Galerkin (II) . . . . . . . . . . . . . . . . . . . . 561 9.3.3 Principio di massimo debole . . . . . . . . . . . . . . . . . . . . . . . . 564 9.4 Diffusione e reazione non lineare . . . . . . . . . . . . . . . . . . . . . . . . . . . 565 9.4.1 Metodo delle sopra/sottosoluzioni . . . . . . . . . . . . . . . . . . . 565 9.4.2 Equilibri, linearizzazione e stabilità . . . . . . . . . . . . . . . . . . 569 9.5 Equazione delle onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 573 9.5.1 Il problema di Cauchy-Dirichlet . . . . . . . . . . . . . . . . . . . . . 574 9.5.2 Il metodo di Faedo-Galerkin (III) . . . . . . . . . . . . . . . . . . . . 576 9.5.3 Soluzione del problema approssimato . . . . . . . . . . . . . . . . 576 9.5.4 Stime dell’energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 577 9.5.5 Esistenza, unicità e stabilità . . . . . . . . . . . . . . . . . . . . . . . . 580 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 583 Appendice A Analisi dimensionale . . . . . . . . . . . . . . . . . . . . . . . . . . . 585 A.1 Un esempio preliminare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585 A.2 Dimensioni e leggi fisiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587 A.3 Il teorema Pi di Buckingham . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 588 Appendice B Misure e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593 B.1 Misura di Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 593 B.1.1 Un problema di ... conteggio . . . . . . . . . . . . . . . . . . . . . . . . 593 B.1.2 Misure e funzioni misurabili . . . . . . . . . . . . . . . . . . . . . . . . 595 B.2 Integrale di Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 597 B.3 Integrali rispetto a una misura qualunque . . . . . . . . . . . . . . . . . . 600 Appendice C Identità e formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603 C.1 Gradiente, divergenza, rotore, Laplaciano . . . . . . . . . . . . . . . . . . . 603 C.2 Identità e formule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605 C.2.1 Formule di Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605 C.2.2 Formule di Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 605 C.2.3 Identità vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 606 Bibliografia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607 Indice analitico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 611
1 Introduzione
1.1 Modelli matematici Nella descrizione di una gran parte di fenomeni nelle scienze applicate e in molteplici aspetti dell’attività tecnica e industriale si fa uso di modelli matematici. Per “modello” intendiamo un insieme di equazioni e/o altre relazioni matematiche in grado di catturare le caratteristiche della situazione in esame e poi di descriverne, prevederne e controllarne lo sviluppo. Le scienze applicate non sono solo quelle classiche; oltre alla fisica e alla chimica, la modellistica matematica è entrata pesantemente in discipline complesse come la finanza, la biologia, l’ecologia, la medicina. Nell’attività industriale (per esempio nelle realizzazioni aeronautiche spaziali o in quelle navali, nei reattori nucleari, nei problemi di combustione, nella generazione e distribuzione di elettricità, nel controllo del traffico, ecc.), la modellazione matematica, seguita dall’analisi e dalla simulazione numerica e poi dal confronto sperimentale, è diventata una procedura diffusa, indispensabile all’innovazione, anche per motivi pratici ed economici. È chiaro che ciò è reso possibile dalle capacità di calcolo di cui oggi si dispone. Un modello matematico è in generale costruito a partire da due mattoni principali: leggi generali e relazioni costitutive. Qui ci occuperemo di modelli in cui le leggi generali sono quelle della Meccanica dei Continui e si presentano come leggi di conservazione o di bilancio (della massa, dell’energia, del momento lineare, ecc.). Le relazioni costitutive sono di natura sperimentale e dipendono dalle caratteristiche contingenti del fenomeno in esame. Ne sono esempi la legge di Fourier per il flusso di calore o quella di Fick per la diffusione di una sostanza o la legge di Ohm per la corrente elettrica. Il risultato della combinazione dei due mattoni è di solito un’equazione o un sistema di equazioni a derivate parziali. Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
2
1 Introduzione
1.2 Equazioni a derivate parziali Un’equazione a derivate parziali è una relazione del tipo F (x1 , ..., xn , u, ux1 , ..., uxn , ux1 x1 , ux1 x2 ..., uxn xn , ux1 x1 x1 , ...) = 0
(1.1)
dove u = u (x1 , ...xn ) è una funzione di n variabili. L’ordine dell’equazione è dato dal massimo ordine di derivazione che vi appare. Una prima importante distinzione è quella tra equazioni lineari e nonlineari. La (1.1) è lineare se F è lineare rispetto ad u e a tutte le sue derivate, altrimenti è nonlineare. Tra i tipi di nonlinearità distinguiamo: – Equazioni semilineari, se F è nonlineare solo rispetto ad u ma è lineare rispetto a tutte le sue derivate. – Equazioni quasi-lineari, se F è lineare rispetto alle derivate di u di ordine massimo. – Equazioni completamente nonlineari, se F è nonlineare rispetto alle derivate di u di ordine massimo. Si può ritenere che la teoria delle equazioni lineari sia sufficientemente ben sviluppata e consolidata, almeno per quanto riguarda le questioni più rilevanti. Al contrario, le equazioni nonlineari presentano una varietà così ricca di aspetti e complicazione che non sembra concepibile una teoria generale. I risultati esistenti e le nuove ricerche si concentrano su casi più o meno specifici, di interesse per le scienze applicate. Per dare al lettore un’idea della vastità di possibili applicazioni, presentiamo una serie di esempi, indicando una possibile (spesso non l’unica!) interpretazione. Negli esempi, x rappresenta una variabile spaziale (di solito in dimensione n = 1, 2, 3) e t è una variabile temporale. Incominciamo con equazioni lineari. In particolare, le equazioni (1.2)– (1.5) sono fondamentali e la loro teoria costituisce una base per molte altre. 1. Equazione del trasporto (prim’ordine): u = u (x,t), x ∈Rn , t ∈ R ut + v (x, t) · ∇u = 0.
(1.2)
Descrive, per esempio, il trasporto di un inquinante (solido) lungo un canale; qui u è la concentrazione della sostanza e v è la velocità della corrente. La incontreremo nella Sezione 4.2. 2. Equazione di diffusione o del calore (second’ordine): u = u (x,t), x ∈Rn , t∈R ut − DΔu = 0 (1.3) dove Δ = ∂x1 x1 + ∂x2 x2 + ... + ∂xn xn è l’operatore di Laplace o Laplaciano. Descrive, per esempio, la propagazione del calore per conduzione attraverso un mezzo omogeneo ed isotropo; u è la temperatura e D codifica le proprietà
1.2 Equazioni a derivate parziali
3
termiche di un materiale. Il Capitolo 2 è dedicato all’equazione di diffusione ed ad alcune sue varianti. 3. Equazione delle Onde (second’ordine): u = u (x,t), x ∈Rn (n = 1, 2, 3), t∈R utt − c2 Δu = 0.
(1.4)
Descrive la propagazione di onde trasversali di piccola ampiezza in una corda (e.g. di violino) se n = 1, in una membrana elastica (e.g. di un tamburo) se n = 2; se n = 3 descrive onde sonore o anche onde elettromagnetiche nel vuoto. Qui u è legata all’ampiezza delle vibrazioni e c è la velocità di propagazione. La sua variante utt − c2 Δu + m2 u = 0, ottenuta aggiungendo il termine di reazione m2 u, si chiama equazione di Klein-Gordon, importante in meccanica quantistica. La variante unidimensionale utt − c2 uxx + k 2 ut = 0, ottenuta aggiungendo il termine di dissipazione k 2 ut , si chiama equazione dei telegrafi, poiché governa la trasmissione di impulsi elettrici attraverso un cavo, quando vi siano perdite di corrente a terra. Gran parte del Capitolo 5 è dedicato all’equazione delle onde. 4. Equazione del potenziale o di Laplace (second’ordine): u = u (x), x ∈Rn Δu = 0.
(1.5)
Le equazioni di diffusione e delle onde descrivono fenomeni in evoluzione col tempo; l’equazione di Laplace (Capitolo 3) descrive lo stato stazionario o di regime corrispondente, in cui la soluzione non dipende più dal tempo. La sua versione non-omogenea Δu = f si chiama equazione di Poisson, importante in problemi di elettrostatica. 5. Equazione di Black-Scholes (second’ordine): u = u (x,t), x ≥ 0, t ≥ 0 1 ut + σ 2 x2 uxx + rxux − ru = 0. 2 Fondamentale in finanza matematica, descrive l’evoluzione del prezzo u di un prodotto finanziario derivato (un’opzione europea, per esempio), basato su un bene sottostante (un’azione, una valuta, ecc.) il cui prezzo è x (si veda la Sezione 2.8).
4
1 Introduzione
6. Equazione della piastra vibrante (quart’ordine): u = u (x,t), x ∈R2 , t∈R utt − Δ2 u = 0 4
4
4
u ∂ u dove Δ2 u = Δ(Δu) = ∂∂xu4 + 2 ∂x∂2 ∂x 2 + ∂x4 è l’operatore biarmonico. In teoria 1 1 2 2 dell’elasticità lineare, descrive le piccole vibrazioni di una piastra omogenea e isotropa (Paragrafo 8.7.2).
7. Equazione di Schrödinger (second’ordine): u = u (x,t), x ∈Rn (n = 1, 2, 3), t ≥ 0, i unità complessa, −iut = Δu + V (x) u. Interviene in meccanica quantistica e descrive l’evoluzione di una particella 2 soggetta al potenziale V . La funzione ψ = |u| ha il significato di densità di probabilità (si veda il Problema 6.6). Vediamo ora qualche esempio di equazione non-lineare 8. Equazione di Burgers (semilineare, prim’ordine): u = u (x,t), x∈R, t ∈ R, ut + cuux = εuxx . Descrive un flusso unidimensionale di particelle di un fluido con viscosità ε. La troviamo nel Paragrafo 4.4.5. 9. Equazione di Korteveg de Vries (semilineare, terz’ordine): u = u (x,t), x ∈ R, t ∈ R, ut + cuux + uxxx = 0. Appare nello studio delle onde dispersive (per la presenza del termine uxxx ) e descrive la formazione di onde solitarie. 10. Equazione di Fisher (semilineare, second’ordine): u = u (x,t), x ∈Rn , t∈R u ut − DΔu = ru 1 − . M È un modello per la crescita di una popolazione di cui u rappresenta la densità, soggetta a diffusione e crescita logistica, espressa dal termine a secondo membro (Sezioni 2.10 e 9.4). 11. Equazione dei mezzi porosi (quasilineare, second’ordine): u = u (x,t), x ∈Rn , t ∈ R ut = k div (uγ ∇u) = kuγ Δu + kγuγ−1 |∇u|
2
dove k > 0 e γ > 1 sono costanti. Questa equazione descrive fenomeni di filtrazione, per esempio quella dell’acqua attraverso il suolo (Sezione 2.10).
1.2 Equazioni a derivate parziali
5
12. Equazione delle superfici minime (quasilineare, second’ordine): u = u (x), x ∈R2 , ⎞ ⎛ ∇u ⎠ = 0. div ⎝ 2 1 + |∇u| Il grafico di una soluzione u minimizza l’area tra tutte le superfici cartesiane 1 il cui bordo si appoggia su una data curva. Per esempio, le bolle di sapone sono superfici minime. 13. Equazione eikonale (completamente non-lineare, del prim’ordine): u = u (x), x ∈R3 , |∇u| = c (x) . È importante in ottica geometrica: le superfici di livello u (x) = t descrivono la posizione del fronte d’onda (luminosa) al tempo t (Paragrafo 4.6.3). 14. Equazione di Monge-Ampère (completamente non-lineare, del second’ordine): u = u (x), x ∈Rn , det D2 u = f (x) dove D2 u indica la matrice Hessiana di u. Originariamente apparsa in problemi di geometria differenziale, è diventata fondamentale nei problemi di allocazione ottima. Veniamo ora ad esempi di sistemi. 15. Elasticità lineare: u = (u1 (x,t) , u2 (x,t) , u3 (x,t)), x ∈R3 , t ∈ R utt = μΔu + (μ + λ)grad div u. Si tratta di tre equazioni scalari di second’ordine. Il vettore u descrive lo spostamento dalla posizione iniziale di un continuo deformabile di densità . 16. Equazioni di Maxwell nel vuoto (sei equazioni lineari scalari del prim’ordine): Et − rot B = 0,
Bt + rot E = 0
div E =0
div B =0
(leggi di Ampère e di Faraday) (leggi di Gauss)
dove E è il campo elettrico e B è il campo di induzione magnetica. Le unità di misura sono quelle “naturali” dove la velocità della luce nel vuoto è c = 1 e la permeabilità magnetica nel vuoto è μ0 = 1. 1
Che siano cioà grafici di funzioni z = v (x, y).
6
1 Introduzione
17. Equazioni di Navier-Stokes: u = (u1 (x,t) , u2 (x,t) , u3 (x,t)), p = p (x,t), x ∈R3 , t ∈ R,
ut + (u · ∇) u = − ρ1 ∇p + νΔu div u =0.
Questo sistema è costituito da quattro equazioni, di cui tre quasilineari. Descrive il moto di un fluido viscoso, omogeneo e incomprimibile. Qui u è la velocità del fluido, p la pressione, ρ la densità (qui costante) e ν è la viscosità cinematica, data dal rapporto tra la viscosità del fluido e la sua densità.
1.3 Problemi ben posti Nella costruzione di un modello, intervengono solo alcune tra le equazioni generali di campo, altre vengono semplificate o eliminate attraverso le relazioni costitutive o procedimenti di approssimazione coerenti con la situazione in esame. Ulteriori informazioni sono comunque necessarie per selezionare o predire l’esistenza e/o l’unicità di una soluzione e si presentano in generale sotto forma di condizioni iniziali e/o condizioni al bordo del dominio di riferimento o altre ancora. Per esempio, tipiche condizioni al bordo prevedono di assegnare la soluzione o la sua derivata normale. Spesso sono appropriate combinazioni di queste condizioni. La teoria si occupa allora di stabilire condizioni sui dati affinché il problema abbia le seguenti caratteristiche: a) esista almeno una soluzione; b) esista una sola soluzione; c) la soluzione dipenda con continuità dai dati. Quest’ultima condizione richiede qualche parola di spiegazione: in sintesi la c) afferma che la corrispondenza dati → soluzione
(1.6)
sia continua ossia che, un piccolo errore sui dati provochi un piccolo errore sulla soluzione. Si tratta di una proprietà estremamente importante, che si chiama anche stabilità locale della soluzione rispetto ai dati. Per esempio, pensiamo al caso in cui occorra usare un computer (cioè quasi sempre) per il calcolo della soluzione: automaticamente, l’inserimento dei dati e le procedure di calcolo comportano errori di approssimazione di vario tipo. Una sensibilità eccessiva della soluzione a piccole variazioni dei dati produrrebbe una soluzione approssimata, neppure lontana parente di quella originale. La nozione di continuità, ma anche la misura degli errori, sia sui dati sia sulla soluzione, si precisa introducendo un’opportuna distanza. Se i dati sono
1.4 Notazioni e nozioni preliminari
7
numeri o vettori finito dimensionali, le distanze sono le solite, per esempio, quella euclidea: se x = (x1 , x2 , ..., xn ) , y = (y1 , y2 , ..., yn )
n 2 dist (x, y) = x − y = (xk − yk ) . k=1
Se si tratta di funzioni, per esempio reali e definite su un dominio I, distanze molto usate sono: dist (f, g) = max |f − g| I
che misura il massimo scarto tra f e g e (f − g)
dist (f, g) =
2
I
che misura lo scarto quadratico tra f e g. Una volta in possesso di una nozione di distanza, la continuità della corrispondenza (1.6) è facile da precisare: se la distanza tra i dati tende a zero allora anche la distanza delle rispettive soluzioni tende a zero. Quando un problema possiede le caratteristiche a), b) c) si dice che è ben posto. Per chi costruisce modelli matematici è molto comodo, a volte essenziale, avere a che fare con problemi ben posti: l’esistenza di una soluzione segnala che il modello ha una sua coerenza, l’unicità e la stabilità aumentano la possibilità di calcoli numerici accurati. Come si può immaginare, in generale, modelli complessi richiedono tecniche di analisi teorica e numerica piuttosto sofisticate. Problemi di una certa complessità diventano tuttavia ben posti e trattabili numericamente in modo efficiente se riformulati e ambientati opportunamente, utilizzando i metodi dell’Analisi Funzionale. Non solo i problemi ben posti sono tuttavia interessanti per le applicazioni. Vi sono problemi che sono intrinsecamente mal posti per mancanza di unicità oppure per mancanza di stabilità ma di grande importanza per la tecnologia moderna. Una classe tipica è quella dei cosiddetti problemi inversi, di cui fa parte, per esempio, la T.A.C. (Tomografia Assiale Computerizzata ). Il trattamento di questo tipo di problema esula però da un’introduzione come questa.
1.4 Notazioni e nozioni preliminari In questa sezione introduciamo alcuni simboli usati costantemente nel seguito e richiamiamo alcune nozioni e formule di Topologia e Analisi in Rn . Insiemi e topologia. Indichiamo rispettivamente con: N, Z, Q, R, C gli insiemi dei numeri naturali, interi (relativi), razionali, reali e complessi. Rn è lo spazio vettoriale n−dimensionale delle n−uple di numeri reali. Indichiamo con e1 ,..., en i vettori della base canonica in Rn . In R2 e R3 possiamo usare anche i, j e k.
8
1 Introduzione
Il simbolo Br (x) indica la (iper)sfera aperta in Rn , con raggio r e centro in x, cioè Br (x) = {y ∈Rn ; |x − y| < r} . Se non c’è necessità di specificare il raggio o centro, scriviamo semplicemente B (x) o B. Il volume di Br e l’area della superficie sferica Sr sono dati da |Br | =
ωn n r n
e
|Sr | = ω n rn−1
dove ω n è l’area della superficie della sfera unitaria 2 S1 in Rn ; in particolare, ω 2 = 2π e ω 3 = 4π. Sia E ⊆ Rn . Un punto x ∈E è: • interno se esiste Br (x) ⊂ E; • di frontiera se ogni sfera Br (x) contiene punti di E e del suo complementare Rn \E. L’insieme dei punti di frontiera di E, la frontiera di E, si indica con ∂E, in particolare Sr = ∂Br ; • punto limite di E se esiste una successione {xk }k≥1 ⊂ E tale che xk → x. E è aperto se ogni punto di E è interno; l’insieme E = E ∪ ∂E si chiama chiusura di E; E è chiuso se E = E. Un insieme è chiuso se e solo se contiene tutti i suoi punti limite. Poiché Rn è aperto e chiuso simultaneamente, anche l’insieme vuoto ∅ è da considerarsi aperto e chiuso. È importante sottolineare che solo Rn e ∅ hanno questa proprietà. Un insieme aperto E è connesso se per ogni coppia di punti x, y ∈ E esiste una curva regolare che li connette, interamente contenuta in E. Gli insiemi aperti e connessi si chiamano domini, per i quali useremo prevalentemente la lettera Ω. Un insieme E si dice convesso se per ogni coppia di punti x, y ∈E il segmento di retta che li unisce è interamente contenuto in E. Evidentemente ogni convesso è anche connesso. Se U ⊂ E, diciamo che U è denso in E se U = E. Questo significa, in particolare, che se x ∈ E, esiste una successione {xk } ⊂ U tale che xk → x, per k → ∞. Per esempio Q è denso in R. E è limitato se esiste una sfera Br (0) che lo contiene. La categoria degli insiemi compatti è particolarmente importante. Si dice che una famiglia F di aperti è una copertura di un insieme E ⊂ Rn se E è contenuto nell’unione degli elementi di F. Un insieme si dice compatto se ogni copertura F di E contiene una sottofamiglia di un numero finito di elementi, che sia ancora una copertura di E. In Rn , gli insiemi compatti sono tutti e soli gli insiemichiusi e limitati. Se E 0 è compatto e contenuto in E, si scrive E0 ⊂⊂ E e si dice che E0 è contenuto con compattezza in E. 2
In generale, ω n = nπ n/2 /Γ di Eulero.
1 2
n + 1 dove Γ (s) = 0+∞ ts−1 e−t dt è la funzione gamma
1.4 Notazioni e nozioni preliminari
9
• Topologia indotta Sia E ⊂ Rn . Si dice che A ⊆ E è aperto (chiuso) relativamente ad E, rispetto alla topologia indotta da Rn , se A è intersezione di E con un insieme aperto (chiuso) in Rn . Tipicamente, dovremo considerare aperti e chiusi relativamente alla frontiera ∂Ω di un dominio. N.B: L’intervallo [−1, 1/2) è aperto relativamente ad E = [−1, 1], rispetto alla topologia indotta da R! Estremo superiore ed inferiore di un insieme di numeri reali. Un insieme E ⊂ R è inferiormente limitato se esiste un numero K tale che K ≤ x per ogni x∈E.
(1.7)
Il maggiore tra i numeri K con la proprietà (1.7) è detto estremo inferiore di E e si indica con inf E. Più precisamente, λ = inf E se λ ≤ x per ogni x ∈ E e se, per ogni ε > 0, possiamo trovare x ¯ ∈ E tale che x ¯ < λ + ε. Se inf E ∈ E, allora inf E è il minimo di E, che si indica con min E. Analogamente, un insieme E ⊂ R è superiormente limitato se esiste un numero K tale che x ≤ K per ogni x∈E. (1.8) Il minore tra i numeri K con la proprietà (1.8) è detto estremo superiore di E e si indica con sup E. Più precisamente, Λ = sup E se Λ ≥ x per ogni x ∈ E e se, per ogni ε > 0, possiamo trovare x ¯ ∈ E tale che x ¯ > Λ − ε. Se sup E ∈ E, allora sup E è il massimo di E, che si indica con max E Limite inferiore e superiore di una successione di numeri reali. Sia {xn }n≥1 una successione di numeri reali. Si dice che l (finito o infinito) è punto limite di {xn }n≥1 se esiste una sottosuccessione {xnk } tale che xnk → l. La classe limite di {xn }n≥1 è l’insieme dei suoi punti limite. L’estremo inferiore λ della classe limite, si chiama limite inferiore di xn e si scrive lim inf xn = λ. n→∞
Analogamente, l’estremo superiore Λ della classe limite, si chiama limite superiore di xn e si scrive lim sup xn = Λ. n→∞
Per esempio, La classe limite della successione {cos n}n≥1 è l’intervallo [−1, 1] e quindi lim inf cos n = −1, lim sup cos n = 1. n→∞
n→∞
Se la classe limite si riduce ad un punto l, allora questo è il limite della successione. Funzioni. Sia Ω ⊆ Rn e u : Ω → R una funzione reale definita in Ω. Diciamo che u è continua in x ∈ Ω se u (y) → u (x) per y → x. Se u è
10
1 Introduzione
continua in ogni punto di Ω, diciamo che u è continua in Ω. L’insieme delle funzioni continue in Ω si indica col simbolo C (Ω). Il simbolo C Ω denota il sottoinsieme di C (Ω) delle funzioni estendibili con continuità fino al bordo di Ω. Il supporto di una funzione continua in Ω è la chiusura (relativamente ad Ω) dell’insieme dei punti in cui è diversa da zero. Si dice che u ∈ C (Ω) è a supporto compatto se è nulla fuori da un compatto contenuto in Ω. L’insieme di queste funzioni si indica con C0 (Ω). Il simbolo χΩ indica la funzione caratteristica di Ω: χΩ = 1 in Ω e χΩ = 0 in Rn \Ω. Diciamo che u è inferiormente (risp. superiormente) limitata in Ω se l’immagine u (Ω) = {y ∈ R, y = u (x) per qualche x ∈Ω} è inferiormente (risp. superiormente) limitata. L’estremo inferiore (risp. superiore) di u in Ω è l’estremo inferiore (risp. superiore) di u (Ω) e si indica col simbolo (risp. sup u (x)). inf u (x) x∈Ω
x∈Ω
Se Ω è limitato e u ∈ C Ω allora esistono il massimo ed il minimo globali di u (Teorema di Weierstrass). ∂u per indicare le derivate parziali Useremo uno dei simboli uxj , ∂xj u, ∂xj prime di u, e ∇u oppure grad u per il gradiente di u. Coerentemente, per le ∂2u derivate di ordine più elevato useremo le notazioni uxj xk , ∂xj xk u, e ∂xj ∂xk così via. Diciamo che u è di classe C k (Ω), k ≥ 1, se u è derivabile con continuità in Ω, fino all’ordine k incluso. L’insieme delle funzioni derivabili con continuità in Ω fino a qualunque ordine si indica con C ∞ (Ω). Se u ∈ C 1 (Ω) allora u is differenziable in Ω e possiamo scrivere, per x ∈ Ω e h ∈ Rn , piccolo: u (x + h) − u (x) = ∇u (x) · h + o (h) dove il simbolo o (h), che si legge “o piccolo di h” denota una quantità tale che o (h) / |h| → 0 per |h| → 0. Il simbolo C k Ω denota l’insieme delle funzioni appartenenti a C k (Ω) le cui derivate fino all’ordine k incluso, possono essere estese con continuità fino a ∂Ω. Integrali. Fino al Capitolo 5 incluso, gli integrali possono essere intesi nel senso di Riemann (proprio o improprio). Una breve introduzione alla misura e all’integrale di Lebesgue si può trovare nell’Appendice A. Siano 1 ≤ p < ∞ e q = p/(p − 1), l’esponente coniugato di p. Vale la seguente importante
1.5 Serie di Fourier
11
disuguaglianza di Hölder: 1/p 1/q p q uv ≤ |u| |v| . Ω
Ω
(1.9)
Ω
Il caso p = q = 2 è noto come disuguaglianza di Schwarz. ∞ n Convergenza uniforme. Una serie m=1 um , dove um : Ω ⊆ R → R, Nsi dice uniformemente convergente in Ω, con somma u, se, posto SN = m=1 um , si ha sup |SN (x) − u (x)| → 0 per N → ∞.
x∈Ω
Invece di ricorrere alla definizione, per stabilire la convergenza uniforme di una serie di funzioni si usa spesso il seguente criterio: Test di Weierstrass . Sia |um (x)| ≤ am , per ogni m ≥ 1 e x ∈ Ω. Se la serie ∞ ∞ numerica m=1 am è convergente, allora m=1 um converge assolutamente e uniformemente in Ω. ∞ Limiti e serie. Sia m=1 um uniformemente convergente in Ω. Se um è continua in x0 per ogni m ≥ 1, allora la somma u è continua in x0 e lim
∞
x→x0
m=1
um (x) =
∞ m=1
um (x0 ) = u (x0 ) .
∞ Integrazione per serie. Sia m=1 um uniformemente convergente in Ω. Se Ω è limitato e um è integrabile in Ω per ogni m ≥ 1, allora:
∞ ∞ um = um . Ω
m=1
m=1
Ω
Derivazione per serie. Sia Ω limitato e um ∈ C 1 Ω per ogni m ≥ 1. Se: ∞ i) la serie m=1 um (x0 ) è convergente in almeno un punto x0 ∈ Ω, ∞ ii) le serie m=1 ∂xj um sono uniformemente convergenti in Ω per ogni j = 1, ..., n, ∞ allora m=1 um converge uniformemente in Ω, con somma u ∈ C 1 Ω e, per ogni x ∈ Ω, ∂ xj
∞ m=1
um (x) =
∞ m=1
∂xj um (x)
(j = 1, ..., n).
1.5 Serie di Fourier Richiamiamo i risultati principali riguardanti la convergenza in media quadratica, puntuale ed uniforme delle serie di Fourier.
12
1 Introduzione
Coefficienti e serie di Fourier. Sia u una funzione periodica di periodo 2T , integrabile su (−T, T ). I coefficienti di Fourier di u sono definiti dalle seguenti formule, dove ω = π/T : 1 T 1 T an = u (x) cos nωx dx, bn = u (x) sin nωx dx. (1.10) T −T T −T Ricordiamo le seguenti relazioni di ortogonalità: T T cos kωx cos mωx dx = sin kωx sin mωx dx = 0 per k = m −T
−T
T
cos kωx sin mωx dx = 0 −T
Inoltre:
T
2
T
cos kωx dx = −T
per ogni k, m ≥ 0.
sin2 kωx dx = T.
(1.11)
−T
Ad u possiamo associare la sua serie di Fourier, scrivendo a0 ∞ u (x) ∼ {ak cos kωx + bk sin kωx} . + k=1 2
(1.12)
• Funzioni pari e dispari. Se u è una funzione dispari, cioè u (−x) = −u (x), abbiamo ak = 0 per ogni k ≥ 0, mentre 2 T bk = u (x) sin kωx dx. T 0 Pertanto, se u è dispari, la sua serie di Fourier è di soli seni:
∞ bk sin kωx. u∼ k=1
Analogamente, se u è pari, i.e. u (−x) = u (x), abbiamo bk = 0 per ogni k ≥ 1, mentre 2 T ak = u (x) cos kωx dx. T 0 Pertanto, se u è pari, la sua serie di Fourier è di soli coseni: a0 ∞ ak cos kωx. u∼ k=1 2 • Forma complessa. Usando l’identità di Eulero eikωx = cos kωx + i sin kωx la serie di Fourier (1.12) può essere espressa nella forma
∞ u ˆk eikωx , k=−∞
1.5 Serie di Fourier
13
dove i coefficienti di Fourier complessi u ˆk sono dati da
1 u ˆk = 2T
T
u (x) e−ikωx dx.
−T
Le relazioni tra i coefficienti reali e complessi sono le seguenti: u ˆ0 =
1 1 a0 , e u ˆk = (ak − bk ) , u ˆ−k = u ˆk 2 2
per k > 0.
Convergenza in media quadratica. Questa è la più naturale nozione di convergenza di una serie di Fourier (si veda il Paragrafo 6.4.2). Sia a0 N + {ak cos kωx + bk sin kωx} SN (x) = k=1 2 la somma parziale N −esima della serie di Fourier di u. Abbiamo: Teorema 5.1. Se u è una funzione a quadrato integrabile 3 in (−T, T ) allora T
lim
N →+∞
−T
2
[SN (x) − u (x)] dx = 0.
Inoltre, vale la seguente formula di Bessel: 1 T
T
u2 =
−T
a20 ∞ 2 ak + b2k . + k=1 2
(1.13)
Poiché la serie numerica a secondo membro della (1.13) è convergente, deduciamo la seguente importante conseguenza: Corollario 5.2 (Riemann-Lebesgue) lim ak = lim bk = 0 .
k→+∞
k→+∞
Nota 5.1. Dal Teorema 5.1 si deducono le seguenti notevoli identità in termini di coefficienti complessi (T = π): π
∞ 1 uv = u ˆk vˆ−k (formula di Parseval) k∈Z 2π −π e
1 2π
π
−π
u2 =
∞ k∈Z
2
|ˆ uk |
(formula di Bessel).
Convergenza puntuale. Diciamo che u soddisfa le condizioni di Dirichlet in [−T, T ] se: i) è continua in [−T, T ] eccetto al più un numero di punti di discontinuità a salto, 3
Cioè
T
−T
u2 < ∞.
14
1 Introduzione
ii) l’intervallo [−T, T ] può essere ripartito nell’unione di un numero finito di sottointervalli in ciascuno dei quali u è monotona. Vale il seguente teorema. Teorema 5.3. Se u soddisfa le condizioni di Dirichlet in [−T, T ] allora la serie di Fourier di u converge in ogni punto di [−T, T ]. Inoltre 4 : ⎧ u (x+) + u (x−) ⎪ ⎪ x ∈ (−T, T ) ⎨ a0 ∞ 2 {ak cos kωx + bk sin kωx} = + k=1 ⎪ 2 ⎪ ⎩ u (T −) + u (−T +) x = ±T. 2 In particolare, sotto le ipotesi del Teorema 5.3, in ogni punto x di continuità per u, la serie di Fourier di u converge a u (x). Convergenza uniforme. Un semplice criterio di convergenza uniforme segue dal test di Weierstras. Poiché |ak cos kωx + bk sin kωx| ≤ |ak | + |bk | si deduce che: se le serie numeriche
∞ |ak | k=1
e
∞ k=1
|bk |
sono convergenti, allora la serie di Fourier di u converge uniformemente in R, con somma u. D’altra parte, possiamo rifinire il Teorema 5.3 come segue. Teorema 5.4. Valgano per u le condizioni di Dirichlet in [−T, T ]. Allora: a) Se u è continua in [a, b] ⊂ (−T, T ), allora la sua serie di Fourier converge uniformemente in [a, b] ; b) Se u è continua in [−T, T ] e u (−T ) = u (T ), allora la sua serie di Fourier converge uniformemente in [−T, T ] (e quindi in R).
1.6 Domini regolari e Lipschitziani Avremo bisogno di classificare i domini Ω in Rn secondo il grado di regolarità della loro frontiera. Definizione 6.1. Diciamo che Ω è un dominio di classe C 1 se per ogni punto x ∈ ∂Ω, esistono un sistema di coordinate (y1 , y2 , ..., yn ) ≡ (y , yn ) con origine in x, una sfera B (x) e una funzione ϕ, definita in un intorno N ⊂ Rn−1 di y = 0 , tale che ϕ ∈ C 1 (N ) , ϕ (0 ) = 0 e 4
Poniamo f (x±) = limy→±x f (y).
1.6 Domini regolari e Lipschitziani
15
Figura 1.1. Un dominio C 1 e un dominio Lipschitziano
1. ∂Ω ∩ B (x) = {(y , yn ) : yn = ϕ (y ) , y ∈ N } ; 2. Ω ∩ B (x) = {(y , yn ) : yn > ϕ (y ) , y ∈ N } . La prima condizione esprime il fatto che ∂Ω coincide localmente con il grafico di una funzione di classe C 1 . La seconda richiede che Ω si trovi localmente da una sola parte rispetto alla frontiera. La frontiera di un dominio di classe C 1 non presenta angoli o spigoli e in ogni punto x ∈ ∂Ω è ben definito un iperpiano tangente (una retta se n = 2, un piano se n = 3), insieme ai due versori normali esterno ed interno. Inoltre, questi versori variano con continuità su ∂Ω. Le coppie (ϕ, N ) nella Definizione 6.1 sono dette carte locali. Se le ϕ sono tutte funzioni di classe C k , k ≥ 1, si dice che Ω è un dominio di classe C k . Se Ω è di classe C k per ogni k ≥ 1, si dice che è un dominio di classe C ∞ . A questi ultimi ci riferiamo con la locuzione domini regolari . Osserviamo che se Ω è limitato è possibile trovare una copertura di ∂Ω (che è un insieme compatto) costituita da un numero finito di sfere Bj = B (xj ), j = 1, ..., N , centrate in xj ∈ ∂Ω. La frontiera ∂Ω può essere dunque descritta tramite N carte locali (ϕj , Nj ). Considerata una carta locale (ϕj , Nj ), la trasformazione biunivoca z = Φj (y) data da z = y (1.14) zn = yn − ϕj (y ) trasforma Ω ∩Bj in un sottoinsieme aperto Uj del semispazio zn > 0 e ∂Ω ∩Bj in un sottoinsieme dell’iperpiano zn = 0, cosicché il suo effetto è di spianare ∂Ω ∩ Bj , come mostrato in Figura 1.2. In una gran parte delle applicazioni i domini rilevanti sono rettangoli, prismi, coni, cilindri o loro unioni. Molto importanti per esempio sono i domini ottenuti con procedure di triangolazione di domini regolari nei metodi di approssimazione numerica. Questi tipi di domini appartengono alla classe dei
16
1 Introduzione
Figura 1.2. Azione del diffeomorfismo (1.14) sulla frontiera ∂Ω
domini Lipschitziani, la cui frontiera coincide localmente col grafico di una funzione Lipschitziana. Definizione 6.2. Si dice che u : Ω → Rn è Lipschitziana con costante L, se |u (x) − u(y)| ≤ L |x − y| per ogni x, y ∈ Ω. Sostanzialmente, una funzione è Lipschitziana in Ω se i suoi rapporti incrementali lungo ogni direzione sono limitati. Tipiche funzioni reali Lipschitziane in Rn sono f (x) = |x| o, più generalmente, la funzione distanza da un insieme chiuso C, definita da f (x) = dist (x, C) = inf |x − y| . y∈C
Poiché il grafico di una funzione Lipschiziana può presentare angoli e/o spigoli, non ci si può aspettare l’esistenza di un iperpiano tangente in ogni suo punto. Tuttavia, l’insieme dei punti “irregolari” costituisce un insieme di misura nulla (secondo Lebesgue). Precisamente, vale il seguente teorema (si veda e.g. Evans and Gariepy, 1997): Teorema 6.1. (di Rademacher). Sia u una funzione Lipschitziana in Ω ⊆ Rn . Allora u è differenziabile in ogni punto di Ω, tranne che in un insieme di misura nulla (secondo Lebesgue). Diciamo allora che un dominio è Lipschitziano se nella Definizione 6.1 le funzioni ϕ sono Lipschitziane o, equivalentemente, se le trasformazioni (1.14) indotte dalle carte locali sono bi-Lipschitziane, ossia se Φ e Φ−1 sono Lipschitziane.
1.7 Formule di integrazione per parti Siano Ω ⊂ Rn un dominio limitato di classe C 1 e F : Ω → Rn , un campo vet 1 toriale di classe C Ω . Essendo F a valori in Rn , scriviamo F ∈ C 1 Ω; Rn . Vale la formula di Gauss o della divergenza: divF dx = F · ν dσ (1.15) Ω
∂Ω
1.7 Formule di integrazione per parti
17
n dove divF = j=1 ∂xj Fj indica la divergenza di F, ν denota il versore normale esterno a ∂Ω e dσ è la misura di “superficie” su ∂Ω. In termini di carte locali si ha: 2 dσ = 1 + |∇ϕ (y )| dy . Dalla (1.15) si possono dedurre alcune formule notevoli. Applicando la (1.15) a vF, con v ∈ C 1 Ω , e ricordando l’identità div(vF) = v divF + ∇v · F, otteniamo la seguente formula di integrazione per parti: v divF dx = vF · ν dσ − ∇v · F dx. Ω
∂Ω
(1.16)
Ω
Scegliendo F = ∇u, u ∈ C 2 (Ω) ∩ C 1 Ω , poiché div∇u = Δu e ∇u · ν = ∂ ν u, si ricava la seguente identità di Green: vΔu dx = v∂ν u dσ − ∇v · ∇u dx. (1.17) Ω
∂Ω
Ω
In particolare, la scelta v ≡ 1 dà Δu dx = Ω
∂ν u dσ.
(1.18)
∂Ω
Se anche v ∈ C 2 (Ω) ∩ C 1 Ω , scambiando i ruoli di u e v nella (1.17) e sottraendo membro a membro, deduciamo una seconda identità di Green: vΔu − uΔv dx = (v∂ν u − u∂ν v) dσ. (1.19) Ω
∂Ω
Nota 7.1. Tutte le formule in questa sezione valgono anche in domini Lipschitziani limitati. Infatti il Teorema di Rademacher implica che, in ogni punto della frontiera di un dominio Lipschitziano, tranne un insieme di punti di misura superficiale zero, esiste un iperpiano tangente, e quindi un versore normale esterno, ben definiti. Ciò è sufficiente per estendere le formule (1.16), (1.17) e (1.19) ai domini Lipschitziani.
2 Diffusione
2.1 L’equazione di diffusione 2.1.1 Introduzione e prime proprietà L’equazione di diffusione o del calore per una funzione u = u (x, t), x variabile reale spaziale, t variabile temporale, ha la forma ut − Duxx = f
(2.1)
dove D è una costante positiva che prende il nome di coefficiente di diffusione. In dimensione spaziale n > 1, cioè quando x ∈ Rn , l’equazione di diffusione è ut − DΔu = f
(2.2)
dove Δ indica l’operatore di Laplace: Δ=
n
∂xk xk .
k=1
La denominazione “equazione di diffusione o del calore” è dovuta al fatto che essa è soddisfatta dalla temperatura in un mezzo omogeneo e isotropo rispetto alla propagazione del calore; f rappresenta l’ “intensità” di una sorgente esogena di calore, distribuita nel mezzo. D’altra parte, le (2.1), (2.2) costituiscono modelli di diffusione molto più generali, dove per diffusione si intende, per esempio, il trasporto di materia dovuto al moto molecolare del mezzo in cui essa è immersa. In tal caso, la soluzione u potrebbe rappresentare la concentrazione di un soluto o di un inquinante oppure anche una densità di probabilità. In ultima analisi si potrebbe dire che l’equazione sintetizza e unifica sotto una scala macroscopica una molteplicità di fenomeni assai differenti tra loro se osservati in scala microscopica. Ci serviremo della (2.2) e di alcune varianti, come prototipo per esplorare la profonda connessione esistente tra alcuni modelli probabilistici e deterministici, secondo lo schema processi di diffusione → densità di probabilità → equazioni differenziali, Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
20
2 Diffusione
leggibile nei due sensi. La star indiscussa in questo genere di questioni è il moto Browniano, dal nome del botanico Brown che osservò, verso la metà del secolo scorso, il comportamento apparentemente caotico di particelle (pollini) sull’acqua, dovuto agli urti con le molecole in moto. Ad opera principalmente di Einstein e di Wiener, tale comportamento irregolare è stato inquadrato nella teoria dei processi stocastici e prende il nome di processo di Wiener o moto Browniano. In condizioni di equilibrio, cioè quando non c’è evoluzione nel tempo, la soluzione dell’equazione di diffusione soddisfa la versione stazionaria (D = 1) −Δu = f
(2.3)
(−uxx = f, in dimensione n = 1). La (2.3) si chiama equazione di Poisson o del potenziale. Se f = 0 si chiama equazione di Laplace e le sue soluzioni sono così importanti in così tanti campi da meritarsi il nome speciale di funzioni armoniche. L’operatore 1 Δ 2 è legato a filo doppio al moto Browniano 1 e infatti, cattura e sintetizza le caratteristiche microscopiche di quel processo. Come accennato nel primo capitolo, l’equazione di Poisson/Laplace non si presenta solo come versione stazionaria dell’equazione di diffusione e, data la sua importanza, ad essa è dedicato il prossimo capitolo. Se f ≡ 0, l’equazione (2.2) si dice omogenea e possiamo subito metterne in evidenza alcune semplici ma importanti proprietà. • Linearità e principio di sovrapposizione. Se u e v sono soluzioni e a, b scalari (reali o complessi), anche au+bv è soluzione. Più in generale, se uk (x,t) è soluzione di ut − DΔu = 0 per ogni valore (intero o reale) di k e g = g (k) è una funzione che si annulla abbastanza rapidamente all’infinito, allora ∞
uk (x,t) g (k)
+∞
e −∞
k=1
uk (x,t) g (k) dk
sono formalmente ancora soluzioni. • Cambio di direzione temporale. Sia u = u (x, t) una soluzione di ut − DΔu = 0. La funzione v(x,t) = u (x, −t) , ottenuta con il cambiamento di variabile t −→ −t, è soluzione dell’equazione aggiunta o backward: vt + DΔv = 0. 1
Nella teoria dei processi stocastici, Browniano.
1 Δ 2
costituisce il generatore infinitesimale del moto
2.1 L’equazione di diffusione
21
Coerentemente l’equazione originale è, a volte, denominata forward. La noninvarianza dell’equazione del calore rispetto ad un cambio di segno nel tempo segnala l’irreversibilità temporale dei fenomeni che essa descrive. Si noti invece che la trasformazione x −→ −x lascia invariata l’equazione: w(x,t) = u (−x, t) è soluzione di wt − DΔw = 0 (invarianza rispetto a riflessioni nello spazio). • Invarianza rispetto a traslazioni (nello spazio e nel tempo). Sia u = u (x, t) una soluzione di ut − DΔu = 0 in un dominio spazio-temporale Ω × (0, T ), dove Ω ⊆ Rn . La funzione v(x,t) = u (x − y, t − s) per y, s fissati, è ancora soluzione della stessa equazione, nel dominio traslato (y+Ω) × (s, s + T ). La verifica è immediata. Naturalmente, rispetto ad y ed s, la funzione u (x − y, t − s) è soluzione dell’equazione backward . • Invarianza rispetto a dilatazioni paraboliche. La trasformazione x −→ ax,
t −→ bt,
(a, b > 0)
rappresenta geometricamente una dilatazione/contrazione (precisamente un’ omotetia) del grafico di u. Cerchiamo condizioni sui coefficienti a, b, c affinché la funzione u∗ (x,t) = u (ax,bt) sia ancora soluzione dell’equazione (2.37). Abbiamo: u∗t (x,t) − DΔu∗ (x,t) = but (ax,bt) − a2 DΔu (ax,bt) e quindi u∗ è soluzione di (2.37) se b = a2 . Poiché il coefficiente di dilatazione temporale è il quadrato di quello spaziale, la trasformazione delle variabili indipendenti data da t −→ a2 t
x −→ ax,
(a, b > 0)
prende il nome di dilatazione parabolica (di rapporto a). Le dilatazioni paraboliche lasciano invariati i blocchi 2
|x| t
oppure
x √ t
e non è quindi sorprendente che tale combinazione di variabili compaia frequentemente nello studio dei fenomeni di diffusione. 2.1.2 La conduzione del calore Il calore è una forma di energia che frequentemente conviene considerare isolata da altre forme. Per ragioni storiche, si usa come unità di misura la caloria,
22
2 Diffusione
che corrisponde a 4.182 joules. Vogliamo derivare un modello matematico per la conduzione del calore in un corpo rigido. Assumiamo che il corpo rigido sia omogeneo ed isotropo, con densità costante ρ e che possa ricevere energia da una sorgente esogena (per esempio, dal passaggio di corrente elettrica o da una reazione chimica oppure dal calore prodotto per assorbimento o irraggiamento dall’esterno). Indichiamo con r il tasso di calore per unità di massa fornito al corpo dall’esterno 2 . Poiché il calore è una forma di energia, è naturale usare la relativa legge di conservazione che possiamo formulare nel modo seguente: Sia V un elemento arbitrario di volume all’interno del corpo rigido. Il tasso di variazione dell’energia interna in V eguaglia il flusso di calore attraverso il bordo ∂V di V , dovuto alla conduzione, più quello dovuto alla sorgente esterna. Se indichiamo con e = e (x, t) l’energia interna per unità di massa, la quantità di energia interna in V è data da eρ dx V 3
cosicché il suo tasso di variazione è d eρ dx = et ρ dx. dt V V Indichiamo il vettore flusso di calore 4 con q. Questo vettore assegna la direzione del flusso di calore e la sua velocità per unità di area. Precisamente, se dσ è un elemento d’area contenuto in ∂V con versore normale esterno ν, q · νdσ è la velocità con la quale l’energia fluisce attraverso dσ e quindi il flusso di calore entrante attraverso ∂V è dato da − q · ν dσ = − divq dx. ∂V
(Teorema di Gauss)
V
Infine, il contributo dovuto alla sorgente esterna è uguale a rρ dx. V
Il bilancio dell’energia richiede dunque: et ρ dx = − divq dx + rρ dx. V
V
(2.4)
V
L’arbitrarietà di V permette di convertire l’equazione integrale (2.4) nell’equazione et ρ = − divq + rρ (2.5) 2 3 4
Le dimensioni di r sono: [r] = cal × tempo−1 × massa−1 . Assumendo di poter derivare sotto il segno di integrale. [q] = cal × lunghezza−2 × tempo−1 .
2.1 L’equazione di diffusione
23
che costituisce la legge fondamentale della conduzione del calore. Poiché e e q sono incognite occorrono leggi costitutive per queste quantità. Assumiamo le seguenti: • legge di Fourier per la conduzione del calore; in condizioni “normali”, il flusso è proporzionale al gradiente di temperatura: q = −κ∇θ
(2.6)
dove θ è la temperatura assoluta e κ > 0, conduttività termica 5 , è legata alle proprietà del materiale. Il segno meno tiene conto del fatto che il calore fluisce verso regioni dove la temperatura è minore. In generale, κ può dipendere da θ, ma in molti casi concreti la sua variazione è trascurabile. Qui la consideriamo costante per cui divq = −κΔθ. (2.7) • L’energia interna è proporzionale alla temperatura assoluta e = cv θ
(2.8)
ove cv è il calore specifico 6 (a volume costante) del materiale. Anche cv , nei casi concreti più comuni, può essere considerato costante. Tenuto conto di queste leggi, la (2.5) diventa θt =
κ 1 Δθ + r cv cv
che è l’equazione di diffusione con D = κ/ (cv ) e f = r/cv . Nel coefficiente D è sintetizzata la risposta termica del materiale. 2.1.3 Problemi ben posti (n = 1) Come abbiamo accennato nel primo capitolo, per ottenere un problema ben posto in un modello matematico occorrono ulteriori informazioni. Quali sono i problemi ben posti per l’equazione di diffusione? Cominciamo in dimensione (spaziale) n = 1. Consideriamo l’evoluzione della temperatura u di una sbarra cilindrica con sezione di area A e di lunghezza L molto superiore al raggio della sezione, isolata termicamente ai lati. Sebbene la sbarra sia tridimensionale, possiamo assumere che il calore fluisca solo lungo l’asse del cilindro e che sia distribuito uniformemente in ogni sezione della sbarra. Possiamo dunque adottare un modello unidimensionale, identificando la sbarra con un segmento del tipo 0 ≤ x ≤ L e assumere che e = e (x, t) , r = r (x, t), con 0 ≤ x ≤ L. Coerentemente, u = u (x, t) e le relazioni costitutive (2.6) e (2.8) diventano e (x, t) = cv u (x, t) , 5 6
[κ] = cal × grado−1 × tempo−1 × lunghezza−1 . [cv ] = cal × grado−1 × massa−1 .
q = −κux i.
24
2 Diffusione
Scegliendo V = A × [x, x + Δx] in (2.4), l’area A della sezione si semplifica e otteniamo x+Δx x+Δx x+Δx cv ρut dx = κuxx dx+ rρ dx x
x
x
che dà per u l’equazione unidimensionale ut − Duxx = f. Vogliamo studiare l’evoluzione della temperatura in un intervallo di tempo, diciamo da t = 0 fino a t = T . È allora ragionevole precisare qual è la distribuzione iniziale: diverse configurazioni iniziali corrisponderanno, in generale, a differenti evoluzioni della temperatura lungo la sbarra. Occorre dunque assegnare il dato iniziale (o di Cauchy) u (x, 0). Questo però non è sufficiente; è necessario tener conto di come la sbarra interagisce con l’ambiente circostante; per convincersene, basti pensare al fatto che, partendo da una data configurazione iniziale, potremmo influire sull’evoluzione di u controllando ciò che succede agli estremi della sbarra; un modo per farlo è, per esempio, usare un termostato per mantenere la temperatura al livello desiderato. Ciò equivale ad assegnare u (0, t) = h1 (t) , u (L, t) = h2 (t)
t ∈ (0, T ],
(2.9)
che si chiamano condizioni di Dirichlet. Anziché la temperatura, si può controllare il flusso di calore uscente/entrante dagli estremi. Adottando sempre la legge di Fourier, si ha: flusso di calore entrante in x = 0 : −κux (0, t) , flusso di calore entrante in x = L : κux (L, t) dove κ > 0 è la costante di conduttività termica. Controllare il flusso agli estremi corrisponde dunque ad assegnare −ux (0, t) = h1 (t) , ux (L, t) = h2 (t)
t ∈ (0, T ],
(2.10)
che si chiamano condizioni di Neumann. Può presentarsi il caso in cui occorra assegnare condizioni miste: in un estremo una condizione di Dirichlet, nell’altro una di Neumann. In altre situazioni è appropriata una condizione di radiazione (o di Robin) in uno o in entrambi gli estremi. Supponiamo che il mezzo circostante sia tenuto alla temperatura U e che il flusso di calore entrante attraverso un estremo, per esempio x = L, sia proporzionale alla differenza U − u, cioè7 κux (L, t) = γ(U − u (L, t)) 7
t ∈ (0, T ]
(2.11)
La formula (2.11) è basata sulla legge (lineare) di raffreddamento di Newton : la perdita di calore dalla superficie di un corpo è funzione lineare della differenza di temperatura U −u dall’ambiente esterno alla superficie. Rappresenta una buona approssimazione della perdita di calore irradiato da un corpo quando |U − u| /u 1.
2.1 L’equazione di diffusione
25
dove γ > 0. Ponendo α = γ/κ > 0 e β = γU/κ la condizione di Robin in x = L si scrive ux (L, t) + αu (L, t) = β t ∈ (0, T ]. (2.12) Le condizioni agli estremi (2.9), (2.10), (2.12) e miste, sono fra le più usate e i problemi ad esse associati ne ereditano il nome. Riassumendo, abbiamo i seguenti tipi di problemi: dati f = f (x, t) (sorgente esterna) e g = g (x) (dato iniziale o di Cauchy), determinare u = u (x, t) tale che ⎧ 0 < x < L, 0 < t < T ⎪ ⎨ ut − Duxx = f u (x, 0) = g (x) 0≤x≤L ⎪ ⎩ + condizioni agli estremi 0 < t < T dove le condizioni agli estremi possono essere le seguenti: • di Dirichlet: u (0, t) = h1 (t) , u (L, t) = h2 (t) , • di Neumann: −ux (0, t) = h1 (t) , ux (L, t) = h2 (t) , • di radiazione o di Robin: −ux (0, t) + αu (0, t) = h1 (t) , ux (L, t) + αu (L, t) = h2 (t)
(α > 0) .
Coerentemente, abbiamo i problemi di Cauchy-Dirichlet, Cauchy-Neumann e così via. Quando h1 = h2 = 0, diciamo che le condizioni al bordo sono omogenee. Frontiera parabolica. Notiamo espressamente che nessuna condizione finale (per t = T ) è assegnata. Le condizioni sono assegnate solo sulla cosiddetta frontiera parabolica del cilindro QT , indicata con ∂p QT e data dall’unione della base [0, L] × {t = 0} e della parte laterale costituita dai punti (0, t) e (L, t) con 0 < t ≤ T (Figura 2.1). In importanti applicazioni, come per esempio alla Finanza Matematica, si presenta il caso in cui x varia in insiemi illimitati, tipicamente intervalli del tipo (0, ∞) o anche tutto R, che corrisponderebbe al caso di una sbarra ideale, infinita. In questi casi occorre richiedere che la soluzione non diverga all’infinito troppo rapidamente. Vedremo condizioni precise più avanti. Abbiamo dunque il • Problema di Cauchy globale ⎧ x ∈ R, 0 < t < T ⎪ ⎨ ut − Duxx = f u (x, 0) = g (x) x∈R ⎪ ⎩ + condizioni per x → ±∞.
26
2 Diffusione
Figura 2.1. La frontiera parabolica di QT
2.1.4 Un esempio elementare. Il metodo di separazione delle variabili Dimostreremo che, sotto ipotesi non troppo onerose sui dati, i problemi considerati sopra sono ben posti, cioè la soluzione esiste, è unica e dipende con continuità dai dati. A volte ciò si può fare con metodi elementari, come quello di separazione delle variabili, che presentiamo servendoci di un semplice esempio di conduzione del calore. Consideriamo la situazione seguente. Una sbarra (che consideriamo unidimensionale) di lunghezza L è tenuta inizialmente a temperatura θ0 . Successivamente, l’estremo x = 0 è mantenuto alla stessa temperatura, mentre l’estremo x = L viene mantenuto ad una temperatura costante θ 1 > θ 0 . Vogliamo sapere come evolve la temperatura. Prima di fare calcoli, proviamo a congetturare che cosa può succedere. Dato che θ1 > θ 0 , dall’estremo caldo comincerà a fluire calore causando un aumento della temperatura all’interno e una fuoruscita di calore dall’estremo freddo. All’inizio, il flusso entrante sarà superiore al flusso uscente, ma col tempo, con l’aumento di temperatura all’interno, esso comincerà a diminuire, mentre il flusso uscente aumenterà. Ci si aspetta che prima o poi i due flussi si bilancino e si assesteranno su una situazione stazionaria. Sarebbe poi interessante avere informazioni sul tempo d’assestamento. Cerchiamo ora di dimostrare che questo è esattamente il comportamento che il nostro modello matematico riproduce. Il problema è: θt − Dθxx = 0
t > 0, 0 < x < L
con le condizioni θ (x, 0) = θ0 θ (0, t) = θ0 , θ (L, t) = θ1
0≤x≤L t > 0.
Poiché siamo interessati al comportamento a regime della soluzione, lasciamo t illimitato. Non lasciamoci impressionare dal fatto che il dato iniziale non si
2.1 L’equazione di diffusione
27
raccordi con continuità con quello laterale all’estremo x = L; vedremo dopo che cosa ciò comporti. • Variabili adimensionali. Conviene riformulare il problema passando a variabili adimensionali, riducendo contemporaneamente i dati a 0 e 1. A tale scopo, occorre riscalare spazio, tempo e temperatura rispetto a grandezze caratteristiche del problema. Per la variabile spaziale è facile. Una grandezza caratteristica è la lunghezza della sbarra. Poniamo quindi y=
x L
che è ovviamente una grandezza adimensionale, essendo rapporto di lunghezze. Notiamo che 0 ≤ y ≤ 1. Come riscalare il tempo? Osserviamo che le dimensioni di D sono lunghezza2 × tempo−1 . 2
La costante τ = LD ha dunque le dimensioni di un tempo ed è indubbiamente legata alle caratteristiche del problema. Introduciamo perciò il tempo adimensionale t s= . τ Poniamo infine θ (Ly, τ s) − θ0 u (y, s) = . θ1 − θ0 Risulta θ (Ly, 0) − θ0 = 0, 0 ≤ y ≤ 1 θ1 − θ0 θ (0, τ s) − θ0 θ (L, τ s) − θ0 u (0, s) = = 0, u (1, s) = = 1. θ1 − θ0 θ1 − θ0
u (y, 0) =
Inoltre, ∂t L2 θt = τ θt = θt ∂s D 2 ∂x = θxx = L2 θxx ∂y
(θ1 − θ0 )us = (θ1 − θ0 )uyy per cui, essendo θt = Dθxx , (θ1 − θ0 )(us − uyy ) =
L2 L2 θt − L2 θxx = Dθ xx − L2 θxx = 0. D D
Riassumendo, si ha us − uyy = 0
(2.13)
28
2 Diffusione
con le condizioni u (y, 0) = 0 e u (0, s) = 0,
u (1, s) = 1.
(2.14)
Osserviamo che nella formulazione adimensionale i parametri L e D non compaiono, evidenziando la struttura matematica del problema. D’altro canto, vedremo più avanti l’utilità dell’adimensionalizzazione nella modellistica. • La solutione stazionaria. Cominciamo a determinare la soluzione stazionaria uSt , che si dimentica della condizione iniziale e soddisfa l’equazione uyy = 0, oltre alle condizioni (2.14). Si trova immediatamente la retta uSt (y) = y. Tornando alle variabili originali, la soluzione stazionaria è θSt (x) = θ0 + (θ1 − θ0 )
x L
che corrisponde ad un flusso uniforme di calore lungo la sbarra, dato dalla legge di Fourier: flusso di calore = −κθx = −κ
(θ1 − θ0 ) . L
• Il regime transitorio. Conviene a questo punto porre U (y, s) = uSt (y, s) − u (y, s) = y − u (y, s) . U rappresenta il regime transitorio che ci aspettiamo tenda a zero per s → +∞. La velocità di convergenza a zero di U dà informazioni sul tempo che la temperatura impiega ad assestarsi sulla posizione di equilibrio uSt . U soddisfa l’equazione (2.13) con la condizione iniziale U (y, 0) = y
0
(2.15)
e le condizioni di Dirichlet omogenee U (0, s) = 0
e
U (1, s) = 0
s > 0.
(2.16)
• Separazione delle variabili . Cerchiamo ora una formula esplicita per U , usando, come abbiamo anticipato, il metodo di separazione delle variabili. L’idea è di sfruttare la natura lineare del problema costruendo la soluzione mediante sovrapposizione di soluzioni della forma w (s) v (y) in cui le variabili s e y si presentano separate. Sottolineiamo che è essenziale avere condizioni agli estremi omogenee. Passo 1. Si comincia a cercare soluzioni della (2.13) nella forma U (y, s) = w (s) v (y)
2.1 L’equazione di diffusione
29
con v (0) = v (1) = 0. Sostituendo, si trova 0 = Us − Uyy = w (s) v (y) − w (s) v (y) da cui, separando le variabili, w (s) v (y) = . w (s) v (y)
(2.17)
Ora, la (2.17) è un’identità, valida per ogni s > 0 ed ogni y ∈ (0, 1). Essendo il primo membro funzione solo della variabile s ed il secondo funzione solo della variabile y, l’identità è possibile unicamente nel caso in cui entrambi i membri siano uguali ad una costante comune, diciamo λ. Abbiamo, dunque, v (y) − λv (y) = 0
(2.18)
v (0) = v (1) = 0
(2.19)
w (s) − λw (s) = 0.
(2.20)
con e
Passo 2. Risolviamo prima il problema (2.18), (2.19). Vi sono tre possibili forme dell’integrale generale di (2.18). a) Se λ = 0, v (y) = A + By (A, B constanti arbitrarie) e le condizioni (2.19) implicano A = B = 0. b) Se λ è positivo, diciamo λ = μ2 > 0, allora v (y) = Ae−μy + Beμy e ancora le condizioni (2.19) implicano A = B = 0. c) Se infine λ = −μ2 < 0, allora v (y) = A sin μy + B cos μy. Imponendo le condizioni (2.19), si trova v (0) = B = 0, v (1) = A sin μ + B cos μ = 0 da cui A arbitrario, B = 0, μ = mπ, m = 1, 2, ... . Solo il terzo caso produce soluzioni non nulle del tipo vm (y) = A sin mπy. Problemi come (2.18), (2.19) si chiamano problemi agli autovalori . I valori μm si chiamano autovalori e le soluzioni vm sono le corrispondenti autofunzioni .
30
2 Diffusione
Con i valori λ = −μ2 = −m2 π 2 , la (2.20) ha come integrale generale, 2
wm (s) = Ce−m
π2 s
(C costante arbitraria).
Otteniamo così soluzioni della forma 2
Um (y, s) = Am e−m
π2 s
sin mπy.
Passo 3. Nessuna tra le soluzioni Um soddisfa la condizione iniziale U (y, 0) = y. Come abbiamo già accennato, cerchiamo di costruire la soluzione desiderata sovrapponendo le infinite soluzioni Um mediante la formula U (y, s) =
∞
2
Am e−m
π2 s
sin mπy.
m=1
Si presentano spontaneamente tre questioni. Q1. La condizione iniziale impone U (y, 0) =
∞
Am sin mπy = y
per 0 ≤ y ≤ 1.
(2.21)
m=1
È possibile scegliere le costanti Am in modo che la (2.21) sia verificata? In quale senso U soddisfa la condizione iniziale? Per esempio, è vero che U (x, s) → y
se
(x, s) → (y, 0)?
Q2. Ogni singola funzione Um è soluzione dell’equazione del calore, ma lo sarà anche U ? Per verificarlo occorrerebbe poter differenziare sotto il segno di somma cosicché: (∂s − ∂yy )U (y, s) =
∞
(∂s − ∂yy )Um (y, s) = 0.
(2.22)
m=1
E le condizioni agli estremi? Q3. Anche supponendo che tutto vada bene, siamo sicuri che U sia l’unica soluzione del problema e quindi descriva senza ombra di dubbio l’evoluzione della temperatura? Q1. La questione 1 è di carattere molto generale e riguarda la possibilità di sviluppare una funzione in serie di Fourier ed in particolare la funzione f (y) = y, nell’intervallo (0, 1). Per via delle condizioni di Dirichlet omogenee agli estremi è naturale sviluppare f (y) = y con una serie di soli seni , ossia sviluppare la funzione dispari, periodica di periodo 2, che coincide con y nell’intervallo [0, 1]. I coefficienti di Fourier si calcolano con la formula 1 1 2 2 y sin kπy dy = − [y cos kπy]10 + cos kπy dy = Ak = 2 kπ kπ 0 0 cos kπ k+1 2 = −2 = (−1) . kπ kπ
2.1 L’equazione di diffusione
31
Lo sviluppo di f (y) = y è, dunque: y=
∞
2 sin mπy. mπ
m+1
(−1)
m=1
(2.23)
Dove è valido lo sviluppo (2.23)? Si vede subito che in y = 1 non può essere vero, in quanto sin mπ = 0 per ogni m e si otterrebbe 1 = 0. La teoria delle serie di Fourier implica che lo sviluppo (2.23) è valido nell’intervallo (−1, 1), mentre agli estremi la serie è ovviamente nulla. Inoltre, la serie converge uniformemente in ogni intervallo [a, b] ⊂ (−1, 1). L’uguaglianza (2.23) vale anche in media quadratica (o nel senso della convergenza in L2 (0, 1)), cioè nel senso che
1 0
[y −
N
(−1)
m+1
m=1
2 sin mπy]2 dy → 0 mπ
per N → +∞.
In conclusione, la nostra (per ora solo candidata) soluzione è U (y, s) =
∞
(−1)
m+1
m=1
2 −m2 π2 s e sin mπy. mπ
(2.24)
Controlliamo che il dato iniziale è assunto in media quadratica, ossia che 1 [U (y, s) − y]2 dy = 0. (2.25) lim s→0
0
Infatti, dall’uguaglianza di Bessel, possiamo scrivere 2 −m2 π 2 s 1 ∞ − 1 e
4 2 [U (y, s) − y] dy = 2 . π m2 0 m=1 Ora, per s ≥ 0, si ha
2
e−m
π2 s
(2.26)
2
−1
1 ≤ 2 m m2 e la serie 1/m2 è convergente. Per il test di Weierstrass, segue che la serie (2.26) converge uniformemente in [0, ∞) e che possiamo passare al limite per s → 0+ sotto il segno di somma, ottenendo (2.25). Un pò più delicato è mostrare8 che U (x, s) → y se (x, s) → (y, 0), con l’unica eccezione del punto y = 1, dove, del resto, già i dati non si raccordano con continuità. Q2. L’espressione di U è abbastanza confortante: è una sovrapposizione di vibrazioni sinusoidali di frequenza m sempre maggiore e di ampiezza fortemente attenuata dalla presenza dell’esponenziale, almeno per s > 0. Infatti, 8
Omettiamo la dimostrazione, un po’ troppo tecnica.
32
2 Diffusione
la rapida convergenza a zero del termine generale della serie (2.24) e delle sue derivate di qualunque ordine, sia rispetto al tempo, sia rispetto allo spazio, permette di scambiare le operazioni di derivazione con quella di somma. Precisamente, abbiamo: 2 2 ∂Um m+2 2mπe−m π s sin mπy, = (−1) ∂s 2 2 ∂ 2 Um m+2 = (−1) 2e−m π s sin mπy ∂y 2
e quindi, se s ≥ s0 > 0, ∂Um −m2 π 2 s0 , ∂s ≤ 2mπe Poiché la serie numerica
∞
2 ∂ Um −m2 π 2 s0 . ∂y 2 ≤ 2mπe
2
me−m
π 2 s0
m=1
è convergente, concludiamo ancoraper il test di Weierstrass che le serie ∞
∂Um e ∂s m=1
∞
∂ 2 Um ∂y 2 m=1
convergono uniformemente in [0, 1] × [s0 , ∞), cosicché la (2.22) è corretta e U è una soluzione della (2.13). Rimangono da verificare le condizioni di Dirichlet: se s0 > 0, U (z, s) → 0 per (z, s) → (0, s0 ) oppure (z, s) → (L, s0 ) . Ciò è vero poiché, sempre per la convergenza uniforme della serie (2.24), possiamo passare al limite sotto il segno di somma in ogni regione [0, L]×(b, +∞) con b > 0. Per la stessa ragione, U ha derivate continue di ogni ordine, fino alla frontiera laterale della striscia [0, L] × (b, +∞). Sottolineiamo che la soluzione s’è “dimenticata” immediatamente della discontinuità iniziale. Q3. Per mostrare che U è l’unica soluzione seguiamo un metodo detto “dell’energia”, che svilupperemo in seguito in contesti molto più generali. Moltiplichiamo per u l’equazione us − uyy = 0 e integriamo rispetto ad y sull’intervallo [0, 1], mantenendo s > 0, fissato; si trova: 1 1 uus dx − uuyy dy = 0. (2.27) 0
0
2.1 L’equazione di diffusione
33
Osserviamo ora che 1 1 1 1 2 1 d uus dx = ∂s u dy = u2 dy 2 0 2 ds 0 0 mentre, integrando per parti, 1 uuyy dy = [u (1, s) uy (1, s) − u (0, s) uy (0, s)] − 0
1 0
2
(uy ) dy.
La (2.27) è allora equivalente a 1 1 1 d 2 2 u dy = [u (1, s) uy (1, s) − u (0, s) uy (0, s)] − (uy ) dy. 2 ds 0 0
(2.28)
Se ora u e v sono soluzioni del nostro problema di Cauchy-Dirichlet, cioè con gli stessi dati iniziali e al bordo, la differenza w = u − v è soluzione dell’equazione ws − wyy = 0 con dati iniziali e al bordo nulli. Applicando la (2.28) a w, si trova 1 1 1 d 2 w2 dy = − (wy ) dy ≤ 0 (2.29) 2 ds 0 0 essendo w (L, s) wy (L, s) − w (0, s) wy (0, s) = 0. La (2.29) indica che la funzione non negativa 1 w2 (y, s) dy E (s) = 0
ha derivata minore o uguale a zero e perciò è decrescente. Ma dalla (2.25) applicata a w, che ha dato iniziale nullo, segue che E (s) → 0
se s → 0+
e quindi si deduce che E (s) = 0, per ogni s > 0. Essendo w2 (y, s) continua e non negativa se s > 0, deve essere w = 0 per ogni s > 0, che significa u = v. • Ritorno alle origini . Ritornando al problema di partenza, la soluzione nelle variabili originali risulta θ (x, t) = θ0 + (θ1 − θ0 )
∞
−m2 π 2 D x mπ m+1 2 − (θ1 − θ0 ) e L2 t sin x. (−1) L mπ L m=1
Dalla formula per la soluzione troviamo conferma della congettura sull’evoluzione della temperatura, fatta all’inizio. Infatti, tutti i termini della serie convergono a zero esponenzialmente per t → +∞ e quindi è facile dimostrare che, a regime, la temperatura si assesta, almeno in media quadratica, sulla soluzione stazionaria: x θ (x, t) → θ0 + (θ1 − θ0 ) t → +∞. L
34
2 Diffusione
4 3 2 1 1
0.8
0.6
0.4
0.2
0
0
0.2
t
0.4
0.6
0.8
1
x
Figura 2.2. La soluzione del problema (2.13), (2.14)
Non solo. Dei vari termini della serie, il primo (m = 1) è quello che decade più lentamente e perciò, coll’andar del tempo, è quello che determina la deviazione dall’equilibrio, indipendentemente dalla condizione iniziale. Questo termine è 2 −π22D t π sin x e L π L −π 2 D
e ha un andamento sinusoidale smorzato, di ampiezza massima π2 e L2 t . In un 2 tempo t dell’ordine di L2 /4D tale ampiezza è minore di e−π /4 , circa l’ 8% del suo valore iniziale. Questo semplice calcolo fornisce l’importante informazione che, per raggiungere lo stato di equilibrio, ci vuole un tempo dell’ordine di grandezza di L2 /D. Non a caso, il fattore di scala del tempo adimensionale τ era esattamente L2 /D. La formulazione adimensionale, oltre che semplificare i calcoli, è estremamente utile nel fare predizioni usando modelli sperimentali. Per avere risultati attendibili, questi modelli devono riprodurre le stesse caratteristiche a scale differenti. Per esempio, se la nostra sbarra fosse un modello sperimentale di una trave molto più grande, lunga L0 , con coefficiente di diffusione D0 , per avere gli stessi effetti temporali di diffusione del calore, occorre sce2 L2 gliere materiale (D) e lunghezza (L) in modo che LD = D00 . In Figura 2.2: la soluzione del problema (2.13), (2.14) per 0 < t ≤ 1. 2.1.5 Problemi in dimensione n > 1 Ragioniamo ora in dimensione spaziale n generica, appoggiando l’intuizione sui casi n = 2 o n = 3. Supponiamo di voler determinare l’evoluzione della temperatura in un corpo conduttore del calore, che occupi nello spazio un dominio9 Ω limitato, nell’intervallo di tempo [0, T ]. Sotto le ipotesi della Sezione 9
Ricordiamo che dominio significa aperto connesso in Rn . Occorre naturalmente evitare confusioni con la definizione di dominio di una funzione, che può essere un insieme qualunque.
2.1 L’equazione di diffusione
35
1.2, la temperatura sarà una funzione u = u (x,t), che soddisfa l’equazione del calore ut − DΔu = f nel cilindro spazio-temporale QT = Ω × (0, T ) . Per determinarla univocamente occorre assegnare prima di tutto la sua distribuzione iniziale u (x, 0) = g (x) x ∈ Ω, dove, ricordiamo, Ω = Ω ∪ ∂Ω indica la chiusura of Ω. Il controllo dell’interazione con l’ambiente circostante si modella mediante opportune condizioni sul bordo ∂Ω. Le più comuni sono le seguenti. Condizione di Dirichlet. La temperatura è mantenuta in ogni punto di ∂Ω ad un livello assegnato; in formule ciò si traduce nell’assegnare u (σ, t) = h (σ,t)
σ ∈ ∂Ω and t ∈ (0, T ].
Condizione di Neumann. Si assegna il flusso di calore entrante/uscente attraverso ∂Ω, che supponiamo essere una curva o una superficie “liscia”, ossia dotata di retta o piano tangente in ogni suo punto 10 . Per esprimere questa condizione, indichiamo con ν = ν (σ) il versore normale al piano tangente a ∂Ω nel punto σ, orientato esternamente a Ω. Dalla legge di Fourier abbiamo q = flusso di calore = −κ∇u per cui il flusso entrante è −q · ν = κ∇u · ν = κ∂ν u. Di conseguenza, la condizione di Neumann equivale ad assegnare la derivata normale ∂ν u (σ, t) , per ogni σ ∈ ∂Ω e t ∈ [0, T ]: ∂ν u (σ, t) = h (σ,t)
σ ∈ ∂Ω and t ∈ (0, T ].
Condizione di radiazione o di Robin. Il flusso (per esempio entrante) attraverso ∂Ω dipende linearmente dalla differenza 11 U − u: −q · ν = γ (U − u)
(γ > 0)
dove U è la temperatura ambiente. Dalla legge di Fourier si ottiene ∂ν u + αu = β
su ∂Ω
con α = γ/κ > 0, β = γU/κ. 10
11
Ossia Ω è un dominio di classe C 1 secondo la Definizione 1.6.1. Possiamo anche ammettere alcuni punti angolosi, come nel caso di un un cono, e anche qualche spigolo, come nel caso di un cubo ed in generale anche i domini Lipschitziani (Sezione 1.6). Legge (lineare) del raffreddamento di Newton.
36
2 Diffusione
Condizioni miste. La frontiera di Ω è scomposta in varie parti, su ciascuna delle quali è assegnata una diversa condizione. Per esempio, per una formulazione del problema misto Dirichlet-Neumann consideriamo due sottoinsiemi non vuoti e disgiunti ∂D Ω e ∂N Ω di ∂Ω, relativamente aperti in Ω (Sezione 1.4), tali che ∂Ω = ∂D Ω ∪ ∂N Ω. Assegniamo poi u = h1 su ∂D Ω × (0, T ] ∂ν u = h2 su ∂N Ω × (0, T ]. Riassumendo, abbiamo i seguenti tipi di problemi: dati f = f (x, t) e g = g (x), determinare u = u (x, t) tale che ⎧ in QT ⎪ ⎨ ut − DΔu = f u (x, 0) = g (x) in Ω ⎪ ⎩ + condizioni al bordo su ∂Ω × (0, T ] dove le condizioni al bordo possono essere le seguenti: • Dirichlet u = h, • Neumann ∂ν u = h, • radiazione o Robin ∂ν u + αu = β
(α > 0) ,
• miste (Dirichlet/Neumann) u = h1 su ∂D Ω,
∂ν u = h2 su ∂N Ω.
In dimensione n > 1, importanti applicazioni fanno intervenire domini illimitati di vario tipo. Un esempio tipico è il problema di Cauchy globale: x ∈ Rn , 0 < t < T ut − DΔu = f u (x, 0) = g (x) x ∈ Rn a cui va aggiunta una condizione per |x| → ∞. Frontiera parabolica. Notiamo ancora espressamente che nessuna condizione finale (per t = T , x ∈Ω) è assegnata. Le condizioni sono assegnate solo sulla cosiddetta frontiera parabolica del cilindro QT , data dall’unione della base Ω × {t = 0} e della parte laterale ST = ∂Ω × (0, T ]: ∂p QT = Ω × {t = 0} ∪ ST .
2.2 Principi di massimo e questioni di unicità
37
2.2 Principi di massimo e questioni di unicità Il fatto che il calore fluisca sempre verso regioni dove la temperatura è più bassa ha come conseguenza che una soluzione dell’equazione omogenea del calore assume massimi e minimi globali sulla frontiera parabolica ∂p QT . Questo risultato è noto come principio di massimo. Inoltre, l’equazione risente dell’irreversibilità temporale nel senso che il futuro è influenzato dal passato ma non viceversa (principio di causalità ). In altri termini, il valore di una soluzione u al tempo t è indipendente da ogni cambiamento nei dati dopo t. In termini matematici, abbiamo il seguente teorema, che vale per funzioni continue fino al bordo del cilindro, con derivata prima temporale e derivate seconde rispetto alle variabili spaziali continue nell’interno di QT . Indichiamo questa classe di funzioni col simbolo C 2,1 (QT ) ∩ C QT . Teorema 2.1. Sia w ∈ C 2,1 (QT ) ∩ C QT tale che wt − DΔw = q ≤ 0
(risp. ≥ 0) in QT .
(2.30)
Allora il massimo (risp. minimo) di w è assunto sulla frontiera parabolica ∂p QT di QT : max w = max w QT
∂p QT
(risp. min w = min w). QT
∂p QT
In particolare, se w è negativa (risp. positiva) su ∂p QT , allora è negativa (risp. positiva) in tutto QT . Dimostrazione. Ricordiamo che la frontiera parabolica è costituita dai punti sulla base del cilindro QT e da quelli sulla parte laterale. Sia q ≤ 0. La dimostrazione nell’altro caso è analoga. Distinguiamo due passi. Passo 1. Sia ε > 0 tale che T − ε > 0. Dimostriamo che max w ≤ max w + εT .
QT −ε
∂p QT
(2.31)
Poniamo u = w − εt. Allora ut − DΔu = q − ε < 0
(2.32)
e il massimo di u in QT −ε è assunto in un punto di ∂p QT −ε . Infatti, supponiamo che ciò non sia vero. Allora esiste un punto (x0 , t0 ), x0 ∈ Ω, 0 < t0 ≤ T −ε, tale che u (x0 , t0 ) è il massimo di u in QT −ε . Ma allora, essendo uxj xj (x0 , t0 ) ≤ 0 per ogni j = 1, ..., n, si avrebbe Δu (x0 , t0 ) ≤ 0 mentre ut (x0 , t0 ) = 0
se t0 < T − ε
ut (x0 , t0 ) ≥ 0
se t0 = T − ε.
oppure
38
2 Diffusione
In ogni caso si avrebbe ut (x0 , t0 ) − DΔu (x0 , t0 ) ≥ 0, incompatibile con (2.32). Pertanto, max u = max u ∂p QT −ε
QT −ε
ed essendo u ≤ w, si ha
max u ≤ max w.
∂p QT −ε
∂p QT
D’altra parte, w ≤ u + εT in QT e quindi max w ≤ max u + εT ≤ max w + εT ∂p QT −ε
QT −ε
∂p QT
(2.33)
che è la (2.31). Passo 2. Poiché w è continua in QT , deduciamo che (controllare) max w → max w
QT −ε
QT
per ε → 0.
Passando allora al limite per ε → 0 nella (2.31) si ricava max w ≤ max w ∂p QT
QT
che conclude la dimostrazione. Definizione 2.1. Le funzioni tali che wt − DΔw ≤ 0 (risp. ≥ 0) si chiamano sottosoluzioni (risp. soprasoluzioni) dell’equazione del calore. Come conseguenza immediata del Teorema 2.1 abbiamo che (Problema 2.4): se in QT (2.34) wt − DΔw = 0 il massimo ed il minimo di w sono assunti sulla frontiera parabolica ∂p QT di QT . In particolare min w ≤ w (x,t) ≤ max w
∂p QT
∂p QT
per ogni (x,t) ∈ QT .
Inoltre (per la dimostrazione si veda il Problema 2.5): Corollario 2.2 (Confronto, unicità e stabilità. di Cauchy Problema Dirichlet). Siano v e w soluzioni in C 2,1 (QT ) ∩ C QT di vt − DΔvt = f1
e
wt − DΔw = f2
rispettivamente, con f1 , f2 limitate in QT . Si ha: a) Se v ≥ w su ∂p QT e f1 ≥ f2 in QT allora v ≥ w in tutto QT ;
2.2 Principi di massimo e questioni di unicità
39
b) Vale la stima di stabilità max |v − w| ≤ max |v − w| + T sup |f1 − f2 | . ∂p QT
QT
(2.35)
QT
In particolare il problema di C-Dirichlet ha al più una soluzione che dipende con continuità dai dati. La disuguaglianza (2.35) è una stima di stabilità uniforme, utile in molte situazioni concrete. Infatti, se v = g1 e w = g2 su ∂p QT e max |g1 − g2 | ≤ ε, sup |f1 − f2 | ≤ ε, QT
QT
allora max |v − w| ≤ ε (1 + T ) . QT
Ne segue che, su un intervallo temporale finito, una piccola distanza tra i dati implica una piccola distanza tra le corrispondenti soluzioni. Il Teorema 2.1 è una versione del cosiddetto principio di massimo debole . L’aggettivo debole è dovuto al fatto che questo teorema non esclude la possibilità che il massimo o il minimo possano essere assunti anche in un punto che non si trova sulla frontiera parabolica. In realtà, vale un risultato più preciso, noto come principio di massimo forte che ci limitiamo ad enunciare: Teorema 2.3 (Principio di massimo forte). Sia u ∈ C 2,1 (QT ) ∩ C QT una sottosoluzione dell’equazione di diffusione. Se u assume il massimo M in un punto (x1 , t1 ) con x1 ∈ Ω e 0 < t1 ≤ T , allora u ≡ M in Ω × [0, t1 ]. Un enunciato analogo vale per il minimo se u è una soprasoluzione in QT . Un altro importante risultato riguarda la pendenza con la quale u raggiunge un punto di massimo o minimo sulla frontiera laterale ST in un punto in cui esiste una sfera tangente internamente ad Ω (Figura 2.3). Precisamente:
Figura 2.3. Proprietà della sfera interna nel punto x0
40
2 Diffusione
Teorema 2.4 (Principio di Hopf). Sia u ∈ C 2,1 (QT ) ∩ C QT una sottosoluzione dell’equazione di diffusione. Assumiamo che: 1. x0 ∈ ∂Ω ha la proprietà della sfera interna, cioè: esiste una sfera BR ⊂ Ω tangente a ∂Ω in x0 ; 2. (x0 , t0 ) ∈ ST è punto di minimo per u in QT ed inoltre u (x0 , t0 ) < u (x,t) in Ω × [0, t0 ); 3. esiste ∂ν u (x0 , t0 ). Allora ∂ν u (x0 , t0 ) < 0. Se il punto è di massimo, tutte le disuguaglianze vanno rovesciate. Il punto chiave espresso nel teorema è che la derivata normale non può essere nulla in (x0 , t0 ). Dimostrazione. In riferimento alla Figura 2.3, sia BR = BR (p) ⊂ Ω, tangente a ∂Ω in x0 . Possiamo sempre supporre che u (x0 , t0 ) = 0 e che quindi u (x,t) > 0 in Ω × [0, t0 ). Sia Poniamo pt = p+β (t0 − t) (p − x0 ) e consideriamo il cilindro “obliquo” CR,t0 = ∪ BR (pt,t ) ∩ BR/2 (x0,t ) dove l’unione è fatta al variare di t tra t0 − a e t0 ; a e β sono numeri positivi (piccoli) che sceglieremo in seguito, in particolare, in modo che CR,t0 ⊂ QT . Vogliamo costruire una sottosoluzione w che si annulli in (x0 , t0 ), tale che ∂ν w (x0 , t0 ) < 0 e che sia minore o uguale di u sulla frontiera parabolica di CR,t0 , data dall’unione dei seguenti tre insiemi: Γ1 = ∪ ∂BR (pt,t ) ∩ BR/2 (x0,t ) , Γ2 = ∪ BR (pt,t ) ∩ ∂BR/2 (x0,t ) e Γ0 = C R,t0 ∩ {t = t0 − a} . Una volta costruita w, per il principio di massimo abbiamo w ≤ u in C R,t0 . Inoltre, essendo w (x0 , t0 ) = u (x0 , t0 ) = 0, possiamo scrivere (ricordiamo che ν è la normale esterna): u (x0 − hν, t0 ) − u (x0 , t0 ) w (x0 − hν, t0 ) − w (x0 , t0 ) ≤ h h Passando al limite per h → 0+ , si ottiene ∂ν u (x0 , t0 ) ≤ ∂ν w (x0 , t0 ) < 0 che conclude la dimostrazione.
h > 0.
2.2 Principi di massimo e questioni di unicità
41
Resta da costruire w. Definiamo 2
2
w (x,t) = e−α|x−pt | − e−αR , con α > 0. Abbiamo w (x0 , t0 ) = 0 e, essendo ν = (x0 − p) /R, 2
∂ν w (x0 , t0 ) = −2αe−αR (x0 − p) ·
2 (x0 − p) = −2αRe−αR < 0. R
Vogliamo scegliere α, β, in modo tale che wt − DΔw < 0 e che w ≤ u su ∂p CR,t0 . Si controlla subito che 2 2 wt − DΔw = αe−α|x−pt | 2β (pt − x) · (p − x0 ) + 2nD − 2α |x − pt | 2 ≤ αe−α|x−pt | 2βC + 2nD − αR2 /2 essendo |(pt − x) · (p − x0 )| limitato e |x − pt | ≥ R/2. Quindi, se α è sufficientemente grande e β piccolo, si ha wt − DΔw < 0 in CR,t0 . Osserviamo ora che su Γ2 ∪ Γ0 si ha u ≥ M0 > 0 e quindi per α grande si ha w < u su Γ2 ∪ Γ0 . Infine su Γ1 si ha w = 0 mentre u ≥ 0. Se dunque α è grande e a, β sono sufficientemente piccoli, concludiamo che w ha tutte le proprietà richieste. Un’immediata conseguenza è il seguente risultato di unicità per il problema di Neumann/Robin. Corollario 2.5 (Unicità per iproblemi di Cauchy-Neumann/Robin). Esi ste un’unica u ∈ C 2,1 (QT ) ∩ C QT tale che ∂ν u esiste su ∂Ω, soluzione di ⎧ in QT ⎨ ut − DΔu = f ∂ν u + αu = h su ST (α ≥ 0) (2.36) ⎩ u (x, 0) = g (x) in Ω. Dimostrazione. Se u e v sono soluzioni di (2.36) soddisfacenti le ipotesi del teorema, allora w = u−v è soluzione dell’equazione omogenea, con w (x,0) = 0 e ∂ν w+αw = 0 su ST . Se w è costante allora è zero. Altrimenti, se w avesse un massimo positivo in (x0 ,t0 ) dovrebbe essere (x,t0 ) ∈ ST e w (x0 ,t0 ) > w (x,t) in Ω × [0, t0 ) (per il Teorema 2.3). Il principio di Hopf dà allora ∂ν w (x0 , t0 ) > 0, in contraddizione con la condizione al bordo ∂ν w (x0 , t0 ) = −αw (x0 , t0 ) ≤ 0. Per identiche ragioni, w non può avere un minimo negativo. Pertanto w = 0 e la soluzione di (2.36) è unica.
42
2 Diffusione
2.3 La soluzione fondamentale Vi sono alcune soluzioni “privilegiate” dell’equazione di diffusione, mediante le quali se ne possono costruire molte altre. In questa sezione ci proponiamo di scoprire uno di questi mattoni, il più importante. 2.3.1 Soluzione fondamentale (n = 1) Costruiamo la nostra soluzione speciale, ragionando per il momento in dimensione n = 1. Ci proponiamo di studiare la propagazione del calore in una sbarra infinita (posta lungo l’asse reale) da una sorgente istantanea di calore inizialmente concentrata in un punto, diciamo l’origine. Sebbene il problema appaia piuttosto irrealistico, rivelerà più avanti la sua notevole importanza. Indichiamo con u∗ la temperatura (assoluta), soluzione dell’equazione del calore omogenea. u∗t − DΔu∗ = 0. (2.37) Per il momento non ci preoccupiamo di modellare la sorgente puntiforme; ritorneremo ampiamente in seguito sul questo problema. Il nostro scopo è di capire cosa succede per t > 0. Osserviamo anzitutto che, data l’assenza di sorgenti distribuite, non c’é produzione né assorbimento di calore e quindi l’energia deve mantenersi costante: ρcv u∗ (x, t) dx = E, per ogni t > 0. (2.38) R
Inoltre, data la “simmetria” del profilo iniziale e l’invarianza della (2.37) per riflessioni nello spazio (Paragrafo. 2.2.1), ci aspettiamo che u∗ sia una funzione pari di x : u∗ (−x, t) = u∗ (x, t). Per determinare la soluzione procediamo in due passi. Passo 1. Dimostriamo che u∗ ha un’espressione analitica del tipo seguente Q x ∗ u (x,t) = √ U √ (2.39) Dt Dt dove Q = E/ρcv e U = U (ξ) , ξ ∈ R, è una funzione positiva e pari, per il momento incognita. Per la dimostrazione, useremo un tipico ragionamento di analisi dimensionale, basato sul cosiddetto Teorema Pi di Buckingham, illustrato in Appendice A. Passo 2. Dimostriamo che ξ2 1 U (ξ) = √ e− 4 . (2.40) 2π Passo 1. La temperatura u∗ in x all’istante t è determinata dalle seguenti quantità: il tempo t, la distanza x dall’origine, i parametri D e Q. Possiamo dunque postulare l’esistenza di una relazione del tipo u∗ = U (x, t, D, Q) .
(2.41)
2.3 La soluzione fondamentale
43
Tutte le quantità che appaiono nella (2.41) sono dimensionali. Il Teorema Pi di Buckingam afferma che si può convertire la (2.41) in una relazione tra quantità adimensionali. A questo scopo elenchiamo le dimensioni fisiche di ciascuno degli argomenti di U, in termini delle 3 unità dimensionali Θ (grado), L (lunghezza) e T (tempo): (2.42) [x] = L, [t] = T , [D] = L2 T −1 , [Q] = ΘL. Possiamo esprimere queste relazioni algebricamente, introducendo i seguenti vettori, le cui componenti sono gli esponenti che compaiono nella (2.42), rispetto a Θ, L, T , nell’ordine: ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ 0 0 0 1 [x] ⎝ 1 ⎠ , [t] ⎝ 0 ⎠ , [D] ⎝ 2 ⎠ , [Q] ⎝ 1 ⎠ . (2.43) 0 1 −1 0 Si vede facilmente che i vettori (2.43) generano tutto R3 . Selezioniamo allora tre tra le quantità sopra elencate, i cui vettori siano linearmente indipendenti. Chiamiamo queste quantità primarie, le altre secondarie. Possiamo scegliere (la scelta non è unica) t, D e Q. Esprimiamo ora le dimensioni di u∗ e della rimanente quantità secondaria x in funzione delle dimensioni di t, D e Q. Si trova: −1/2 −1/2 1/2 1/2 [u∗ ] = [Q] [D] [t] e [x] = [D] [t] . Di conseguenza, le quantità √ u∗ Dt Π= Q
e
x Π1 = √ Dt
sono adimensionali. Torniamo alla (2.41). √ √ Se moltiplichiamo entrambi i membri per Dt/Q e sostituiamo x = Π1 Dt, otteniamo la relazione √ √ Dt Dt √ U (x, t, D, Q) = U Π1 Dt, t, D, Q Π= Q Q che si può scrivere nella forma Π = U (Π1 , t, D, Q) .
(2.44)
Nella (2.44), a sinistra, c’è una quantità adimensionale. Ne segue che anche l’espressione U (Π1 , t, D, Q) deve essere adimensionale. Ma questo implica che U deve essere indipendente dalle quantità primarie t, D, Q, altrimenti, cambiando per queste le unità di misura, a destra della (2.44) avremmo una variazione mentre Π rimarrebbe invariato. In conclusione si deduce che deve essere Π = U (Π1 ) e cioé, ritornando alle variabili originali, troviamo Q x u∗ (x,t) = √ U √ Dt Dt
44
2 Diffusione
dove U ≥ 0 essendo u∗ una temperatura (assoluta). Si noti che per arrivare alla formula (2.39) non abbiamo usato l’equazione del calore!! Soluzioni della forma (2.39) si chiamano soluzioni di autosimilarità (self similar solutions 12 ). Passo 2. Occorre determinare U = U (ξ) , ξ ∈ R, in modo che u∗ sia soluzione della (2.37). Per la conservazione dell’energia (2.38) deve poi essere Q x Q= √ dx =√ Q U (ξ) dξ U √ Dt R Dt ξ=x/ Dt R per cui richiediamo che
U (ξ) dξ = 1.
(2.45)
R
Per determinare U imponiamo che u∗ sia soluzione di (2.37). Abbiamo: Q 1 3 1 ∗ − t− 2 U (ξ) − √ xt−2 U (ξ) ut = √ 2 2 D D Q =− √ [U (ξ) + ξU (ξ)] 2t Dt Q u∗xx = U (ξ) , (Dt)3/2 e perciò u∗t
−
Du∗xx
Q =− √ t Dt
! 1 1 U (ξ) + ξU (ξ) + U (ξ) . 2 2
Affinché u∗ sia soluzione della (2.37) occorre dunque che la funzione U soddisfi l’equazione differenziale ordinaria in R 1 1 U (ξ) + ξU (ξ) + U (ξ) = 0. 2 2
(2.46)
Essendo un’equazione del secondo ordine, per selezionare una soluzione ci vogliono due condizioni supplementari. La (2.45) implica 13 : U (−∞) = U (+∞) = 0. 12
13
Una soluzione di un particolare problema di evoluzione si dice di autosimilarità o autosimile se la sua configurazione spaziale (grafico) rimane simile a sé stessa per ogni tempo durante l’evoluzione. In una dimensione spaziale, le soluzioni autosimili hanno la forma generale u (x, t) = a (t) F (x/b (t)) dove, preferibilmente, u/a and x/b sono quantità adimensionali. Rigorosamente, implica solo lim inf U (x) = 0. x→±∞
2.3 La soluzione fondamentale
45
Poiché cerchiamo soluzioni pari (osserviamo che anche l’equazione (2.46) è invariante rispetto alla riflessione ξ → −ξ) ci possiamo limitare al semiasse ξ ≥ 0, imponendo le condizioni U (0) = 0 e U (+∞) = 0.
(2.47)
Per risolvere la (2.46), riscriviamola nella forma ! d 1 U (ξ) + ξU (ξ) = 0 dξ 2 da cui
1 U (ξ) + ξU (ξ) = C 2
(C ∈ R).
(2.48)
Inserendo ξ = 0 nella (2.48) e ricordando la (2.47) si deduce che C = 0. La (2.48) diventa 1 U (ξ) + ξU (ξ) = 0 2 che è a variabili separabili ed ha come integrale generale la famiglia di esponenziali U (ξ) = c0 e−
ξ2 4
(c0 ∈ R).
Queste funzioni sono positive, pari, si annullano all’infinito. Rimane solo da scegliere c0 in modo che valga (2.45). Poiché14 √ ξ2 2 e− 4 dξ = 2 e−z dz = 2 π ξ=2z
R
R
la scelta corretta è c0 = (4π)
−1/2
.
Ritornando alle variabili originali, abbiamo trovato un’unica soluzione positiva dell’equazione del calore della forma x2 Q e− 4Dt , 4πDt
u∗ (x, t) = √ e tale che
u∗ (x, t) dx = Q
x ∈ R, t > 0
per ogni t > 0.
R
Se Q = 1 si tratta di una famiglia di Gaussiane e la mente corre alla densità di una distribuzione normale di probabilità. Approfondiremo più avanti questa connessione. 14
Ricordare che
R
2
e−z =
√
π.
46
2 Diffusione
Definizione 3.1. La funzione x2 1 e− 4Dt , ΓD (x, t) = √ 4πDt
x ∈ R, t > 0
(2.49)
si chiama soluzione fondamentale dell’equazione di diffusione in dimensione uno. 2.3.2 La distribuzione di Dirac La soluzione fondamentale descrive l’evoluzione della temperatura da una sorgente unitaria puntiforme. Esiste un modello matematico per tale sorgente? Per arrivarci esaminiamo il comportamento della soluzione fondamentale per t → 0+ . Per ogni x = 0, fissato, si ha: x2 1 e− 4Dt = 0 4πDt
lim ΓD (x, t) = lim √ t↓0
t↓0
(2.50)
mentre
1 lim ΓD (0, t) = lim √ = +∞. (2.51) t↓0 t↓0 4πDt " Le (2.50), (2.51) insieme a R ΓD (x, t) dx = 1 per ogni t > 0, implicano che, quando si fa tendere t a 0, la soluzione fondamentale tende a concentrarsi intorno all’origine. Se interpretiamo ΓD come densità (di massa o di probabilità), al limite, tutta la massa (unitaria) è concentrata in x = 0 (in Figura 2.4, il grafico di Γ1 ). La distribuzione limite di massa si può modellare matematicamente introducendo la distribuzione (o misura) di Dirac nell’origine, che si indica con il
100 80 60 40 20 0 -20 0.04 0.02
5 0 -0.02 -0.04 x
4 3 2
x 10
1 t
Figura 2.4. Il grafico della soluzione fondamentale Γ1
-5
2.3 La soluzione fondamentale
47
simbolo δ 0 o semplicemente con δ. La sua denominazione indica che non si tratta di una funzione nel solito senso dell’analisi poiché dovrebbe avere le proprietà seguenti: • δ (0) = ∞, δ (x) = 0 per x = 0, " • R δ (x) dx = 1, chiaramente incompatibili con ogni concetto classico di funzione e di integrale. La sua definizione rigorosa si colloca all’interno della teoria delle funzioni generalizzate o distribuzioni (ma non nel senso probabilistico) di L. Schwartz, che tratteremo nel Capitolo 7. Qui ci limitiamo a qualche considerazione euristica. Consideriamo la funzione caratteristica dell’intervallo [0, ∞), spesso denominata funzione di Heaviside: 1 se x ≥ 0 H (x) = 0 se x < 0, e osserviamo che
⎧ 1 H (x + ε) − H (x − ε) ⎨ = 2ε Iε (x) ≡ ⎩0 2ε
se − ε ≤ x < ε altrove.
Valgono le seguenti proprietà: i) Per ogni ε > 0, 1 Iε (x) dx = × 2ε = 1. 2ε R Si può interpretare Iε come un impulso unitario di durata 2ε (Figura 2.5). ii)
lim Iε (x) = ε↓0
0 ∞
se x = 0 se x = 0.
Figura 2.5. Approssimazione della delta di Dirac
48
2 Diffusione
iii) Se ϕ = ϕ (x) è una funzione regolare, nulla al di fuori di un intervallo limitato (funzione test ), si ha ε 1 Iε (x) ϕ (x) dx = ϕ (x) dx −→ ϕ (0) . ε−→0 2ε −ε R Le proprietà i) e ii) indicano che Iε ha come limite un oggetto, che ha precisamente le proprietà formali della distribuzione di Dirac nell’origine. La iii) suggerisce come identificare questo oggetto e cioè attraverso la sua azione su una funzione test. Definizione 3.2. Si chiama distribuzione di Dirac nell’origine la funzione generalizzata che si indica con δ e che agisce su una funzione test ϕ nel seguente modo: δ (2.52) ϕ −→ ϕ (0) . La relazione (2.52) viene spesso scritta nella forma δ, ϕ = ϕ (0) o anche δ (x) ϕ (x) dx = ϕ (0) dove, naturalmente, il simbolo di integrale è puramente formale. Notiamo anche che la proprietà ii) indica che vale la formula notevole H = δ il cui significato sta nel calcolo seguente, dove si usa un’integrazione per parti e ϕ è la solita funzione test: ∞ ϕdH = − Hϕ = − ϕ = ϕ (0) (2.53) R
R
0
essendo ϕ nulla per x grande15 . Se anzichè nell’origine, la massa unitaria è concentrata in un punto y, si parla di distribuzione di Dirac in y, indicata con δ y oppure δ (x − y), definita dalla relazione δ (x − y) ϕ (x) dx = ϕ (y) . (2.54) La funzione ΓD (x − y, t) è allora l’unica soluzione dell’equazione del calore con massa totale unitaria per ogni tempo, che soddisfi la condizione iniziale ΓD (x − y, 0) = δ (x − y) . 15
Il primo integralenella (2.53) è da intendersi nel senso di Riemann-Stieltjes e formalmente coincide con ϕ (x) H (x) dx
e cioè con l’azione della funzione generalizzata H sulla funzione test ϕ.
2.3 La soluzione fondamentale
49
Nota 2.1. Abbiamo dimostrato che la (2.49) descrive l’evoluzione della temperatura da una sorgente unitaria di calore inizialmente concentrata nell’origine. Così come una soluzione u dell’equazione del calore ha molte interpretazioni anche la soluzione fondamentale si può interpretare in vari modi, per esempio, come concentrazione di una sostanza che diffonde o una densità di probabilità. In generale si può pensarla come una unit source solution: ΓD (x, t) dà la concentrazione in x all’istante t tra x e x + dx, generata dalla diffusione di una massa unitaria inizialmente (per t = 0) concentrata nell’origine. Da un altro punto di vista, se immaginiamo la massa unitaria composta da un enorme numero N di particelle, ΓD (x, t) dx dà la probabilità che una singola particella si trovi tra x e x + dx al tempo t, ovvero la percentuale delle N particelle che si trovano nell’intervallo (x,x + dx) all’istante t. Inizialmente ΓD è nulla al di fuori dell’origine. Appena t > 0, ΓD è sempre positiva su tutto R: questo fatto indica che la massa concentrata in x = 0 diffonde istantaneamente su tutto l’asse reale e quindi con velocità di propagazione infinita. Ciò, a volte, costituisce un limite all’uso della (2.1) come modello realistico, anche se, come si vede in Figura 2.4, per t > 0, piccolo, ΓD è praticamente nulla al di fuori di un intervallo centrato nell’origine, di ampiezza un poco più grande di 4D. 2.3.3 Soluzione fondamentale (n > 1) In dimensione spaziale maggiore di 1, si possono ripetere sostanzialmente gli stessi discorsi. Studiamo la diffusione del calore o di una massa Q in tutto Rn , da una sorgente istantanea inizialmente concentrata nell’origine. L’assenza di sorgenti distribuite implica per la soluzione u∗ (temperatura o concentrazione di massa) la legge di conservazione (di energia o massa) u∗ (x,t) dx = Q per ogni t > 0. (2.55) Rn
Usando il metodo dell’analisi dimensionale si trova per u∗ l’espressione analitica √ Q U (ξ) , ξ = |x| / Dt u∗ (x, t) = n/2 (Dt) dove U è una funzione positiva. Per determinare U imponiamo che u∗ sia soluzione di u∗t − DΔu∗ = 0. Ricordando l’espressione dell’operatore di Laplace per funzioni radiali (Appendice D), possiamo scrivere: u∗t = −
1 n/2
2t (Dt)
[nU (ξ) + ξU (ξ)]
50
2 Diffusione
1
Δu∗ =
1+n/2
U (ξ) +
(Dt)
! n−1 U (ξ) . ξ
Pertanto, affinché u∗ sia soluzione di (2.2), U deve essere una soluzione (positiva) in (0, +∞) dell’equazione differenziale ordinaria ξU (ξ) + (n − 1) U (ξ) +
n ξ2 U (ξ) + ξU (ξ) = 0. 2 2
(2.56)
Moltiplicando per ξ n−2 , possiamo scrivere la (2.56) nella forma 1 (ξ n−1 U (ξ)) + (ξ n U (ξ)) = 0 2 che dà 1 ξ n−1 U (ξ) + ξ n U (ξ) = C 2
(C ∈ R).
(2.57)
Assumendo che i limiti per ξ → 0+ di U e U siano finiti, passando al limite per ξ → 0+ nella (2.57), deduciamo che C = 0 e quindi 1 U (ξ) + ξU (ξ) = 0. 2 Otteniamo ancora la famiglia di soluzioni U (ξ) = c0 e−
ξ2 4
.
Usando la conservazione della massa ricaviamo, dividendo per Q: 1=
(Dt)
1 n/2
U Rn
=√
y=x/ 4Dt
da cui c0 = (4π)
c0 2n
−n/2
|x| √ Dt
c0 dx = (Dt)n/2
2
Rn
e−|y| dy = c0 2n
#
2
|x| exp − 4Dt n R
2
e−z dz
$ dx
n
R
= c0 (4π)
n/2
. In conclusione, abbiamo trovato soluzioni della forma
u∗ (x, t) =
|x|2
Q n/2
(4πDt)
e− 4Dt ,
(x ∈ Rn , t > 0) .
Come in dimensione n = 1, la scelta Q = 1 è speciale.
2.4 Passeggiata aleatoria simmetrica (n = 1)
51
Definizione 3.3 La funzione ΓD (x, t) =
|x|2
1 (4πDt)
n/2
e− 4Dt
(x ∈Rn , t > 0)
si chiama soluzione fondamentale dell’equazione di diffusione in dimensione n. Le osservazioni fatte dopo la Definizione 3.1 si possono facilmente generalizzare al caso multidimensionale. Si può, in particolare, definire la distribuzione di Dirac in un punto y mediante la relazione δ (x − y) ϕ (x) dx = ϕ (y) dove ϕ è una funzione test, continua in Rn e nulla al di fuori di un insieme chiuso e limitato (cioè compatto). La soluzione fondamentale ΓD (x − y, t), per y fissato, è l’unica soluzione del problema di Cauchy ut − DΔx u = 0 x ∈Rn , t > 0 u (x, 0) = δ (x − y) x ∈ Rn che soddisfi la (2.55) con Q = 1.
2.4 Passeggiata aleatoria simmetrica (n = 1) In questa sezione, cominciamo ad esplorare la connessione tra modelli probabilistici e deterministici, lavorando in dimensione spaziale n = 1. Come obiettivo ci proponiamo di costruire il moto Browniano, che è un modello continuo, come limite di un semplice processo stocastico, amichevolmente denominato passeggiata aleatoria (random walk ), che è invece un modello discreto. Nel realizzare il procedimento di limite, si vede come l’equazione del calore (che è un modello continuo) possa essere approssimata con un’equazione alle differenze che la “discretizza”, stabilendo così anche un collegamento con alcuni metodi numerici, che permettono il calcolo approssimato delle soluzioni. Tra l’altro si chiarirà la natura del coefficiente di diffusione D. 2.4.1 Calcoli preliminari Nella nostra passeggiata aleatoria, un’ipotetica particella di massa unitaria 16 è in moto lungo una retta (l’asse x), secondo le seguenti regole. Fissiamo: • un passo di lunghezza h, • un intervallo di tempo di durata τ . 16
Ma è possibile pensare ad una massa unitaria costituita da un grande numero di particelle.
52
2 Diffusione
Figura 2.6. Passeggiata aleatoria simmetrica
1. In un tempo τ la particella si muove di h, partendo da x = 0. 2. Essa si muove a destra o a sinistra con probabilità p = 12 , in modo indipendente dal passo precedente (Figura 2.6). All’istante t = N τ , cioè dopo N passi, la particella si troverà in un punto x = mh, dove N è un intero naturale ed m è un intero relativo tale che −N ≤ m ≤ N . Le variabili x ed m sono dunque variabili aleatorie 17 . Poniamoci il seguente problema: Calcolare la probabilità p (x, t) che la particella si trovi in x al tempo t. Un’interpretazione possibile: ad intervalli di tempo τ , lanciamo una moneta (non truccata!). Se esce testa, la particella si muove a destra e vince 1 euro; se esce croce, si muove a sinistra e perde 1 euro: p (x, t) è la probabilità di possedere m euro dopo N lanci. • Calcolo di p (x, t). Sia x = mh la posizione della particella dopo N passi. Per raggiungere x, la particella esegue un certo numero di passi a destra, diciamo k, ed N − k passi a sinistra. Evidentemente, 0 ≤ k ≤ N e m = k − (N − k) = 2k − N
(2.58)
cosicché N ed m hanno la stessa parità (entrambi pari o entrambi dispari) e k=
1 (N + m) . 2
Ne segue che p (x, t) = pk dove pk =
numero di cammini con k passi a destra su N . numero dei cammini con N passi
(2.59)
Ora, il numero di cammini con k passi a destra ed N − k a sinistra è dato dal coefficiente binomiale18 N N! = . CN,k = k k! (N − k)! 17 18
Rigorosamente occorrerebbe usare due simboli diversi, per esempio X e M . L’insieme dei cammini con k passi a destra ed N − k a sinistra è in corrispondenza biunivoca con l’insieme delle permutazioni di N lettere alfabetiche, di cui k uguali a D (destra) ed N − k uguali a S (sinistra). Il numero di tali permutazioni è precisamente CN,k .
2.4 Passeggiata aleatoria simmetrica (n = 1)
53
D’altra parte, il numero dei possibili cammini è 2N (perché?). Abbiamo, dunque: CN,k 1 pk = N x = mh, t = N τ , k = (N + m) . (2.60) 2 2 • Media e deviazione standard di x. Per passare “al continuo” dobbiamo far tendere a 0 sia h, sia τ . Se desideriamo costruire una copia continua e fedele della passeggiata aleatoria, occorre isolare alcuni parametri quantitativi che codifichino le caratteristiche essenziali del moto e mantenerli sostanzialmente inalterati nel passaggio al limite. Questi due parametri sono 19 : a) la media (o valore atteso) di x dopo N passi = x = m h, % & % & b) il momento secondo di x dopo N passi = x2 = m2 h2 . ' Si noti che la quantità m2 h rappresenta essenzialmente la distanza media dall’origine dopo N passi. Dalla (2.58) abbiamo m = 2 k − N e
(2.61)
& % & (2.62) m2 = 4 k 2 − 4 k N + N 2 . % & % & Per calcolare m e m2 è quindi sufficiente calcolare k e k 2 . Per %
definizione e per la (2.60), possiamo scrivere N N & 1 2 k2 = k 2 pk = N k CN,k . 2 k=1 k=1 k=1 k=1 (2.63) Sebbene sia possibile eseguire i calcoli direttamente dalla (2.63), è più facile usare la funzione generatrice delle probabilità, definita da:
k =
N
kpk =
N 1 kCN,k , 2N
G (s) =
N
k=0
19
%
pk sk =
N 1 CN,k sk . 2N k=1
Se una variabile aleatoria x assume solo N possibili x1 ,..., xN con probabilità p1 , ..., pN , i suoi momenti di ordine (intero) q ≥ 1 sono dati da E (xq ) = xq =
N j=1
xqj pj .
Il momento primo (q = 1) è la media o valore atteso di x, mentre var (x) = x2 − x2 è la varianza di x. La radice quadrata della varianza è detta deviazione standard.
54
2 Diffusione
La funzione G contiene in forma compatta le informazioni sui momenti di k e funziona per le variabili aleatorie a valori interi. In particolare, abbiamo: G (s) =
N 1 kCN,k sk−1 , 2N
G (s) =
k=1
N 1 k (k − 1) CN,k sk−2 . 2N k=2 (2.64)
Ponendo s = 1 e usando (2.63), otteniamo: N 1 kCN,k = k 2N
G (1) =
(2.65)
k=1
e G (1) =
N % & 1 k (k − 1) CN,k = k (k − 1) = k2 − k . N 2
(2.66)
k=2
D’altra parte, inserendo a = 1 e b = s nella formula del binomio N
(a + b)
=
N
CN,k aN −k bk ,
k=0
deduciamo che G (s) =
N 1 1 N CN,k sk = N (1 + s) N 2 2 k=0
da cui
N N (N − 1) e G (1) = . 2 4 Dalle (2.67), (2.65) e (2.66) ricaviamo allora: G (1) =
k =
N 2
e
(2.67)
%
& N (N + 1) k2 = . 4
Finalmente, ricordando che m = 2k − N , abbiamo m = 2 k − N = 2
N −N =0 2
e quindi anche x = 0. Risultato non sorprendente, data la simmetria della passeggiata. Inoltre % 2& % & m = 4 k 2 − 4N k + N 2 = N 2 + N − 2N 2 + N 2 = N da cui
'
x2 =
√
N h.
(2.68)
che è la deviazione standard di x, essendo x = 0. La (2.68) contiene un’importante informazione: dopo N τ istanti, la distanza dall’origine è dell’ordine
2.4 Passeggiata aleatoria simmetrica (n = 1)
55
√
di N h. Euristicamente: la scala temporale è dell’ordine del quadrato della scala spaziale. In altri termini, se si vuole lasciare invariata la deviazione standard, occorre riscalare il tempo come il quadrato dello spazio ossia usare le dilatazioni paraboliche, incontrate nella sezione precedente! Ma procediamo con ordine. Il prossimo passo è ricavare un’equazione alle differenze per p = p (x, t); è su questa equazione che effettueremo il passaggio al limite. 2.4.2 La probabilità di transizione limite Nel valutare p (x, t), teniamo presente che la nostra particella si muove ad ogni passo in modo indipendente dal cammino percorso precedentemente. Se essa si trova in x al tempo t+τ , significa che, al tempo t, si trovava in x−h oppure in x + h, con ugual probabilità. Il teorema delle probabilità totali fornisce allora la relazione 1 1 (2.69) p (x, t + τ ) = p (x − h, t) + p (x + h, t) 2 2 con le condizioni iniziali p (0, 0) = 1 e p (x, 0) = 0
se x = 0
che ricordano quelle della soluzione fondamentale Γ . Fissati x e t, vogliamo ora esaminare cosa succede se passiamo al limite per h → 0, τ → 0. Intanto conviene pensare che p (x, t) sia una funzione definita su tutto R× (0, ∞) e non solo nei punti (mh, N τ ). C’è un’altra osservazione da fare. Dopo il passaggio al limite ci troveremo con una distribuzione continua di probabilità e quindi p (x, t) dovrebbe essere nulla in ogni punto. Ma se interpretiamo p come densità di probabilità l’anomalia scompare. Supponendo p differenziabile quanto occorre, possiamo scrivere p (x, t + τ ) = p (x, t) + pt (x, t) τ + o (τ ) , 1 p (x ± h, t) = p (x, t) ± px (x, t) h + pxx (x, t) h2 + o h2 . 2 Sostituendo nella (2.69), dopo alcune semplificazioni, si trova pt τ + o (τ ) =
1 pxx h2 + o h2 2
e, dividendo per τ , 1 h2 pxx + o pt + o (1) = 2 τ
h2 τ
.
(2.70)
Siamo ad un punto cruciale: nell’ultima equazione ritroviamo la combinazione h2 τ !!
56
2 Diffusione
Se vogliamo ottenere qualcosa di sensato quando h, τ → 0, occorre che il rapporto h2 /τ si mantenga finito e positivo. Assumiamo dunque che h2 = 2D τ
(D > 0)
(2.71)
(l’inserimento del 2 ha ragioni puramente estetiche). Passando al limite nella (2.70) si ottiene per p l’equazione del calore pt = Dpxx
(2.72)
lim p (x, t) = δ.
(2.73)
e le condizioni iniziali diventano t→0+
Abbiamo già constatato che l’unica soluzione del problema (2.72), (2.73) è data dalla soluzione fondamentale dell’equazione di diffusione, p (x, t) = ΓD (x, t) essendo
p (x, t) dx = 1. R
La costante D nella (2.71) è dunque il coefficiente di diffusione. La nostra costruzione rivela che il nome è appropriato. Ricordando infatti i calcoli svolti sopra, si ha % 2& t = Nτ x = N h2 e quindi
%
& x2 h2 = = 2D t τ che√significa: nell’unità di tempo, la particella diffonde ad una distanza media di 2D. È questa la caratteristica della passeggiata aleatoria che si conserva nel passaggio al limite. Sempre dalla (2.71) ricaviamo che h 2D = →∞ τ h
e cioè che la velocità h/τ , con la quale la particella effettua ogni passo, diventa infinita. Il fatto, quindi, che la particella diffonda ad una distanza media finita nell’unità di tempo è dovuto alle continue fluttuazioni del suo moto. 2.4.3 Dalla passeggiata aleatoria al moto Browniano Che cosa è diventata la passeggiata aleatoria? Che tipo di moto si ottiene? Possiamo rispondere usando il Teorema Centrale Limite del calcolo delle probabilità. Indichiamo con xj = x (jτ ) la posizione raggiunta dopo j passi e poniamo, per j ≥ 1, hξ j = xj − xj−1 .
2.4 Passeggiata aleatoria simmetrica (n = 1)
57
Le ξ j sono variabili aleatorie indipendenti e identicamente distribuite : valgono % & % & 1 o −1 con probabilità 12 . Hanno media ξ j = 0 e varianza ξ 2j = 1. La posizione della particella dopo N passi è xN = h
N
ξj .
j=1
Se scegliamo
h=
2Dt , N
2
cioè in modo che hτ = 2D, e passiamo al limite per N → ∞, il Teorema Centrale Limite assicura che xN converge in legge20 ad una variabile aleatoria X = X (t), che ha una distribuzione normale con media 0 e varianza 2Dt, la cui densità è ΓD (x, t). La passeggiata aleatoria è diventata un cammino continuo; nel caso D = 1/2, essa si chiama moto Browniano, che caratterizzeremo più avanti attraverso le sue proprietà essenziali. Di solito, si usa la notazione B = B (t) per indicare la posizione (aleatoria) di una particella che si muove di moto Browniano. In realtà, al variare del tempo, le variabili aleatorie B (t) sono definite su un comune spazio di probabilità (Ω, F, P ), dove Ω è un insieme (degli eventi elementari), F una σ−algebra in Ω (degli eventi misurabili) e P un’opportuna misura di probabilità in F 21 ; quindi, la notazione corretta dovrebbe essere B (t, ω) con ω ∈ Ω; per comodità (o pigrizia), la dipendenza da ω viene di solito sottintesa. La famiglia di variabili aleatorie B (t, ω), col tempo t come parametro reale, costituisce un processo stocastico, continuo. Pensando di fissare ω ∈ Ω, otteniamo la funzione reale t −→ B (t, ω) che descrive uno dei possibili cammini di una particella Browniana. Bloccando t, otteniamo la variabile aleatoria ω −→ B (t, ω) . Senza curarci troppo di definire rigorosamente Ω, è importante saper calcolare probabilità del tipo P {B (t) ∈ I} dove I ⊆ R è un sottoinsieme ragionevole, tecnicamente un insieme di Borel o boreliano 22 . 20
Cioè: se N → ∞,
Prob {a < xN < b} →
21 22
b a
ΓD (x, t) dx.
Appendice B. Si può pensare ad un intervallo o ad un insieme ottenuto con unioni ed intersezioni di un numero qualunque, anche un’infinità numerabile, di intervalli. Si veda l’Appendice B.
58
2 Diffusione
Figura 2.7. Traiettoria Browniana
La Figura 2.7 mostra il significato di questo calcolo: fissare t equivale a fissare una retta verticale, diciamo t = t. Pensiamo che I sia sottoinsieme di questa retta; in Figura 2.7, I è un intervallo e P {B (t) ∈ I} è la probabilità che la nostra particella “visiti” I all’istante t. Richiamiamo le proprietà caratterizzanti del moto Browniano, senza essere troppo esigenti. Volendo essere minimalisti, si potrebbe sintetizzare tutto con la formula23 √ (2.74) dB ∼ dtN (0, 1) = N (0, dt) dove N (0, 1) indica una variabile aleatoria normale standard, cioè con media nulla e varianza uno. Si noti che la particella con D generico si muove come un multiplo di un moto Browniano; per essa si avrebbe infatti. √ dX = 2D dB. • Continuità delle traiettorie . Con probabilità 1, i possibili cammini di una particella Browniana sono funzioni t −→ B (t) continue per t ≥ 0. Naturalmente, il fatto che la velocità istantanea sia infinita, indica che la traiettoria non è differenziabile in alcun punto! Inoltre si può dimostrare che la lunghezza del cammino in ogni intervallo finito di tempo è infinita. • Legge di Gauss per gli incrementi. Si può partire da un punto x = 0, considerando il processo B x (t) = x + B (t) . 23
Se X è una variabile aleatoria, scriviamo X ∼ N ν, σ 2 se X è distribuita secondo una 2 legge normale con media ν e varianza σ .
2.4 Passeggiata aleatoria simmetrica (n = 1)
59
Ad ogni punto x corrisponde una probabilità P x , da interpretarsi come la distribuzione associata ai cammini effettuati da una particella che inizialmente si trova in x, con le seguenti proprietà (se x = 0, poniamo P 0 = P , omettendo l’indice): a) P x {B x (0) = x} = P {B (0) = 0} = 1; b) per ogni s ≥ 0, t ≥ 0, l’incremento B x (t + s) − B x (s) = B (t + s) − B (s) ha distribuzione (o legge) normale con media zero e varianza t, quindi con densità 1 − x2 e 2t Γ (x, t) ≡ Γ 12 (x, t) = √ 2πt ed è indipendente da ogni evento accaduto in un tempo ≤ s. Per esempio, gli eventi {B x (t2 ) − B x (t1 ) ∈ I2 } , {B x (t1 ) − B x (t0 ) ∈ I1 } sono indipendenti se t0 < t1 < t2 . • Probabilità di transizione. Per ogni insieme di Borel I ⊆ R, è definita una funzione di transizione P (x, t, I) = P x {B x (t) ∈ I} che rappresenta la probabilità che la particella, inizialmente in x, si trovi in I all’istante t. Si ha: Γ (y, t) dy = Γ (y − x, t) dy. P (x, t, I) = P {B (t) ∈ I − x} = I−x
I
• Proprietà di Markov e proprietà di Markov Forte. Sia μ una misura di probabilità24 su R. Se la posizione iniziale della particella è aleatoria con una distribuzione di probabilità μ, parliamo allora di moto Browniano con distribuzione iniziale μ, che indichiamo con B μ . A questo processo è associata una distribuzione di probabilità P μ tale che per ogni boreliano I ⊆ R, P μ {B μ (0) ∈ I} = μ (I) . La probabilità che la particella si trovi in I al tempo t si calcola con la formula (Teorema delle Probabilità Totali) P x {B x (t) ∈ I} dμ (x) = P (x, t, I) dμ (x) . P μ {B μ (t) ∈ I} = R
24
R
Si veda l’Appendice B per la definizione di una misura di probabilità μ e di integrale rispetto alla misura μ.
60
2 Diffusione
La proprietà di Markov si può esprimere così: data una qualunque condizione H, relativa al comportamento della particella prima dell’istante s ≥ 0, il processo Y (t) = B x (t + s) è un moto Browniano con distribuzione iniziale 25 μ (I) = P x {B x (s) ∈ I |H } . Sostanzialmente, questa proprietà stabilisce l’indipendenza del processo futuro B x (t + s) da quello passato (prima di s), quando il presente B x (s) è noto e riflette l’assenza di memoria della passegiata aleatoria. Nella proprietà di Markov forte, s è sostituito da un tempo τ aleatorio, che dipende solo dal comportamento della particella nell’intervallo [0, τ ]. In altri termini, per decidere se τ ≤ t, è sufficiente la conoscenza della traiettoria fino al tempo t e non oltre. Tali tempi aleatori prendono il nome di tempi di arresto. Un esempio importante è il tempo di prima uscita da un dominio (aperto connesso), che avremo modo di considerare nel prossimo capitolo. Un esempio di tempo τ , aleatorio, che non sia un tempo d’arresto è il seguente: τ = inf {t : B (t) > 10 e B (t + 1) < 10} . Infatti (misurando il tempo in secondi), τ è “il più piccolo” fra gli istanti t tali che: la traiettoria al tempo t si mantiene sopra il livello 10 e un secondo dopo si trova sotto tale livello. Evidentemente, per decidere se il valore di τ è minore o uguale (per esempio) a 3, non è sufficiente conoscere la traiettoria fino all’istante t = 3, ma occorre esaminare la traiettoria anche all’istante “futuro” 4. • Valore atteso. Per x, t fissati, la funzione di transizione P (x, t, I) coincide con la legge di un moto Browniano uscente da x. Data una funzione (sufficientemente regolare) g = g (y), y ∈ R, si può definire la variabile aleatoria Z (t) = (g ◦ B x ) (t) = g (B x (t)) . Il suo valore atteso è assegnato dalla formula g (y) P (x, t, dy) = g (y) Γ (x − y, t) dy. E [Z (t)] = R
R
Vedremo più avanti la rilevanza di questa formula.
2.5 Diffusione, trasporto e reazione 2.5.1 Passeggiata aleatoria con deriva (drift) Una variante della passeggiata aleatoria si ottiene abbandonando l’ipotesi di simmetria del moto. Assumiamo dunque che la nostra ipotetica particella di massa unitaria sia in moto lungo l’asse x secondo le seguenti regole. 25
P (A |H ) indica la probabilità di A, condizionata ad H.
2.5 Diffusione, trasporto e reazione
61
1. In un tempo τ la particella si muove di h, partendo da x = 0. 2. Essa si muove a destra con probabilità p0 = 12 e a sinistra con probabilità q0 = 1 − p0 , in modo indipendente dal passo precedente (Figura 2.8). Indichiamo ancora con p = p (x, t) la probabilità che la particella ha di trovarsi in x = mh al tempo t = N τ . Se indichiamo ancora con k la variabile aleatoria che conta il numero di passi a destra, questa volta troviamo (Problema 2.12.) pk = CN,k pk0 q0N −k
(2.75)
per cui la funzione generatrice delle probabilità è data da N
G (s) = (p0 s + q0 ) . Si trovano poi seguenti valori per la media e varianza di x: a) valore atteso di x dopo N passi: x = N (p0 − q0 )h; % & b) momento secondo di x dopo N passi = x2 = N h2 . Il primo valore indica la posizione media rispetto all’origine. Essendo t = N τ abbiamo (p0 − q0 )h x = (2.76) t τ che indica la posizione media raggiunta nell’unità di tempo e codifica l’asimmetria del moto. Nel passaggio al limite per h, τ → 0 occorrerà mantenere questa caratteristica del moto, attraverso un controllo del rapporto a secondo membro della (2.76). ' 2 Notiamo che √ la fluttuazione media dall’origine, data da x , è ancora uguale a N h. Le caratteristiche della diffusione sono dunque rimaste invariate rispetto al caso simmetrico e sono codificate nel rapporto % 2& x h2 = , t τ anche questo da mantenere costante. Passiamo ora al calcolo della probabilità di transizione limite. Dal teorema delle probabilità totali, abbiamo p (x, t + τ ) = p0 p (x − h, t) + q0 p (x + h, t)
Figura 2.8. Passeggiata aleatoria con deriva
(2.77)
62
2 Diffusione
con le solite condizioni iniziali p (0, 0) = 1 e p (x, 0) = 0
se x = 0.
Fissati x e t, vogliamo esaminare che cosa succede passando al limite per h → 0, τ → 0. Proviamo a procedere come nel caso simmetrico. Supponendo p differenziabile quanto occorre, scriviamo ancora p (x, t + τ ) = p (x, t) + pt (x, t) τ + o (τ ) 1 p (x ± h, t) = p (x, t) ± px (x, t) h + pxx (x, t) h2 + o h2 . 2 Sostituendo nella (2.77), dopo alcune semplificazioni, si trova pt τ + o (τ ) =
1 pxx h2 + (q0 − p0 ) hpx + o h2 . 2
(2.78)
Dividendo per τ , si ottiene pt + o (1) =
(q0 − p0 ) h 1 h2 px + o pxx + 2 τ τ
h2 τ
.
(2.79)
Rispetto al caso simmetrico è comparso un nuovo termine, indicato nel riquadro. Si noti che il coefficiente di px coincide con il secondo membro della (2.76). Proviamo a passare al limite per h, τ → 0, assumendo (come prima) che h2 = 2D. τ Come era prevedibile, questo non è sufficiente: se manteniamo p0 e q0 costanti si ha (q0 − p0 ) h →∞ τ e dalla (2.79) si ottiene una contraddizione. D’altra parte abbiamo visto che è naturale un controllo del rapporto (q0 − p0 ) h/τ . Scrivendo (q0 − p0 ) h2 (q0 − p0 ) h (q0 − p0 ) = 2D = τ h h τ si vede che occorre richiedere q0 − p0 →β h
(2.80)
con β finito. Poiché q0 + p0 = 1, (2.80) equivale a p0 =
1 β − h + o (h) 2 2
e
q0 =
1 β + h + o (h) , 2 2
(2.81)
2.5 Diffusione, trasporto e reazione
63
che si potrebbe interpretare come una condizione di simmetria del moto a livello microscopico 26 . In tal caso (q0 − p0 ) h2 → 2Dβ ≡ b τ h e la (2.79) diventa pt = Dpxx + bpx
(2.82)
dove è possibile che D e b dipendano da x e t. Smascheriamo il termine bpx incominciando ad esaminare le dimensioni (fisiche) di b. Poiché q0 − p0 è adimensionale, essendo una differenza di probabilità, b ha le dimensioni di h/τ e cioè di una velocità: [b] = spazio × tempo−1 . Il coefficiente b codifica dunque la tendenza del moto continuo, risultante dal passaggio al limite, a muoversi verso una direzione privilegiata con velocità (scalare) |b|: a destra se b < 0, a sinistra se b > 0. In altri termini, esiste una corrente di intensità |b| che trasporta la particella in una direzione mentre questa diffonde con costante D. La passeggiata aleatoria è diventata un processo di diffusione con deriva. Quest’ultimo punto di vista incita all’analogia con una sostanza che diffonde mentre viene trasportata, ad esempio, lungo un corso d’acqua. 2.5.2 Inquinante in un canale Esaminiamo un semplice modello di trasporto e diffusione di una sostanza inquinante lungo un canale con corrente che si muove con velocità v costante lungo la direzione positiva dell’asse x. Implicitamente stiamo trascurando la profondità (pensando che l’inquinante galleggi) e la dimensione trasversale del canale (pensando ad un canale molto stretto). Vogliamo derivare un modello matematico, capace di descrivere l’evoluzione della concentrazione c = c (x, t) della sostanza. Le dimensioni fisiche di c sono massa × lunghezza−1 per cui c (x, t) dx rappresenta la massa presente al tempo t nell’intervallo [x, x + dx] (di lunghezza infinitesima, Figura 2.9). Coerentemente, l’integrale x+Δx c (y, t) dy (2.83) x
rappresenta la massa presente al tempo t nell’intervallo [x, x + Δx] . Per costruire un modello matematico per c ricorriamo alle leggi generali di bilancio 26
Se a livello microscopico non ci fosse simmetria, la velocità istantanea infinita farebbe schizzare immediatamente la particella all’infinito (chiedo contemporaneamente perdono per aver osato scrivere una frase del genere).
64
2 Diffusione
Figura 2.9. Trasporto di inquinante
e/o conservazione. Nel caso presente, in assenza di sorgenti esogene (cioè di aggiunta o sottrazione di massa) vige il principio di conservazione della massa: il tasso di variazione dela massa contenuta in un intervallo [x, x + Δx] uguaglia il flusso netto di massa attraverso gli estremi. Ricordando la (2.83), il tasso di variazione della massa che si trova nell’intervallo [x, x + Δx] è dato da27 x+Δx d x+Δx c (y, t) dy = ct (y, t) dy (2.84) dt x x e ha segno positivo (negativo) se entra più (meno) massa di quanta ne esca. Indichiamo con q = q (x, t) il flusso di massa che entra nell’intervallo [x, x + Δx] attraverso il punto x al tempo t. Le dimensioni fisiche di q sono massa × tempo−1 . Il flusso netto di massa agli estremi dell’intervallo è dato da q (x, t) − q (x + Δx, t) . (2.85) Uguagliando (2.84) e (2.85), la legge di conservazione della massa si scrive x+Δx ct (y, t) dy = q (x, t) − q (x + Δx, t) . x
Dividendo per Δx e passando al limite per Δx → 0, si trova ct = −qx .
(2.86)
A questo punto dobbiamo decidere con che tipo di flusso di massa abbiamo a che fare o, in altri termini, stabilire una legge costitutiva per q. Vi sono varie possibilità, tra cui: a) Convezione o trasporto. Il flusso è determinato dalla sola corrente d’acqua, come se l’inquinante formasse una macchia che viene trasportata dal fluido, senza deformarsi o espandersi. In tal caso è ragionevole supporre che q (x, t) = vc (x, t) 27
Presumendo di poter effettuare la derivazione sotto il segno di integrale.
2.5 Diffusione, trasporto e reazione
65
dove, ricordiamo, v indica la velocità (costante) della corrente. b) Diffusione. Abbiamo già trovato qualcosa di simile a proposito della diffusione del calore. Secondo la legge di Fourier il flusso di calore è proporzionale e di segno opposto al gradiente di temperatura. Qui si può adottare una legge analoga, che nella circostanza prende il nome di legge di Fick : q (x, t) = −Dcx (x, t) dove D è una costante che dipende dalla sostanza ed ha le solite dimensioni lunghezza2 × tempo−1 . L’idea è che la sostanza si espanda in zone da alta a bassa concentrazione, da cui il segno meno nell’espressione di q. Nel nostro caso, trasporto e diffusione sono entrambe presenti, e quindi sovrapponiamo due effetti scrivendo q (x, t) = vc (x, t) − Dcx (x, t) . Dalla (2.86) deduciamo ct = Dcxx − vcx .
(2.87)
Poiché D e v sono costanti, è facile determinare l’evoluzione di una massa Q di inquinante posta inizialmente nell’origine. Si tratta di determinare la soluzione di (2.87) con la condizione iniziale c (x, 0) = Qδ (x) dove δ è la distribuzione di Dirac nell’origine. Ci si può liberare del termine −vcx con un semplice cambiamento di variabili. Infatti, poniamo w (x, t) = c (x, t) ehx+kt con h, k da determinarsi opportunamente. Si ha: wt = [ct + kc]ehx+kt wx = [cx + hc]ehx+kt ,
wxx = [cxx + 2hcx + h2 c]ehx+kt
e quindi, usando l’uguaglianza ct = Dcxx − vcx , wt − Dwxx = ehx+kt [ct − Dcxx − 2Dhcx + (k − Dh2 )c] = = ehx+kt [(−v − 2Dh)cx + (k − Dh2 )c] per cui, se scegliamo
v v2 , k= 2D 4D la funzione w è soluzione dell’equazione del calore wt − Dwxx = 0, con la condizione iniziale h=−
w (x, t) = c (x, 0) e− 2D x = Qδ (x) e− 2D x . v
v
66
2 Diffusione
Nel Capitolo 7 vedremo che δ (x) e− 2D x = δ (x), per cui w (x, t) = ΓD (x, t) e di conseguenza v v c (x, t) = QΓD (x, t) exp x− t 2D 2 v
che v è lav Γ D “trasportata e modulata” dall’onda progressiva Q exp 2D x − 2 t , in moto verso destra con velocità v/2. In situazioni realistiche, l’inquinante è soggetto a decadimento per decomposizione biologica. L’equazione che ne deriva diventa ct = Dcxx − vcx − γc
(2.88)
dove γ è il tasso percentuale di decadimento 28 . Ci occupiamo di questo caso nella prossima sezione, per mezzo di un’altra variante della passeggiata aleatoria. Nota 2.2. Se D e v non fossero costanti, la (2.88) diventerebbe ct = (Dc)x − (vc)x − γc.
(2.89)
Tratteremo questo tipo di equazioni nel Capitolo 9. 2.5.3 Passeggiata aleatoria con deriva e reazione Torniamo alla nostra passeggiata aleatoria con deriva, ipotizzando che la particella o meglio, la massa unitaria, si estingua o scompaia, per assorbimento o decadimento di qualche natura, ad un tasso percentuale costante γ > 0 . Ciò significa che in un intervallo di tempo da t a t + τ scompare una massa pari a Q (x, t) = τ γp (x, t) . L’equazione alle differenze per p diventa p (x, t + τ ) = p0 [p (x − h, t) − Q (x − h, t)] + q0 [p (x + h, t) − Q (x + h, t)]. Essendo29 p0 Q (x − h, t) + q0 Q (x + h, t) = Q (x, t) + (q0 − p0 )hQx (x, t) + ... = τ γp (x, t) + O (τ h) con i soliti calcoli si perviene a pt τ + o (τ ) = 28 29
1 pxx h2 − (q0 − p0 )hpx − τ γp + O (τ h) + o h2 . 2
[γ] = tempo−1 . Il simbolo di “ O (h)” (“O grande di h”) indica qui una quantità dell’ordine di grandezza di h.
2.6 Passeggiata aleatoria multidimensionale
67
Dividiamo per τ e passiamo al limite per h, τ → 0; assumendo h2 = 2D τ
e
q 0 − p0 → β, h
otteniamo l’equazione di diffusione, trasporto e reazione (o assorbimento) pt = Dpxx + bpx − γp
(b = 2Dβ).
(2.90)
Nota 2.3. Il termine −γp appare nella (2.90) come un termine di decadimento. D’altra parte, in importanti situazioni, γ potrebbe essere negativo, modellando questa volta una creazione di massa al tasso percentuale |γ|. Per questa ragione l’ultimo termine prende il nome generico di termine di reazione e la (2.90) costituisce un modello di diffusione con deriva e reazione . Riassumendo, esaminiamo separatamente gli effetti dei tre termini a secondo membro della (2.90). • pt = Dpxx modella la sola diffusione. Il comportamento della soluzione fondamentale ΓD ne codifica l’evoluzione tipica, caratterizzata dagli effetti di espansione, regolarizzazione (smoothing) e appiattimento del dato iniziale. • pt = bpx è un’equazione di puro trasporto, che considereremo in dettaglio nel Capitolo 4. Le soluzioni sono onde progressive della forma g (x + bt). • pt = −γp è un modello di reazione lineare. Le soluzioni sono multipli di e−γt che decadono (crescono) se γ > 0 (γ < 0). Finora abbiamo dato un’interpretazione probabilistica per un moto su tutto R, dove non vi sono condizioni al bordo. Nei Problemi 2.9 e 2.10 si trovano le interpretazioni probabilistiche delle condizioni di Dirichlet e Neumann in termini di barriere assorbenti e riflettenti, rispettivamente.
2.6 Passeggiata aleatoria multidimensionale 2.6.1 Il caso simmetrico Quanto fatto in dimensione n = 1 si può estendere a dimensione n > 1; tipicamente n = 2, 3. Cominciamo a considerare la passeggiata aleatoria simmetrica. Conviene introdurre il reticolo Zn (= Z × Z per n = 2, = Z×Z×Z per n = 3) dei punti x ∈Rn le cui coordinate sono interi relativi. Introdotto il passo spaziale h > 0, il simbolo hZn indica il reticolo dei punti le cui coordinate sono interi relativi moltiplicati per h. Ogni punto x ∈hZn , possiede un “intorno discreto” di 2n punti a distanza h, dati da x+hej e x−hej (j = 1, ..., n), dove i vettori ej sono quelli della base canonica in Rn . La nostra particella si muove in hZn secondo le seguenti regole.
68
2 Diffusione
Figura 2.10. Passeggiata simmetrica bidimensionale
1. Parte da x = 0. 2. Se essa si trova in x al tempo t, al tempo t + τ la particella si troverà in 1 . uno dei punti x ± hej con probabilità p = 2n 3. Essa si muove in modo indipendente dal passo precedente (Figura 2.10). Come prima, ci poniamo il problema di calcolare la probabilità p (x, t) che la particella si trovi in x al tempo t. Il teorema delle probabilità totali fornisce la relazione 1 {p (x+hej , t) + p (x−hej , t)} 2n j=1 n
p (x, t + τ ) =
(2.91)
con le condizioni iniziali p (0, 0) = 1 e p (x, 0) = 0
se x = 0
che ricordano quelle della soluzione fondamentale Γ . Infatti, per raggiungere il punto x al tempo t+τ , la particella deve trovarsi al tempo t in uno dei punti dell’intorno discreto di x e da lì muoversi verso x con probabilità 1/2n. Fissati x e t, vogliamo ora esaminare cosa succede se passiamo al limite per h → 0, τ → 0. Supponendo p differenziabile quanto occorre, possiamo scrivere p (x, t + τ ) = p (x, t) + pt (x, t) τ + o (τ ) 1 p (x ± hej , t) = p (x, t) ± pxj (x, t) h + pxj xj (x, t) h2 + o h2 . 2 Sostituendo nella (2.91), dopo alcune semplificazioni, si trova pt τ + o (τ ) =
h2 Δp + o h2 2n
2.6 Passeggiata aleatoria multidimensionale
69
e dividendo per τ , pt + o (1) =
1 h2 Δp + o 2n τ
h2 τ
.
(2.92)
La situazione è pressochè identica al caso uni-dimensionale: per ottenere un risultato significativo quando h, τ → 0, occorre ancora che il rapporto h2 /τ si mantenga finito e positivo. Assumiamo dunque che h2 = 2nD. τ
(2.93)
Da (2.93), si deduce√ che nell’unità di tempo, la particella diffonde ad una distanza media di 2nD. Le dimensioni fisiche di D non sono cambiate. Passando al limite nella (2.92) si ottiene per p l’equazione del calore pt = DΔp e le condizioni iniziali diventano lim p (x, t) = δ. t↓0
Come prima, l’unica soluzione è data dalla soluzione fondamentale p (x, t) ≡ ΓD (x, t) =
|x|2
1 (4πDt)
n/2
e− 4Dt ,
t > 0.
La passeggiata aleatoria n−dimensionale è diventata un cammino continuo che, nel caso D = 12 , prende il nome di moto Browniano n-dimensionale. Indichiamo con B = B (t) = B (t, ω) la posizione di una particella “Browniana”. Le sue proprietà caratteristiche sono le seguenti. • Con probabilità 1, i possibili cammini di una particella Browniana sono funzioni t −→ B (t) continue per t ≥ 0. • Il processo Bx (t) = x + B (t) definisce il moto Browniano con partenza da x. Ad ogni punto x è associata una probabilità P x , da interpretarsi come la distribuzione dei cammini effettuati da una particella che inizialmente si trova in x, con le seguenti proprietà (se x = 0, poniamo P 0 = P, omettendo l’indice): a) P x {Bx (0) = x} = P {B (0) = 0} = 1, b) per ogni s ≥ 0, t ≥ 0, l’incremento Bx (t + s) − Bx (s) = B (t + s) − B (s)
70
2 Diffusione
segue una legge normale con media zero e matrice di covarianza tIn , quindi con densità |x|2 1 − 2t e , Γ (x, t) = Γ 12 (x, t) = n/2 (2πt) ed è indipendente da ogni evento accaduto in un tempo ≤ s. Per esempio, gli eventi {B (t2 ) − B (t1 ) ∈ A1 }
{B (t1 ) − B (t0 ) ∈ A2 }
sono indipendenti se t0 < t1 < t2 . • Funzione di transizione. Per ogni insieme di Borel A ⊆ Rn , è definita una funzione di transizione P (x, t, A) = P x {Bx (t) ∈ A} che rappresenta la probabilità che la particella, inizialmente in x, si trovi in A all’istante t. Si ha: P (x, t, A) = P {B (t) ∈ A − x} = Γ (y, t) dy = Γ (y − x, t) dy. A−x
A
• Invarianza. Il moto è invariante per rotazioni. • Proprietà di Markov e proprietà di Markov Forte. Se la posizione iniziale è aleatoria con una distribuzione di probabilità μ definita sui boreliani di Rn , parliamo di moto Browniano con distribuzione iniziale μ, che si può indicare con Bμ . A questo processo è associata una distribuzione di probabilità P μ tale che P μ {Bμ (0) ∈ A} = μ (A) mentre la probabilità che la particella si trovi in A al tempo t si calcola con la formula μ μ P {B (t) ∈ A} = P (x, t, A) dμ (x) . (2.94) Rn
La proprietà di Markov si può esprimere così: data una qualunque condizione H, riguardante il comportamento della particella prima dell’istante s ≥ 0, il processo dopo s, Y (t) = Bx (t + s), è un moto Browniano con distribuzione iniziale μ (A) = P x {Bx (s) ∈ A |H } . Ancora, questa proprietà stabilisce l’indipendenza del processo futuro Bx (t + s) dal passato quando il presente Bx (s) è noto e codifica l’ assenza di memoria del processo. Nella proprietà di Markov forte, s è sostituito da un tempo d’arresto τ , che dipende solo dal comportamento della particella nell’intervallo [0, τ ].
2.7 Un esempio di diffusione e reazione (n = 3)
71
2.6.2 Passeggiata con deriva e reazione Come nel caso unidimensionale, si possono costruire varianti non simmetriche o con reazione della passeggiata aleatoria in Zn . Per esempio, possiamo ammettere comportamenti diversi lungo le direzioni degli assi coordinati scegliendo un passo spaziale hj lungo la direzione ej , per ogni j = 1, ..., n. Il corrispondente processo limite modella un moto anisotropo, le cui caratteristiche sono codificate nella matrice ⎛ ⎞ D1 0 · · · 0 ⎜ 0 D2 0 ⎟ ⎜ ⎟ D =⎜. . . . ... ⎟ ⎝ .. ⎠ 0 0 · · · Dn dove Dj = h2j /2nτ è il coefficiente di diffusione nella direzione ej . L’equazione che governa la probabilità di transizione p (x,t) è pt =
n
Dj pxj xj .
(2.95)
j=1
Possiamo ulteriormente rompere la simmetria richiedendo che, lungo la direzione ej , la probabilità di muoversi nei due vesri siano pj e qj , con pj + qj = 1. Se per hj e τ tendenti a zero si assume che qj − pj → βj hj
e
bj = 2Dj β j ,
il vettore di trasporto o deriva b = (b1 , ..., bn ) codifica l’asimmetria del moto. Aggiungendo un termine di reazione della forma ap, si ottiene l’equazione di diffusione-trasporto-reazione ut =
n
j=1
Dj pxj xj +
n
bj uxj + au.
(2.96)
j=1
Nel Problema 2.21 chiediamo al lettore di completare i dettagli nella derivazione delle equazioni (2.95) e (2.96). Tratteremo questo tipo di equazioni da un punto di vista più generale nel Capitolo 9.
2.7 Un esempio di diffusione e reazione (n = 3) In questa sezione esaminiamo un modello di diffusione-reazione in un materiale fissile. Sebbene la situazione sia molto semplificata rispetto alla realtà, si possono già cogliere alcuni aspetti interessanti. Sparando neutroni su un nucleo di uranio può succedere che il nucleo si spezzi in 2 parti liberando altri neutroni già presenti nel nucleo e provocando
72
2 Diffusione
il fenomeno della fissione nucleare. Alcuni aspetti macroscopici del fenomeno possono essere modellati elementarmente. Supponiamo di avere un cilindro di materiale fissile di altezza h e raggio R, con massa totale M = π R2 h dove è la densità di massa. A livello macroscopico, i neutroni liberi diffondono come una sostanza chimica in un mezzo poroso. Se N = N (x, y, z,t) è la densità dei neutroni, avremo, in assenza di fissione, una legge del tipo: flusso di neutroni uguale a −D∇N . La legge di conservazione della massa, fornisce allora Nt = DΔN. Se all’interno del cilindro vengono liberati neutroni ad un tasso relativo γ > 0, avremo l’equazione (2.97) Nt = DΔN + γN, dove diffusione e reazione sono presenti e antagoniste: la diffusione tende a diminuire N mentre, ovviamente, il termine di reazione provocherebbe da solo un aumento esponenziale. Cruciale è il comportamento asintotico di N per t → +∞. Cerchiamo soluzioni limitate, soddisfacenti condizioni di Dirichlet omogenee sul bordo del cilindro, con l’idea che la densiatà sia maggiore al centro e molto bassa vicino al bordo. È allora ragionevole assumere che N abbia una simmetria rispetto all’asse del cilindro, che pensiamo dislocato lungo l’asse z. Usando le coordinate spaziali cilindriche (r, θ, z), con x = r cos θ, y = r sin θ, possiamo scrivere N = N (r, z, t) e le condizioni di Dirichlet sul bordo del cilindro diventano N (R, z, t) = 0 N (r, 0, t) = N (r, h, t) = 0
0
(2.98)
0
per ogni t > 0. Coerentemente, assegnamo una condizione iniziale N (r, z, 0) = N0 (r, z)
(2.99)
tale che N0 (R, z) = 0 per 0 < z < h, e N0 (r, 0) = N0 (r, h) = 0.
(2.100)
Per risolvere il problema (2.97), (2.98), (2.99), liberiamoci anzitutto del termine di reazione, ponendo N (r, z, t) = N (r, z, t) eγt .
(2.101)
2.7 Un esempio di diffusione e reazione (n = 3)
73
Scrivendo poi l’operatore di Laplace in coordinate cilindriche 30 l’equazione per N è la seguente: 1 (2.102) Nt = D Nrr + Nr + Nzz . r Con le stesse condizioni iniziali e al bordo di N . Per il principio di massimo, sappiamo che esiste solo una soluzione, continua fino al bordo del cilindro. Per trovare una formula esplicita, usiamo il metodo di separazione delle variabili, cercando prima soluzioni limitate della forma N (r, z, t) = u (r) v (z) w (t) ,
(2.103)
soddisfacenti le condizioni di Dirichlet omogenee u (R) = 0 e v (0) = v (h) = 0. Sostituendo (2.103) nella (2.102), si trova 1 u (r) v (z) w (t) = D[u (r) v (z) w (t) + u (r) v (z) w (t) + u (r) v (z) w (t)]. r Dividendo per N e riordinando i termini, otteniamo u (r) 1 u (r) w (t) v (z) − + . = Dw (t) u (r) r u (r) v (z)
(2.104)
I due membri della (2.104) dipendono da variabili diverse e pertanto devono essere entrambi uguali ad una costante b. Per v abbiamo dunque il problema agli autovalori v (z) − bv (z) = 0 v (0) = v (h) = 0. 2
2
Gli autovalori sono bm ≡ −ν 2m = − mh2π , m ≥ 1 intero, con corispondenti autofunzioni v (z) = sin ν m z. L’equazione per w e u si può scrivere nella forma: w (t) u (r) 1 u (r) + ν 2m = + Dw (t) u (r) r u (r)
(2.105)
dove le variabili r e t sono ancora separate. I due membri della (2.105) devono perciò essere uguali ad una costante comune μ. Per w otteniamo dunque l’equazione w (t) = D(μ − ν 2m )w (t) che dà 30
w (t) = c exp D μ − ν 2m t ,
c ∈ R.
In coordinate cilindriche rispetto all’asse z si ha Δ = ∂rr + r1 ∂r + ∂zz .
(2.106)
74
2 Diffusione
L’equazione per u è
1 u (r) + u (r) − μu (r) = 0 r
(2.107)
con u (R) = 0
e
u limitata in [0, R] .
(2.108)
La (2.107) è un’equazione parametrica di Bessel, di ordine zero, con parametro −μ; le condizioni (2.108) implicano 31 μ = −λ2 < 0. A meno di costanti moltiplicative, la sola soluzione non nulla e limitata di (2.107), (2.108) è J0 (λr), dove J0 (x) =
∞ k
(−1) x 2k 2 2 (k!)
k=0
è la funzione di Bessel di primo genere e ordine zero. Imponendo u (R) = 0, si trova J0 (λR) = 0. Ora, la funzione di Bessel J0 ha infiniti zeri positivi e semplici32 λn , n ≥ 1: 0 < λ1 < λ2 < ... < λn < ... per cui, se λR = λn , si trovano infinite soluzioni date da λn r . un (r) = J0 R Quindi
λ2n . R2 Riassumendo, abbiamo determinato infinite soluzioni a variabili separate della forma μ = μn = −
Nmn (r, z, t) = un (r) vm (z) wm,n (t) = λn r λ2n 2 sin ν m z exp −D ν m + 2 t = J0 R R 31
Infatti, scriviamo l’equazione di Bessel (2.107) nella forma ru − μru = 0. Moltiplicando per u e integrando su (0, R) , si trova R R u2 dr. ru udr = μ 0
(2.109)
0
Integrando per parti e usando (2.108), si ottiene R R R (u )2 dr = − ru udr = ru u 0 − 0
32
0
R
(u )2 dr < 0
0
e infine, da (2.109) si deduce μ < 0. Questi zeri sono noti con elevato grado di accuratezza e si trovano tabulati in vari testi. I primi 5 sono, con 4 decimali esatti: 2.4048, 5.5201, 8.6537, 11.7915, 14.9309.
2.7 Un esempio di diffusione e reazione (n = 3)
75
soddisfacenti le condizioni di Dirichlet. Rimane da soddisfare la condizione iniziale. Poiché l’equazione e le condizioni di Dirichlet omogenee costituiscono un problema lineare, usiamo il principio di sovrapposizione e scriviamo la candidata soluzione finale come ∞
cmn Nmn (r, z, t) . N (r, z, t) = n,m=1
I coefficienti cm,n devono essere scelti in modo che ∞ ∞
mπ λn r sin z = N0 (r, z) . (2.110) cmn Nmn (r, z, 0) = cmn J0 R h n,m=1 n,m=1 La seconda delle (2.100) e la (2.110) suggeriscono uno sviluppo di N0 in serie di Fourier di soli seni rispetto a z. Sia, allora, 2 h mπ cm (r) = z, m ≥ 1, N (r, z) sin h 0 h e ∞
mπ N0 (r, z) = z. cm (r) sin h m=1 La (2.110) indica che per ogni m, i cmn sono i coefficienti dello sviluppo di cm (r) nella serie di Fourier-Bessel ∞
λn r = cm (r) . cmn J0 R n=1 Non siamo realmente interessati all’esatta formula per i cmn , ma, comunque, torneremo tra breve su questo punto. In conclusione, ricordando la (2.101), l’espressione analitica del nostro problema originale è la seguente: ! ∞
λ2 λn r cmn J0 exp γ − Dν 2m − D n2 t sin ν m z. N (r, z, t) = R R n,m=1 (2.111) Naturalmente, la (2.111) è solo una soluzione formale, poiché dovremmo stabilire in che senso i dati iniziali e al bordo vengono assunti e controllare che le necessarie differenziazioni termine a termine possano essere effettuate. Ciò può essere assicurato sotto ragionevoli ipotesi di regolarità di N0 , ma non intendiamo addentrarci nei calcoli. Piuttosto, l’espressione analitica della soluzione permette già di trarre una conclusione abbastanza interessante sulla sua evoluzione temporale. Consideriamo per esempio il valore di N al centro 2 2 del cilindro, cioè per r = 0 e z = h/2; si ha, essendo J0 (0) = 1, e ν 2m = mh2π , ! ∞
m2 π 2 λ2 h mπ N 0, , t = cmn sin exp γ − D 2 − D n2 t . 2 2 h R n,m=1
76
2 Diffusione
Il fattore esponenziale è massimo per m = n = 1, per cui il termine prevalente nella somma è ! π2 λ2 c11 exp γ − D 2 − D 12 t . h R Se ora
γ−D
π2 λ21 + h2 R2
< 0,
ogni termine tende a zero per t → ∞ e la reazione si spegne. Se invece γ−D ossia
π2 λ2 + 12 2 h R
>0
λ2 γ π2 > 2 + 12 D h R
(2.112)
allora si ha una crescita esponenziale almeno nel primo termine e quindi anche per N (0, h/2, t). La (2.112) è possibile solo se sono verificate entrambe le relazioni Dπ 2 Dλ21 h2 > e R2 > . (2.113) γ γ Le (2.113) costituiscono una limitazione inferiore per l’altezza e per il raggio del cilindro. Pertanto, deduciamo l’esistenza di una massa critica al di sotto della quale la reazione non si sostiene. Nota 7.1. Il problema di sviluppare in serie di funzioni di Bessel una data funzione r è analogo a quello dello sviluppo in serie di Fourier, con le funn che fanno la parte delle funzioni trigonometriche. Assumiamo zioni J0 λR
Figura 2.11. La funzione di Bessel J0
2.8 Il problema di Cauchy globale (n = 1)
77
per semplicità R = 1. Le funzioni di Bessel J0 (λn r) soddisfano le seguenti proprietà di ortogonalità, 1 0 m = n xJ0 (λm x)J0 (λn x)dx = 1 0 2 cn m = n dove cn =
∞
k=0
k
(−1) k! (k + 1)!
λn 2
2k+1 .
Una funzione f abbastanza regolare (per esempio di classe C 1 ([0, 1])) ammette uno sviluppo del tipo ∞
f (x) = an J0 (λn x) (2.114) n=0
dove i coefficienti ak sono assegnati dalla formula 2 c2n
an =
1 0
xf (x) J0 (λn x) dx.
La serie (2.114) converge nel senso seguente: se SN (x) =
N
fn J0 (λn x)
n=0
allora
lim
N →+∞
0
R
2
[f (x) − SN (x)] xdx = 0.
(2.115)
Nel Capitolo 6 inquadreremo il problema in un ambito più generale.
2.8 Il problema di Cauchy globale (n = 1) 2.8.1 Il caso omogeneo In questa sezione ci occupiamo del problema di Cauchy globale, limitandoci alla dimensione 1; idee, tecniche e formule si estendono senza difficoltà e con pochi cambiamenti al caso multidimensionale. Cominciamo col problema omogeneo ut − Duxx = 0 in R× (0, ∞) (2.116) u (x, 0) = g (x) in R dove g, il dato iniziale, è assegnato. Il problema (2.116) si presenta, per esempio, quando si voglia determinare l’evoluzione della temperatura o di una
78
2 Diffusione
concentrazione di massa lungo un filo molto lungo (infinito), conoscendone la distribuzione al tempo iniziale t = 0. Un ragionamento intuitivo porta a congetturare quale possa essere la soluzione, ammesso per il momento che esista e sia unica. Interpretiamo u (x, t) come concentrazione (o densità lineare di massa), nel senso che u (x, t) dx assegna la massa che si trova nell’intervallo (x, x + dx) al tempo t. Vogliamo determinare la concentrazione dovuta alla diffusione di una massa la cui concentrazione iniziale è data da g. La quantità g (y) dy rappresenta la massa concentrata nell’intervallo (y, y + dy) al tempo t = 0. Come abbiamo visto, la funzione ΓD (x − y, t) è una unit source solution, che descrive la diffusione di una massa unitaria inizialmente concentrata nel punto y. Di conseguenza ΓD (x − y, t) g (y) dy fornisce la concentrazione in x al tempo t, dovuta alla diffusione della massa g (y) dy. Grazie alla linearità dell’equazione di diffusione, possiamo usare il principio di sovrapposizione, che permette di calcolare la soluzione come somma dei singoli contributi. Si trova così la formula: u (x, t) = R
1 4πDt
ΓD (x − y, t) g (y) dy = √
g (y) e−
(x−y)2 4Dt
dy.
(2.117)
R
Per ogni t > 0 fissato, la (2.117) è la convoluzione del dato iniziale con la Gaussiana ed ha un’interessante interpretazione probabilistica, in termini di valore atteso. Assumiamo per semplicità D = 12 . Sia B x (t) la posizione di una particella Browniana partita dal punto x e sia g (y) il guadagno acquisito al passaggio per il punto y. Allora si può scrivere (E sta per valore atteso rispetto alla misura di probabilità P x , con densità Γ (x − y, t)): u (x, t) = E [g (B x (t))] da cui la “ricetta stocastica” per la costruzione della soluzione u : per calcolare u nel punto (x, t), si considera una particella Browniana con partenza in x, se ne calcola la posizione B x (t) al tempo t, si calcola il valore atteso del guadagno g (B x (t)). Naturalmente, tutto ciò è euristico ed occorre assicurarsi che le cose funzionino rigorosamente. In particolare bisogna accertarsi che, sotto ipotesi ragionevoli sul dato iniziale g, la (2.117) sia effettivamente l’unica soluzione del problema di Cauchy. Per esempio, si vede che se g cresce troppo per x → ±∞, per esempio più 2 di un esponenziale del tipo eax , a > 0, la pur rapida convergenza a 0 della gaussiana non è sufficiente a far convergere l’integralea (2.117). Ancora più delicata è l’unicità della soluzione, come vedremo più avanti.
2.8 Il problema di Cauchy globale (n = 1)
79
2.8.2 Esistenza della soluzione Il seguente teorema assicura che la (2.117) sia effettivamente soluzione del problema di Cauchy sotto ipotesi abbastanza naturali sul dato iniziale, verificate nei casi importanti per le applicazioni. La dimostrazione è piuttosto tecnica e preferiamo ometterla. Tuttavia, nel caso g continua e limitata la prova si semplifica notevolmente ed un suggerimento è indicato nel Problema 2.15. Teorema 8.1 Sia g una funzione con un numero finito di punti di discontinuità in R, tale che 2
|g (x)| ≤ ceax ,
∀x ∈ R
(2.118)
con a e c numeri positivi opportuni, e sia u definita dalla (2.117). Allora: i) u è ben definita ed è differenziabile fino a qualunque ordine nella striscia 1 e in tale striscia R× (0, T ), con T < 4Da ut −Duxx = 0, ii) Se x0 è un punto in cui g è continua, allora u (y, t) → g (x0 )
per (y, t) → (x0 , 0) , t > 0,
iii) Esistono due costanti c1 e A tali che |u (x, t)| ≤ c1 eAx
2
,
∀x, t ∈ R× (0, T ) .
Nota 8.1. Il teorema indica che, se ammettiamo un dato iniziale con una crescita esponenziale come quella indicata, la (2.117) è una soluzione del problema di Cauchy, che esiste in un intervallo di tempo finito. Vedremo più avanti che, sotto le ipotesi indicate, è anche l’unica soluzione. In molte applicazioni, i dati iniziali hanno un andamento all’infinito di tipo polinomiale, per cui la disuguaglianza (2.118) risulta soddisfatta per qualunque A > 0. Ciò comporta che, in realtà, non vi sia nessuna limitazione sull’intervallo temporale di esistenza di questa soluzione, essendo T <
1 4Da
con A arbitrario, e, in particolare, piccolo quanto si vuole. Nota 8.2. La proprietà i ) enuncia un fatto piuttosto interessante: anche se il dato iniziale è discontinuo in qualche punto, immediatamente dopo la soluzione è diventata continua e anzi dotata di derivate di ogni ordine (di classe C ∞ ). La diffusione è quindi un processo regolarizzante, che tende cioè a smussare le irregolarità. In Figura 2.12 il fenomeno è illustrato per il dato iniziale g (x) = χ(−2,0) (x) + χ(1,4) (x) .
80
2 Diffusione
1
0.5
0 1
0.8
0.6
0.4 0.2 t
0
-2
-1
1
0
2
3
4
x
Figura 2.12. Effetto regolarizzante dell’equazione del calore
Nota 8.3. La proprietà ii ) indica in particolare che, se il dato iniziale g è continuo in R, allora la soluzione è continua in R×[0, T ) e cioè (x−y)2 1 √ lim g (y) e− 4Dt dy = g (x0 ) per ogni x0 ∈ R. (x,t)→(x0 ,0) 4πDt R Un’interessante conseguenza di questo fatto è che ogni funzione continua in un intervallo [a, b] può essere uniformemente approssimata da polinomi. Precisamente, abbiamo il seguente importante Teorema di Approssimazione (di Weierstrass). Sia g ∈ C ([a, b]). Allora, per ogni ε > 0, esiste un polinomio p = p (x) tale che max |g (x) − p (x)| ≤ ε.
x∈[a,b]
(2.119)
Dimostrazione. Estendiamo g con continuità su tutto R, in modo che sia nulla al di fuori di un intervallo che contenga [a, b], diciamo [−L, L] . In tal modo, risulta anche che g è limitata su R. Poniamo M = max |g|. Fissiamo ora ε > 0. Dal Teorema 8.1 deduciamo che la funzione L (x−y)2 1 g (y) e− 4t dy u (x, t) = √ 2 πt −L è soluzione dell’equazione ut − uxx = 0 in R× (0, +∞) e che, per ogni ε > 0, se t0 è sufficientemente piccolo, si ha max |g (x) − u (x, t0 )| ≤ ε .
x∈[a,b]
(2.120)
D’altra parte, usando la formula di Taylor di ordine N per la funzione esponenziale, con N sufficientemente grande, possiamo scrivere + * N k 2 k − (x−y)2 (−1) (x − y) e 4t0 − ≤ ε , (2.121) k! 4t0 k=1
2.8 Il problema di Cauchy globale (n = 1)
81
per ogni x ∈ [a, b] e y ∈ [−L, L]. Definiamo 1 pN (x) = √ 2 πt0
L
g (y) −L
N k
(−1) k=1
k!
*
(x − y) 4t0
2
+k dy.
Allora pN (x) è un polinomio di grado 2N e dalla (2.121) si ricava L ε ε LM √ |g (y)| dy ≤ √ , |u (x, t0 ) − pN (x)| ≤ πt0 2 πt0 −L
(2.122)
per ogni x ∈ [a, b]. Dalle (2.120) e (2.122) otteniamo allora max |g (x) − pN (x)| ≤ max |g (x) − u (x, t0 )| + max |u (x, t0 ) − pN (x)|
x∈[a,b]
x∈[a,b]
x∈[a,b]
LM ≤ ε 1 + √ . πt0 √ Basta ora scegliere ε = ε(1 + LM/ πt0 )−1 per avere la (2.119).
2.8.3 Il caso non omogeneo. Metodo di Duhamel L’equazione alle differenze p (x, t + τ ) =
1 1 p (x − h, t) + p (x + h, t) 2 2
che abbiamo ricavato nella Sezione 4.2 durante l’analisi della passeggiata aleatoria simmetrica, può essere considerata come una versione probabilistica del principio di conservazione della massa: la densità di massa presente in (x, t + τ ) è la somma delle densità diffuse da (x + h, t) e da (x − h, t); non si è aggiunta o tolta massa alla quantità originariamente presente. Coerentemente, la differenza 1 1 p (x, t + τ ) − [ p (x − h, t) + p (x + h, t)] 2 2 può essere considerata una misura della densità di massa aggiunta/tolta nell’intervallo di tempo da t a t + τ . Dividendo per τ e passando al limite per h e τ → 0 con le modalità indicate nella Sezione 4.2, si trova pt − Dpxx per cui l’operatore differenziale ∂t − D∂xx misura il tasso istantaneo di produzione della densità di massa. Supponiamo ora che dal tempo t = 0 fino ad un certo istante t = s > 0 non vi sia massa presente e che all’istante s si produca nel punto y una massa unitaria. Sappiamo modellare una sorgente del genere mediante una misura di Dirac in y, che pensiamo anche funzione del tempo, essendo presente solo al tempo s. La scriviamo nella forma δ (x − y, t − s) .
82
2 Diffusione
Siamo condotti allora all’equazione non omogenea pt − Dpxx = δ (x − y, t − s) con la condizione iniziale p (x, 0) = 0. Quale può essere la soluzione? Fino all’istante t = s non succede niente e dopo questo istante δ (x − y, t − s) = 0, quindi è come se cominciassimo da t = s e risolvessimo il problema pt − Dpxx = 0,
x ∈ R, t > s
con condizione iniziale p (x, s) = δ (x − y, t − s). Abbiamo già risolto questo problema quando s = 0: la soluzione è ΓD (x − y, t). Una traslazione nel tempo fornisce la soluzione per s generico: p (x, t) = ΓD (x − y, t − s) . Generalizziamo, considerando una sorgente distribuita nella striscia R× (0, T ) che produca/tolga densità di massa al tasso f (x, t). Precisamente, f (x, t) dxdt è la massa prodotta/tolta (dipende dal segno di f ) tra x e x + dx, nell’intervallo di tempo (t, t + dt). Se inizialmente non è presente alcuna massa, siamo condotti al problema vt − Dvxx = f (x, t) in R× (0, T ) (2.123) v (x, 0) = 0 in R. Per costruire la soluzione nel punto (x, t), ragioniamo euristicamente come prima. Calcoliamo il contributo di una massa f (y, s) dyds, concentrata tra y e y + dy e prodotta nell’intervallo (s, s + ds). È come se avessimo un secondo membro della forma f ∗ (x, t) = f (x, t) δ (x − y, t − s), per cui la quantità f (y, s) ΓD (x − y, t − s) dyds rappresenta la densità di massa presente in x all’istante t, dovuta alla diffusione della massa f (y, s) dyds. Il contributo totale (la soluzione) si ottiene per sovrapposizione e cioè: • sommando i contributi delle masse concentrate tra y e y+dy per s fissato. Il risultato è w (x, t, s) ds, dove w (x, t, s) = ΓD (x − y, t − s) f (y, s) dy; (2.124) R
• sommando ulteriormente i contributi in ciascun intervallo di tempo per s da 0 a t: t v (x, t) = f (y, s) ΓD (x − y, t − s) dyds. 0
R
La costruzione euristica che abbiamo presentato è un esempio di applicazione del metodo di Duhamel, che enunciamo nel nostro caso.
2.8 Il problema di Cauchy globale (n = 1)
83
Metodo di Duhamel. Per costruire la soluzione del problema (2.123), si eseguono i seguenti passi. 1. Si costruisce una famiglia di soluzioni del problema di Cauchy omogeneo, in cui il tempo iniziale, anzichè essere t = 0, fissato, è un tempo s > 0, variabile, ed il dato iniziale è f (x, s). 2. Si integra la famiglia così trovata rispetto ad s, tra 0 e t. Esaminiamo i due passi. 1. Consideriamo il problema di Cauchy omogeneo x ∈ R, t > s wt − Dwxx = 0 (2.125) w (x, s, s) = f (x, s) x ∈ R dove il tempo iniziale s funge da parametro. La funzione Γ y,s (x, t) = ΓD (x − y, t − s) è la soluzione fondamentale che soddisfa, per t = s, la condizione iniziale Γ y,s (x, s) = δ (x − y) e quindi, la soluzione di (2.125) è data dalla (2.124): ΓD (x − y, t − s) f (y, s) dy. w (x, t, s) = R
La famiglia di soluzioni richiesta è dunque w (x, t, s). 2. Integriamo w rispetto a s; si trova t t w (x, t, s) ds = ΓD (x − y, t − s) f (y, s) dyds. v (x, t) = 0
0
(2.126)
R
La (2.126) è soluzione del problema (2.123). Infatti v (x, 0) = 0 e si ha, usando le (2.125) t vt − Dvxx = w (x, t, t) + [wt (x, t, s) − Dwxx (x, t, s)] = f (x, t) . 0
Tutto funziona sotto ipotesi ragionevoli su f , precisate nel Teorema 8.2. • Anche la (2.126) ha un’interpretazione probabilistica. Per semplicità riferiamoci al caso D = 1/2. Osserviamo che la funzione w, costruita al passo 1 del principio di Duhamel, coincide col valore atteso del guadagno di una particella Browniana partita in x al tempo s, la cui posizione è B x (t − s)33 , e pertanto si può scrivere w (x, t, s) = Γ (x − y, t − s) f (y, s) dy = E [f (B x (t − s), s)] . R
33
Abbiamo usato l’omogeneità nel tempo del moto Browniano.
84
2 Diffusione
La (2.126) rappresenta l’accumulo (ossia l’integrale) di questi guadagni medi al variare di s tra 0 e t. Con uno scambio dell’ordine di integrazione, si ottiene t t x v (x, t) = E [f (B (t − s), s)] ds = E f (B x (t − s), s) ds . 0
0
Per la linearità dei problemi omogeneo e non omogeneo, la formula per il caso generale si trova per sovrapposizione delle (2.117) e (2.126). Sintetizziamo tutto nel seguente Teorema 8.2. Sia g come nel Teorema 8.1. Se f e le sue derivate ft , fx , fxx sono continue e limitate in R×[0, T ), la funzione t z (x, t) = ΓD (x − y, t) g (y) dy + Γ (x − y, t − s) f (y, s) dyds R
0
R
(2.127) è continua in R × (0, T ) con le sue derivate zt , zx , zxx ed è soluzione del problema di Cauchy non omogeneo zt − Dzxx = f in R× (0, T ) (2.128) z (x, 0) = g in R 1 . La condizione iniziale va intesa nel senso che, se x0 è un punto dove T < 4Da di continuità di g, allora z (x, t) → g (x0 ) quando (x, t) → (x0 , 0), t > 0. In particolare, se g è continua in R, allora z è continua in R×[0,T ).
2.8.4 Principio di massimo globale. Unicità Rimane aperta l’importante questione dell’unicità della soluzione. Il seguente contro-esempio di Tychonov, mostra che non c’è unicità, in generale. Sia exp −t−2 per t > 0 h (t) = 0 per t ≤ 0. La funzione (anche se un po’ anomala) T (x, t) =
∞
h(k) (t) k=0
(2k)!
x2k
è soluzione del problema di Cauchy con dato iniziale nullo 34 . Poiché anche u (x, t) ≡ 0 è soluzione dello stesso problema, si deduce che, in generale, il problema di Cauchy non ha soluzione unica e che pertanto non è ben posto. Che cosa non va in T ? Cresce troppo all’infinito per tempi piccoli. Infatti, la miglior stima di crescita per T è la seguente: 2! x (θ>0) |T (x, t)| ≤ C exp θt 34
La verifica non è facile! Si veda il libro di F. John in bibliografia.
2.8 Il problema di Cauchy globale (n = 1)
85
che peggiora rapidamente quando t → 0+ , per la presenza del fattore 1/θt ad esponente. Se invece di 1/θt ci fosse una costante, come nella iii) del Teorema 8.1, allora le cose cambiano. Infatti, nella classe di soluzioni a crescita controlla2 ta da un esponenziale del tipo ceAx , (la cosiddetta classe di Tychonov ), la soluzione del problema di Cauchy omogeneo è unica. Ciò è conseguenza del seguente principio di massimo. Teorema 8.3. (Principio di massimo globale). Sia z continua in R×[0, T ], con derivate zx , zxx , zt continue in R × (0, T ), tale che, in R × (0, T ) : zt − Dzxx ≤ 0 e z (x, t) ≤ ceAx
2
,
(risp. ≥ 0)
risp. ≥ −ceAx
dove c è una costante positiva. Allora risp. sup z (x, t) ≤ sup z (x, 0) R
R×[0,T ]
inf
R×[0,T ]
2
(2.129)
z (x, t) ≥ inf z (x, 0) . R
La dimostrazione non è facile, ma se si assume che z sia anche limitata da sopra o da sotto (cioè A = 0 in (2.129)), allora la dimostrazione è una semplice conseguenza del principio di massimo debole, Teorema 2.2 (si veda il Problema 2.16). Possiamo ora dimostrare il seguente risultato di unicità. Corollario 8.4 (Unicità I). Sia u soluzione di ut − Duxx = 0 in R× (0, T ) u (x, 0) = 0 in R, continua in R × [0, T ], con derivate ux , uxx , ut continue in R × (0, T ). Se |u| soddisfa la (2.129) allora u ≡ 0. Dimostrazione. Dal Teorema 8.3 abbiamo 0 = inf u (x, 0) ≤ R
inf
R×[0,T ]
u (x, t) ≤ sup u (x, t) ≤ sup u (x, 0) = 0 R
R×[0,T ]
cosicché u ≡ 0.
Notiamo che se |g(x)| ≤ ceax
2
per ogni x ∈ R
(a > 0)
e u (x, t) =
R
ΓD (x − y, t) g (y) dy,
(2.130)
86
2 Diffusione
in base al Teorema 8.1 vale la stima |u (x, t)| ≤ CeAx
2
in R × (0, T )
(2.131)
per cui u appartiene alla classe di Tychonov in R × (0, T ), per T < 1/4Da. Inoltre, se f è come nel Teorema 8.2 e t ΓD (x − y, t − s) f (y, s) dyds, v (x, t) = 0
R
ricaviamo facilmente la stima t inf f ≤ v (x, t) ≤ t sup f, R
(2.132)
R
per ogni x ∈ R, 0 ≤ t ≤ T. Infatti, possiamo scrivere: t v (x, t) ≤ sup f ΓD (x − y, t − s) dyds = t sup f R
poiché
0
R
R
R
ΓD (x − y, t − s) dy = 1
per ogni x, t, s, t > s. Analogamente si dimostra che v (x, t) ≥ t inf R f . Come conseguenza, abbiamo: Teorema 8.5 (Unicità II). Supponiamo che f e g soddisfino le ipotesi indicate nel Teorema 8.2. Allora il problema (2.128), ha esattamente una soluzione z nella classe di Tychonov in R × (0, T ) per T < (4Da)−1 . Questa soluzione coincide con la (2.127) ed inoltre, per ogni (x, t) ∈ R × [0, T ]. inf g + t inf f ≤ z (x, t) ≤ sup g + t sup f. R
R
R
R
(2.133)
Dimostrazione. Se z1 e z2 sono soluzioni dello stesso problema con gli stessi dati, allora w = z1 − z2 è soluzione di (2.128) con f = g = 0 e soddisfa le ipotesi del principio di massimo. Ne segue che sup w (x, t) = 0 R×[0,T ]
che implica z1 ≤ z2 . Applicando lo stesso ragionamento a w = z2 − z1 si deduce anche z2 ≤ z1 . • Stabilità e confronto. La (2.133) è un stima di stabilità della corrispondenza dati → soluzione. Infatti, siano u1 e v2 soluzioni di (2.128), con dati g1 , f1 e g2 , f2 rispettivamente. Se le ipotesi del Teorema 8.4 unicità sono soddisfatte, possiamo scrivere sup |u − v| ≤ T sup |f1 − f2 | + sup |g1 − g2 | . R×[0,T ]
R×[0,T ]
R
2.9 Un’applicazione alla finanza matematica
87
Quindi, se sup |f1 − f2 | ≤ ε,
R×[0,T ]
sup |g1 − g2 | ≤ ε R
allora sup |u1 − u2 | ≤ ε (1 + T )
R×[0,T ]
che implica stabilità puntuale uniforme su tutto l’asse reale. Il problema di Cauchy risulta così ben posto. Questa non è la sola conseguanza della (2.133). Possiamo usarla per confrontare due soluzioni. Per esempio, da f ≥ 0 e g ≥ 0 segue subito che anche u ≥ 0. Analogamente, se f1 ≥ f2 e g1 ≥ g2 si ha u1 ≥ u2 . • L’equazione backward. Nelle applicazioni alla finanza, ma anche al calcolo delle probabilità, si incontrano equazioni backward, come, per esempio, la ormai mitica equazione di Black and Scholes, oggetto della Sezione 9.2. L’irreversibilità del tempo, indica che un problema ben posto per l’equazione backward nell’intervallo temporale [0, T ] prevede una condizione finale, cioè per t = T , anziché iniziale. D’altra parte, il cambiamento di variabili t −→ T − t muta l’equazione backward nella forward e quindi, dal punto di vista matematico, le due equazioni sono equivalenti. Modulo questa osservazione, la teoria svolta rimane valida.
2.9 Un’applicazione alla finanza matematica In questa sezione applichiamo alcuni dei risultati visti finora al problema di determinare il prezzo di alcuni prodotti finanziari, in particolare delle cosiddette opzioni Europee. Le opzioni più semplici sono chiamate call o put. Si tratta di contratti su un bene di riferimento, in gergo il sottostante (per esempio, azioni, buoni di vario tipo, valuta, merci...), stipulati, diciamo, al tempo t = 0, tra un possessore (holder ) ed un sottoscrittore (subscriber ), con la seguente caratteristica. Al momento della stipula del contratto un prezzo di esercizio E (strike price, exercise price) è fissato. A un tempo futuro T , fissato (data di scadenza, expiry date), • il possessore di un’opzione call può (ma non è obbligato) esercitare l’opzione comprando il sottostante al prezzo E; nel caso che il possessore decida di comprare, il sottoscrittore deve vendere. • Il possessore di un’opzione put può (ma non è obbligato) vendere il sottostante al prezzo E; nel caso che il possessore decida di vendere, il sottoscrittore deve comprare.
88
2 Diffusione
Poiché un’opzione conferisce al possessore un diritto senza alcun obbligo (il possessore può, ma non deve, in entrambi i casi) mentre al contempo conferisce un obbligo al sottoscrittore, l’opzione ha un prezzo e il punto cruciale è: qual è il prezzo “equo” che deve essere pagato al tempo t = 0? Sicuramente tale prezzo dipende dall’evoluzione del prezzo del sottostante, che indicheremo con S, dal prezzo d’esercizio E, dal tempo di scadenza T e dal tasso d’interesse corrente, r. Per esempio, per il possessore di una call, minore è E e più elevato sarà il suo prezzo; il contrario capita per il possessore di una put. Le fluttuazioni del prezzo del sottostante hanno un’influenza decisiva, in quanto sono proprio esse che incorporano i fattori di rischio e determineranno, a scadenza, il valore dell’opzione. Per rispondere alla nostra domanda, introduciamo la funzione valore V = V (S, t), che rappresenta il prezzo dell’opzione al tempo t quando il prezzo del sottostante è S. Ci serve conoscere V (S (0) , 0). Quando vogliamo distinguere tra call e put, usiamo le notazioni C (S, t) e P (S, t), rispettivamente. Il problema è determinare V in modo coerente col funzionamento di mercato ove sono scambiati sia il sottostante sia tali opzioni. Per risolverlo useremo il metodo di Black-Scholes, basato sostanzialmente sulla fondata assunzione di un modello evolutivo per S e su un principio generale di buon funzionamento dei mercati, ossia l’impossibilità di arbitraggio. 2.9.1 Un modello di evoluzione per il prezzo Poiché S dipende da fattori più o meno prevedibili, è chiaro che non è ipotizzabile un modello deterministico per descriverne l’evoluzione. Per costruirne uno, assumiamo l’ipotesi di efficienza del mercato, riflessa nelle seguenti condizioni: a) il mercato risponde immediatamente a nuove informazioni sul bene; b) l’evoluzione non ha memoria: la storia passata è interamente riprodotta nel prezzo attuale, che non dà ulteriori informazioni. La condizione a) presuppone un modello d’evoluzione continuo. La condizione b) equivale in sostanza a richiedere che un cambiamento dS nel prezzo abbia una proprietà di Markov, come il moto Browniano. Più che per dS, è significativo un modello per cambiamenti relativi di prezzo e cioè per dS/S (che si chiama rendimento o return e che ha il pregio di essere adimensionale). Ipotizziamo che dS/S si possa scomporre nella somma di due termini. • Un termine è deterministico, prevedibile, e dà al rendimento il contributo μdt, dovuto alla crescita media μ (drift ) del prezzo del bene. Assumiamo che μ sia costante. Se ci fosse solo questo termine avremmo dS = μdt S
2.9 Un’applicazione alla finanza matematica
89
e, di conseguenza, d log S = μdt, da cui la crescita esponenziale S (t) = S (0) eμt . • L’altro termine è stocastico, tiene conto degli aspetti aleatori legati all’evoluzione del prezzo e dà il contributo σdB dove dB è l’incremento di un moto Browniano con valore atteso zero e varianza dt. Il coefficiente σ, che assumiamo costante, prende il nome di volatilità del prezzo e misura la deviazione standard del rendimento. Riunendo i contributi, si trova dS = μdt + σdB. S
(2.134)
Si notino le dimensioni “fisiche” di μ e σ: [μ] = tempo−1 , [σ] = tempo−1/2 . La (2.134) è un’equazione differenziale stocastica. Per risolverla si potrebbe essere tentati di scrivere d log S = μdt + σdB e integrare tra 0 e t, ottenendo log
S (t) = μt + σ (B (t) − B (0)) = μt + σB (t) . S (0)
Ciò non è corretto. La presenza del termine di diffusione σdB impone l’uso della formula di Itô che è una formula per il differenziale stocastico di una funzione composta. Facciamo una breve parentesi su questa importante formula, limitandoci a procedere in modo euristico. Digressione sulla formula di Itô. Sia B = B (t) il solito moto Browniano. Un processo di Itô è un processo X = X (t) che soddisfa un’equazione differenziale stocastica del tipo dX = a (X, t) dt + σ (X, t) dB
(2.135)
dove a è il coefficiente di deriva (drift ) e σ quello di diffusione. Se σ fosse nullo, l’equazione sarebbe deterministica e le traiettorie si calcolerebbero con i soliti metodi dell’analisi. Inoltre, data una qualunque funzione abbastanza regolare, F = F (x, t), potremmo facilmente calcolare il tasso di variazione di F lungo le traiettorie dell’equazione. Basta calcolare dF = Ft dt + Fx dX = {Ft + aFx } dt. Esaminiamo ora il tasso di variazione nel caso σ non nullo; il calcolo precedente non fornisce tutto il differenziale di F . Infatti, usando la formula di Taylor, si ha, ponendo X (0) = X0 : F (X, t) =
90
2 Diffusione
1 2 2 Fxx (dX) + 2Fxt dXdt + Ftt (dt) + ... . 2 Il differenziale di F lungo le traiettorie di (2.135) si ottiene selezionando nella formula precedente i termini lineari rispetto a dt e dX. Troviamo, quindi, ancora i termini F (X0 , 0) + Ft dt + Fx dX +
Ft dt + Fx dX = {Ft + aFx } dt + σFx dB. 2
I termini 2Fxt dXdt + Ftt (dt) non sono lineari rispetto a dt e dX e perciò 2 non entrano nel differenziale. Ma controlliamo il termine in (dX) . Sempre formalmente, si ha: 2
2
2
2
(dX) = [adt + σdB] = a2 (dt) + 2aσdBdt + σ 2 (dB) . Mentre gli altri termini sono di ordine superiore, quello incorniciato è di ordine esattamente σ 2 dt. √ In ultima analisi, ciò è ancora una conseguenza del fatto che dB ∼ dtN (0, 1). Il differenziale di F lungo le traiettorie di (2.135) è dunque dato dalla seguente importante formula di Itô: ! 1 dF = Ft + aFx + σ 2 Fxx dt + σFx dB. 2 Osserviamo incidentalmente che la formula di Itô associa all’equazione differenziale stocastica l’operatore differenziale alle derivate parziali 1 L = ∂t + σ 2 ∂xx + a∂x . 2 Siamo ora pronti a risolvere la (2.134), che scriviamo nella forma dS = μSdt + σSdB. Scegliamo F (S) = log S. Essendo Ft = 0,
FS =
1 , S
Fss = −
1 S2
la formula di Itô dà, con X = S, a (S, t) = μS, σ (S, t) = σS: 1 2 d log S = μ − σ dt + σdB. 2 Adesso si può integrare tra 0 e t, ottenendo 1 log S = log S0 + μ − σ 2 t + σB (t) 2
2.9 Un’applicazione alla finanza matematica
91
essendo B (0) = 0. La variabile aleatoria Y = log S ha perciò una distribuzione normale con media log S0 + μ − 12 σ 2 t e varianza σ 2 t. La sua densità di probabilità è pertanto 2 , y − log S0 − μ − 12 σ 2 t 1 exp − . f (y) = √ 2σ 2 t 2πσ 2 t La densità di S è data allora dalla formula 2 , log s − log S0 − μ − 12 σ 2 t 1 1 p (s) = f (log s) = √ exp − s 2σ 2 t s 2πσ 2 t che definisce la distribuzione lognormale. 2.9.2 L’equazione di Black-Scholes Costruiamo adesso l’equazione differenziale che regge l’evoluzione di V (S, t). Fissiamo bene le principali ipotesi di lavoro: • • • • • •
S segue una legge lognormale. La volatilità σ è nota. Non consideriamo costi di transazione o dividendi. Possiamo comprare o vendere una qualunque quantità del bene. Assumiamo che vi sia un tasso prevalente di interesse r > 0, per un investimento privo di rischio. Ciò significa che un euro posto in banca al tempo t = 0 diventa erT euro al tempo T . Impossibilità di arbitraggio.
L’ultima ipotesi è quella veramente sostanziale nella costruzione del modello e potremmo enunciarla nella forma: ogni guadagno istantaneo senza rischio deve avere rendimento r. È una specie di legge di conservazione del denaro!! Per tradurre questo principio in termini matematici useremo preliminarmente un metodo intuitivo. Più avanti useremo un metodo più rigoroso, legato al concetto di copertura (hedging) e di portafoglio autofinanziante (self-financing portfolio). L’idea è anzitutto di calcolare il differenziale di V per mezzo della formula di Itô e poi di costruire un portafolio Π, privo di rischio e consistente dell’opzione e di un’opportuna quantità di sottostante S. Usando poi il principio di non arbitraggio, si deduce che Π deve crescere al tasso di interesse corrente r, i.e. dΠ = rΠdt. Quest’ultima equazione coincide con la fondamentale equazione di Black-Scholes. Essendo dS = μSdt + σSdB
92
2 Diffusione
si ha
dV =
1 Vt + μSVS + σ 2 S 2 VSS 2
! dt + σSVS dB.
(2.136)
Il passo successivo è cercare di togliere il termine legato al rischio dall’espressione di dV , cioè il termine aleatorio σSVS dB, costruendo un portafoglio Π, consistente dell’opzione e di una quantità −Δ (niente a che fare con l’operatore di Laplace!) di sottostante: Π = V − SΔ. Consideriamo ora l’intervallo di tempo (t, t + dt), durante il quale Π subisce una variazione dΠ. Se riusciamo a mantenere Δ uguale al suo valore al tempo t durante tutto l’intervallo (t, t + dt), la variazione di Π è data da dΠ = dV − ΔdS. Questo è un punto chiave nella costruzione del modello e richiede una giustificazione rigorosa. Sebbene ci accontentiamo di mantenere un livello intuitivo, torneremo su questa questione nella Sezione 9.4. Usando (2.136), troviamo dΠ = dV − ΔdS = (2.137) ! 1 2 2 = Vt + μSVs + σ S VSS − μSΔ dt + σS(VS − Δ)dB. 2 Se scegliamo Δ = VS , intendendo che in riferimento all’intervallo di tempo (t, t+dt) il valore di VS in t è Δ, allora scompare la componente stocastica nella (2.137). La scelta appare un po’... miracolosa, ma è giustificata dal fatto che V ed S sono dipendenti e la componente aleatoria nei loro movimenti è proporzionale ad S. Scegliendo un’opportuna combinazione lineare di V ed S, tale componente svanisce. L’evoluzione del portafoglio Π è ora interamente deterministica, retta dall’equazione ! 1 dΠ = Vt + σ 2 S 2 VSS dt. 2 Ed è qui che entra il principio di non arbitraggio. Se si investe Π al tasso d’interesse r, senza rischio, in un tempo dt si avrà un incremento pari a rΠdt. Confrontiamo ora dΠ con rΠdt. • Se fosse dΠ > rΠdt, ci si fa prestare Π, si investe nel portafoglio, si ricava dΠ, con un costo di prestito pari a rΠdt. Si avrebbe così un guadagno istantaneo senza rischio pari a dΠ − rΠdt.
2.9 Un’applicazione alla finanza matematica
93
• Se fosse dΠ < rΠdt, si vende Π, si investe in banca al tasso d’interesse r e si ricava rΠdt, con un guadagno istantaneo senza rischio pari a rΠdt − dΠ. Deve quindi essere dΠ =
1 Vt + σ 2 S 2 VSS 2
! dt = rΠdt
da cui, ricordando che Π = V − VS S, si ottiene la celebrata equazione di Black-Scholes: 1 Vt + σ 2 S 2 VSS + rSVS − rV = 0. 2 Si noti che l’equazione non fa intervenire il coefficiente μ (drift ) presente nell’equazione per S. Ciò è apparentemente controintuitivo e costituisce uno degli aspetti più interessanti del modello. Il significato finanziario dell’equazione di Black-Scholes si evidenzia scomponendo il primo membro nel seguente modo: LV =
1 Vt + σ 2 S 2 VSS 2 ./ 0
−
rendimento del portafoglio
rV − rSVS . ./ 0 rendimento investimento in banca
L’equazione di Black-Scholes è un’equazione un po’ più generale di quelle viste finora ma che, come vedremo subito, si può ricondurre all’equazione del calore. Poiché il coefficiente di VSS è positivo, si tratta di un’equazione backward. Per avere un problema ben posto, occorre una condizione finale (per t = T ), una condizione per S = 0 ed una condizione all’infinito, cioè per S → +∞. • Condizione finale. Vediamo quale condizione finale occorre imporre per le opzioni che stiamo trattando. Call. Se al tempo T , si ha S > E allora si esercita l’opzione, con guadagno S − E. Se invece S ≤ E, non si esercita l’opzione con guadagno nullo. Il valore finale (final payoff ) dell’opzione è dunque C (S, T ) = max {S − E, 0} ,
S > 0.
(2.138)
Put. Se al tempo T si ha S ≥ E, non ha senso esercitare l’opzione, mentre si esercita se S < E. Il valore finale dell’opzione è dunque P (S, T ) = max {E − S, 0} ,
S > 0.
(2.139)
• Condizioni agli estremi. Esaminiamo ora le condizioni da imporre per S = 0 e per S → +∞. Call. Se ad un certo istante è S = 0, l’equazione (2.134) implica che S = 0 dopo quell’istante e quindi l’opzione è senza valore: C (0, t) = 0,
t ≥ 0.
(2.140)
94
2 Diffusione
Per S → +∞, la grandezza del prezzo d’esercizio diventa sempre meno importante e quindi l’opzione avrà valore C (S, t) ∼ S,
per S → +∞.
(2.141)
Put. Se ad un certo istante è S = 0, e quindi S = 0 anche dopo, il guadagno finale sarà certamente E. Per determinare il valore P (0, t) occorre quindi determinare il valore attuale della quantità E ricevuta al tempo T . Si trova, perciò, P (0, t) = Ee−r(T −t) . Per S → +∞, l’opzione non sarà probabilmente esercitata, per cui P (S, t) = 0,
per S → +∞.
2.9.3 Le soluzioni Riassumiamo i dati del problema. Equazione di Black-Scholes: 1 Vt + σ 2 S 2 VSS + rSVS − rV = 0. 2 Condizione finale. C (S, T ) = max {S − E, 0} ,
per la call,
P (S, T ) = max {E − S, 0} ,
per la put.
Condizioni agli estremi C (0, t) = 0, P (0, t) = Ee−r(T −t) ,
C (S, t) ∼ S
S → +∞,
P (S, T ) = 0
S → +∞,
per la call, per la put.
Osserviamo l’equazione di Black-Scholes da un punto di vista dimensionale. Si noti come SVS e S 2 Vss abbiano le stesse dimensioni di V , diciamo che sono misurate in euro. Le dimensioni di tutti i termini sono euro × tempo−1 . Abbiamo inoltre a disposizione grandezze caratteristiche di riferimento per S, V e t. Per S e V una grandezza di riferimento naturale è il prezzo di esercizio E. Ricordiamo poi che σ 2 ha le dimensioni di tempo−1 e perciò 1/σ 2 rappresenta una misura intrinseca temporale. Operiamo quindi il seguente cambiamento di variabili, che permette inoltre di ridurre l’equazione a coefficienti costanti e passare dall’equazione backward alla forward. S 1 1 2τ x = log , τ = σ 2 (T − t) , v (x, τ ) = V Eex , T − 2 E 2 E σ
2.9 Un’applicazione alla finanza matematica
95
con −∞ < x < +∞. Si ha: 1 Vt = − σ 2 Evτ 2 E V S = vx , S
VSS = −
E E vx + 2 vxx . S2 S
Sostituendo nell’equazione di Black-Scholes, si ha, dopo alcune semplificazioni, 1 1 − σ 2 vτ + σ 2 (−vx + vxx ) + rvx − rv = 0 2 2 ossia vτ = vxx + (k − 1) vx − kv dove k =
2r σ2
(2.142)
è un parametro adimensionale. Le condizioni iniziali diventano v (x, 0) = max {ex − 1, 0}
per la call, e v (x, 0) = max {1 − ex , 0} per la put. Siamo nelle condizioni per usare la teoria svolta nelle sezioni precedenti. La (2.142) è un’equazione che si può ricondurre a quella del calore, come indicato nel Problema 2.18. La soluzione è unica e per scriverla possiamo usare la formula (2.165), con D = 1, b = k − 1, c = −k. Le condizioni iniziali sono: 1 1 12 (k+1)y 1 1 − e 2 (k−1)y y > 0 e g (y) = e 2 ky max e 2 y − e− 2 y , 0 = 0 y≤0 (2.143) per la call, e 1 1 12 (k−1)y 1 1 e − e 2 (k+1)y y < 0 ky − y y g (y) = e 2 max e 2 − e 2 , 0 = (2.144) 0 y≥0 per la put. Si trova − k−1 2 x−
v (x, τ ) = e
(k+1)2 4
τ
1 4πτ
√
g (y) e− R
(x−y)2 4τ
dy .
√ Per avere una formula più significativa, poniamo y = 2τ z + x; abbiamo allora, fissando l’attenzione sulla call : √ z2 (k+1)2 k−1 1 v (x, τ ) = e− 2 x− 4 τ √ 2τ z + x e− 2 dz = g 2π R =
e−
(k+1)2 k−1 4 2 x−
√
2π
τ
96
2 Diffusione
+∞
e
1 2 (k+1)
√
(
2τ z+x)− 12 z 2
− √x2τ
dz −
+∞
e
1 2 (k−1)
(
,
√
2τ z+x)− 12 z 2
dz
.
− √x2τ
Dopo un altro po’ di calcoli35 , si trova v (x, τ ) = ex N (d+ ) − e−kτ N (d− ) dove
1 N (z) = √ 2π
z
1
2
e− 2 y dy
−∞
è la funzione di distribuzione normale standard e √ x 1 d± = √ + (k ± 1) 2τ . 2 2τ Ritornando alle variabili originali, si trova, per la call: C (S, t) = SN (d+ ) − Ee−r(T −t) N (d− ) log (S/E) + r ± 12 σ 2 (T − t) √ d± = . σ T −t
con
Nel caso della put, si mostra che la formula è P (S, t) = Ee−r(T −t) N (−d− ) − SN (−d+ ) . Infine, si ha (risparmiandoci i calcoli): Δ = CS = N (d+ ) > 0 per la call, Δ = PS = N (d+ ) − 1 < 0 per la put. Si noti come CS e PS siano strettamente crescenti rispetto ad S, essendo N funzione strettamente crescente e d+ funzione strettamente crescente di S. Le funzioni C, P sono perciò funzioni strettamente convesse di S, per ogni t, in particolare, Css > 0, Pss > 0. 35
Per esempio, per calcolare il primo integrale, si completa il quadrato ad esponente scrivendo
2 √ 1 √ 1 1 1 1 1 (k + 1) z − (k + 1) 2τ . 2τ z + x − z 2 = (k + 1) x + (k + 1)2 τ − 2 2 2 4 2 2 Poi, ponendo y =
√ 1 (k + 1) 2τ , si ottiene 2 ∞ √ 1 1 2 e 2 (k+1)( 2τ z+x)− 2 z dz = √ −x/
2τ
1 1 (k+1)x+ (k+1)2 τ 2 4 e
∞
−x/
1
√
2τ −(k+1)
√
τ/
2
e− 2 y dz.
√
2
2.9 Un’applicazione alla finanza matematica
97
• Parità call-put. Le opzioni put e call con lo stesso prezzo d’esercizio e lo stesso tempo di scadenza sono correlate tra loro e col sottostante tramite il seguente portafoglio: Π =S+P −C dove il segno meno davanti a C indica una posizione di vendita (short position). Per questo portafoglio, il guadagno alla scadenza è Π (S, T ) = S + max {E − S, 0} − max {S − E, 0} = E essendo Π uguale a S + (E − S) = E se E ≥ S e uguale a S − (S − E) = E se E ≤ S. Si tratta dunque di un guadagno certo, senza rischio, il cui valore al tempo t deve coincidere col guadagno di un deposito bancario pari ad E, in base all’assenza di arbitraggio. Si trova quindi la relazione di parità (put–call parity) S + P − C = Ee−r(T −t) .
(2.145)
La (2.145) indica, tra l’altro, che, noto il valore di C (o di P ), si può ricavare facilmente il valore di P (o di C). Dalla (2.145), essendo Ee−r(T −t) ≤ E e P ≥ 0, si ricava C (S, t) = S + P − Ee−r(T −t) ≥ S − E da cui, essendo sempre C ≥ 0, C (S, t) ≥ max {S − E, 0} . Si deduce che il valore C si mantiene sempre sopra il guadagno finale. Non è così per il valore di una put. Infatti, P (0, t) = Ee−r(T −t) ≤ E e quindi il valore di P si trova sotto il guadagno finale per S vicino a 0, per poi superarlo un po’ prima che S raggiunga il valore E. Tutto ciò è visibile nelle Figure 2.13 e 2.14, dove sono illustrati gli andamenti di C e P in funzione di S, per alcuni valori di T − t. • Volatilità diverse. Confrontiamo il valore di un’opzione relativa a due beni con volatilità σ 1 e σ 2 , diverse tra loro, con identici tempo e prezzo di esercizio. Assumiamo σ 1 > σ 2 ed indichiamo con C (1) , C (2) il valore delle opzioni call relative. Vogliamo mostrare che C (1) (S, t) > C (2) (S, t) per 0 < t < T , S > 0, cosa del resto non sorprendente: diminuendo il rischio, il valore dell’opzione decresce. Per confrontare C (1) e C (2) , osserviamo che la
98
2 Diffusione
Figura 2.13. La funzione valore di un’opzione call
Figura 2.14. La funzione valore di un’opzione put
funzione W = C (1) − C (2) soddisfa l’equazione 1 1 (1) Wt + σ 22 S 2 WSS + rSWS − rW = (σ 22 − σ 21 )S 2 CSS 2 2
(2.146)
con W (S, T ) = 0, W (0, t) = 0 e W → 0 per S → +∞. La (2.146) è un’equazione non omogenea, con secondo membro negativo (1) per S > 0, poiché CSS > 0. Essendo W continua in [0, +∞) × [0, T ] e nulla all’infinito, essa assume minimo globale m ≤ 0. Essendo l’equazione di tipo backward, tale punto non può appartenere a (0, +∞) × {0}. Vogliamo mostrare che m = 0. Date le condizioni finali e a agli estremi, basta dimostrare che W (S, t) > 0 per S > 0 e 0 < t < T . Se non fosse vero, esisterebbe un punto di minimo globale (S0 , t0 ) con S0 > 0 e 0 < t0 < T . Abbiamo allora Wt (S0 , t0 ) = 0 e WS (S0 , t0 ) = 0,
WSS (S0 , t0 ) ≥ 0.
2.9 Un’applicazione alla finanza matematica
99
Sostituendo S = S0 , t = t0 nella (2.146) si ottiene una contraddizione, per cui W = C (1) − C (2) > 0 per ogni S > 0 e ogni 0 < t0 < T . Per la put vale un risultato analogo, come si può controllare subito usando la parità put-call. 2.9.4 Strategia di copertura (self-financing strategy) La traduzione del principio di non arbitraggio in termini matematici si può fare più rigorosamente introducendo il concetto di portafolio autofinanziante. L’idea è “replicare” V mediante un portafolio consistente di un certo numero d’unità del sottostante S e di un certo numero d’unità di un’obbligazione Z, che costituisca un investimento privo di rischio al tasso di interesse r, tale cioè che dZ = rZdt. Se Z (0) = 1, abbiamo dunque Z (t) = ert . La possibilità effettuare questa operazione è garantita dall’ipotesi di completezza del mercato. A tale scopo, cerchiamo di determinare due processi φ e ψ in modo che V = φS + ψZ (0 ≤ t ≤ T ), (2.147) per eliminare ogni fattore di rischio. Infatti, mettendosi dalla parte del sottoscrittore (colui che vende l’opzione), il rischio è che al tempo T il prezzo S (T ) superi E e il compratore eserciti di conseguenza l’opzione. Se però nel frattempo egli ha costruito il portafoglio (2.147), il profitto che ne deriva uguaglia esattamente i fondi necessari a pagare il cliente. Viceversa, se l’opzione vale zero al tempo T , anche il portafoglio varrà zero. Ma affinché tutto funzioni è necessario che il sottoscrittore non investa denaro extra in questa strategia (hedging). Ciò si può assicurare richiedendo che il portafoglio (2.147) si autofinanzi cioè che i cambi in valore dipendano solo dai cambiamenti di S e di Z. In formule, si richiede che dV = φdS + ψdZ
(0 ≤ t ≤ T ).
(2.148)
Abbiamo già incontrato una formula del genere quando abbiamo costruito il portafoglio Π = V − SΔ o V = Π + SΔ, richiedendo che dV = dΠ + ΔdS. Questa costruzione non è altro che la duplicazione di V per mezzo di un portafolio autofinanziante, con Π nel ruolo di Z e ψ = 1. Qual è il reale significato della (2.148)? Lo si vede meglio in un modello a tempo discreto, nel quale t assuma solo valori in un insieme del tipo t0 < t1 < ... < tN . Supponiamo che gli intervalli (tj − tj−1 ) siano piccoli ed indichiamo con Sj e Zj i valori assunti al tempo tj da S e Z. Conseguentemente, cerchiamo due sequenze φj e ψ j
100
2 Diffusione
corrispondenti alle quantità scelte di S e Z per formare (2.147) il portafoglio dal tempo tj−1 al tempo tj . In particolare, la coppia φj , ψ j è scelta al tempo tj−1 . Dato l’intervallo (tj−1 , tj ), Vj = φj Sj + ψ j Zj rappresenta il valore di chiusura del portafoglio mentre φj+1 Sj + ψ j+1 Zj è il valore d’acquisto del nuovo. La condizione di autofinanziamento significa che di mercato del portafoglio al tempo tj , individuato dalla coppia il valore φj , ψ j , finanzia esattamente l’acquisto del nuovo portafoglio, individuato dalla coppia φj+1 , ψ j+1 , decisa al tempo tj , che occorre mantenere fino a tj+1 . In formule, φj+1 Sj + ψ j+1 Zj = φj Sj + ψ j Zj (2.149) e cioè il gap finanziario Dj = φj+1 Sj + ψ j+1 Zj − Vj deve essere nullo (altrimenti dovrebbe essere immesso denaro fresco per sostenere l’operazione o dalla stessa se ne potrebbe “spillare”). La (2.149) equivale ad affermare che Vj+1 − Vj = (φj+1 Sj+1 + ψ j+1 Zj+1 ) − (φj Sj + ψ j Zj ) = (φj+1 Sj+1 + ψ j+1 Zj+1 ) − φj+1 Sj + ψ j+1 Zj = φj+1 (Sj+1 − Sj ) + ψ j+1 (Zj+1 − Zj ) ossia ΔVj = φj+1 ΔSj + ψ j+1 ΔZj la cui versione continua è esattamente la (2.148). Combinando la formula (2.136) per dV con la (2.148) si ottiene ! 1 2 2 Vt + μSVS + σ S VSS dt + σSVS dB = (φμS + ψrZ) dt + σSφdB. 2 Scegliendo φ = VS si eliminano i termini in dB (fattori di rischio) e si elidono anche anche i termini μSVS . Ricordando che ψZ = V − φS = V − VS S, si ritrova l’equazione 1 Vt + σ 2 S 2 VSS + rSVS − rV = 0. 2
(2.150)
Per il controllo che il portafoglio VS S + ψZ sia effettivamente autofinanziante, rimandiamo ai testi specializzati in bibliografia.
2.10 Due modelli non lineari
101
2.10 Due modelli non lineari Tutti i modelli matematici che abbiamo esaminato finora sono lineari. D’altra parte, la natura della maggior parte dei problemi reali è nonlineare. Per esempio, problemi di filtrazione richiedono modelli di diffusione non lineare; termini di trasporto non lineari si presentano in fluidodinamica; termini di reazione non lineare sono molto frequenti in dinamica delle popolazioni o in modelli di cinetica chimica. La presenza di una non linearità in un modello matematico dà origine a una varietà di fenomeni interessanti che non hanno corrispettivo nel caso lineare. Per esempio, la velocità di diffusione può essere finita oppure la soluzione può diventare non limitata in un tempo finito oppure ancora possono esistere soluzioni in forma di onde progressive con profili speciali, ciascuno con la propria velocità di propagazione. In questa sezione cerchiamo di indurre un po’ d’intuizione su che cosa possa succedere in due tipici ed importanti esempi: uno di diffusione di un gas in un mezzo poroso, l’altro di dinamica delle popolazioni. Nel Capitolo 4, esamineremo modelli di trasporto non lineare. 2.10.1 Diffusione non lineare. Equazione dei mezzi porosi Consideriamo la diffusione di un gas di densità ρ = ρ (x, t) in un mezzo poroso. Siano v = v (x, t) la velocità del gas e κ la porosità del mezzo, che rappresenta la frazione di volume occupato dal gas. La legge di conservatione della massa dà, in questo caso: κρt + div (ρv) = 0.
(2.151)
Oltre alla (2.151), il flusso è governato dalle seguenti due leggi costitutive (empiriche). • Legge di Darcy: μ (2.152) v = − ∇p ν dove p = p (x, t) è la pressione, μ è la permeabilità del mezzo è ν è la viscosità del gas. Assumiamo che μ e ν siano costanti positive. • Equazione di stato: p = p0 ρα
p0 > 0, α > 0. 1/α
Da (2.152) e (2.153) abbiamo, poiché p div (ρv) = −
μ (1 +
1/α 1/α)νp0
∇p = (1 + 1/α)
Δ(p1+1/α ) = −
dove m = 1 + α > 1. Da (2.151) otteniamo ρt =
(m − 1) μp0 Δ(ρm ). κmν
(2.153) −1
∇(p
1+1/α
),
(m − 1) μp0 Δ (ρm ) mν
102
2 Diffusione
Riscalando il tempo (t → mezzi porosi
(m − 1) μp0 t) otteniamo infine l’equazione dei κmν ρt = Δ(ρm ).
Poiché
(2.154)
Δ(ρm ) = div mρm−1 ∇ρ
il coefficiente di diffusione nella (2.154) è D (ρ) = mρm−1 e perciò l’effetto di diffusione cresce con la densità. Si può scrivere l’equazione dei mezzi porosi in termini della pressione u = p/p0 = ρm−1 . Si controlla subito che l’equazione per u è data da ut = muΔu +
m 2 |∇u| m−1
(2.155)
che mostra ancora una volta la dipendenza da u del coefficiente di diffusione. Uno dei problemi relativi alla (2.154) o alla (2.155) consiste nel capire come un dato iniziale ρ0 , confinato in una piccola regione Ω evolva col tempo. Il punto chiave è quindi esaminare l’evoluzione della frontiera incognita ∂Ω, la cosiddetta frontiera libera del gas, la cui velocità di espansione, dalla (2.152), dovrebbe risultare proporzionale a |∇u|. Ciò significa che ci aspettiamo una velocità finita di propagazione, in contrasto con il caso classico m = 1. L’equazione dei mezzi porosi non può essere trattata con strumenti elementari, poiché per densità molto basse l’effetto diffusivo è tenue e l’equazione degenera. Tuttavia possiamo ricavare un po’ di intuizione su ciò che può succedere esaminando una specie di soluzioni fondamentali, le cosiddette soluzioni di Barenblatt, in dimensione spaziale 1. Consideriamo dunque l’equazione ρt = (ρm )xx .
(2.156)
Cerchiamo soluzioni di autosimilarità nonnegative della forma ρ (x, t) = t−α U xt−β ≡ t−α U (ξ) e soddisfacenti la condizione (conservazione della massa)
+∞
ρ (x, t) dx = 1. −∞
Quest’ultima condizione richiede che
+∞
1= −∞
t−α U xt−β dx = tβ−α
+∞
U (ξ) dξ −∞
2.10 Due modelli non lineari
103
1/3 Figura 2.15. La soluzione di Barenblatt ρ (x, t) = t−1/5 1 − x2 t−2/5 per t = +
1, 4, 10, 30
" +∞ cosicché deve essere α = β e −∞ U (ξ) dξ = 1. Sostituendo nella (2.156), troviamo αt−α−1 (−U − ξU ) = t−mα−2α (U m ) . Quindi, se scegliamo α = 1/ (m + 1), otteniamo per U l’equazione differenziale ordinaria (m + 1) (U m ) + ξU + U = 0 che può essere scritta nella forma d (m + 1) (U m ) + ξU = 0. dξ Abbiamo dunque
(m + 1) (U m ) + ξU = constante. Scegliendo la costante uguale a zero, si ha
(m + 1) (U m ) = (m + 1) mU m−1 U = −ξU ossia che è equivalente a
(m + 1) mU m−2 U = −ξ (m + 1) m m−1 U = −ξ. m−1
Integrando, troviamo. 1/(m−1) U (ξ) = A − Bm ξ 2 dove A è una costante arbitraria e Bm = (m − 1) /2m (m + 1) .
104
2 Diffusione
Naturalmente, per mantenere un significato fisico, dobbiamo avere A > 0 e A − Bm ξ 2 ≥ 0. In conclusione abbiamo trovato soluzioni dell’equazione dei mezzi porosi della forma ⎧ 2 1/(m−1) ⎪ ⎨ 1 A−B x se x2 ≤ At2α /Bm m 2α t (α = 1/ (m + 1)) ρ (x, t) = tα ⎪ ⎩ 2 2α 0 se x > At /Bm note come soluzioni di Barenblatt (Figura 2.16). I punti ' x = ± A/Bm tα ≡ ±r (t) rappresentano la frontiera della regione dove si trova il gas. La sua velocità di propagazione è dunque ' r˙ (t) = α A/Bm tα−1 . 2.10.2 Reazione non lineare. Equazione di Fischer Nel 1937 Fisher36 introdusse un modello per la dispersione spaziale di un cosiddetto gene favorevole 37 in una popolazione, in un habitat unidimensionale di lunghezza infinita. Se v indica la concentrazione del gene, l’equazione di Fisher è v τ > 0, y ∈ R, (2.157) vτ = Dvyy + rv 1 − M dove D, r e M sono parametri positivi. Una questione importante è determinare se il gene può propagarsi come un’onda progressiva, con una sua specifica velocità di propagazione. Secondo la terminologia della Sezione 1.2, (2.157) è un’equazione semilineare, in cui la diffusione è accoppiata ad una crescita logistica, attraverso il termine di reazione v . f (v) = rv 1 − M Il parametro r rappresenta il potenziale biologico (tasso netto di nascita-morte, con dimensione tempo−1 ), mentre M è la capacità dell’habitat. Se riscaliamo tempo, spazio e concentrazione ponendo ' t = rτ , x = r/Dy, u = v/M, la (2.157) assume la forma adimensionale ut = uxx + u (1 − u) ,
t > 0.
(2.158)
Notiamo i due equilibri u ≡ 0 e u ≡ 1. In assenza di diffusione, 0 è instabile e 1 è asintoticamente stabile. Una traiettoria con dato iniziale u (0) = u0 tra 0 e 1 ha il tipico comportamente mostrato in Figura 2.16. 36 37
Fisher, R. A. (1937), The wave of advance of advantageous gene. Ann. Eugenics, 7, 355-69. Cioè un gene che ha un vantaggio nella lotta per la sopravvivenza.
2.10 Due modelli non lineari
105
Figura 2.16. Curva logistica (r = 0.1, u0 = 1/3)
Se quindi x ∈ R,
u (x, 0) = u0 (x) ,
(2.159)
è un dato iniziale per l’equazione (2.157) tale che 0 < u0 (x) < 1, ci aspettiamo che diffusione e reazione siano in competizione, con l’effetto di una diminuzione di u dovuta alla diffusione, contro la tendenza della reazione ad accrescere u verso la soluzione di equilibrio 1. Vogliamo dimostrare l’esistenza di onde progressive in grado di connettere i due stati di equilibrio, cioè soluzioni della forma u (x, t) = U (z) ,
z = x − ct,
dove c rappresenta la velocità di propagazione, soddisfacenti le condizioni t > 0, x ∈ R
0 < u < 1, e lim u (x, t) = 1
x→−∞
e
lim u (x, t) = 0.
x→+∞
(2.160)
La prima delle (2.160) stabilisce che la concentrazione del gene è saturata all’estremo sinistro mentre la seconda indica che questa è zero in quello destro. Chiaramente, questo genere di soluzioni realizza un bilancio tra diffusione e reazione. Essendo la (2.157) invariante rispetto alla trasformazione x → −x, è sufficiente considerare c > 0, cioè onde progressive in moto verso destra. Poiché ut = −cU ,
ux = U ,
uxx = U ,
( = d/dz)
sostituendo u (x, t) = U (z) in (2.158), troviamo per U l’equazione differenziale ordinaria U + cU + U − U 2 = 0 (2.161) con lim U (z) = 1
z→−∞
e
lim U (z) = 0.
z→+∞
(2.162)
106
2 Diffusione
Ponendo U = V , la (2.161) è equivalente al sistema dU =V, dz
dV = −cV − U + U 2 dz
(2.163)
nel piano (U, V ). Questo sistema ha i due punti di equilibrio (0, 0) e (1, 0), corrispondenti ai due della logistica. La nostra onda progressiva corrisponde a un’orbita (eteroclina) che congiunge (1, 0) a (0, 0), con 0 < U < 1. Esaminiamo prima il comportamento delle orbite vicino ai punti di equilibrio. Le matrici dei coefficienti del sistema linearizzato nei punti (0, 0) e (1, 0) sono, rispettivamente, 0 1 0 1 J (0, 0) = e J (1, 0) = . −1 −c 1 −c Gli autovalori di J (0, 0) sono λ± =
2 ' 11 −c ± c2 − 4 , 2
con autovettori corrispondenti h± =
−c ∓
√
c2 − 4
2
.
Se c ≥ 2 gli autovalori sono entrambi negativi mentre se c < 2 sono complessi. Pertanto, nodo stabile se c ≥ 2 (0, 0) è fuoco stabile se c < 2. Gli autovalori di J (1, 0) sono μ± =
2 ' 11 −c ± c2 + 4 , 2
di segno opposto, e quindi (1, 0) è un punto di sella. Le varietà instabile e stabile escono da (1, 0) secondo le direzioni dei due autovettori √ √ c + c2 + 4 c − c2 + 4 k+ = e k− = , 2 2 rispettivamente. Ora, il vincolo 0 < U < 1 esclude il caso c < 2, poiché in questo caso U cambia segno lungo le orbite che tendono all’origine. Per c ≥ 2, tutte le orbite38 in un intorno dell’origine (0, 0) tendono a (0, 0) per z → +∞, con pendenza limite λ+ . D’altra parte, la sola orbita che tende a (1, 0) per z → −∞ rimanendo nella regione 0 < U < 1 è la varietà instabile γ del punto di sella. 38
Ad eccezione delle due orbite sulla varietà stabile tangente ad h− in (0, 0), nel caso c > 2.
2.10 Due modelli non lineari
107
0.1 0
V
-0.1 -0.2 -0.3 -0.4 -0.5 0
0.2
0.4
0.6
0.8
1
U
Figura 2.17. Orbite del sistema (2.163)
La Figura 2.17 mostra la configurazione delle orbite nella regione di interesse (Problema 2.23). La conclusione è che per ogni c ≥ 2 esiste un’unica onda progressiva, che sia soluzione della (2.157) con velocità c. Inoltre, U è strettamente decrescente. Nelle variabili originali, esiste un’unica onda √ progressiva, che sia soluzione della (2.157) per ogni velocità c ≥ cmin = 2 rD. Abbiamo, dunque, uno “spettro” continuo di velocità di propagazione. La velocità minima c = cmin è particolarmente importante. Infatti, l’aver trovato onde progressive è solo l’inizio. Molte questioni sorgono naturalmente. Tra queste, lo studio della stabilità di queste soluzioni o anche il comportamento asintotico (per t → +∞) di una soluzione con dato iniziale u0 di tipo transizionale, cioè ⎧ x≤a ⎨1 a<x
39
Per esempio, il libro di Murray, vol I, 2001, o di Grindrod, 1991.
108
2 Diffusione
Problemi 2.1. Usare il metodo di separazione delle variabili per risolvere il seguente problema di Cauchy-Neumann: ⎧ 0 < x < L, t > 0 ⎨ ut − uxx = 0 u (x, 0) = x 0<x
0. Esaminare il comportamento asintotico di u (x, t) per t → +∞. 2.2. Usare il metodo di separazione delle variabili per risolvere il seguente problema di Cauchy-Neumann: ⎧ 0 < x < π, t > 0 ⎨ ut − uxx = tx u (x, 0) = 1 0≤x≤π ⎩ ux (0, t) = ux (L, t) = 0 t > 0. [Suggerimento. Scrivere la candidata soluzione come u (x, t) = k≥0 ck (t) vk (x) dove le vk sono le autofunzioni del problema agli autovalori associato all’equazione omogenea]. 2.3. Usare il metodo di separazione delle variabili per risolvere (almeno formalmente) il seguente problema misto Neumann-Robin. ⎧ 0 < x < π, t > 0 ut − Duxx = 0 ⎪ ⎪ ⎨ u (x, 0) = g (x) 0≤x≤π ux (0, t) = 0 ⎪ ⎪ t > 0. ⎩ ux (L, t) + u (L, t) = U [Risposta. La soluzione è u (x, t) =
2
ck e−Dμk t cos μk x,
k≥0
dove i numeri μk sono gli zeri positivi dell’equazione μ tan μ = 1 e ck è il coefficiente dello sviluppo in serie di g − U rispetto a cos μk ]. 2.4. Evoluzione di una soluzione chimica. Consideriamo un tubo di lunghezza L e sezione di area A costante, con asse nella direzione dell’asse x, contenente una soluzione salina di concentrazione c (gr/m3 ). Assumiamo che: a. A sia abbastanza piccola da poter ritenere che la concentrazione c dipenda solo da x e t, b. la diffusione del sale sia uni-dimensionale, nella direzione x, c. la velocità del fluido sia trascurabile, d. all’estremità sinistra x = 0 del tubo si immette una soluzione di concentrazione costante C0 gr/m3 ad una velocità di R0 m3 /sec ed all’altro estremo x = L, la soluzione è rimossa alla stessa velocità.
Problemi
109
1 . Utilizzando la legge di Fick, mostrare che c è soluzione di un opportuno problema di Neumann-Robin. 2 . Risolvere esplicitamente il problema e mostrare che, per t → +∞, c (x, t) tende ad una concentrazione di equilibrio c∞ (x). [Risposte. 1. le condizioni agli estremi sono: cx (0, t) = −C0 R0 /DA, cx (L, t) = −(R0 /DA)c (L, t) . 2. c∞ (x) = C0 + (R0 /DA) (L − x)]. 2.5. Dimostrare il Corollario 2.3. [Suggerimento. b). Porre u = v − w, M = supQT |f1 − f2 | e applicare il Teorema 2.2 a z± = ±u − M t]. 2.6. Siano Q2 = (0, 2) × (0, 2) ed u la soluzione del problema ut − uxx = 0 in Q2 u=g su ∂Q2 4
dove g (t) = M per 0 ≤ t ≤ 1 e g (t) = M − (1 − t) per 1 < t ≤ 2. Calcolare u (1, 1) e controllare che è il massimo u in Q2 . Non è questo in contraddizione con il principio di massimo forte nella Sezione 2.2? 2.7. Sia u = u(x, t) una soluzione dell’equazione del calore nel dominio ¯1 ∪ Q ¯ 2 dove Q1 e Q2 sono i rettangoli in Figura 2.18. piano DT = QT \ Q Supponiamo che u assuma il suo massimo M in un punto interno (x1 , t1 ). In quali altri punti u è uguale ad M ?
Figura 2.18. In quali punti (x, t) , u (x, t) = M ?
2.8. Diffusione da sorgente concentrata in un punto, costante nel tempo. soluzioni autosimili di ut − uxx = 0 della forma u (x, t) = a) √Trovare U x/ t , esprimendo il risultato in termini della funzione errore x 2 2 erf (x) = √ e−z dz. π 0
110
2 Diffusione
b) Usare il risultato per risolvere il seguente problema di diffusione su una semiretta, con concentrazione mantenuta costante in x = 0 per t > 0: ⎧ x > 0, t > 0 ⎨ ut − uxx = 0 x>0 u (0, t) = C, limx→+∞ u (x, t) = 0 ⎩ u (x, 0) = 0 t > 0. 2.9. Determinare per α e β esistono solutioni autosimili di ut −uxx = quali f (x) della forma tα U x/tβ , in ciascuno dei casi seguenti: (a) f (x) = 0,
(b) f (x) = 1,
(c) f (x) = x.
[Risposta. (a) α arbitrario, β = 1/2. β = 1/2].
(b) α = 1, β = 1/2.
(c) α = 3/2,
2.10. Barriere riflettenti e condizione di Neumann. Consideriamo la passeggiata aleatoria della Sezione 4. Supponiamo che una barriera perfettamente riflettente sia posta nel punto L = mh + h2 > 0. Con ciò intendiamo che, se la particella raggiunge il punto L − h2 al tempo t e si muove verso destra, allora subisce una riflessione e ritorna in L − h2 al tempo t + τ . Mostrare che, quando h, τ → 0 e h2 /τ = 2D, p = p (x, t) è soluzione del problema ⎧ x < L, t > 0 ⎨ pt − Dpxx = 0 p (x, 0) = δ x0 "L e inoltre −∞ p (x, t) dx = 1. Determinare esplicitamente la soluzione. [Risposta: p (x, t) = ΓD (x, t) + ΓD (x − 2L, t)].
2.11. Barriere assorbenti e condizione di Dirichlet. Consideriamo la passeggiata aleatoria della Sezione 4. Supponiamo che una barriera perfettamente assorbente sia posta nel punto L = mh > 0. Con ciò intendiamo che, se la particella raggiunge il punto L − h al tempo t e si muove verso destra, allora è assorbita e si ferma in L. Mostrare che, quando h, τ → 0 e h2 /τ = 2D, p = p (x, t) è soluzione del problema ⎧ x < L, t > 0 ⎨ pt − Dpxx = 0 p (x, 0) = δ x 0. Determinare esplicitamente la soluzione. [Risposta: p (x, t) = ΓD (x, t) − ΓD (x − 2L, t)]. 2.12. Nel caso della passeggiata aleatoria con deriva, dimostrare che, indicata con k la variabile aleatoria che conta il numero dei passi a destra dopo N passi, si ha pk = CN,k pk0 q0N −k ,
Problemi
111
per cui la funzione generatrice delle probabilità è data da G (s) = N (p0 s + q0 ) . Usare la funzione G per mostrare che: (a) valore atteso di x dopo N passi: x = N (p0 − q0 )h % & (b) momento secondo di x dopo N passi = x2 = N h2 . 2.13. Passeggiata aleatoria simmetrica con forza elastica di richiamo. Il moto di una particella aleatoria unidimensionale è soggetto alle seguenti regole. Sia N un intero naturale fissato. 1. In un tempo τ la particella si muove di h, partendo da x = 0. 2. Se si trova nel punto mh, con −N ≤ m ≤ N , si muove verso destra e verso sinistra, rispettivamente, con probabilità 1 m 1 m 1− e q= 1+ p= 2 N 2 N in modo indipendente dal passo precedente. Dimostrare che, se h2 /t = 2D e N τ = γ > 0, quando h, τ → 0 ed N → +∞ la probabilità di transizione limite è soluzione dell’equazione pt = Dpxx +
1 (xp)x . γ
2.14. Dimostrare il Teorema 8.2 nel caso g continua e limitata in R. [Suggerimento. Scrivere u (x, t) − g (x0 ) = [g (y) − g (x0 )]ΓD (x − y, t) dy. R
Fissato ε > 0, sia |g (y) − g (x0 )| < ε se |y − x0 | < δ (continuità di g). Dividere l’intervallo di integrazione negli insiemi I1 = {y : |y − x0 | < δ}
e
I2 = {y : |y − x0 | ≥ δ} .
Mostrare che il modulo dell’integrale su I1 è minore di ε e che l’integrale su I2 tende a zero se (x, t) → (x0 , 0), t > 0]. 2.15. Usare la trasformata di Fourier parziale u ˆ (ξ, t) = e−ixξ u (x, t) dx R
per risolvere il problema di Cauchy (2.116) e ritrovare la formula (2.117). 2.16. Provare il Teorema 8.3 assumendo la condizione z (x, t) ≤ C, x ∈ R, 0 ≤ t ≤ T e spezzando la dimostrazione nei seguenti passi:
112
2 Diffusione
a) Sia supR z (x, 0) = M0 e definiamo w (x, t) =
2C x2 ( + Dt) + M0 . L2 2
Controllare che wt − Dwxx = 0 e usare il principio di massimo per dimostrare che w ≥ z nel rettangolo RL = [−L, L] × [0, T ] . b) Fissare arbitrariamente (x0 , t0 ) e scegliere L in modo che (x0 , t0 ) ∈ RL . Usando a) dedurre che z (x0 , t0 ) ≤ M0 . 2.17. Scrivere la formula per la soluzione del problema di Cauchy x ∈ R, t > 0 ut = Duxx + bux + cu u (x, 0) = g (x) x∈R dove D, b, c sono coefficienti costanti. Mostrare che, se c < 0 e g è limitato, u (x, t) → 0 per t → +∞. [Risposta. Ricondursi all’equazione del calore con un opportuno cambio di variabili. La soluzione è: b2 b c− 4D t e 2D (y−x) g (y) ΓD (x − y, t) dy (2.165) u (x, t) = e R
dove ΓD è la soluzione fondamentale dell’equazione del calore]. 2.18. Problema in un quadrante. Trovare una formula esplicita per la soluzione del problema di Cauchy ⎧ x > 0,t > 0 ⎨ ut = uxx u (x, 0) = g (x) x≥0 ⎩ u (0, t) = 0 t>0 con g continua e g (0) = 0. [Suggerimento. Estendere g al semiasse x < 0 per riflessione dispari: g (−x) = −g (x). Risolvere il corrispondente problema di Cauchy globale e scrivere il risultato come integrale su (0, +∞)]. 2.19. Un principio di massimo. Sia Q T = Ω × (0, T ), con Ω dominio limitato in Rn . Sia u ∈ C 2,1 (QT ) ∩ C QT soluzione dell’equazione ut = DΔu + b (x,t) · ∇u + c (x,t) u
in QT
dove b e c sono continue in QT . Mostrare che, se u ≥ 0 (risp. u ≤ 0) su ∂p QT allora u ≥ 0 (risp. u ≤ 0) in QT . [Suggerimento. Assumere prima che c (x,t) ≤ a < 0. Ridursi poi a questo caso ponendo u (x,t) = v (x, t) ekt con k > 0 opportuno]. 2.20. Completare i dettagli delle dimostrazioni delle formule (2.95) e (2.96) nella Sezione 6.2.
Problemi
113
2.21. Inquinante in dimensioni n ≥ 2. Usando la legge di conservazione della massa, scrivere un modello di diffusione e trasporto per un inquinante, in dimensione 2 e 3, assumendo la seguente legge costitutiva per il vettore di flusso q =v (x,t) c (x, t) −κ (x, t) ∇c (x,t). ./ 0 ./ 0 trasporto
legge di Fick
[Risposta. Si trova l’equazione ct + div (vc − κ (x, t) ∇c (x,t)) = 0 che si dice in forma di divergenza (Capitolo 9)]. 2.22. Reazione e diffusione lineare in dimensione 2. Sia R = (0, p)×(0, q) . Consideriamo l’equazione ut = D (uxx + uyy ) + λu
per t > 0, (x, y) ∈ R
(2.166)
e la condizione iniziale u (x, y, 0) = g (x, y)
(x, y) ∈ R.
(2.167)
Usando il metodo di separazione delle variabili, trovare la soluzione di (2.166) e (2.167) che soddisfa le seguenti condizioni su ∂R: a. ∇u · n =0 dove D, λ, p, q sono costanti positive, b. u = 0. Determinare e confrontare nei due casi il comportamento della soluzione per t → +∞ e darne un’interpretazione fisica (in termini di concentrazione di una sostanza o di conduzione del calore). 2.23. Un problema di ... invasione. Una popolazione di densità P = P (x, y, t) e massa totale M (t) è inizialmente (t = 0) concentrata in un punto isolato del piano (diciamo l’origine (0, 0)) e cresce ad un tasso lineare a > 0 diffondendosi con costante D. a) Scrivere il problema che governa l’evoluzione di P e risolverlo. b) Determinare l’evoluzione della massa P (x, y, t) dxdy. M (t) = R2
c) Sia BR il cerchio centrato in (0, 0) e raggio R. Determinare R = R (t) in modo che P (x, y, t) dxdy = M (0) . R2 \BR(t)
d) Definiamo area metropolitana la regione BR(t) e area rurale la regione R2 \BR(t) . Determinare la velocità di avanzamento del fronte metropolitano.
114
2 Diffusione
[Suggerimento. c) Si trova:
R2 (t) P (x, y, t) dxdy = M (0) exp at − 4Dt R2 \BR(t)
!
da cui R (t) = ...]. Risolvere il seguente problema di Cauchy-Dirichlet in B1 = 2.24. x ∈ R3 : |x| < 1}: ⎧ x ∈ B1 , t > 0 ⎨ ut = Δu u (x, 0) = 0 x ∈ B1 ⎩ u (σ, t) = 1 σ ∈ ∂B1 , t > 0. Calcolare limt→+∞ u (x,t). [Suggerimento. La soluzione è radiale, per cui u = u (r, t) , r = |x|. Osservare che 2 1 Δu = urr + ur = (ru)rr . r r Porre v = ru, ricondursi a condizioni di Dirichlet omogenee e usare il metodo di separazione delle variabili]. 2.25. Risolvere il seguente problema di Cauchy-Dirichlet ⎧ x ∈ K, t > 0 ⎨ ut = Δu u (x, 0) = 0 x∈K ⎩ u (σ, t) = 1 σ ∈ ∂K, t > 0 dove K è il parallelepipedo K = (x, y, z) ∈ R3 : 0 < x < a, 0 < y < b, 0 < z < c . Calcolare limt→+∞ u (x,t). 2.26. In B1 = x ∈ R3 : |x| < 1 , risolvere il seguente problema di CauchyNeumann: ⎧ x ∈ B1 , t > 0 ⎨ ut = Δu x ∈ B1 u (x, 0) = |x| ⎩ σ ∈ ∂B1 , t > 0. uν (σ, t) = 1 2.27. Risolvere il seguente problema di Cauchy-Dirichlet nonomogeneo nella sfera unitaria B1 in R3 (u = u (r, t) , r = |x|): ⎧ 2 ⎪ ⎨ ut − (urr + ur ) = qe−t 0 < r < 1, t > 0 r u (r, 0) = U 0≤r≤1 ⎪ ⎩ u (1, t) = 0 t > 0.
Problemi
115
[Risposta. La soluzione è ! ∞ n 2 (−1) q −t −λ2n t −λ2n t sin(λn r) e −e − Ue u (r, t) = r n=1 λn 1 − λ2n dove λn = nπ]. 2.28. Usando il principio di massimo, confrontare i valori di due opzioni call C (1) and C (2) , con la stessa volatilità, nei seguenti casi: (a) stesso prezzo di esercizio e T1 > T2 . (b) stesso tempo di esercizio ed E1 > E2 . 2.29. Giustificare rigorosamente la configurazione delle orbite in Figura 2.17 ed in particolare dedurre che l’orbita instabile γ connette i due punti di equilibrio del sistema (2.163), completando i dettagli nei passi seguenti. 1. Siano F = V i+ −cV + U 2 − U j ed n la normale interna alla frontiera del triangolo Ω in Figura 2.19. Mostrare che, se β è scelto opportunamente, F · n > 0 lungo ∂Ω. 2. Dedurre che tutte le orbite del sistema (2.163) che partono da un punto in Ω non possono uscire da Ω (si dice che Ω è una regione positivamente invariante) e converge all’origine quando z → +∞. 3. Infine, dedurre che la separatrice instabile γ del punto di sella (1, 0) tende a (0, 0) per z → +∞.
Figura 2.19. Regione di intrappolamento (positivamente invariante ) per le orbite del campo vettoriale F =V i + −cV + U 2 − U j
3 Equazione di Laplace
3.1 Introduzione L’equazione di Laplace Δu = 0 appare frequentemente nelle scienze applicate, in particolare nello studio dei fenomeni stazionari, e le sue soluzioni prendono il nome di funzioni armoniche. Per esempio, la posizione di equilibrio di una membrana perfettamente elastica è una funzione armonica, come pure il potenziale di velocità di un fluido omogeneo. La temperatura di un corpo omogeneo e isotropo in condizioni di equilibrio è armonica ed in questo caso l’equazione di Laplace costituisce la controparte stazionaria (indipendente dal tempo) dell’equazione di diffusione. Insieme alla sua versione non omogenea (equazione di Poisson) Δu = f svolge un ruolo importante nella teoria dei campi conservativi (elettrico, magnetico, gravitazionale ed altri ancora) dove il vettore campo è gradiente di un potenziale. Per esempio, sia E un campo elettrostatico generato da una distribuzione di cariche in un dominio Ω di R3 . Allora, in unità standard, div E = 4πρ ε , dove ρ è la densità di carica ed ε è la costante dielettrica del mezzo. Quando esiste un potenziale u tale che ∇u = −E, allora Δu = div∇u = −4πρ/ε, che è l’equazione di Poisson. Nella regione dello spazio priva di cariche si ha ρ = 0 ed u è una funzione armonica in quella regione. In dimensione 2, la teoria delle funzioni armoniche è strettamente legata a quella delle funzioni olomorfe 1 . Infatti, le parti reale ed immaginaria di una funzione olomorfa sono armoniche. Per esempio, poiché le funzioni z m = ρm (cos mθ + i sin mθ) 1
m∈N
Una funzione f = f (z) si dice olomorfa in un aperto Ω del piano complesso se è ivi derivabile in senso complesso, cioè se in ogni punto z0 ∈ Ω il limite lim
z→z0
f (z) − f (z0 ) = f (z0 ) z − z0
esiste finito. Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
118
3 Equazione di Laplace
(ρ, θ coordinate polari) sono olomorfe in tutto il piano complesso C, le funzioni u (ρ, θ) = ρm cos mθ
v (ρ, θ) = ρm sin mθ
e
risultano armoniche in R2 (dette armoniche elementari ). In coordinate Cartesiane sono polinomi armonici; per m = 1, 2, 3 sono i seguenti: x, y, xy, x2 − y 2 , x3 − 3xy 2 , 3x2 y − y 3 . Altri esempi sono u (x, y) = eαx cos αy, v (x, y) = eαx sin αy
(α ∈ R),
che corrispondono alle parti reale ed immaginaria di f (z) = eαz , z = x + iy, entrambe armoniche in R2 , e u (r, θ) = log r,
v (r, θ) = θ,
parti reale ed immaginaria di f (z) = log0 z ≡ log r+iθ, armoniche in R2 \ (0, 0) e R2 \ {θ = 0} , rispettivamente. In questo capitolo presentiamo la formulazione dei più importanti problemi ben posti e le proprietà classiche delle funzioni armoniche, con particolare attenzione alle dimensioni due e tre. Come nel Capitolo 2, sottolineiamo alcuni aspetti probabilistici, sfruttando la connessione tra passeggiata, aleatoria, moto Browniano e operatore di Laplace. Centrale è la nozione di soluzione fondamentale, che sviluppiamo con i primi elementi della cosiddetta teoria del potenziale.
3.2 Problemi ben posti. Unicità Consideriamo l’equazione di Poisson Δu = f
in Ω
(3.1)
dove Ω ⊂ Rn è un dominio limitato. I problemi ben posti associati all’equazione di Poisson sono sostanzialmente quelli già visti per l’equazione di diffusione, naturalmente senza condizione iniziale. Sulla frontiera ∂Ω possiamo assegnare: • una condizione di Dirichlet. Si assegnano i valori di u : u = g;
(3.2)
• una condizione di Neumann. Si assegna la derivata normale di u : ∂ν u = h dove ν è la normale esterna a ∂Ω;
(3.3)
3.2 Problemi ben posti. Unicità
119
• una condizione di Robin o di radiazione. Si assegna ∂ν u + αu = h
(α > 0);
• condizioni miste. Per esempio, si assegna u=g ∂ν u = h
su Γ D su ΓN ,
(3.4)
dove ΓD e ΓN sono sottoinsiemi non vuoti, disgiunti, relativamente aperti in ∂Ω e tali che Γ D ∪ ΓN = ∂Ω. Quando g = h = 0 diciamo che le precedenti condizioni sono omogenee. Alcune interpretazioni sono le seguenti. Se u è la posizione di una membrana perfettamente flessibile ed f è un carico esterno distribuito (forza verticale per unità di superficie), allora (3.1) modella una stato d’equilibrio. La condizione di Dirichlet corrisponde a fissare la posizione del bordo della membrana. La condizione di Robin descrive un attacco elastico al bordo mentre una condizione di Neumann omogenea indica che il bordo della membrana è libero di muoversi verticalmente senz’attrito. Se u è la concentrazione di equilibrio di una sostanza, la condizione di Dirichlet prescrive il livello di u al bordo, mentre quella di Neumann assegna il flusso di u attraverso il bordo Usando l’identità di Green (1.17), possiamo dimostrare il seguente teorema di unicità: Teorema 2.1. Sia Ω ⊂ Rn un dominio limitato regolare. Allora esiste al più una funzione di classe C 2 (Ω) ∩ C 1 Ω soluzione di Δu = f in Ω e tale che, su ∂Ω, u=g
oppure
∂ν u + αu = h
(α > 0)
oppure ancora u=g
su Γ D ⊂ ∂Ω
e
∂ν u = h
su ΓN
dove f, g, h sono funzioni continue assegnate. Nel caso del problema di Neumann, cioè su ∂Ω, ∂ν u = h due soluzioni differiscono per una costante. Dimostrazione. Siano u e v soluzioni dello stesso problema. Poniamo w = u − v. Allora Δw = 0 e soddisfa condizioni (una delle quattro indicate) nulle al bordo. Sostituendo u = v = w nella (1.17) si trova 2 |∇w| dx = w∂ν w dσ. Ω
∂Ω
120
3 Equazione di Laplace
Ma
w∂ν w dσ = 0 ∂Ω
nel caso del problema di Dirichlet e di quello misto, mentre w∂ν w dσ = − αw2 dσ ≤ 0 ∂Ω
∂Ω
nel caso del problema di Robin. In ogni caso si deduce che 2 |∇w| dx ≤ 0 Ω
che implica ∇w = 0 e cioè w = u − v = costante. Questo conclude la dimostrazione nel caso del problema di Neumann. Negli altri casi la costante deve essere nulla (perché?), da cui u = v. Nota 2.1. Se Δu = f in Ω e ∂ν u = h su ∂Ω e sostituiamo u nella (1.18), si trova f dx = h dσ. (3.5) Ω
∂Ω
È questa una condizione di compatibilità sui dati f ed h, necessaria per l’esistenza di una soluzione del problema di Neumann. Quando dunque si deve risolvere un problema di Neumann per l’equazione di Poisson, la prima cosa da fare è controllare la validità della (3.5): se non è verificata, il problema non ha soluzione. Vedremo più avanti il significato fisico di questa condizione.
3.3 Funzioni armoniche 3.3.1 Funzioni armoniche nel discreto Nel capitolo precedente abbiamo esplorato la connessione tra moto Browniano ed equazione di diffusione. Vogliamo ora esaminare le proprietà principali delle funzioni armoniche e per farlo ritorniamo alla passeggiata aleatoria considerata nella Sezione 2.4, analizzando meglio la relazione con l’operatore di Laplace Δ. Per fissare le idee lavoriamo in dimensione n = 2, ma ragionamenti e conclusioni possono essere facilmente estesi a ogni dimensione n > 2. Siano τ > 0 il passo temporale e h > 0 quello spaziale. Indichiamo con hZ2 il reticolo dei punti x = (x1 , x2 ) le cui coordinate sono multipli interi di h. Sia p (x,t) = p (x1 , x2 , t) la probabilità di transizione, cha assegna la probabilità di trovare la nostra particella aleatoria nel punto x al tempo t. Nella Sezione 2.4 abbiamo ricavato un’equazione alle differenze per p, che qui riscriviamo in dimensione due: p (x, t + τ ) =
1 {p (x+he1 , t) + p (x−he1 , t) + p (x+he2 , t) + p (x−he2 , t)} . 4 (3.6)
3.3 Funzioni armoniche
121
Possiamo scrivere questa formula in modo più significativo introducendo l’operatore l’operatore di media Mh che agisce su una generica funzione u = u (x) secondo la formula 1 {u (x+he1 ) + u (x−he1 ) + u (x+he2 ) + u (x−he2 )} 4 1 u (y) . = |x−y|=h 4
Mh u (x) =
Osserviamo che Mh u (x) è la media aritmetica dei valori di u nei punti del reticolo hZ2 , che si trovano a distanza h da x. Diciamo che questi punti costituiscono l’intorno discreto di x, di raggio h. È chiaro che la (3.6) si può scrivere nella forma p (x, t + τ ) = Mh p (x,t) .
(3.7)
Nella (3.7), la probabilità p al tempo t + τ è determinata dall’azione di Mh su p al tempo precedente ed è allora naturale interpretare l’operatore di media come generatore della passeggiata aleatoria. Veniamo ora all’operatore di Laplace. Se u è di classe C 2 , non è difficile mostrare che2 Mh u (x) − u (x) 1 (3.8) lim → Δu (x) . 2 h→0 h 4 Non è sorprendente, quindi, che l’operatore di Laplace sia strettamente connesso col moto Browniano. La (3.8) incita a definire, per ogni h > 0 fissato, l’operatore di Laplace discreto con la formula Δ∗h = Mh − I dove I indica l’operatore identità (cioè Iu = u). L’operatore Δ∗h è ben definito sulle funzioni u definite in tutto il reticolo hZ2 e, coerentemente, diciamo che u è d-armonica (d sta per discreto) se Δ∗h u = 0. Le funzioni d-armoniche, dunque, sono quelle che in ogni punto x, coincidono con la media dei propri valori nei punti dell’intorno discreto di x di raggio h. Possiamo andare oltre e definire il problema di Dirichlet discreto. A questo scopo sia A un sottoinsieme limitato di hZ2 . Diciamo che A è connesso se è possibile congiungere una qualunque coppia di punti x0 , x1 in A, mediante un cammino3 su hZ2 interamente contenuto 2
Si ha, usando la formula di Taylor al secondo ordine, dopo aver eliso i termini opposti di prim’ordine: M u (x) = u (x) +
h2 {ux1 x1 (x) + ux2 x2 (x)} + o h2 4
da cui la formula discende facilmente.
122
3 Equazione di Laplace
Figura 3.1. Dominio per il problema di Dirichlet discreto
in A. Definiamo interno un punto x di A il cui intorno di raggio h sia contenuto in A. I punti di A non interni, si dicono di frontiera (Figura 3.1). L’insieme dei punti di frontiera di A (la frontiera di A) si indica col simbolo ∂A. Problema di Dirichlet discreto. Siano A un sottoinsieme limitato e connesso di hZ2 e g una funzione definita sulla frontiera ∂A di A. Vogliamo determinare u, definita in A, tale che ∗ nei punti interni di A Δh u = 0 (3.9) u=g su ∂A. Sia u soluzione di (3.9); due importanti proprietà discendono “quasi gratis”. 1. Principio di massimo: Se u assume il suo massimo o il suo minimo in un punto interno allora u è costante. Infatti, supponiamo che x ∈A sia un punto interno e che u (x) = M ≥ u (y) per ogni y ∈A. Poiché u (x) è la media aritmetica dei valori che assume nei quattro punti a distanza h da x, in tutti questi punti u deve esse uguale a M . Sia x1 = x uno dei quattro punti. Per la medesima ragione, u (y) = M per ogni y nell’intorno di raggio h di x1 . Poiché A è connesso, procedendo in questo modo possiamo dimostrare che u (y) = M in ogni punto di A. 2. u assume massimo e minimo su ∂A. Immediata conseguenza di 1. 3. La soluzione del problema di Dirichlet è unica (esercizio). Il problema (3.9) ha una notevole interpretazione probabilistica che si può usare per costruire la soluzione. Ritorniamo alla passeggiata aleatoria della nostra particella e interpretiamo g come un guadagno: se la particella parte da x e raggiunge la frontiera di A in y otteniamo un guadagno g (y). Vogliamo mostrare che, qualunque sia il punto di partenza x, la particella raggiunge ∂A con probabilità uno e che il valore di u (x) è il valore atteso del guadagno g, rispetto ad un’opportuna distribuzione di probabilità su ∂A. 3
Ricordiamo che due punti consecutivi in un cammino hanno distanza h.
3.3 Funzioni armoniche
123
Per ogni Γ ⊆ ∂A, indichiamo con P (x,Γ ) la probabilità che la particella aleatoria con partenza in x ∈A raggiunga per la prima volta ∂A in un punto y ∈ Γ . Dobbiamo provare che P (x, ∂A) = 1 per ogni x ∈ A. Chiaramente, se x ∈ Γ si ha P (x,Γ ) = 1, mentre se x ∈ ∂A\Γ , allora P (x,Γ ) = 0. Facciamo vedere che, per Γ fissato, la funzione x −→ wΓ (x) ≡ P (x,Γ ) è d-armonica nei punti interni ad A, cioé Δ∗h wΓ = 0. A tale scopo, introduciamo la probabilità di transizione p (1, x, y) , ovvero la probabilità di passare da x a y in un passo. Data la simmetria del moto, abbiamo p (1, x, y) = 1/4 se |x − y| = 1, altrimenti p (1, x, y) = 0. Per il teorema delle probabilità totali, si può ottenere wΓ (x) come la somma delle probabilità dei seguenti eventi disgiunti ed esaustivi (cioè la cui unione è l’evento certo): la particella parte da x, al passo successivo si trova in y e da qui raggiunge Γ . Si può allora scrivere
wΓ (x) = p (1, x, y) wΓ (y) = Mh wΓ (x) 2 y∈hZ
che equivale a
(I − Mh )wΓ = Δ∗h wΓ = 0.
Dunque wΓ è d − armonica in A. In particolare, se scegliamo Γ = ∂A, la funzione w∂A (x) è d-armonica e assume valore 1 sul bordo, essendo w∂A (x) = P (x,∂A) = 1 se x ∈ ∂A. D’altra parte, anche la funzione z (x) ≡ 1 è d-armonica con gli stessi valori al bordo. Poiché la soluzione del problema di Dirichlet è unica (proprietà 3) deve essere w∂A (x) ≡ 1 in tutto A. Pertanto, la probabilità di raggiungere ∂A partendo da un qualunque punto interno ad A è uguale ad 1. Ciò significa che la funzione d’insieme Γ → P (x,Γ ) definisce una misura di probabilità su ∂A, per ogni x ∈ A, fissato. È ora facile costruire la soluzione u di (3.9). Microteorema 3.1. Il valore della soluzione di (3.9) nel punto x è dato dal valore atteso del guadagno g (·) rispetto alla probabilità P (x,·). Cioè:
u (x) = g (y) P (x, {y}) . (3.10) y∈∂A
124
3 Equazione di Laplace
Dimostrazione. Ogni addendo g (y) P (x, {y}) = g (y) w{y} (x) è d-armonico in A e quindi anche u lo è. Inoltre, se x ∈ ∂A allora u (x) = g (x) poiché ogni termine nella somma è uguale a g (x) se y = x oppure a zero se y = x. Quando h → 0, la (3.8) mostra che, formalmente, le funzioni d-armoniche “diventano” armoniche. Sembra dunque ragionevole che versioni appropriate delle precedenti proprietà continuino a valere nel caso continuo. Cominciamo con la proprietà di media. 3.3.2 Proprietà di media Lasciandoci guidare dal caso discreto esaminato nella sottosezione precedente, vogliamo stabilire alcune proprietà fondamentali delle funzioni armoniche. Per essere precisi, diciamo che u è armonica in un dominio Ω ⊆ Rn se u ∈ C 2 (Ω) e Δu = 0 in Ω. Ora, poiché le funzioni d-armoniche, per definizione, sono definite in termini di proprietà di media, è ragionevole aspettarsi che le funzioni armoniche ereditino una proprietà di media del tipo: il valore al centro di ogni sfera BR ⊂⊂ Ω 4 uguaglia la media aritmetica dei valori al bordo ∂BR . In realtà, si può dire di più. Ricordiamo che ω n indica la misura superficiale di ∂B1 e |B1 | = ω n /n il suo volume. Teorema 3.2. Sia u armonica in Ω ⊂ Rn . Allora, per ogni sfera BR (x) ⊂⊂ Ω, con raggio R e centro x, valgono le formule: n u (y) dy (3.11) u (x) = ω n Rn BR (x) 1 u (x) = u (σ) dσ (3.12) ω n Rn−1 ∂BR (x) dove dσ è l’elemento di superficie su ∂BR (x) . Dimostrazione. Cominciamo dalla seconda formula. Poniamo, per r < R, 1 u (σ) dσ g (r) = ω n rn−1 ∂Br (x) e cambiamo variabili, ponendo σ = x+rσ . Allora σ ∈ ∂B1 (0), dσ = rn−1 dσ e quindi 1 u (x + rσ ) dσ . g (r) = ω n ∂B1 (0) 4
Ricordiamo che il simbolo A ⊂⊂ B significa che A è un insieme compatto (chiuso e limitato) contenuto in B. Si legge: A è a chiusura compatta contenuta in B.
3.3 Funzioni armoniche
125
Poniamo v (y) = u (x + ry) e osserviamo che ∇v (y) = r∇u (x + ry) Δv (y) = r2 Δu (x + ry) . Si ha, dunque,
1 d 1 u (x + rσ ) dσ = ∇u (x + rσ ) · σ dσ g (r) = ω n ∂B1 (0) dr ω n ∂B1 (0) 1 = ∇v (σ ) · σ dσ = (Teorema della Divergenza) ω n r ∂B1 (0) 1 r Δv (y) dy = Δu (x + ry) dy = 0. = ω n r B1 (0) ω n B1 (0)
Dunque g è costante e poiché g (r) → u (x) per r → 0, si ha la (3.12). Per dimostrare la (3.11), moltiplichiamo la (3.12) (con R = r) per rn−1 e integriamo entrambi i membri tra 0 ed R. Si trova R Rn 1 1 dr u (σ) dσ = u (y) dy u (x) = ωn 0 ω n BR (x) n ∂Br (x) da cui la (3.11).
Molto più significativo è l’inverso del Teorema 3.2. Diciamo che una funzione continua u soddisfa la proprietà di media in Ω, se (3.11) oppure (3.12) vale per ogni sfera BR (x) ⊂⊂ Ω. Ora, una funzione continua con la proprietà di media in un dominio Ω risulta necessariamente armonica in Ω. Si ottiene così una caratterizzazione delle funzioni armoniche mediante la proprietà di media proprio come nel caso discreto. Come sottoprodotto si deduce che ogni funzione armonica in un dominio Ω è automaticamente dotata di derivate di ogni ordine e cioè è di classe C ∞ (Ω). Si noti che questo fatto non è banale. Per esempio, u (x, y) = x + y |y| è soluzione dell’equazione uxx + uxy = 0 in tutto R2 , tuttavia non è due volte differenziabile rispetto ad y in (0, 0). Teorema 3.4. Sia u ∈ C (Ω). Se u ha la proprietà di media, allora u ∈ C ∞ (Ω) ed è armonica in Ω. Posticipiamo la dimostrazione alla fine della prossima sezione. 3.3.3 Principi di massimo Come nel caso discreto, se una funzione possiede la proprietà di media in un dominio5 Ω, non può assumere massimi o minimi globali in punti interni a Ω, a meno che essa non sia costante. Se Ω è limitato e u (non costante) è continua in Ω, segue che u assume massimo e minimo solo su ∂Ω. Precisamente: 5
Ricordiamo che per dominio si intende un insieme aperto e connesso.
126
3 Equazione di Laplace
Teorema 3.5 (Principio di massimo). Se u ∈ C (Ω) ha la proprietà di media nel dominio Ω ⊆ Rn e p ∈ Ω è un punto di estremo (massimo o minimo) globale per u, allora u è costante. In particolare, se Ω è limitato e u ∈ C(Ω) non è costante, allora, per ogni x ∈ Ω, u (x) < max u ∂Ω
e
u (x) > min u. ∂Ω
Dimostrazione. Sia u non costante e p sia, per fissare le idee, punto di minimo: m = u(p) ≤ u(y) ∀y ∈Ω. Facciamo vedere che u ≡ m in Ω. Sia q un altro punto di Ω. Poiché Ω è connesso, è sempre possibile determinare una sequenza finita di sfere B (xj ) ⊂⊂ Ω, j = 0, ..., N , tali che (Figura 3.2): • xj ∈ B (xj−1 ) , per ogni j = 1, ..., N ; • x0 = p, xN = q. Per la proprietà di media (|B (p)| indica il volume della sfera B (p)), 1 u (y) dy. m = u (p) = |B (p)| B(p) Supponiamo che esista z ∈ B (p) tale che u (z) > m. Presa una sfera Br (z) ⊂ B (p) possiamo scrivere: 1 m= u (y) dy (3.13) |B (p)| B(p) , 1 = u (y) dy + u (y) dy . |B (p)| B(p)\Br (z) Br (z)
Figura 3.2. Sequenza di cerchi sovrapposti che connettono i punti p e q
3.3 Funzioni armoniche
Usando ancora la proprietà di media si ha u (y) dy = u (z) |Br (z)| > m |Br (z)| .
127
(3.14)
Br (z)
Essendo u (y) ≥ m per ogni y, dalle (3.13) e (3.14) otteniamo la contraddizione 1 {m |B (p) \Br (z)| + m |Br (z)|} = m. m> |B (p)| Ne segue che u = m in B (p) e in particolare in x1 . Ripetendo il ragionamento appena fatto si trova che u = m in B (x1 ) e, in particolare, in x2 . Iterando il procedimento, si deduce che u = m anche in xN = q. Essendo q un punto arbitrario di Ω, si conclude che u = m in tutto Ω. Come semplice corollario si ricava un teorema di unicità per il problema di Dirichlet, migliore del Teorema 2.1, e di stabilità della corrispondenza dati → soluzione. Per ogni funzione g definita su ∂Ω, indichiamo con ug la soluzione di Δu = 0 in Ω (3.15) u=g su ∂Ω. Corollario 3.6. Siano Ω un dominio limitato di Rn e g ∈ C (∂Ω). Il problema (3.15) ha al massimo una soluzione appartenente a C 2 (Ω) ∩ C Ω . Siano inoltre g1 , g2 ∈ C (∂Ω). a) Confronto: se g1 ≥ g2 su ∂Ω e g1 = g2 in almeno un punto di ∂Ω, allora ug1 > ug2 in Ω. (3.16) b) Stabilità: max |ug1 − ug2 | = max |g1 − g2 | ∂Ω
Ω
(3.17)
Dimostrazione. Dimostriamo prima (a) e (b) . La funzione w = ug1 − ug2 è armonica ed è uguale a g1 − g2 su ∂Ω. Poiché g1 e g2 differiscono in almeno un punto di ∂Ω, w non è costante e dal Teorema 3.5 deduciamo che w (x) > min(g1 − g2 ) ≥ 0 ∂Ω
per ogni x ∈Ω,
che è la (3.16). Per provare (b), applichiamo il Teorema 3.5 a w e −w. Deduciamo le disuguaglianze ±w (x) ≤ max |g1 − g2 | ∂Ω
che equivalgono a (3.17).
per ogni x ∈Ω
128
3 Equazione di Laplace
Se ora g1 = g2 , la (3.17) implica maxΩ |u1 − u2 | = 0 e cioè u1 = u2 , da cui l’unicità per il problema di Dirichlet (3.15). Nota 3.1. Un teorema di unicità per i problemi di Neumann e Robin segue da un principio di Hopf analogo a quello del Teorema 2.4 del Capitolo 2. Per i dettagli si veda il Problema 3.10. 3.3.4 Il problema di Dirichlet in un cerchio. Formula di Poisson Dimostrare l’esistenza di una soluzione di uno dei problemi al contorno per l’equazione di Laplace/Poisson, sotto ipotesi ragionevoli sui dati, non è elementare. Nella seconda parte del testo, in particolare nel Capitolo 8, affronteremo il problema in grande generalità. Nel caso di geometrie particolarmente favorevoli, si può ricorrere a metodi speciali, come il metodo di separazione delle variabili. Usiamolo per calcolare la soluzione del problema di Dirichlet in un cerchio nel piano. Siano BR (p) il cerchio di raggio R e centro p = (p1 , p2 ) e g ∈ C (∂BR (p)). Vogliamo determinare la soluzione u ∈ C 2 (BR (p)) ∩ C B R (p) del problema di Dirichlet:
in BR (p) su ∂BR (p) .
Δu = 0 u=g
(3.18)
Teorema 3.7. L’unica soluzione u ∈ C 2 (BR (p)) ∩ C B R (p) del problema (3.18) è data dalla seguente formula di Poisson: u (x) =
R2 − |x − p| 2πR
2
g (σ)
∂BR (p)
2 dσ.
|x − σ|
(3.19)
In particolare, u ∈ C ∞ (BR (p)). Dimostrazione. Possiamo senz’altro supporre che p = 0 e scriviamo BR = BR (0) . La simmetria del dominio suggerisce il passaggio a coordinate polari; poniamo x2 = r sin θ x1 = r cos θ e U (r, θ) = u (r cos θ, r sin θ) , G (θ) = g (R cos θ, R sin θ) . Scrivendo l’operatore di Laplace in coordinate polari 6 , si perviene all’equazione 1 1 Urr + Ur + 2 Uθθ = 0, 0 < r < R, 0 ≤ θ ≤ 2π, (3.20) r r con la condizione di Dirichlet U (R, θ) = G (θ) , 6
Appendice C.
0 ≤ θ ≤ 2π.
3.3 Funzioni armoniche
129
Poiché la soluzione u dev’essere continua nel cerchio (chiuso), U e G devono essere continue in [0, R] × [0, 2π] e [0, 2π], rispettivamente, e inoltre periodiche di periodo 2π rispetto a θ. Utilizziamo il metodo di separazione delle variabili, cercando prima soluzioni della forma U (r, θ) = v (r) w (θ) con v, w limitate e w periodica di periodo 2π. Sostituendo nella (3.20) si trova 1 1 v (r) w (θ) + v (r) w (θ) + 2 v (r) w (θ) = 0 r r ossia, separando le variabili −
r2 v (r) + rv (r) w (θ) = . v (r) w (θ)
Questa identità è possibile solo quando i due quozienti hanno un valore comune costante λ. Siamo così ricondotti all’equazione ordinaria r 2 v (r) + rv (r) + λv (r) = 0
(3.21)
e al problema di autovalori
w (θ) − λw (θ) = 0 w (0) = w (2π) .
(3.22)
Il lettore può facilmente controllare che il problema (3.22) ha solo la soluzione nulla se λ ≥ 0. Se λ = −μ2 , μ > 0, l’equazione differenziale nella (3.22) ha l’integrale generale (a, b ∈ R) .
w (θ) = a cos μθ + b sin μθ La periodicità 2π di w forza μ = m, intero ≥ 0. La (3.21), con λ = −m2 , è risolta da7 v (r) = d1 r−m + d2 rm
(d1 , d2 ∈ R) .
Dovendo essere v limitata, occorre escludere r−m , m > 0, e ciò implica d1 = 0. Abbiamo così trovato le infinite armoniche elementari rm {am cos mθ + bm sin mθ}
m = 0, 1, 2, ...
sovrapponendo le quali (l’equazione di Laplace è lineare) confezioniamo la candidata soluzione:
∞ U (r, θ) = a0 + rm {am cos mθ + bm sin mθ} . (3.23) m=1
7
È un’equazione di Eulero. Si riconduce a coefficienti costanti col cambio di variabile s = log r.
130
3 Equazione di Laplace
I coefficienti am e bm devono essere scelti in modo da soddisfare la condizione al bordo lim
(r,θ)→(R,ξ)
∀ξ∈ [0, 2π] .
U (r, θ) = G (ξ)
(3.24)
Caso G ∈ C 1 ([0, 2π]). Cominciamo a considerare il caso in cui G sia una funzione regolare, in particolare dotata di derivata G continua in [0, 2π]. Si può quindi sviluppare G in serie di Fourier: G (ξ) =
α 0 ∞ + {αm cos mξ + β m sin mξ} m=1 2
dove la serie converge uniformemente e αm
1 = π
2π
G (ϕ) cos mϕ dϕ, 0
βm
1 = π
2π
G (ϕ) sin mϕ dϕ. 0
La (3.24) è quindi soddisfatta se scegliamo a0 =
α0 , 2
am = R−m αm ,
bm = R−m β m .
Sostituiamo dunque questi valori di a0 , am , bm nella (3.23) e riordiniamo opportunamente i termini; per r ≤ R otteniamo: U (r, θ)
1 ∞ r m 2π α0 G (ϕ) {cos mϕ cos mθ + sin mϕ sin mθ} dϕ + m=1 R π 2 0 1 2π 1 ∞ r m + G (ϕ) {cos mϕ cos mθ + sin mϕ sin mθ} dϕ = m=1 R π 0 2 2π 1 1 ∞ r m + = G (ϕ) cos m(ϕ − θ) dϕ. m=1 R π 0 2 =
L’integrazione termine a termine è giustificata dalla convergenza uniforme della serie. Osserviamo inoltre che, per r < R, la serie nell’ultimo integrale converge uniformemente insieme alle derivate di qualunque ordine, cosicché non ci sono problemi nel derivare prima sotto il segno di integrale e poi termine a termine. Poiché tutti gli addendi sono funzioni armoniche, anche la U (r, θ) risulta armonica per r < R (e anche C ∞ (BR )). Per ottenere un’espressione analitica migliore, notiamo che la serie entro parentesi quadre è la parte reale di una serie geometrica e precisamente:
∞ m=1
r m R
cos m(ϕ − θ) = Re
1 ∞ m=1
ei(ϕ−θ)
r m 2 . R
3.3 Funzioni armoniche
131
Poiché Re
∞ m=1
ei(ϕ−θ)
r m 1 = Re −1 R 1 − ei(ϕ−θ) Rr R2 − rR cos (ϕ − θ) −1 R2 + r2 − 2rR cos (ϕ − θ) rR cos (ϕ − θ) − r2 = 2 R + r2 − 2rR cos (ϕ − θ) =
si ottiene 1 ∞ r m 1 R2 − r 2 + , cos m(ϕ − θ) = 2 2 m=1 R 2 2 R + r − 2rR cos (ϕ − θ)
(3.25)
che, sostituita nella formula per U , dà la formula di Poisson in coordinate polari: R2 − r2 2π G (ϕ) dϕ. (3.26) U (r, θ) = 2 2 2π R + r − 2Rr cos (θ − ϕ) 0 Ritornando a variabili cartesiane si trova 8 2 g (σ) R2 − |x| u (x) = 2 dσ 2πR |x − σ| ∂BR
(3.27)
che è la (3.19) con p = 0. Il Corollario 3.6 assicura che la (3.27) è l’unica soluzione del problema di Dirichlet (3.18). In particolare, essendo u (x) ≡ 1 la soluzione del problema di Dirichlet con dato g ≡ 1, si deduce la formula 2
1=
R2 − |x| 2πR
∂BR
1
2 dσ.
|σ − x|
(3.28)
Caso g ∈ C (∂BR ). Abbiamo mostrato che la (3.27) è soluzione del problema (3.18) sotto l’ipotesi aggiuntiva che G (θ) = g (R cos θ, R sin θ) avesse derivate continue. Anche se g è solo continua, la formula (3.27) ha perfettamente senso e definisce una funzione armonica in BR (e anche di classe C ∞ (BR )). Il problema è dimostrare che lim u (x) = g (ξ) ,
x→ξ 8
∀ξ ∈ ∂BR .
Si ha σ = R(cos ϕ, sin ϕ), dσ = Rdϕ e |x−σ|2 = (R cos ϕ − r cos θ)2 + (R sin ϕ − r sin θ)2 = R2 + r2 − 2Rr (cos ϕ cos θ + sin ϕ sin θ) = R2 + r2 − 2Rr cos (θ − ϕ) .
(3.29)
132
3 Equazione di Laplace
Fissiamo ora ξ ∈ ∂BR ed ε > 0. Per la continuità di g si può scegliere un arco Γδ ⊂ ∂BR di lunghezza δ, centrato in ξ, tale che |g (σ) − g (ξ)| < ε su Γδ .
(3.30)
Possiamo allora scrivere, usando la (3.28), 2
R2 − |x| u (x) − g (ξ) = 2πR
2
=
R2 − |x| 2πR
g (σ) − g (ξ)
∂BR 2
(· · · ) dσ + Γδ
R2 − |x| 2πR
2
|σ − x|
dσ
(· · · ) dσ ≡ I + II.
∂BR \Γδ
Essendo |u (x) − g (ξ)| ≤ |I|+|II|, basta dimostrare che |I| < ε e che |II| → 0 se x → ξ. Per la (3.30) e la (3.28) si ha:
2
R2 − |x| |I| ≤ 2πR
|g (σ) − g (ξ)|
Γδ
2
|σ − x|
2
R2 − |x| dσ < ε 2πR
Γδ
1
2 dσ
|σ − x|
< ε. (3.31)
D’altra parte, se x → ξ e σ ∈ ∂BR \Γδ , si ha 2
R2 − |x| → 0
|σ − x| ≥ δ/2.
e
Allora si può scrivere: 2
|II| ≤
R2 − |x| 2πR
∂BR \Γδ
|g (σ) − g (ξ)| 2
|σ − x|
dσ ≤
4 max |g| 2 2 (R − |x| ) → 0. δ2
La (3.27) è dunque soluzione del problema (3.18); il Corollario 3.6 ne assicura ancora l’unicità. • Formula di Poisson in dimensione n ≥ 3. Il Teorema 3.7 ha un’appron priata estensione in dimensione n ≥ 3. Se BR (p) ⊂ R e g ∈ C (∂BR (p)), 2 la soluzione u ∈ C (BR (p)) ∩ C B R (p) del problema di Dirichlet (3.18) è data da 2 R2 − |x − p| g (σ) (3.32) u (x) = n dσ. ωn R ∂BR (p) |x − σ| Possiamo ora procedere con la dimostrazione del Teorema 3.4. Dimostrazione del Teorema 3.4. Osserviamo preliminarmente che se due funzioni hanno la proprietà di media in un dominio Ω, allora anche la loro differenza ha la stessa proprietà. Sia ora u ∈ C (Ω) con la proprietà di media e consideriamo una sfera B ⊂⊂ Ω. Sia v la soluzione del problema Δv = 0
in B,
v=u
su ∂B.
3.3 Funzioni armoniche
133
Dal Teorema 3.7, v ∈ C ∞ (B) ∩ C B ed essendo armonica ha la proprietà di media in B. Allora anche la funzione w = v − u ha la proprietà di media in B e pertanto assume massimo e minimo su ∂B. Essendo w = 0 su ∂B si conclude che u = v e quindi u ∈ C ∞ (B) ed è armonica. Per l’arbitrarietà di B segue la tesi. Un’immediata conseguenza del Teorema 3.7 è che se u è armonica in un dominio Ω, allora u ∈ C ∞ (Ω). Ciò implica che ogni derivata di qualunque ordine di una funzione armonica è ancora armonica; infatti, potendosi scambiare l’ordine di derivazione, si ha: Δuxj = (Δu)xj = 0 e così per ogni altra derivata. Un’altra importante conseguenza è la possibilità di controllare le derivate di ogni ordine di una funzione armonica u in un punto p mediante il massimo di u in una sfera centrata in p. Lo dimostriamo per le derivate prime e seconde nel seguente corollario. Corollario 3.8. Siano u armonica in Ω ⊆ Rn e BR (p) ⊂⊂ Ω. Allora, per ogni j, k = 1, ..., n, ux (p) ≤ n max |u| , j R ∂BR (p)
2 uxj x (p) ≤ (2n) max |u| . k R2 ∂BR (p)
(3.33)
Dimostrazione. Poiché uxj è armonica in Ω, dalla proprietà di media e dalla formula di Gauss, possiamo scrivere: n n ux (y) dy = u (σ) ν j dσ uxj (p) = ω n Rn BR (p) j ω n Rn ∂BR (p) e quindi, essendo |∂BR (p)| = ω n Rn−1 n ux (p) ≤ n |u (σ)| dσ ≤ max |u| . j ω n Rn ∂BR (p) R ∂BR (p)
(3.34)
Dalla (3.34) con uxk al posto di u e R/2 al posto di R, si trova: ux
j xk
2n max |ux | . (p) ≤ R ∂BR/2 (p) k
Applicando ora la (3.34) ad uxk , con R/2 al posto di R, per ogni q ∈ ∂BR/2 (p) si ha: 2n |uxk (q)| ≤ max |u| R ∂BR/2 (q) si deduce: ux
j xk
2n (2n)2 max |uxk | ≤ (p) ≤ max |u| R ∂BR/2 (p) R2 ∂BR (p)
essendo ∂BR/2 (q) ⊂ BR (p).
134
3 Equazione di Laplace
3.3.5 Disuguaglianza di Harnack e teorema di Liouville Dalle formule di Poisson e di media si ricava un altro principio di massimo, noto come disuguaglianza di Harnack. Teorema 3.9. Sia u armonica e nonnegativa in BR = BR (0) ⊂ Rn . Allora, per ogni x ∈BR , Rn−2 (R − |x|) n−1
(R + |x|)
u (0) ≤ u (x) ≤
Rn−2 (R + |x|) n−1
(R − |x|)
u (0) .
(3.35)
Dimostrazione. Dalla formula di Poisson: 2
u (x) =
R2 − |x| ωn R
∂BR
u (σ) n dσ. |σ − x| 2
Osserviamo che R−|x| ≤ |σ − x| ≤ R+|x| e che R2 −|x| = (R−|x|)(R+|x|). Allora 1 Rn−2 (R + |x|) Rn−2 (R + |x|) u (σ) dσ = u (x) ≤ n−1 u (0) . (R − |x|)n−1 ω n Rn−1 ∂BR (R − |x|) Analogamente u (x) ≥
Rn−2 (R − |x|) 1 (R + |x|)n−1 4πR2
u (σ) dσ = ∂BR
Rn−2 (R + |x|) n−1
(R − |x|)
u (0) .
La disuguaglianza di Harnack ha un’importante conseguenza: le uniche funzioni armoniche in Rn , limitate inferiormente (o superiormente), sono le costanti. Corollario 3.10 (Teorema di Liouville). Se u è armonica in Rn e u (x) ≥ M , allora u è costante. Dimostrazione. La funzione w = u − M è armonica in Rn e nonnegativa. Fissiamo x ∈Rn e scegliamo R > |x|; la disuguaglianza di Harnack dà Rn−2 (R − |x|) n−1
(R + |x|)
w (0) ≤ w (x) ≤
Rn−2 (R + |x|) n−1
(R − |x|)
w (0) .
Passando al limite per R → ∞ si trova w (0) ≤ w (x) ≤ w (0) ossia w (0) = w (x). Essendo x arbitrario, si conclude che w, e quindi anche u, è costante.
3.3 Funzioni armoniche
135
3.3.6 Una soluzione probabilistica per il problema di Dirichlet Nella Sezione 3.1 abbiamo risolto il problema di Dirichlet discreto per via probabilistica. Gli strumenti chiave nella costruzione della soluzione, espressa nella formula (3.10), sono stati la proprietà di media e l’assenza di memoria della passeggiata aleatoria (ogni passo è indipendente dai precedenti). Nel caso continuo valgono appropriate versioni di queste proprietà e, in particolare, la proprietà di Markov del moto Browniano ne codifica l’assenza di memoria 9 È dunque ragionevole aspettarsi che esista un’opportuna versione della formula (3.10) per la soluzione del problema di Dirichlet per l’operatore di Laplace. Ragioniamo ancora nel caso bidimensionale, tenendo sempre presente che tutto vale, con ovvi cambiamenti, in dimensione maggiore di due. Sia Ω un dominio limitato di R2 e g ∈ C (∂Ω). Vogliamo ricavare una formula di rappresentazione per la soluzione u ∈ C 2 (Ω) ∩ C Ω del problema Δu = 0 in Ω (3.36) u=g su ∂Ω. Sia X (t) la posizione di una particella Browniana con partenza in x ∈ Ω e introduciamo il tempo τ = τ (x) di prima uscita da Ω: ! τ (x) = inf t : X (t) ∈ R2 \Ω t≥0
che si può anche definire come il tempo di prima visita a ∂Ω (Figura 3.3). Il tempo τ è un tempo d’arresto: per decidere se l’evento {τ ≤ t} si è verificato o meno, è sufficiente osservare il processo fino al tempo t. Osserviamo infatti che, fissato t ≥ 0, per decidere se τ ≤ t è sufficiente considerare l’evento E = {X (s) ∈ Ω per tutti i tempi s da 0 fino a t, t incluso} .
Figura 3.3. Punto di prima visita a ∂Ω
9
Sezione 2.6.
136
3 Equazione di Laplace
Se E si verifica, allora deve essere τ > t per cui {τ ≤ t} è falso mentre se E non si verifica vuol dire che vi sono punti della traiettoria fuori da Ω per tempi s ≤ t e quindi {τ ≤ t} è vero. Verifichiamo ora che prima o poi la particella esce da Ω quasi certamente. Vale infatti il seguente Lemma 3.11. Per ogni x ∈ Ω, τ (x) è finito con probabilità 1, cioè: P {τ (x) < ∞} = 1. Dimostrazione. Basta far vedere che la particella rimane dentro un qualunque cerchio Br = Br (x) ⊂ Ω, di raggio r e centro x, con probabilità zero. Se indichiamo con τ r il tempo di prima uscita da Br , dobbiamo mostrare che P {τ r = ∞} = 0. Supponiamo che X (t) ∈ Br fino all’istante t = k (k intero naturale). Allora, per j = 1, 2, ..., k deve essere |X (j) − X (j − 1)| < 2r. L’evento {τ r > k} implica dunque tutti gli eventi Ej = {|X (j) − X (j − 1)| < 2r}
j = 1, 2, ..., k
e quindi anche la loro intersezione. Ne segue che P {τ r > k} ≤ P ∩kj=1 Ej .
(3.37)
D’altra parte, gli incrementi X (j)−X (j − 1) sono equidistribuiti secondo una legge normale standard e mutuamente indipendenti, per cui possiamo scrivere $ # 2 |z| 1 dz ≡γ < 1 P {|X (j) − X (j − 1)| < 2r} = exp − 2π {|z|<2r} 2 e
k 3 P ∩kj=1 Ej = P {Ej } = γ k .
(3.38)
j=1
Poiché l’evento {τ r = ∞} implica l’evento {τ r > k}, dalle (3.37) e (3.38) deduciamo P {τ r = ∞} ≤ P {τ r > k} ≤ γ k . Facendo tendere k a +∞ si trova P {τ r = ∞} = 0.
Il Lemma 3.11 implica che X (τ ) ∈ ∂Ω in un tempo finito, con probabilità uno. Possiamo allora introdurre su ∂Ω una distribuzione di probabilità associata alla variabile aleatoria X(τ ), ponendo, per ogni insieme di Borel 10 F ⊂ ∂Ω, P (x,τ , F ) = P {X(τ ) ∈ F } (τ = τ (x) ). 10
Appendice B.
3.3 Funzioni armoniche
137
P (x,τ , F ) rappresenta la probabilità di fuga da Ω attraverso F . Per ogni x fissato in Ω, la funzione d’insieme F −→ P (x,τ (x) , F ) definisce una misura di probabilità su ∂Ω, poiché P (x,τ (x) , ∂Ω) = 1, in base al Lemma 3.10. Possiamo ora congetturare quale sia la formula per la soluzione del problema di Dirichlet (3.36), analogo continuo della (3.10). Per ogni σ ∈∂Ω, interpretiamo g (σ) come guadagno all’arrivo della particella in σ. Per calcolare il valore u (x) si fa partire da x un moto Browniano X, si calcola il primo punto X (τ ) in cui X tocca il bordo di Ω. Si calcola il guadagno g (X (τ )) e se ne fa il valore atteso rispetto alla distribuzione P (x,τ , ·). Tutto funziona se ∂Ω è sufficientemente regolare. Precisamente: Teorema 3.12. Siano Ω un dominio limitato e Lipschitziano e g ∈ C (∂Ω). L’unica soluzione u ∈ C 2 (Ω) ∩ C Ω del problema (3.36) è data dalla formula seguente: g (σ) P (x, τ (x) , dσ) = E x [g (X (τ ))] . (3.39) u (x) = ∂Ω
Dimostrazione (parzialmente euristica). Per F ⊆ ∂Ω, fissato, consideriamo la funzione uF : x −→P (x, τ (x) , F )). Si può dimostrare (e dovrebbe essere intuitivamente plausibile) che uF è continua in Ω. Facciamo vedere che uF è armonica mostrando che possiede la proprietà di media (Teorema 3.4). Sia BR = BR (x) ⊂⊂ Ω. Se τ R = τ R (x) è il tempo di prima uscita da BR , allora X (τ R ) ha una distribuzione uniforme su ∂BR , data l’invarianza per rotazioni del moto Browniano. Ciò significa che, per esempio, la probabilità di uscire da BR attraverso un arco K ⊂ ∂BR , partendo dal centro, è pari a lunghezza di K . 2πR Ora, prima di raggiungere F , la particella deve uscire da BR , dove, come abbiamo appena osservato, ha posizione aleatoria uniforme. Poiché τ R è un tempo d’arresto, possiamo usare la proprietà di Markov forte (Sezione 2.6) secondo la quale, dopo τ R , X (t) può essere considerato come un moto Browniano con distribuzione iniziale uniforme su ∂BR , espressa dalla formula (Figura 3.4) dσ μ (dσ) = 2πR dove dσ è elemento di lunghezza su ∂BR ). Pertanto, la particella esce da ∂BR attraverso un arco di lunghezza dσ, centrato in σ, e da lì raggiunge F con probabilità dσ P (σ,τ (σ) , F ) μ (dσ) = uF (σ) . 2πR
138
3 Equazione di Laplace
Figura 3.4. Proprietà di Markov per una particella Browniana
Integrando questa probabilità su ∂BR otteniamo uF (x), cioè: 1 uF (x) = uF (σ) dσ 2πR ∂BR (x) che è precisamente la proprietà di media per uF . Quindi uF è armonica in Ω. Osserviamo anche che, se σ∈∂Ω, allora τ (σ) = 0 e pertanto 1 se σ ∈ F uF (σ) = P (σ, 0, F ) = 0 se σ ∈ ∂Ω\F ossia: su ∂Ω, uF coincide con la funzione caratteristica dell’insieme F . Se dunque dσ è un elemento d’arco su ∂Ω centrato in σ, euristicamente, la funzione x −→ g (σ) P (x,τ (x) , dσ) (3.40) è armonica in Ω, assume il valore g (σ) in dσ e il valore zero su ∂Ω\dσ. Per avere la funzione armonica uguale a g su tutto ∂Ω, basta sommare i contributi di ciascuna delle (3.40) integrando su ∂Ω. Si ottiene così la (3.39). Rigorosamente, per affermare che (3.39) è effettivamente la soluzione cercata, occorre sincerarsi che assuma con continuità i dati al bordo di Ω. Si può dimostrare che tutto funziona perfettamente se Ω è abbastanza regolare, per esempio un dominio Lipschitziano. L’unicità segue dal Corollario 3.6. Nota 3.2. La (3.39) vale inalterata in dimensione n ≥ 3. La misura F −→ P (x, τ (x) , F ) si chiama misura armonica in x del dominio Ω ed in generale non si può esprimere con formule esplicite. Nel caso particolare Ω = BR (p) abbiamo però calcolato la soluzione del problema di Dirichlet, pervenendo alla formula di Poisson (3.32). Un rapido esame di questa formula indica che la misura armonica in x di BR (p) è data da 2
P (x,τ (x) , dσ) =
1 R2 − |x − p| dσ. ω n R |σ − x|n
3.3 Funzioni armoniche
139
Figura 3.5. Una modifica dei dati di Dirichlet sull’arco AB influenza il valore della soluzione in x
Nota 3.3. La (3.39) indica che il valore della soluzione in un punto x dipende dai valori del dato di Dirichlet su tutto ∂Ω (a meno di modifiche di misura superficiale nulla). Nella situazione in Figura 3.5, un cambiamento del dato g sull’arco AB influenza il valore della soluzione nel punto x, anche se questo è molto distante e vicino a ∂Ω. Questo fatto va tenuto ben presente nella costruzione di metodi numerici. 3.3.7 Ricorrenza e moto Browniano Abbiamo visto che la soluzione di un problema di Dirichlet può essere costruita usando le proprietà generali di un moto Browniano. Viceversa, la conoscenza per via deterministica della soluzione di alcuni problemi di Dirichlet, permette di ricavare interessanti proprietà del moto Browniano. Vediamo un esempio molto semplice in due dimensioni. Siano a, R due numeri reali con R > a > 0. Ricordando che ln |x| è armonica in R2 \ {0}, si controlla facilmente che la funzione ln |R| − ln |x| ln R − ln a è armonica nella corona circolare Ca,R = x ∈R2 ; a < |x| < R e inoltre uR (x) =
uR (x) = 1 su ∂Ba (0) ,
uR (x) = 0 su ∂BR (0) .
Si può dunque interpretare uR (x) come la probabilità di fuga dalla corona circolare attraverso ∂Ba (0), partendo da x: uR (x) = PR (x,τ (x) , ∂Ba (0)) . Se passiamo al limite per R → +∞, si ha PR (x,τ (x) , ∂Ba (0)) =
ln R − ln |x| → 1 = P∞ (x,τ (x) , ∂Ba (0)) ln R − ln a
e cioè la probabilità di partire da x ed entrare prima o poi nel cerchio Ba (0) è uguale a 1. Data l’invarianza per traslazioni nello spazio del moto Browniano,
140
3 Equazione di Laplace
si arriva alle stesse conclusioni se l’origine è sostituita da un qualunque altro punto. Poiché, inoltre, abbiamo mostrato che anche la probabilità di uscire da un qualunque cerchio è uguale a 1, siamo condotti al seguente enunciato: fissato x e fissato un qualunque cerchio nel piano, un moto Browniano con partenza in x entra ed esce dal cerchio infinite volte con probabilità 1. Si dice che il moto Browniano bidimensionale è ricorrente. In tre dimensioni il moto Browniano non è ricorrente. Infatti, la funzione uR (x) =
1 1 |x| − R 1 1 a − R
è armonica nella corona sferica Sa,R = x ∈ R3 ; a < |x| < R e inoltre uR (x) = 1 su ∂Ba (0) ,
uR (x) = 0 su ∂BR (0) .
Si può dunque interpretare uR (x) come la probabilità di fuga dalla corona sferica attraverso ∂Ba (0), partendo da x: uR (x) = PR (x,τ (x) , ∂Ba (0)) . Se passiamo al limite per R → +∞, si ha PR (x,τ (x) , ∂Ba (0)) =
1 1 |x| − R 1 1 a − R
→
a = P∞ (x,τ (x) , ∂Ba (0)) . |x|
La probabilità di entrare prima o poi nella sfera Ba (0) non è più 1 e diventa sempre più piccola all’allontanarsi di x dall’origine.
3.4 Soluzione fondamentale e potenziale Newtoniano 3.4.1 La soluzione fondamentale La (3.39) non è l’unica formula di rappresentazione per la soluzione del problema di Dirichlet. In questa sezione vedremo formule che coinvolgono potenziali di vario tipo costruiti usando come mattone pricipale una particolare funzione armonica in tutto Rn , tranne che in un punto, e che chiameremo soluzione fondamentale dell’operatore di Laplace. Come per l’equazione di diffusione, cominciamo a considerare due proprietà che caratterizzano l’operatore Δ: l’invarianza per traslazioni e l’invarianza per rotazioni dello spazio. Sia u = u (x) armonica in Rn . Invarianza per traslazioni significa che anche la funzione v (x) = u (x − y), per ogni y fissato, è armonica. Il controllo è immediato. Invarianza per rotazioni significa che, data una rotazione in Rn , rappresentata da una matrice ortogonale M (i.e. MT = M−1 ), anche v (x) = u (Mx)
3.4 Soluzione fondamentale e potenziale Newtoniano
141
è armonica in Rn . Per dimostrarlo, osserviamo che, se indichiamo con D2 u la matrice Hessiana di u, si ha Δu = TrD2 u = traccia della Hessiana di u. Poiché
D2 v (x) = MT D2 u (Mx) M
e M è ortogonale, abbiamo Δv (x) = Tr[MT D2 u (Mx) M] = TrD2 u (Mx) = Δu (Mx) = 0 e perciò v è armonica. Ora, una tipica espressione invariante per rotazioni è la distanza di un punto (diciamo) dall’origine, cioè r = |x|. Cerchiamo dunque funzioni armoniche che dipendano solo da r, ovvero soluzioni a simmetria radiale u = u (r). Ragioniamo in dimensione n = 3. Se passiamo a coordinate sferiche (r, ψ, θ), r > 0, 0 < ψ < π, 0 < θ < 2π, l’operatore Δ ha l’espressione seguente11 : ! ∂2 2 ∂ 1 1 ∂2 ∂ ∂2 Δ= 2 + + 2 + cot ψ 2 + 2 ∂ψ ∂ψ 2 -∂r ./ r ∂r0 r - (sin ψ) ∂θ ./ 0 parte radiale
parte sferica (operatore di Laplace-Beltrami)
e l’equazione di Laplace per u = u (r) si riduce all’equazione differenziale ordinaria ∂ 2 u 2 ∂u =0 + ∂r2 r ∂r il cui integrale generale è u (r) =
C + C1 r
con C, C1 costanti arbitrarie.
Se n = 2, si trova (passando a coordinate polari) ∂ 2 u 1 ∂u =0 + ∂r2 r ∂r e quindi u (r) = C log r + C1 . Scegliamo, C = La funzione
11
Appendice C.
1 4π
1 se n = 3, C = − 2π se n = 2 e in entrambi i casi C1 = 0. ⎧ 1 ⎪ ⎨ − 2π log |x| n = 2 (3.41) Φ (x) = 1 ⎪ n=3 ⎩ 4π |x|
142
3 Equazione di Laplace
si chiama soluzione fondamentale per l’operatore di Laplace Δ. Φ è definita per x = 0 e, come dimostreremo nel Capitolo 7, la scelta della costante C è stata fatta in modo che ΔΦ = −δ in Rn dove δ indica la distribuzione di Dirac in x = 0. Notevole è il significato fisico di Φ: se n = 3, in unità di misura standard, 4πΦ rappresenta il potenziale elettrostatico (o gravitazionale) generato da una carica (o massa) unitaria posta nell’origine che si annulla all’infinito. In dimensione 2, 2πΦ (x1 , x2 ) = − log x21 + x22 rappresenta il potenziale generato da una carica di densità totale 1, distribuita lungo l’asse x3 . Se la carica è posta in un punto y, il potenziale corrispondente sarà 4πΦ (x − y) ed allora Δx Φ (x −y) = −δ (x − y) . Per simmetria, si ha anche Δy Φ (x − y) = −δ (x − y), dove stavolta è fissato x. Nota 4.1. In dimensione n > 3, la soluzione fondamentale dell’operatore di Laplace è 1 1 Φ (x) = . (n − 2) ω n |x|n−2 3.4.2 Il potenziale Newtoniano −1
Supponiamo che (4π) f (x) rappresenti la densità di una carica localizzata all’interno di un sottoinsieme compatto di R3 . Allora Φ (x − y) f (y) dy rap−1 presenta il potenziale in x generato dalla carica (4π) f (y) dy, presente in una piccola regione di volume dy, centrata in y. Il potenziale totale si ottiene sommando tutti i contributi e si trova 1 f (y) Φ (x − y) f (y) dy = dy (3.42) Nf (x) = 4π |x − y| 3 3 R R che è la convoluzione tra f e Φ ed è chiamato potenziale Newtoniano di f . Formalmente, abbiamo ΔNf (x) = Δx Φ (x − y) f (y) dy = − δ (x − y) f (y) dy = −f (x) . R3
R3
(3.43) Sotto opportune ipotesi su f , la (3.43) è infatti vera (Teorema 4.1). Chiaramente, Nf (x) non è la sola soluzione di Δv = −f , poiché se c è costante, anche
3.4 Soluzione fondamentale e potenziale Newtoniano
143
Nf + c è soluzione della stessa equazione. Tuttavia, il potenziale Newtoniano è la sola soluzione che si annulla all’infinito. Precisamente, vale il seguente risultato, dove, per semplicità, assumiamo che f ∈ C 2 R3 con supporto compatto12 : Teorema 4.1. Sia f ∈ C 2 R3 a supporto compatto. Allora Nf ∈ C 2 R3 ed è l’unica soluzione in R3 dell’equazione di Poisson Δu = −f
(3.44)
che si annulla all’infinito. Dimostrazione. Unicità. Sia v ∈ C 2 R3 un’altra soluzione di (3.44) che si annulla all’infinito. Allora w = u − v è una funzione armonica limitata in R3 e quindi costante, in base al Teorema di Liouville (Corollario 3.10). Poiché w si annulla all’infinito deve essere zero, cioé u = v. Per dimostrare che Nf ∈ C 2 R3 , osserviamo che possiamo scrivere la (3.42) nella forma alternativa 1 f (x − y) dy. Nf (x) = Φ (y) f (x − y) dy = 4π R3 |y| R3 Poiché 1/ |y| è integrabile in un intorno dell’origine ed f è nulla fuori da un compatto, possiamo differenziare due volte sotto il segno di integrale per ottenere, per ogni j, k = 1, ..., n : ∂xj xk Nf (x) = Φ (y) fxj xk (x − y) dy. (3.45)
3
R3
Poiché fxj xk ∈ C R , la (3.45) mostra che ognuna delle derivate ∂xj xk Nf è continua, per cui Nf ∈ C 2 R3 . Resta da dimostrare la (3.44). Poiché Δx f (x − y) = Δy f (x − y), dalla (3.45) abbiamo ΔNf (x) = Φ (y) Δx f (x − y) dy = Φ (y) Δy f (x − y) dy. R3
R3
Vogliamo integrare per parti usando la formula (1.17). Tuttavia, poiché Φ ha una singolarità in y = 0, occorre prima isolare l’origine, scegliendo Br = Br (0) e scrivendo ΔNf (x) = · · · dy + · · · dy ≡ Ir (x) + Jr (x), (3.46) Br
R3 \Br
riservandoci poi di passare al limite per r → 0. Usando coordinate sferiche, troviamo: r max |Δf | max |Δf | 2 1 ρ dρ = dy = max |Δf | r |Ir (x)| ≤ 4π 2 0 Br |y| 12
Ricordiamo che il supporto di una funzione continua f è la chiusura dell’insieme dove f è non nulla.
144
3 Equazione di Laplace
da cui Ir (x) → 0
se r → 0.
Ricordando che f si annulla fuori da un compatto, possiamo integrare Jr per parti (due volte); si ottiene (ν σ indica il versore normale esterno a ∂Ω nel punto σ): 1 Jr (x) = ∇σ f (x − σ) · ν σ dσ − ∇Φ (y) · ∇y f (x − y) dy 4πr ∂Br R3 \Br 1 = ∇σ f (x − σ) · ν σ dσ − f (x − σ) ∇Φ (σ) · ν σ dσ 4πr ∂Br ∂Br poiché ΔΦ = 0 in R3 \Br . Abbiamo: 1 ∇σ f (x − σ) · ν σ dσ ≤ r max |∇f | → 0 4πr ∂Br
se r → 0.
−3
D’altra parte, ∇Φ (y) = −y |y| e il versore normale esterno a ∂Br (rispetto a R3 \Br ) è ν σ = −σ/r, cosicché 1 f (x − σ) ∇Φ (σ) · ν σ dσ = f (x − σ) dσ → f (x) se r → 0. 4πr 2 ∂Br ∂Br Concludiamo che, Jr (x) → −f (x) se r → 0. Infine, passando al limite per r → 0 nella (3.46), ricaviamo Δu (x) = −f (x). Nota 4.2. Il Teorema 4.1 vale in realtà sotto ipotesi molto meno restrittive su f . Per esempio, è sufficiente che f ∈ C 1 R3 e per |x| grande −2−ε
|f (x)| ≤ C |x|
, ε > 0.
Nota 4.3. Una versione appropriata del Teorema 4.1 vale in dimensione n = 2, con il potenziale Newtoniano sostituito dal potenziale logaritmico 1 Lf (x) = Φ (x − y) f (y) dy = − log |x − y| f (y) dy. (3.47) 2π R2 R2 Il potenziale logaritmico non si annulla all’infinito; il suo andamento asintotico è il seguente (Problema 3.11) M 1 log |x| + O per |x| → +∞ (3.48) u (x) = − 2π |x|
dove M=
f (y) dy. R2
Precisamente, il potenziale logaritmico è l’unica soluzione dell’equazione Δu = −f in R2 con l’andamento asintotico (3.48).
3.4 Soluzione fondamentale e potenziale Newtoniano
145
3.4.3 Formula di scomposizione di Helmholtz Usando le proprietà del potenziale Newtoniano possiamo risolvere i seguenti due problemi, che intervengono in numerose applicazioni, e.g. in elasticità lineare, fluidodinamica o elettrostatica. 1) Ricostruzione di un campo vettoriale in R3 conoscendo divergenza e rotore. Si tratta di risolvere il seguente Dati uno scalare f ed un campo problema. vettoriale ω, determinare u ∈C 2 R3 ; R3 tale che div u = f (3.49) in R3 rot u = ω e inoltre u (x) → 0 se |x| → ∞. 2) Scomposizione di un campo vettoriale u nella somma di un campo solenoidale (a divergenza nulla) e di uno irrotazionale. Precisamente, dato u, si vuole trovare uno scalare ϕ e un campo vettoriale w tali che valga la seguente formula di scomposizione di Helmholtz: u = ∇ϕ + rot w.
(3.50)
Consideriamo il problema (1). Anzitutto osserviamo che div rot u =0 per cui deve essere div ω =0, altrimenti non c’è soluzione. Occupiamoci di stabilire se la soluzione è unica. Vista la linearità degli operatori differenziali coinvolti, ragioniamo come al solito e supponiamo che u1 e u2 siano soluzioni del problema con gli stessi dati f e ω. Poniamo w = u1 − u2 ed osserviamo che div w = 0
e
rot w = 0
in R3
ed inoltre w si annulla all’infinito. Da rot w = 0 si deduce che esiste uno scalare U tale che ∇U = w mentre da div w =0 si ha div∇U = ΔU = 0. Dunque U è armonica ed allora lo sono anche le sue derivate, ossia le componenti wj di w. Ma ogni wj è continua in R3 e tende a zero all’infinito, per cui è limitata. Il Teorema di Liouville (Corollario 3.10) implica che wj è costante e perciò nulla. Pertanto la soluzione del problema (1) è unica. Per determinare u, scriviamo u = z + v e cerchiamo z e v in modo che div v = f
rot v = 0
div z = 0
rot z = ω.
146
3 Equazione di Laplace
Da rot v = 0 si deduce l’esistenza di uno scalare ϕ tale che ∇ϕ = v mentre div v = f implica Δϕ = f . Sotto ipotesi opportune su f , in base al Teorema 4.1, l’unica soluzione di Δϕ = f che si annulla all’infinito è −Nf (x) = − Φ (x − y) f (y) dy R3
e quindi v = −∇Nf . Per determinare z, ricordiamo l’identità (Appendice C) rot rot z = ∇div z − Δz
(3.51)
che, dovendo essere div z = 0 e rot z = ω, si riduce a rot ω = −Δz. Usando ancora il Teorema 4.1, scriviamo z (x) = Nrot ω (x) = Φ (x − y) rot ω (y) dy. R3
La candidata soluzione per il nostro problema è dunque il campo vettoriale u (x) = Nrot
ω
(x) − ∇Nf (x) .
(3.52)
A questo punto occorre verificare che la (3.52) sia effettivamente la soluzione richiesta, sotto ipotesi ragionevoli su f e ω. Riassumiamo le conclusioni nel seguente teorema (si veda la Nota 4.2). Teorema 4.2. Siano f ∈ C 1 R3 , ω ∈ C 2 R3 ; R3 con div ω = 0 e tali che, per |x| abbastanza grande, |f (x)| ≤
M 2+ε
|x|
,
|rot ω| ≤
M 2+ε
|x|
(ε > 0) .
(3.53)
Allora il campo vettoriale (3.52) è l’unica soluzione del sistema (3.49) che tende a zero all’infinito. Dimostrazione (cenno). L’unicità è già stata dimostrata. Ora, le ipotesi su f ed ω permettono di differenziare sotto il segno di integrale. Inoltre, poiché ∇x Φ (x − y) = −∇y Φ (x − y) , possiamo scrivere (nel Problema 3.21 si chiede di giustificare l’integrazione per parti): Φ (x − y) rot ω (y) dy divNrot ω (x) = div R3 = −∇y Φ (x − y) · rot ω (y) dy 3 R = Φ (x − y) div rot ω (y) dy = 0. R3
3.4 Soluzione fondamentale e potenziale Newtoniano
147
Essendo div∇Nf = −f , si deduce che div u = divNrot
ω
− div∇Nf = f.
Analogamente, usando la (3.51) e la formula 8 di Gauss in Appendice C.2, abbiamo: rotNrot ω (x) = rotx [Φ (x − y) rot ω (y)] dy 3 R = ∇x Φ (x − y) × rot ω (y) dy R3 =− ∇y Φ (x − y) × rot ω (y) dy 3 R Φ (x − y) rot rot ω (y) dy = R3
= −NΔω (x) = ω (x) che conclude la dimostrazione, essendo rot∇Nf (x) = 0.
Veniamo ora al problema (2). Se u, f = div u e ω = rot u verificano le ipotesi del Teorema 4.2, si può scrivere Φ (x − y) rot rot u (y) dy − ∇ Φ (x − y) div u (y) dy. u (x) = R3
R3
Dalla dimostrazione del Teorema 4.2 si ha Φ (x − y) rot rot u (y) dy = rot R3
R3
Φ (x − y) rot u (y) dy
(3.54)
e perciò si conclude che u = ∇ϕ + rot w
(3.55)
con ϕ (x) = −Ndiv u (x)
e
w (x) = Nrot u (x) .
La (3.55) è la formula richiesta.
• Un’applicazione alla fluidodinamica. Consideriamo il moto tridimensionale di un fluido Newtoniano incomprimibile (per esempio l’acqua) di densità ρ e viscosità μ, costanti, soggetto all’azione di un campo di forze conservativo13 F = ∇f . Siano u = u (x,t) la velocità del fluido, p = p (x,t) la pressione idrostatica e T il tensore degli sforzi. Ricordiamo le leggi di conservazione per la massa e quella di bilancio del momento lineare, date, rispettivamente, da Dρ + ρ divu = ρt + divρu = 0 Dt 13
Il campo gravitazionale, per esempio.
(3.56)
148
3 Equazione di Laplace
e ρ
Du = ρ (ut + (u·∇)u) = F + divT. Dt
(3.57)
La quantità Dρ Dt = ρt + ∇ρ · u si chiama derivata materiale di ρ ed esprime la variazione di densità lungo il cammino di una particella di fluido. La derivata materiale di u, Du Dt , è data dalla somma di ut , l’accelerazione del fluido dovuta al carattere non stazionario del moto, e di (u · ∇) u, l’accelerazione inerziale dovuta al trasporto di fluido14 . Per i fluidi Newtoniani si adotta per il tensore T la legge costitutiva T = −pI + μ∇u.
(3.58)
Essendo ρ costante, dalle (3.56), (3.57), (3.58) ricaviamo per u e p le celebri equazioni di Navier-Stokes : div u = 0 (3.59) e 1 1 Du = ut + (u · ∇)u = − ∇p + νΔu+ ∇f Dt ρ ρ
(ν = μ/ρ).
(3.60)
Cerchiamo una soluzione di (3.59), (3.60) in R3 × (0, +∞), che soddisfi la condizione iniziale u (x,0) = g (x) x ∈ R3 , (3.61) dove anche g è solenoidale: div g = 0. In generale, il sistema (3.59), (3.60) è difficile da risolvere. Nel caso in cui la velocità è bassa, per esempio a causa dell’elevata viscosità, il ternine inerziale diventa trascurabile rispetto, per esempio, a νΔu, e la (3.60) si riduce all’equazione linearizzata 1 1 ut = − ∇p + νΔu + ∇f. ρ ρ
(3.62)
È possibile scrivere una formula per la soluzione di (3.59), (3.61), (3.62) scrivendo l’equazione per ω =rot u. Infatti, calcolando il rotore di (3.62) e (3.61), essendo rot(∇p + νΔu + ∇f ) = νΔω, otteniamo: ω t = νΔω x ∈ R3 , t > 0 ω (x,0) = rot g (x) 14
x ∈ R3 .
La i − esima componente di (u·∇) u è data da Du Dt
3
j=1
∂ui uj ∂x . Per esempio, calcoliamo j
per un fluido che ruota uniformemente nel piano x, y con velocità angolare ωk. Allora u (x, y) = −ωyi+ωxj. Poiché ut = 0, il moto è stazionario e Du ∂ ∂ = (u·∇) u = −ωy +ωx (−ωyi+ωxj) = −ω 2 (−xi+yj) Dt ∂x ∂y
che è l’accelerazione centrifuga.
3.5 La funzione di Green
Questo è un problema di Cauchy globale per l’equazione del calore. Se g ∈C 2 R3 ; R3 e rot g è limitato, possiamo scrivere # $ 2 1 |y| exp − ω (x,t) = rot g (x − y) dy. 3/2 4νt R3 (4πνt)
149
(3.63)
Inoltre, per t > 0, differenziando sotto il segno di integrale in (3.63) deduciamo che div ω = 0. Ne segue che, se rot g (x) si annulla rapidamente all’infinito 15 , possiamo risalire a u risolvendo il sistema rot u = ω,
div u = 0,
usando la formula (3.52) con f = 0. Resta da calcolare la pressione. Da (3.62) abbiamo l’equazione per p : ∇p = −ρut + μΔu − ∇f.
(3.64)
Poiché ω t = νΔω, il secondo membro della (3.64) ha rotore nullo e quindi la (3.64) si può risovere e determina p a meno di una costante additiva (come deve essere). In conclusione: Siano f ∈ C 1 R3 , g ∈ C 2 R3 ; R3 , con div g = 0 e rot g 2 3 3 che si annulla rapidamente all’infinito. Esistono 3 un’unica u ∈ C R ; R , con 1 rot u che si annulla all’infinito, e p ∈ C R , unica a meno di una costante additiva, soddisfacenti il sistema (3.59), (3.61), (3.62).
3.5 La funzione di Green 3.5.1 Potenziali (domini limitati) La (3.42) dà una rappresentazione della soluzione dell’equazione di Poisson in tutto R3 . In domini limitati, ogni formula di rappresentazione deve tener conto dei valori di u e della sua derivata normale al bordo, come indicato nel seguente teorema. Consideriamo la soluzione fondamentale Φ (x − y) =
1 4πrxy
rxy = |x − y| .
Se x ∈ Ω è fissato, il simbolo Φ (x − ·) indica la funzione y −→ Φ (x − y). Poniamo ∂ν Φ (x − σ) = ∇y Φ (x − σ) · ν σ dove ∇y Φ (x − σ) denota ∇y Φ calcolato in x − σ normale esterno a ∂Ω nel punto σ. 15
|rot g (x)| ≤ M/ |x|2+ε , ε > 0, è sufficiente.
e ν σ indica il versore
150
3 Equazione di Laplace
Teorema 5.1. Siano Ω ⊂ R3 un dominio limitato regolare e u ∈ C 2 Ω . Allora u (x) = − Φ (x − y) Δu (y) dy Ω + Φ (x − σ) ∂ν u (σ) dσ − ∂ν Φ (x − σ) u (σ) dσ. (3.65) ∂Ω
∂Ω
Il primo integrale è il potenziale Newtoniano di −Δu in Ω. Gli integrali di superficie nella (3.65) prendono il nome di potenziali di strato semplice con densità ∂ν u e di doppio strato con momento u, rispettivamente. Esamineremo più avanti questi potenziali. Dimostrazione. Vogliamo applicare l’identità di Green (si veda la (1.19)) (vΔu − uΔv)dx = (v∂ν u −u∂ν v)dσ (3.66) Ω
∂Ω
a u e Φ (x − ·). Tuttavia, Φ (x − ·) ha una singolarità in x, per cui non può essere inserita direttamente in (3.66). Isoliamo la singolarità considerando una sfera Bε (x), con ε piccolo e definendo Ωε = Ω\B ε (x). In Ωε , Φ (x − ·) è regolare ed armonica. Sostituendo dunque Ω con Ωε , possiamo applicare la (3.66) a u e Φ (x − ·). Poiché ∂Ωε = ∂Ω ∪ ∂Bε (x) e Δy Φ (x − y) = 0, troviamo: 1 1 ∂u ∂ 1 Δu dy = −u dσ rxσ ∂ν ∂ν rxσ Ωε rxy ∂Ωε
(· · · ) dσ +
= ∂Ω
∂Bε (x)
1 rxσ
∂u dσ + ∂ν
(3.67) ∂ 1 u dσ. ∂ν rxσ ∂Bε (x)
Vogliamo ora far tendere ε a zero nella (3.67). Esaminiamo separatamente i tre integrali dipendenti da ε; si ha: 1 1 Δu dy → Δu dy per ε → 0 (3.68) r r Ωε xσ Ω xσ essendo 1/rxσ positiva e integrabile in Ω e Δu ∈ C Ω . Su ∂Bε (x), abbiamo rxσ = ε e |∂ν u| ≤ M , poiché |∇u| è limitato; allora 1 ∂ν u dσ ≤ 4πεM → 0 per ε → 0. (3.69) ∂Bε (x) rxσ Consideriamo infine il termine più delicato, ∂ 1 u dσ. ∂ν rxσ ∂Bε (x)
3.5 La funzione di Green
151
Sul bordo della sfera Bε (x), il versore normale esterno ad Ωε nel punto σ è ν σ = x−σ e quindi ε ∂ 1 1 1 x−σx−σ = 2. = ∇y · νσ = ∂ν rxσ rxσ ε3 ε ε Di conseguenza, u ∂Bε (x)
∂ 1 1 dσ = 2 ∂ν rxσ ε
∂Bε (x)
u dσ → 4πu (x) ,
(3.70)
per la continuità di u. Passando al limite per ε → 0 nella (3.67), dalle (3.68), (3.69), (3.70) si ottiene la (3.65). Sebbene interessante, la (3.65) non risulta completamente soddisfacente per rappresentare soluzioni di problemi al bordo, come vedremo più avanti. Per ottenere una formula migliore, abbiamo bisogno di introdurre un nuovo tipo di soluzione fondamentale. 3.5.2 La funzione di Green per il problema di Dirichlet La funzione Φ definita in (3.41) è la soluzione fondamentale dell’operatore Δ in tutto lo spazio Rn (n = 2, 3). Si può definire anche la soluzione fondamentale per l’operatore Δ in un dominio Ω ⊂ Rn , limitato o illimitato, con l’idea che essa rappresenti il potenziale generato da una carica unitaria posta in un punto y all’interno di un conduttore, che occupa la regione Ω e che sia messo a terra al bordo. Indichiamo con G (x, y) questa funzione, che prende il nome di funzione di Green in Ω per l’operatore Δ. Per x ∈ Ω, fissato, G soddisfa Δy G (x, y) = −δ x
in Ω
e G (x, σ) = 0,
σ ∈ ∂Ω
per via della messa a terra del conduttore. Si vede allora che vale la formula G (x, y) = Φ (x − y) − ϕ (x, y) dove ϕ, come funzione di y, per x fissato, è soluzione del problema di Dirichlet Δy ϕ (x, y) = 0 in Ω (3.71) ϕ (x, σ) = Φ (x − σ) su ∂Ω. Due importanti proprietà della funzione di Green sono le seguenti (Problema 3.14):
152
3 Equazione di Laplace
(a) Positività: G (x, y) > 0, per ogni x, y ∈ Ω, e G (x, y) → +∞ se x − y → 0; (b) Simmetria: G (x, y) = G (y, x). L’esistenza delle funzione di Green per un particolare dominio dipende dalla risolubilità del problema di Dirichlet (3.71). Dal Teorema 3.12, esistenza ed unicità sono assicurate se Ω è un dominio Lipschitziano e limitato. Tuttavia, anche sapendo che la funzione di Green esiste, si conoscono formule esplicite solo per domini molto particolari. A volte funziona una tecnica nota come metodo delle immagini . In questo metodo, ϕ (x, ·) è considerato come il potenziale generato da una carica virtuale q posta in un opportuno punto x∗ , l’immagine di x, appartenente al complementare di Ω. La carica q e il punto x∗ devono essere scelti in modo che, su ∂Ω, ϕ (x, ·) sia uguale al potenziale generato da una carica unitaria posta in x. Il modo più semplice per illustrare il metodo è calcolare la funzione di Green per un semispazio. Naturalmente, trattandosi di una funzione di Green, richiediamo che G si annulli all’infinito. • La funzione di Green per il semispazio superiore in R3 . Sia R3+ il semispazio R3+ = {(x1 , x2 , x3 ) : x3 > 0} . Fissiamo x = (x1 , x2 , x3 ) e osserviamo che se scegliamo x∗ = (x1 , x2 , −x3 ), allora, su y3 = 0 abbiamo: |x∗ − y| = |x − y| . Dunque, se x ∈R3+ , allora x∗ appartiene al complementare di R3+ e la funzione ϕ (x, y) = Φ (x∗ −y) =
1 4π |x∗ − y|
risulta armonica in R3+ con ϕ (x, y) = Φ (x − y) sul piano y3 = 0. In conclusione, 1 1 G (x, y) = − (3.72) 4π |x − y| 4π |x∗ − y| è la funzione di Green per il semispazio superiore. • La funzione di Green per la sfera . Sia Ω = BR = BR (0) ⊂ R3 . Per trovare la funzione di Green per BR , siano ϕ (x, y) =
q 4π |x∗ − y|
3.5 La funzione di Green
153
e x fissato in BR . Cerchiamo di determinare x∗ nel complementare di BR e q in modo che q 1 (3.73) = ∗ 4π |x − y| 4π |x − y| quando |y| = R. La (3.73) dà 2
2
|x∗ − y| = q 2 |x − y| ossia
2
(3.74)
2
|x∗ | − 2x∗ · y + R2 = q 2 (|x| − 2x · y + R2 ).
Riordinando i termini, possiamo scrivere 2
2
∗
|x∗ | + R2 − q 2 (R2 + |x| ) = 2y · (x − q 2 x).
(3.75)
Poiché il primo membro non dipende da y, deve essere x∗ = q 2 x e quindi 2
2
q 4 |x| − q 2 (R2 + |x| ) + R2 = 0 da cui q = R/ |x| . Tutto funziona per x = 0 e dà |x| ∗ 1 1 R − (x = Φ (x − y) − Φ G (x, y) = − y) , 4π |x − y| |x| |x∗ − y| R (3.76) 2 R dove x∗ = 2 x, x = 0. Poiché |x| −1
|x∗ − y| = |x|
2
R4 − 2R2 x · y + y |x|
1/2 ,
quando x → 0 abbiamo ϕ (x, y) =
1 R 1 → ∗ 4π |x| |x − y| 4πR
Figura 3.6. L’immagine x∗ di x nella costruzione della funzione di Green per la sfera
154
3 Equazione di Laplace
e quindi possiamo definire 1 1 1 − . G (0, y) = 4π |y| R 3.5.3 Formula di rappresentazione di Green Dal Teorema 5.1 sappiamo che ogni funzione regolare u può essere scritta come somma di un potenziale di volume (Newtoniano) con densità −Δu, di un potenziale di strato semplice con densità ∂ν u e di un potenziale di doppio strato di momento u. Supponiamo che u sia soluzione del seguente problema di Dirichlet: Δu = f in Ω (3.77) u=g su ∂Ω. Dalla (3.65) ricaviamo, per x ∈Ω, fissato: u (x) = −
Φ (x − y) f (y) dy+ Φ (x − σ) ∂ν u (σ) dσ− g (σ) ∂ν Φ (x − σ) dσ
Ω
+ ∂Ω
(3.78)
∂Ω
dove, come al solito, ∂ν Φ (x − σ) indica la derivata di Φ (x − ·) lungo la normale esterna a ∂Ω. Questa formula di rappresentazione esprime u in termini dei dati f e g ma fa intervenire anche la derivata normale ∂ν u, sulla quale non si hanno informazioni. Per liberarsi del termine contenente ∂ν u, consideriamo la funzione di Green G (x, y) = Φ (x − y) − ϕ (x, y) in Ω. Poiché ϕ (x, ·) è armonica in Ω, possiamo applicare la (3.66) a u e ϕ (x, ·); troviamo: −
ϕ (x, y) f (y) dy + ϕ (x, σ) ∂ν u (σ) dσ + g (σ) ∂ν ϕ (x, σ) dσ. 0=
Ω
∂Ω
(3.79)
∂Ω
Sommando le (3.78), (3.79) e ricordando che ϕ (x, σ) = Φ (x − σ) su ∂Ω, otteniamo: Teorema 5.2. Sia Ω un dominio regolare e u una funzione regolare del problema (3.77). Allora, per ogni x ∈Ω:
u (x) = −
g (σ) ∂ν G (x, σ) dσ.
f (y) G (x, y) dy− Ω
(3.80)
∂Ω
Pertanto, la soluzione del problema (3.77) può essere scritta come somma dei due potenziali di Green a secondo membro delle (3.80), che fanno intervenire
3.5 La funzione di Green
solo i dati del problema. In particolare, se u è armonica, allora u (x) = − g (σ) ∂ν G (x, σ) dσ.
155
(3.81)
∂Ω
Conrontando la (3.81) con la (3.39), deduciamo che −∂ν G (x, σ) dσ rappresenta la misura armonica in Ω. La funzione P (x, σ) = −∂ν G (x, σ) si chiama nucleo di Poisson. Poiché G (·, y) > 0 in Ω e si annulla su Ω, P è nonnegativo (in realtà positivo, per il Principio di Hopf, Problema 3.10). D’altra parte, la formula f (y) G (x, y) dy u (x) = − Ω
dà la soluzione dell’equazione di Poisson Δu = f in Ω, che si annulla su ∂Ω. Dalla positività di G deduciamo che: f ≥0
in Ω implica u ≤ 0 in Ω,
che è un’altra forma del principio di massimo. • Nucleo di Poisson e formula di Poisson per la sfera. Dalla (3.76) possiamo calcolare il nucleo di Poisson per la sfera B = BR (0) ⊂ R3 . Abbiamo, −2 ricordando che x∗ = R2 |x| x, se x = 0: 1 R R x∗ − y x−y ∇y − . − = 3 ∗ |x − y| |x| |x − y| |x| |x∗ − y|3 |x − y| −1
Se σ ∈∂BR , dalla (3.74) abbiamo |x∗ − σ| = R |x| |x − σ| e quindi * + * + 2 2 1 x−σ |x| x∗ − σ −σ |x| ∇y G (x, σ) = − 2 = . 3 1 − R2 4π |x − σ|3 R |x − σ|3 4π |x − σ| Poiché su ∂BR la normale esterna è ν σ = σ/R, abbiamo 2
P (x, σ) = −∂ν G (x, σ) = −∇y G (x, σ) · ν σ =
1 R2 − |x| . 4πR |x − σ|3
Come conseguenza, ritroviamo la formula di Poisson (si veda la (3.32) per n = 3) 2 g (σ) R2 − |x| u (x) = (3.82) 3 dσ 4πR ∂BR (0) |x − σ| per l’unica soluzione del problema di Dirichlet Δu = 0 in BR e u = g su ∂BR .
156
3 Equazione di Laplace
3.5.4 La funzione di Neumann Possiamo ricavare una formula di rappresentazione anche per la soluzione dei problemi di Neumann o di Robin. Per esempio, sia u una soluzione regolare del problema Δu = f in Ω (3.83) ∂ν u = h su ∂Ω dove f e h devono soddisfare le condizioni di compatibilità h (σ) dσ = f (y) dy. ∂Ω
(3.84)
Ω
Ricordiamo che u è univocamente determinata a meno di costanti additive. Dal Teorema 4.1 possiamo scrivere Φ (x − y) f (y) dy + u (x) = − Ω (3.85) h (σ) Φ (x − σ) dσ − u (σ) ∂ν Φ (x − σ) dσ. + ∂Ω
∂Ω
Questa volta non abbiamo informazioni sul valore di u su ∂Ω e perciò occorre liberarsi del secondo integrale. Imitando il procedimento seguito per il problema di Dirichlet, cerchiamo di trovare un analogo della funzione di Green, cioè una funzione N = N (x, y) data da N (x, y) = Φ (x − y) − ψ (x, y) dove, per x fissato, ψ è soluzione di Δy ψ = 0 ∂ν ψ (x, σ) = ∂ν Φ (x − σ)
in Ω su ∂Ω,
in modo da avere ∂ν N (x, σ) = 0 su ∂Ω. Ma questo problema di Neumann non ha soluzione in quanto la condizione di compatibilità ∂ν Φ (x − σ) dσ = 0 ∂Ω
non è soddisfatta. Infatti, ponendo u ≡ 1 in (3.65), otteniamo ∂ν Φ (x − σ) dσ = −1.
(3.86)
∂Ω
Tenendo conto della (3.86), chiediamo allora che ψ sia soluzione del problema ⎧ in Ω ⎨ Δy ψ = 0 (3.87) 1 ⎩ ∂ν ψ (x, σ) = ∂ν Φ (x − σ) + su ∂Ω. |∂Ω|
3.6 Unicità in domini illimitati
157
In questo modo si ha
∂ν Φ (x − σ) + ∂Ω
1 |∂Ω|
dσ = 0
e il problema (3.87) è risolubile. Osserviamo che, con questa scelta di ψ, abbiamo 1 ∂ν N (x, σ) = − su ∂Ω. (3.88) |∂Ω| Applicando ora la formula (3.66) a u e ψ (x, ·) si trova: 0=− ψ (x, σ) ∂ν u (σ) dσ + h (σ) ∂ν ψ (σ) dσ + ψ (y) f (y) dy. ∂Ω
∂Ω
Ω
(3.89)
Sommando la (3.89) alla (3.85) ed usando la (3.88) si trova infine: Teorema 5.3. Sia Ω un dominio regolare e u una soluzione regolare di (3.83). Allora: 1 u (σ) dσ = h (σ) N (x, σ) dσ − f (y) N (x, y) dy. u (x) − |∂Ω| ∂Ω ∂Ω Ω Pertanto, anche la soluzione del problema di Neumann (3.83) può essere scritta" come somma di due potenziali, a meno della costante additiva 1 c = |∂Ω| u (σ) dσ, il valor medio di u in Ω. ∂Ω La funzione N si chiama funzione di Neumann (o anche funzione di Green per il problema di Neumann).
3.6 Unicità in domini illimitati 3.6.1 Problemi esterni Problemi in domini illimitati si presentano per esempio nel moto di un fluido in presenza di un ostacolo, in problemi di capacità o di scattering per onde acustiche o elettromagnetiche. Come nel caso del problema di Poisson in tutto Rn , in un problema in un dominio illimitato occorre assegnare opportune condizioni all’infinito per ottenere un problema ben posto. Consideriamo, per esempio, il problema di Dirichlet Δu = 0 in |x| > 1 (3.90) u=0 su |x| = 1. Per ogni numero reale a, u (x) = a log |x|
e u (x) = a (1 − 1/ |x|)
158
3 Equazione di Laplace
sono soluzioni di (3.90) in dimensione due e tre, rispettivamente. Manca visibilmente l’unicità. Se siamo in dimensione due, per ripristinarla è sufficiente richiedere che u sia limitata. In dimensione tre basta prescrivere il limite di u (x) per |x| → ∞. Queste condizioni sono sufficienti a selezionare un’unica soluzione. Il problema (3.90) è un problema di Dirichlet esterno. Dato un dominio limitato Ω chiamiamo esterno di Ω l’insieme Ωe = Rn \Ω. Senza perdere in generalità, assumiamo che 0 ∈ Ω e, per semplicità, consideriamo solo insiemi esterni connessi, cioè domini esterni. Si noti che ∂Ωe = ∂Ω. Come abbiamo visto in più occasioni, i principi di massimo risultano utilissimi in questioni di unicità. In domini esterni abbiamo: Teorema 6.1. Siano Ωe ⊂ Rn , n ≥ 3, un dominio esterno e u ∈ C 2 (Ωe ) ∩ C(Ω e ) armonica in Ω e . Se u → 0 per |x| → ∞ e u ≥ 0 (risp. u ≤ 0) su ∂Ωe , allora u ≥ 0 (risp. u ≤ 0) in Ωe . Dimostrazione. Sia u ≥ 0 su ∂Ωe . Fissiamo ε > 0 e scegliamo r0 tale che, per ogni r ≥ r0 , si abbia Ω ⊂ {|x| < r} e u ≥ −ε su {|x| = r}. Nell’insieme limitato Ωe,r = Ωe ∩ {|x| < r} possiamo applicare principio di massimo e dedurre che u ≥ −ε in questo insieme. Poiché ε è arbitrario e r può essere arbitrariamente grande, segue che u ≥ 0 in Ωe . La dimostrazione nel caso u ≤ 0 su ∂Ωe è analoga; lasciamo i dettagli al lettore. Un’immediata conseguenza è il seguente risultato di unicità in dimensione n ≥ 3 (per n = 2 vedere il Problema 3.16): Teorema 6.2 (Unicità per il problema di Dirichlet esterno). Sia Ωe ⊂ Rn , n ≥ 3, un dominio esterno. Esiste al più una soluzione u ∈ C 2 (Ωe ) ∩ C(Ω e ) del problema di Dirichlet ⎧ in Ωe ⎪ ⎨ Δu = f u=g su ∂Ωe (3.91) ⎪ ⎩ u (x) → u∞ |x| → ∞. Dimostrazione. Basta applicare il Teorema 6.1 alla differenza di due soluzioni. Segnaliamo un’importante conseguenza del Teorema 6.1 e del Corollario 3.8: una funzione armonica che si annulla all’infinito è controllata, per |x| grande, dalla soluzione fondamentale. In realtà c’è di più. Microteorema 6.3. Sia u armonica in Ωe ⊂ Rn , n ≥ 3, tale che u (x) → 0 per |x| → ∞. Allora esistono r0 e una costante M dipendente da r0 , tali che
3.6 Unicità in domini illimitati
159
se |x| ≥ r0 , si ha, per ogni j, k = 1, 2, 3: |u (x)| ≤
M |x|
n−2 ,
uxj (x) ≤
M |x|
n−1 ,
uxj x (x) ≤ Mn . k |x|
(3.92)
Dimostrazione (per n = 3). Scegliamo a 1, in modo che Ω ⊂ {|x| < a} e che |u (x)| ≤ 1 se |x| ≥ a. Per dimostrare la prima delle (3.92), poniamo w (x) = u(x)−a/ |x|. Allora w è armonica per |x| ≥ a, w (x) ≤ 0 su |x| = a e si annulla all’infinito. Dal Teorema 6.1, w (x) ≤ 0 se |x| ≥ a. (3.93) Ponendo v (x) = a/ |x| − u(x), con un ragionamento analogo si deduce v (x) ≥ 0
se |x| ≥ a.
(3.94)
se {|x| ≥ a}
(3.95)
Le (3.93) e (3.94) implicano a |x|
|u (x)| ≤
e quindi la prima delle (3.92) vale con r0 = a. La stima sulle derivate prima segue da (3.33) e (3.95). Infatti, sia x con |x| ≥ 2a. Possiamo sempre trovare un intero m ≥ 2 tale che ma ≤ |x| < (m + 1)a. Allora B(m−1)a (x) ⊂ Ωe e dalla (3.33) si ha uxj (x) ≤
3 max |u| . (m − 1) a ∂B(m−1)a (x)
Ma per quanto visto precedentemente, sappiamo che max∂B(m−1)a (x) |u| ≤ a/ |x|, per cui otteniamo uxj (x) ≤
3 1 . (m − 1) |x|
D’altra parte, essendo m ≥ 2, si ha m − 1 ≥ (m + 1) /3 ≥ |x| /3a, per cui si ottiene ux (x) ≤ 9a . j 2 |x| Analogamente si dimostra che, per |x| ≥ 2a, ux
j xk
27a (x) ≤ 3. |x|
Le (3.92) valgono dunque con r0 = 2a ed M = 27a. Se Ω è regolare, le stime (3.92) assicurano la validità dell’identità di Green ∇u · ∇v dx = v∂ν u dσ (3.96) Ωe
∂Ωe
160
3 Equazione di Laplace
per ogni coppia di funzioni u, v ∈ C 2 (Ωe ) ∩ C 1 (Ω e ), armoniche in Ωe e nulle all’infinito. Per dimostrarlo, si applica l’identità (3.96) nel dominio limitato Ωe,r = Ωe ∩ {|x| < r} . Si passa poi al limite per r → ∞ e si ottiene la (3.96) in Ωe . Invitiamo il lettore a sviluppare i dettagli. D’altra parte, per mezzo dell’identità (3.96), possiamo dimostrare una versione appropriata del Teorema 6.2 per il problema di Neumann/Robin esterno: ⎧ in Ωe ⎪ ⎨ Δu = f ⎪ ⎩
∂ν u + ku = g u → u∞
su ∂Ωe (k ≥ 0)
(3.97)
per |x| → ∞.
Si noti che il caso k = 0 corrisponde al problema di Robin mentre il caso k = 0 corrisponde al problema di Neumann. Teorema 6.4. (Unicità per il problema esterno di Neumann/Robin). Sia Ωe ⊂ Rn ,n ≥ 3, un dominio esterno con frontiera regolare. Allora esiste al più una soluzione u ∈ C 2 (Ωe ) ∩ C 1 (Ω e ) del problema (3.97). Dimostrazione. Siano u, v soluzioni del problema (3.97) e poniamo w = u − v. Allora w è armonica in Ωe , ∂ν w + kw = 0 su ∂Ωe e tende a 0 per |x| → ∞. Applichiamo l’identità (3.96) con u = v = w. Si ha, essendo ∂ν w = −kw su ∂Ωe : 2 |∇w| dx = w∂ν w dσ = − kw2 dσ ≤ 0. Ωe
∂Ωe
∂Ωe
Deve dunque essere ∇w = 0 che implica w = 0, poiché si annulla all’infinito.
3.7 Potenziali di superficie In questa sezione esaminiamo il significato e le principali proprietà dei potenziali di superficie presenti nella formula (3.65). Una notevole conseguenza è la possibilità di convertire un problema di valori al bordo in un’equazione integrale sul bordo. Questo genere di formulazione può essere ottenuto per operatori e problemi più generali non appena sia nota la soluzione fondamentale ad essi corrispondente. Pertanto costituisce un metodo flessibile con importanti applicazioni. In particolare, fornisce la base teorica per il cosiddetto metodo degli elementi al bordo che può offrire numerosi vantaggi dal punto di vista del costo computazionale per l’approssimazione numerica, per via della riduzione della dimensione. Qui presentiamo la formulazione integrale dei problemi di Dirichlet e Neumann, con alcuni risultati fondamentali. Il lettore può trovare dimostrazioni complete e la formulazione integrale di problemi più generali nella letteratura alla fine del libro.
3.7 Potenziali di superficie
161
3.7.1 Il potenziale di doppio strato L’ultimo integrale nella (3.65) è della forma μ (σ) ∂ν Φ (x − σ) dσ D (x;μ) =
(3.98)
∂Ω
ed è chiamato potenziale di doppio strato di μ. In tre dimensioni rappresenta il potenziale generato da una distribuzione superficiale di dipoli 16 di momento μ su ∂Ω. Per capire quali possano essere le proprietà di D (x;μ), è utile considerare prima il caso particolare μ (σ) ≡ 1, cioè D (x;1) = ∂ν Φ (x − σ) dσ. (3.99) ∂Ω
Inserendo u ≡ 1 nella (3.65) troviamo D (x;1) = −1
per ogni x ∈Ω.
(3.100)
D’altra parte, se x ∈ Rn \Ω è fissato, Φ (x − ·) è armonica in Ω e può essere inserita nella (3.66) con u ≡ 1; il risultato è D (x;1) = 0
per ogni x ∈ Rn \Ω.
(3.101)
Che cosa succede per x ∈ ∂Ω? Anzitutto occorre controllare se D (x;1) è ben definito su ∂Ω, cioè se l’integrale è convergente. Infatti la singolarità di ∂ν Φ (x − σ) diventa critica se x ∈ ∂Ω poiché per σ → x il suo ordine di infinito è uguale alla dimensione topologica di ∂Ω. In questo caso l’integrale può non esistere. Per esempio, nel caso n = 2, abbiamo (x − σ) · ν σ 1 1 ∂ν log |x − σ| dσ = − dσ. D (x;1) = − 2π ∂Ω 2π ∂Ω |x − σ|2 L’ordine d’infinito dell’integranda per σ → x è uno e ∂Ω è una curva, un oggetto unidimensionale. Per n = 3 abbiamo 1 ∂ 1 1 (x − σ) · ν σ dσ = D (x;1) = dσ. 4π ∂Ω ∂ν |x − σ| 4π ∂Ω |x − σ|3 16
Per ogni σ ∈ ∂Ω, siano −q (σ ) e q (σ ) due cariche puntiformi collocate nei punti σ e σ +hν σ , rispettivamente. Se h è molto piccolo, la coppia di cariche si chiama dipolo, di asse ν . Il potenziale indotto in un punto x è dato da uh (x, σ ) = q (σ ) [Φ (x− (σ +hν )) − Φ (x − σ )]
Φ (x− (σ +hν )) − Φ (x − σ ) = q (σ ) h . h Poiché h è molto piccolo, ponendo q (σ ) h = μ (σ ), possiamo scrivere, approssimando al prim’ordine, uh (x, σ ) μ (σ ) ∂ν Φ (x − σ ) . Integrando su ∂Ω si ottiene D (x;μ).
162
3 Equazione di Laplace
Figura 3.7. Interpretazione geometrica dell’integranda in D (x, 1) (n = 2)
L’ordine d’infinito dell’integranda per σ → x è due e ∂Ω è una superficie, un oggetto bidimensionale. Tuttavia, se assumiamo che Ω è di classe C 2 , allora si può dimostrare che D (x;1) è ben definito e continuo su ∂Ω. Per calcolare il valore di D (x;1) su ∂Ω, osserviamo prima che le formule (3.100) e (3.101) si possono dedurre immediatamente dall’interpretazione geometrica dell’integranda in D (x;1). Precisamente, poniamo rxσ = |x − σ| e, per n = 2, consideriamo la quantità dσ ∗ = −
(x − σ) · ν σ (σ − x) · ν σ dσ = dσ. 2 2 rxσ rxσ
Abbiamo, in riferimento alla Figura 3.7: (σ − x) · ν σ = cos ϕ rxσ e quindi dσ =
(σ − x) · ν σ dσ = cos ϕ dσ rxσ
è la proiezione dell’elemento di lunghezza dσ sul cerchio ∂Brxσ (x), a meno di infinitesimi di ordine superiore. Allora dσ ∗ = è la proiezione di dσ su ∂B1 (x).
dσ rxσ
3.7 Potenziali di superficie
Figura 3.8. Valori di
∂Ω
163
dσ ∗ per n = 2
Integrando dσ ∗ su ∂Ω, il contributo totale è 2π se x ∈ Ω (caso a) di Figura 3.8) mentre è 0 se x ∈ R2 \Ω, per via delle compensazioni di segno indotte dall’orientazione di ν σ (caso c) di Figura 3.8). In conclusione 2π se x ∈ Ω ∗ dσ = 0 se x ∈ R2 \Ω ∂Ω che sono equivalenti alle (3.100) e (3.101), essendo 1 D (x;1) = − dσ ∗ . 2π ∂Ω Il caso b) in Figura 3.8 corrisponde a x ∈ ∂Ω. Dovrebbe essere intuitivamente chiaro che il punto x “vede” un angolo totale di π radianti per cui D (x;1) = −1/2. Le stesse considerazioni si possono fare in dimensione n = 3. Questa volta, la quantità (Figura 3.9) dσ ∗ = −
(x − σ) · ν σ (σ − x) · ν σ dσ = dσ 3 3 rxσ rxσ
è la proiezione su ∂B1 (x) (cioè l’angolo solido) dell’elemento di superficie dσ. Integrando su ∂Ω, si ottiene la misura dell’angolo solido sotteso da ∂Ω visto dal punto x17 . Se x è interno ad Ω, tale angolo solido coincide con tutto lo spazio e pertanto la sua misura è uguale a quella della superficie della sfera 17
Sia S una superficie regolare tale che 0 ∈S / e tale che ogni retta passante per 0 intersechi S solo in un punto. Si chiama angolo solido sotteso da S con vertice in 0, e si indica con Ω (S), l’ insieme delle semirette uscenti da 0 che intersecano S. Se S1 è la proiezione di S sulla superficie sferica di raggio 1 centrata in 0, la quantità |Ω (S)| = area (S1 ) definisce la misura dell’angolo solido. Il teorema della divergenza implica che (esercizio): σ ·ν |Ω (S)| = dσ. 3 S |σ |
164
3 Equazione di Laplace
Figura 3.9. L’angolo solido dσ ∗ , proiettato da dσ
unitaria 4π. Se x è esterno ad Ω, i contributi all’integrale da ogni elemento di superficie appaiono con due segni diversi e quindi si elidono. Se x è su ∂Ω, “vede” solo un semispazio e l’angolo solido è uguale a 2π. Poiché 1 dσ ∗ , D (x;1) = − 4π ∂Ω troviamo ancora −1, 0, −1/2 nei tre casi, rispettivamente. Riassumiamo i risultati nel seguente lemma. Lemma 7.1 (di Gauss). Sia Ω limitato, di classe C 2 . Allora ( n = 2, 3) ⎧ −1 ⎪ ⎪ ⎨ D (x;1) = ∂ν Φ (x − σ) dσ = − 12 ⎪ ∂Ω ⎪ ⎩ 0
x∈Ω x ∈ ∂Ω
(3.102)
x ∈ Rn \Ω.
Dunque, quando μ ≡ 1, il potenziale di doppio strato ha una discontinuità a salto attraverso ∂Ω. Osserviamo che se x ∈∂Ω, dalle (3.102) si ha: 1 2
lim
D (z;1) = D (x;1) +
lim
1 D (z;1) = D (x;1) − . 2
z→x, z∈Rn \Ω
e z→x, z∈Ω
Queste due formule sono la chiave per capire le proprietà principali di D (z;μ), enunciate nel seguente teorema.
3.7 Potenziali di superficie
165
Teorema 7.2. Siano Ω ⊂ Rn limitato, di classe C 2 e μ continua su ∂Ω (n = 2, 3). Allora D (x;μ) è armonica in Rn \∂Ω e le seguenti relazioni valgono per ogni x ∈ ∂Ω : lim
z→x, z∈Ω
1 D (z;μ) = D (x;μ) − μ (x) 2
(3.103)
e 1 D (z;μ) = D (x;μ) + μ (x) . 2 z→x, z∈Rn \Ω lim
(3.104)
Dimostrazione. Ci limitiamo ad illustrare i passi principali, omettendo i dettagli più tecnici. Se x ∈ / ∂Ω, non ci sono problemi nel derivare sotto il segno di integrale. D’altra parte, per σ fissato ∂Ω, la funzione x −→ ∂ν Φ (x − σ) = ∇y Φ (x − σ) · ν σ è armonica e quindi D (x;μ) risulta armonica in Rn \∂Ω. Consideriamo la (3.103). Questa non è una formula elementare e non si può ricavare passando al limite sotto il segno di integrale, sempre per il fatto che la singolarità di ∂ν Φ (x − σ) è critica quando x ∈ ∂Ω. Sia z ∈ Rn \Ω. Dal Lemma di Gauss si ha ∂ν Φ (z − σ) dσ = 0
μ (x) ∂Ω
e quindi possiamo scrivere ∂ν Φ (x − σ) [μ (σ) − μ (x)] dσ.
D (x;μ) =
(3.105)
∂Ω
Ora, se σ è vicino ad x, la regolarità del dominio e la continuità di μ mitigano la singularità di ∂ν Φ (x − σ) permettendo di passare al limite sotto il segno d integrale. Abbiamo allora: lim ∂ν Φ (z − σ) [μ (σ) − μ (x)] dσ = ∂ν Φ (x − σ) [μ (σ) − μ (x)] dσ. z→x
∂Ω
∂Ω
Usando ancora il Lemma di Gauss, abbiamo: ∂ν Φ (x − σ) μ (σ) dσ − μ (x) = ∂Ω
∂ν Φ (x − σ) dσ ∂Ω
1 = D (x;μ) + μ (x) . 2 La dimostrazione della (3.104) è simile.
166
3 Equazione di Laplace
Nota 7.1. Dalle (3.103) e (3.104) segue subito che il salto di D (x;μ) attraverso ∂Ω riproduce il momento μ: lim
x→x, x∈Rn \Ω
D (x;μ) −
lim
x→x, x∈Ω
D (x;μ) = μ (x) .
3.7.2 Il potenziale di strato semplice Il secondo integrale nella (3.65) è della forma Φ (x − σ) ψ (σ) dσ S (x,ψ) = ∂Ω
ed è chiamato potenziale di strato semplice di ψ. In tre dimensioni rappresenta il potenziale generato da una distribuzione superficiale di cariche di densità ψ su ∂Ω. Se Ω è un dominio diclasse C 2 e ψ è continua su ∂Ω, allora S è continuo attraverso ∂Ω e ΔS = 0
in Rn \∂Ω,
poiché non ci sono problemi nel derivare sotto il segno di integrale. È ben noto dalla Fisica che il flusso di un potenziale presenta una discontinuità a salto attraverso una superficie portante una carica eletrostatica ed il salto riproduce esattamente la densità di carica ψ. Ci aspettiamo quindi un salto delle derivate normali di S attraverso ∂Ω pari a ψ. Precisamente si ha il sequente Teorema. Teorema 7.3. Siano Ω ⊂ Rn limitato, di classe C 2 , e ψ continua su ∂Ω (n = 2, 3). Allora S (x;ψ) è armonica in Rn \∂Ω e le seguenti relazioni valgono per ogni x ∈ ∂Ω : 1 lim ∂ν x S (z;ψ) = ∂ν x Φ (x − σ) ψ (σ) dσ + ψ (x) (3.106) z→x, z∈Ω 2 ∂Ω e
lim
z→x, z∈Rn \Ω
∂ν x S (z;ψ) =
1 ∂ν x Φ (x − σ) ψ (σ) dσ − ψ (x) . 2 ∂Ω
(3.107)
dove ∂ν x = ∇x · ν x . Omettiamo la dimostrazione, che si può condurre sulla falsariga di quella del Teorema 7.2. 3.7.3 Cenno alle equazioni integrali della teoria del potenziale Per mezzo delle relazioni (3.103)-(3.107) possiamo ridurre i principali problemi al bordo della teoria del potenziale, interni o esterni, ad equazioni integrali
3.7 Potenziali di superficie
167
di forma speciale. Sia Ω ⊂ Rn (n = 2, 3) un dominio regolare e g ∈ C (∂Ω). Descriviamo il procedimento di riduzione per il problema di Dirichlet interno: Δu = 0 in Ω (3.108) u=g su ∂Ω. Il punto di partenza è ancora una volta la formula (3.65), che dà per la soluzione u di (3.108) la rappresentazione Φ (x − σ) ∂ν u (σ) dσ− g (σ) ∂ν Φ (x − σ) dσ. u (x) = ∂Ω
∂Ω
Nella sezione 3.5.3 abbiamo usato la funzione di Green per liberarci del potenziale di strato semplice, contenente la derivata normale ∂ν σ u, sulla quale non abbiamo informazioni. Qui adottiamo una strategia diversa: ci dimentichiamo semplicemente del potenziale di strato semplice e cerchiamo di rappresentare u come potenziale di doppio strato, scegliendo opportunemente il momento μ. In altri termini, cerchiamo una funzione continua μ su ∂Ω, tale che la soluzione u di (3.108) sia data da μ (σ) ∂ν Φ (x − σ) dσ = D (x;μ) . (3.109) u (x) = ∂Ω
La (3.109) è armonica in Ω, per cui occorre solo controllare i valori al bordo cioè che lim u (x) = g (z) . x→z∈∂Ω
Tenendo conto della (3.103), se x ∈ Ω e x → z ∈ ∂Ω, otteniamo per μ l’equazione integrale 1 z ∈ ∂Ω. (3.110) μ (σ) ∂ν Φ (z − σ) dσ − μ (z) = g (z) 2 ∂Ω Se μ ∈ C (∂Ω) è soluzione di (3.110), allora la (3.109) è la soluzione di (3.108) in C 2 (Ω) ∩ C Ω . Precisamente, vale il seguente teorema, che ci limitiamo ad enunciare. Teorema 7.4. Sia Ω un dominio limitato di classe C 2 e g ∈ C (∂Ω). Allora l’equazione integrale (3.110) ha un’unica soluzione μ ∈ C (∂Ω) e la soluzione u ∈ C 2 (Ω) ∩ C Ω del problema di Dirichlet (3.108) può essere rappresentata come potenziale di doppio strato di μ. Consideriamo ora il problema di Neumann interno Δu = 0 in Ω (3.111) su ∂Ω ∂ν u = g dove g ∈ C(∂Ω) soddisfa la condizione di compatibilità. g dσ = 0. ∂Ω
Sappiamo che u è unica a meno di una costante additiva.
(3.112)
168
3 Equazione di Laplace
Questa volta cerchiamo una funzione ψ, continua su ∂Ω, tale che la soluzione u di (3.111) sia data dal potenziale di strato semplice di ψ: u (x) = ψ (σ) Φ (x − σ) dσ = S (x,ψ) . (3.113) ∂Ω
La (3.113) è armonica in Ω, per cui occorre solo controllare la condizione di Neumann cioè che lim ∂ν z u (x) = g (z) . x→z∈∂Ω
Tenendo conto della (3.106), se x ∈ Ω e x → z ∈ ∂Ω, otteniamo per ψ l’equazione integrale 1 z ∈ ∂Ω. (3.114) ψ (σ) ∂ν z Φ (z − σ) dσ + ψ (z) = g (z) 2 ∂Ω Se ψ ∈ C (∂Ω) è soluzione di (3.114), allora (3.113) è soluzione di (3.111) in C 2 (Ω) ∩ C 1 Ω . Si può mostrare che la soluzione generale della (3.114) è data dalla famiglia ad un parametro C0 ∈ R, ψ = ψ + C0 ψ 0 dove ψ è una soluzione fissata della (3.114) e ψ 0 è soluzione dell’equazione omogenea 1 ψ 0 (σ) ∂ν z Φ (z − σ) dσ + ψ 0 (z) = 0 z ∈ ∂Ω. (3.115) 2 ∂Ω Come ci si aspettava, si trovano infinite soluzioni del problema di Neumann. Osserviamo che ψ 0 (σ) Φ (x − σ) dσ S (x,ψ 0 ) = ∂Ω
è armonica in Ω e la sua derivata normale si annulla su ∂Ω, a causa delle (3.107) e (3.115). Di conseguenza, S (x,ψ 0 ) è costante e vale il seguente teorema, che ancora ci limitiamo ad enunciare. Teorema 7.5. Sia Ω un dominio limitato di classe C 2 e g ∈ C (∂Ω) soddisfacente la (3.112). Allora, il problema di Neumann (3.111) ha infinite soluzioni u ∈ C 2 (Ω) ∩ C 1 Ω della forma u (x) = S x,ψ + C, dove ψ è una particolare soluzione della (3.114) e C è una costante arbitraria. Un ulteriore vantaggio del metodo è che, il linea di principio, i problemi esterni sono trattabili nello stesso modo, con lo stesso livello di difficoltà. È sufficiente usare le condizioni (3.104), (3.107) e procedere nello stesso modo (Problema 3.19).
3.7 Potenziali di superficie
169
Come esempio di applicazione del metodo, risolviamo il problema di Neumann interno per il cerchio. • Problema di Neumann per il cerchio. Consideriamo il problema di Neumann in BR = BR (0) ⊂ R2 : Δu = 0 in BR ∂ν u = g su ∂BR dove g ∈ C(∂BR ) soddisfa la condizione di compatibilità (3.112). Sappiamo che u è unica a meno di una costante additiva. Vogliamo esprimere una soluzione come potenziale di strato semplice: 1 u (x) = − ψ (σ) log |x − σ| dσ. (3.116) 2π ∂BR La condizione di Neumann ∂ν u = g su ∂BR equivale alla seguente equazione integrale per la densità ψ: 1 (z − σ) · ν z 1 − ψ (σ) dσ + ψ (z) = g (z) (z ∈ ∂BR ). (3.117) 2 2π ∂BR |z − σ| 2 Su ∂BR si ha ν z = z/R, (z − σ) · z =R2 − z · σ,
2 |z − σ| = 2 R2 − z · σ
per cui l’equazione integrale (3.117) si riduce a 1 1 − ψ (σ) dσ + ψ (z) = g (z) 4πR ∂BR 2
(z ∈ ∂BR ).
(3.118)
Le soluzioni dell’equazione omogenea (g = 0) sono le funzioni costanti ¯ della (3.118) con ψ 0 (x) ≡ C (perché?). Una soluzione particolare ψ ¯ (σ) dσ = 0 ψ ∂BR
è data da ¯ (z) = 2g (z) . ψ Dunque, la soluzione generale della (3.118) ha la forma ψ (z) = 2g (z) + C
C∈R
per cui, a meno di una costante additiva, la soluzione del problema di Neumann è 1 g (σ) log |x − σ| dσ. u (x) = − π BR
170
3 Equazione di Laplace
Nota 7.2. Le equazioni integrali (3.110) e (3.117) sono della forma 1 (3.119) K (z, σ) ρ(σ)dσ ± ρ (z) = g (z) , 2 ∂Ω note come equazioni integrali di Fredholm di seconda specie . La loro soluzione si basa sulla seguente alternativa di Fredholm: o la (3.119) ha esattamente una soluzione per ogni g ∈ C(∂Ω), oppure l’equazione omogenea 1 K (z, σ) φ(σ)dσ ± φ (z) = 0 2 ∂Ω ha un numero finito φ1 , ..., φN di soluzioni linearmente indipendenti. In quest’ultimo caso, la (3.119) non è sempre risolubile e si ha: a) l’equazione omogenea aggiunta 1 K (σ, z) φ∗ (σ)dσ ± φ∗ (z) = 0 2 ∂Ω ha N soluzioni linearmente indipendenti φ∗1 , ..., φ∗N ; b) l’equazione (3.119) è risolubile se e solo se g soddisfa le seguenti N condizioni di compatibilità: φ∗j (σ)g (σ) dσ = 0, j = 1, ..., N ; (3.120) ∂Ω
c) se g soddisfa le (3.120), la soluzione generale della (3.119) è data da ρ = ρ + C1 φ1 + ...CN φN dove ρ è una soluzione particolare dell’equazione (3.119) e C1 , ..., CN sono costanti arbitrarie. L’analogia con la risolubilità dei sistemi lineari algebrici dovrebbe essere evidente. Torneremo sull’alternativa di Fredholm in un contesto generale, nel Capitolo 6.
Problemi 3.1. Funzioni sub e superarmoniche. Sia Ω ⊆ Rn . Diciamo che una funzione u ∈ C(Ω) è subarmonica (risp. superarmonica) in Ω se per ogni BR (x) ⊂⊂ Ω, 1 u dσ (risp ≥ ). u (x) ≤ ω n Rn ∂BR (x) Dimostrare le seguenti proprietà:
Problemi
171
a) sia u ∈ C(Ω) è subarmonica (risp. superarmonica) in Ω. Allora per ogni BR (x) ⊂⊂ Ω, n u (x) dx (risp ≥ ); u (x) ≤ ω n Rn−1 BR (x) b) Principio di massimo. Siano Ω un dominio limitato e u ∈ C Ω subarmonica (superarmonica) in Ω, non costante. Allora, per ogni x ∈ Ω u (x) < max u ∂Ω
(u (x) > min u); ∂Ω
(3.121)
c) Se u ∈ C 2 (Ω) è subarmonica (superarmonica) in Ω, allora Δu ≥ 0 (risp. Δu ≤ 0) in Ω; d) Vero o falso: se u è subarmonica e positiva in Ω allora u2 è subarmonica; e) Siano u ∈ C 2 (Ω) subarmonica in Ω e F : R → R, F ∈ C 2 (R) . Sotto quali condizioni su F la funzione composta F ◦ u è subarmonica? 3.2. Sia u armonica in Rn , n ≥ 2, tale che u2 dx < ∞. Rn
Mostrare che u ≡ 0. [Suggerimento. Scrivere la formula di media in BR (p) per u. Usare la disuguaglianza di Schwarz e passare al limite per R → +∞]. 3.3. Sia u armonica in un dominio Ω ⊆ Rn . Dimostrare le seguenti proprietà di u: a) Se BR (p) ⊂⊂ Ω allora, per ogni multiindice α = (α1 , ..., αn ) |Dα u (p)| ≤
|α|
(n |α|) R|α|
max |u|
∂BR (p)
( |α| = α1 + · · · + αn )
(usare il principio di induzione); b) Dedurre che vale il seguente sviluppo di Taylor u (x) =
∞
Dα u (p) α (x − p) α!
(α! = α1 ! · · · αn !)
|α|=0
per x opportunamente vicino a p e quindi che u è analitica (reale) in Ω; c) Dedurre che se u ha un massimo o un minimo locale in p ∈ Ω, allora u è costante in Ω.
172
3 Equazione di Laplace
3.4. Sia Ω la sezione trasversale di un cilindro con asse parallelo all’asse z; torcendolo, si produce uno sforzo tangenziale in ogni sezione. Se σ 1 e σ 2 sono le componenti scalari dello sforzo nei piani (x, z) e (y, z), esiste una funzione v = v(x, y; z) (stress function) tale che vx = σ 1 ,
vy = σ 2 .
In opportune unità di misura, v è soluzione del problema vxx + vyy = −2 in Ω v=0 su ∂Ω. Assumendo che v ∈ C 2 (Ω) ∩ C 1 Ω , dimostrare che lo sforzo, rappresentato 2 da |∇v| , assume il massimo su ∂Ω. 3.5. Sia BR = (x, y) ∈ R2 : x2 + y 2 < R . Usare il metodo di separazione delle variabili per risolvere il problema Δu = y in BR u=1 su ∂BR . 3.6. Sia B1,2 = (r, θ) ∈ R2 ; 1 < r < 2 . Esaminare la risolubilità del problema di Neumann ⎧ in B1,2 ⎨ Δu = −1 u = cos θ su r = 1 (λ ∈ R) ⎩ u = λ(cos θ)2 su r = 2 e scrivere una formula esplicita della soluzione, quando esiste. 3.7. (Principio di riflessione di Schwarz ). Sia B1+ = (x, y) ∈ R2 : x2 + y 2 < 1, y > 0 e u ∈ C 2 B1+ ∩C(B1+ ), armonica in B1+ , u (x, 0) = 0. Mostrare che la funzione U (x, y) =
u (x, y) −u (x, −y)
y≥0 y<0
ottenuta da u per riflessione dispari rispetto a y, è armonica in tutto B1 . [Suggerimento. Sia v la soluzione di Δv = 0 in B1 , v = U su ∂B1 . Definire w (x, y) = v (x, y) + v (x, −y) e mostrare che w ≡ 0 ...].
Problemi
173
Figura 3.10. Cerchio interno tangente in x0
3.8. Enunciare e dimostrare il principio di riflessione di Schwarz in dimensione tre. 3.9. Sia u armonica in Rn e M una matrice ortogonale di ordine n. Usando la proprietà di media, mostrare che v (x) = u (Mx) è armonica in Rn . 3.10. Principio di Hopf. Sia Ω ⊂ R2 and u ∈ C 2 (Ω) ∩ C 1 (Ω), armonica e positiva in Ω. Supponiamo che nel punto x0 ∈ ∂Ω valga la seguente condizione (Figura 3.10): esiste un cerchio CR (p) ⊂ Ω tale che CR (p) ∩ ∂Ω = {x0 } . a) Mostrare che se u (x0 ) = 0, allora uν (x0 ) < 0. b) Dedurre che il problema di Robin ha una sola soluzione in C 2 (Ω) ∩ C (Ω). 1
c) Generalizzare a dimensione n > 2. [Suggerimento. a) Usare il principio di massimo per confrontare u con la funzione armonica w (x) =
ln R − ln |x − p| min u ln R − ln(R/2) ∂CR/2 (p)
nella corona circolare A = CR (p) \CR/2 (p) . Confrontare poi le derivate normali in x0 ]. 3.11. Sia f ∈ C 2 R2 con supporto K, compatto, e 1 u (x) = − log |x − y| f (y) dy. 2π R2 Mostrare che u (x) = −
M −1 log |x| + O(|x| ), 2π
per |x| → +∞
174
3 Equazione di Laplace
dove
f (y) dy.
M= R2
[Suggerimento. Scrivere log |x − y| = log (|x − y| / |x|) + log |x| e mostrare che, se y ∈ K, |log (|x − y| / |x|)| ≤ C/ |x| ]. 3.12. Ricavare la formula di rappresentazione (3.65) in dimensione due. 3.13. Calcolare la funzione di Green per il cerchio di raggio R. [Risposta parziale: G (x, y) = − dove x∗ = R2 x |x|
−2
1 |x| ∗ [log |x − y| − log( |x − y|)], 2π R
, x = 0].
3.14. Siano Ω ⊂ Rn limitato, regolare e G la funzione di Green in Ω. Dimostrare che, per ogni x, y ∈ Ω, x = y,si ha: a) G (x, y) > 0; b) G (x, y) = G (y, x). [Suggerimento. a) Siano Br (x) ⊂ Ω e w la funzione armonica in Ω\B r (x) tale che w = 0 su ∂Ω e w = 1 su ∂Br (x). Mostrare che, per ogni r abbastanza piccolo, si ha G (x, ·) > w (·) in Ω\B r (x). b) Fissato x ∈ Ω, definire w1 (y) = G (x, y) e w2 (y) = G (y, x). Applicare l’identità di Green (3.66) in Ω\Br (x) a w1 e w2 . Far tendere r a 0]. 3.15. Calcolare la funzione di Green per il semipiano R2+ = {(x, y) ; y > 0} e ricavare (formalmente) la formula di Poisson y u (x, 0) u (x, y) = dξ π R (x − ξ)2 + y 2 per una funzione armonica e limitata in R2+ . 3.16. Dimostrare che il problema di Dirichlet esterno nel piano ha un’unica soluzione limitata u ∈ C 2 (Ωe ) ∩ C Ω e , eseguendo i passi seguenti. Sia w la differenza di due soluzioni limitate. Allora w è armonica in Ωe , si annulla su ∂Ωe ed è limitata, diciamo |w| ≤ M .
Problemi
175
Passo 1. Possiamo assumere che 0 ∈ Ω. Siano Ba (0) e BR (0) tali che Ba (0) ⊂ Ω ⊂ BR (0) e definiamo
ln |x| − ln |a| . ln R − ln a Usando il principio di massimo dedurre che w ≤ uR , nella corona circolare Ba,R = x ∈R2 ; a < |x| < R . uR (x) = M
Passo 2. Far tendere R a +∞ e dedurre che w ≤ 0 in Ωe . Passo 3. Procedendo in modo analogo, mostrare che w ≥ 0 in Ωe . 3.17. Ritrovare la formula di Poisson per il cerchio BR , rappresentando la soluzione di Δu = 0 in BR , u = g su ∂BR , come potenziale di doppio strato. 3.18. Considerare il problema esterno di Neumann-Robin in R3 ⎧ in Ωe ⎪ ⎨ Δu = 0 ∂ν u + ku = g su ∂Ωe , (k ≥ 0) ⎪ ⎩ u→0 per |x| → ∞. −1−ε
a) Sia k = 0. Mostrare che se per |x| → ∞, |u (x)| ≤ M |x| la condizione gdσ = 0
(3.122)
, con ε > 0,
∂Ω
è necessaria per la risolubilità di (3.122). b) Rappresentare la soluzione come potenziale di strato semplice e ricavare l’equazione integrale per la densità incognita. [Suggerimento. a) Mostrare che, per R 1, g dσ = ∂ν u dσ. ∂Ω
{|x|=R}
Far tendere R a +∞ e usare il Corollario 3.8]. 3.19. Risolvere (formalmente) il problema di Neumann nel semispazio R3+ , usando un potenziale di strato semplice. 3.20. Considerare l’equazione Lu ≡ Δu + k2 u = 0
in R3
detta equazione di Helmoltz o equazione ridotta delle onde. a) Mostrare che le soluzioni radiali u = u (r), r = |x|, soddisfacenti la condizione uscente di Sommerfeld 1 per r → +∞, ur + iku = O r2
176
3 Equazione di Laplace
sono della forma ϕ (r; k) = c
e−ikr r
c ∈ C.
b) Per f regolare e a supporto compatto in R3 , definire il potenziale U (x) = c0
f (y) R3
e−ik|x−y| dy . |x − y|
Determinare c0 in modo che LU (x) = −f (x) .
[Risposta. b): c0 = (4π)
−1
].
3.21. Giustificare le integrazioni per parti nella dimostrazione del Teorema 4.2, integrando prima sulla corona sferica BR (x) \Br (x) e poi passando al limite per R → +∞ e r → 0.
4 Leggi di conservazione scalari ed equazioni del prim’ordine
4.1 Leggi di conservazione In questa prima parte del capitolo ci concentriamo su equazioni a derivate parziali del prim’ordine del tipo ut + q (u)x = 0,
x ∈ R, t > 0.
(4.1)
In generale, u = u (x, t) rappresenta la densità o la concentrazione di una quantità fisica Q e q (u) è la sua funzione flusso 1 . La (4.1) costituisce una relazione tra densità e flusso e prende il nome di legge di conservazione, per il seguente motivo. Se consideriamo un intervallo arbitrario [x1 , x2 ], l’integrale x2 u (x, t) dx x1
rappresenta la quantità presente tra x1 e x2 al tempo t. Una legge di conservazione esprime il fatto che, in assenza di sorgenti esterne (ossia senza aggiunta o sottrazione di Q), il tasso di variazione di Q all’interno di [x1 , x2 ] è determinato dal flusso netto attraverso gli estremi dell’intervallo. Se il flusso è modellato da una funzione q = q (u), la legge di conservazione si esprime mediante l’equazione d x2 u (x, t) dx = −q (u (x2 , t)) + q (u (x1 , t)) . (4.2) dt x1 dove assumiamo che q > 0 (q < 0) se il flusso avviene nella direzione positiva (negativa) dell’asse x. In ipotesi di regolarità di u e q, la (4.2) si può riscrivere nella forma x 2
x1 1
[ut (x, t) + q (u (x, t))x ] dx = 0
Le dimensioni di q sono massa × tempo−1 .
Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
178
4 Leggi di conservazione scalari ed equazioni del prim’ordine
che implica la (4.1), in virtù dell’arbitrarietà dell’intervallo [x1 , x2 ]. A questo punto dobbiamo decidere con che tipo di funzione flusso abbiamo a che fare o, in altri termini, stabilire una legge costitutiva per q. Nella prossima sezione riprenderemo il modello dell’inquinante sul fiume, considerato nel Capitolo 2, trascurando gli effetti della diffusione ed esaminando l’effetto del puro trasporto. In questo caso si ha una legge lineare in u, in cui cioè la funzione di flusso è proporzionale a u: q (u) = vu dove v è costante. Si tratta di un modello di convezione o trasporto nel quale vi è la velocità di deriva. Successivamente esamineremo un modello non lineare con velocità dipendente da u, che servirà per introdurre e motivare lo sviluppo della teoria. La (4.1) appare in molti fenomeni di fluidodinamica unidimensionale e spesso sta alla base della formazione e propagazione delle cosiddette onde d’urto (shock waves). Queste ultime sono soluzioni che presentano linee di discontinuità a salto e si pone quindi il problema di interpretare l’equazione (4.1) in modo da consentire ad una funzione discontinua di essere soluzione. Un tipico problema associato alla (4.1) è quello ai valori iniziali : ut + q (u)x = 0 (4.3) u (x, 0) = g (x) dove x ∈ R. Se x varia in un intervallo semi-infinito o finito, per avere un problema ben posto, occorre aggiungere opportune condizioni al bordo, come vedremo più avanti.
4.2 Equazione lineare del trasporto 4.2.1 Inquinante in un fiume Riprendiamo il modello di evoluzione di un inquinante in canale stretto considerato nel Paragrafo 2.5.2. Se diffusione e trasporto sono entrambi presenti, abbiamo ricavato l’equazione ct = Dcxx − vcx dove c è la concentrazione e vi è la velocità della corrente (v > 0). Se D = 0 ci si riduce all’equazione di puro trasporto, ct + vcx = 0 che, introducendo il vettore v = vi + j,
(4.4)
4.2 Equazione lineare del trasporto
179
Figura 4.1. Caratteristica per il problema di trasporto lineare
si può scrivere come vcx + ct = ∇c · v = 0 evidenziando la perpendicolarità del gradiente di c e del vettore v. Ma ∇c è ortogonale alle linee di livello di c, lungo le quali c è costante. Le linee di livello di c sono perciò le rette parallele a v, di equazione x = vt + x0 . Tali rette si chiamano caratteristiche (Figura 4.1). Proponiamoci ora di studiare l’evoluzione della concentrazione c conoscendone il profilo iniziale c (x, 0) = g (x) .
(4.5)
Il calcolo della soluzione in un punto generico (¯ x, t¯), t¯ > 0, è molto semplice. Sia x = vt + x0 l’equazione della caratteristica che passa per (¯ x, t¯). Retrocediamo lungo tale retta dal punto (¯ x, t¯) fino al punto (x0 , 0) nel quale essa interseca l’asse x. Poiché c è costante lungo la caratteristica e x0 = x ¯ − v t¯, deve essere c (¯ x, t¯) = g (x0 ) = g (¯ x − v t¯) . Pertanto, se g ∈ C 1 (R), la soluzione del problema di Cauchy (4.4), (4.5) è data da c (x, t) = g (x − vt) . (4.6) La (4.6) rappresenta un’onda progressiva che si muove con velocità v, nella direzione positiva dell’asse x. In Figura 4.2, un profilo iniziale di concentrazione g (x) = sin (πx) χ[0,1] (x) è trasportato nel piano x, t lungo le rette x + t = costante, cioè con velocità unitaria v = 1. 4.2.2 Sorgente distribuita Consideriamo ora la presenza di una sorgente (o pozzo) di inquinante distribuita lungo il canale, di intensità f = f (x, t) . La funzione f ha le dimensioni di concentrazione per unità di tempo. Invece della (4.2) abbiamo x2 d x2 c (x, t) dx = −q (u (x2 , t)) + q (u (x1 , t)) + f (x, t) dx dt x1 x1
180
4 Leggi di conservazione scalari ed equazioni del prim’ordine
1.5 1 0.5 0 -0.5 1
0.8
0.6
0.4
0.2
0
-1
-2
-3
0
t
1
2
3
x
Figura 4.2. Onda progressiva
e con calcoli analoghi ai precedenti, il nostro modello diventa ct + vcx = f (x, t)
(4.7)
con la condizione iniziale c (x, 0) = g (x) .
(4.8) Anche in questo caso, il calcolo della soluzione u in un punto generico x, t non presenta particolari difficoltà. Sia x = x0 + vt l’equazione della carat teristica passante per x, t . Calcoliamo u lungo questa caratteristica ponendo w (t) = c (x0 + vt, t). Usando la (4.7), si vede che w è la soluzione dell’equazione differenziale ordinaria w˙ (t) = vcx (x0 + vt, t) + ct (x0 + vt, t) = f (x0 + vt, t) con la condizione iniziale w (0) = g (x0 ) . Integrando tra 0 e t si trova w t = g (x0 ) +
t
0
f (x0 + vs, s) ds.
Ricordando che x0 = x − vt, otteniamo c x, t = w t = g x − vt +
0
t
f x − v(t − s), s ds.
(4.9)
Poiché x, t è arbitrario, se g e f sono sufficientemente regolari, la (4.9) è la formula della soluzione. Alternativamente, la (4.9) si può ricavare col metodo di Duhamel, come nel Paragrafo 2.8.3 (Problema 4.1).
4.2 Equazione lineare del trasporto
181
Microteorema 1.1. Siano g ∈ C 1 (R) ed f, fx ∈ C (R×[0, +∞)). La soluzione del problema ct + vcx = f (x, t) x ∈ R, t > 0 x∈R
c(x, 0) = g (x)
appartiene a C 1 (R×[0, +∞) ed è data dalla formula c (x, t) = g (x − vt) +
t 0
f (x − v(t − s), s) ds.
Esempio 1.1. La soluzione del problema ct + vcx = e−t sin x c (x, 0) = 0
(4.10)
x ∈ R, t > 0 x∈R
è data da
t
c (x, t) = 0
=
e−s sin (x − v(t − s)) ds
1 −t −e (sin x + v cos x) + sin(x − vt) + v cos(x − vt) . 1 + v2
4.2.3 Estinzione e sorgente localizzata Supponiamo che l’inquinante si estingua per decomposizione batteriologica ad un tasso r (x, t) = −γc (x, t) γ > 0. In assenza di diffusione (D = 0) e di sorgenti esterne, il modello matematico è ct + vcx = −γc con la condizione iniziale c (x, 0) = g (x) . Se poniamo
γ
u (x, t) = c (x, t) e v x , γ γ u x = cx + c e v x v e quindi l’equazione per u è
abbiamo
e
γ
ut = ct e v x
ut + vux = 0 con condizione iniziale
(4.11)
γ
u (x, 0) = g (x) e v x .
182
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Dal Microteorema 1.1 abbiamo γ
u (x, t) = g (x − vt) e v (x−vt) e dalla (4.11):
c (x, t) = g (x − vt) e−γt
che rappresenta un’onda progressiva smorzata. Esaminiamo ora l’effetto di una sorgente d’inquinante posta in un dato punto del canale, per esempio in x = 0. Tipicamente, si può pensare ad acque di rifiuto in impianti industriali. Supponiamo che, prima che l’impianto entri in funzione, per esempio prima dell’istante t = 0, il fiume sia pulito. Vogliamo determinare la concentrazione di inquinante, assumendo che questa sia mantenuta ad un livello costante β > 0 per t > 0. Un modello per la sorgente si ottiene introducendo la funzione di Heaviside 1 t≥0 H (t) = 0 t<0 con la condizione al bordo c (0, t) = βH (t) dove H è adimensionale, e la condizione iniziale c (x, 0) = 0
per x > 0. γ
Come prima, poniamo u (x, t) = c (x, t) e v x , che è soluzione di ut + vux = 0 con le condizioni: γ
u (x, 0) = c (x, 0) e v x = 0 u (0, t) = c (0, t) = βH(t)
x>0 t ∈ R.
Poiché u è costante lungo le caratteristiche, abbiamo una soluzione della forma u (x, t) = u0 (x − vt)
(4.12)
dove u0 è da determinarsi usando le condizioni al bordo e la condizione iniziale. Per calcolare u nel settore 0 < x < vt, osserviamo che le caratteristiche uscenti da un punto (0, t) sull’asse t trasportano il dato βH (t). Quindi deve essere u0 (−vt) = βH (t) . Ponendo s = −vt si ha e da (4.12)
s u0 (s) = βH − v x u (x, t) = βH t − . v
4.2 Equazione lineare del trasporto
183
4 3 2 1 0 1.5 1.5
1
1
0.5
0.5 0
0
t
x
Figura 4.3. Propagazione di una discontinuità
Questa formula dà la soluzione anche nel settore x > vt,
t > 0,
poiché la caratteristiche uscenti dall’asse x trasportano dati nulli e quindi deduciamo u = c = 0. Ciò significa che l’inquinante non ha ancora raggiunto il punto x al tempo t, se x > vt. Infine, ricordando la (4.11), troviamo x −γ x c (x, t) = βH t − e v . v Si osservi che in (0, 0) c’è una discontinuità che si trasporta lungo la caratteristica x = vt. La Figura 4.3 mostra la soluzione per β = 3, γ = 0.7, v = 2. 4.2.4 Caratteristiche inflow e outflow Il problema precedente è un problema nel quadrante x > 0, t > 0. Per determinare univocamente la soluzione abbiamo usato, oltre al dato iniziale, un dato sul semiasse positivo x = 0, t > 0. Il nuovo problema risulta così ben posto. Ciò è dovuto al fatto che, essendo v > 0, all’aumentare del tempo, tutte le caratteristiche che escono dal bordo trasportano le informazioni (i dati) verso l’interno del quadrante x > 0, t > 0. Si dice che le caratteristiche sono inflow rispetto al quadrante. Esaminiamo in generale la situazione per un’equazione del tipo ut + aux = f (x, t) nel quadrante x > 0, t > 0, dove a è costante (a = 0). Le caratteristiche sono le rette x − at = costante
184
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.4. Le frecce indicano dove vanno assegnati i dati
la cui configurazione è illustrata in Figura 4.4. Si vede che, se a > 0, siamo nella situazione dell’inquinante: le caratteristiche uscenti dal bordo entrano nel dominio ed occorre assegnare i dati su entrambi i semiassi. Se invece a < 0, le caratteristiche che partono dall’asse x entrano nel dominio (inflow characteristics ) mentre quelle che partono dall’asse t sono uscenti (outflow characteristics ). In questo caso i dati iniziali sono sufficienti a determinare il valore della soluzione mentre non deve essere assegnato il valore su x = 0, t > 0. Se ora abbiamo un problema nella striscia x ∈ [0, R], t > 0, oltre alla condizione iniziale occorre assegnare i dati u (0, t) = h0 (t) se a > 0 u (R, t) = hR (t) se a < 0. Il problema che si ottiene risulta ben posto, in quanto la soluzione è determinata univocamente in ogni punto della striscia dai valori lungo le caratteristiche. La stabilità della soluzione rispetto ai dati segue poi dal seguente semplice calcolo. Per fissare le idee, siano a > 0 e u soluzione del problema2 ⎧ 0 < x < R, t > 0 ⎪ ⎨ ut + aux = 0 u (0, t) = h (t) t>0 (4.13) ⎪ ⎩ u (x, 0) = g (x) 0 < x < R. Moltiplichiamo l’equazione per u e scriviamo uut + auux = 2
1 d 2 a d 2 u + u = 0. 2 dt 2 dx
Per il caso ut + aux = f , vedere il Problema 4.2.
4.3 Traffico su strada
185
Integriamo rispetto ad x in (0, R); si trova: d dt
R 0
u2 (x, t) dx + a u2 (R, t) − u2 (0, t) = 0.
Usiamo il dato u (0, t) = h (t) e la positività di a per ottenere d dt
0
R
u2 (x, t) dx ≤ ah2 (t) .
Integrando in t ed usando la condizione iniziale u (x, 0) = g (x), si ha
R 0
u2 (x, t) dx ≤
R
g 2 (x) dx + a
0
t
h2 (s) ds.
(4.14)
0
Siano ora u1 e u2 soluzioni del problema con dati iniziali g1 e g2 e dati laterali h1 e h2 su x = 0. Per la linearità del problema, w = u1 − u2 è soluzione del problema (4.13) con dato iniziale g1 − g2 e dato laterale h1 − h2 su x = 0. Applicando la (4.14) a w si trova
R 0
[u1 (x, t) − u2 (x, t)]2 dx ≤
0
R
(g1 − g2 )2 dx + a
0
t
(h1 − h2 )2 ds
che mostra come lo scarto quadratico tra le soluzioni sia controllato da quello tra i dati, per ogni t > 0. In questo senso la soluzione del problema (4.13) dipende con continuità dal dato iniziale e da quello laterale su x = 0. Si noti che i valori di u su x = R non intervengono nella (4.14).
4.3 Traffico su strada 4.3.1 Un modello di dinamica del traffico Un intenso traffico su un tratto rettilineo di una grande arteria stradale, si può assimilare da lontano al flusso di un fluido descritto per mezzo di variabili macroscopiche come la densità di auto ρ (auto per unità di lunghezza), la loro velocità media v e il loro flusso q (auto per unità di tempo). Le tre funzioni ρ, u e q (più o meno regolari) sono legate tra loro dalla semplice relazione convettiva q = vρ. Per costruire un modello matematico che governi l’evoluzione di ρ adottiamo le seguenti ipotesi. 1. C’è una sola corsia e non sono permessi sorpassi. Questo è realistico per esempio per il traffico in un tunnel (Problema 4.7). Modelli a più corsie con sorpasso consentito sono al di là degli scopi di questa introduzione.
186
4 Leggi di conservazione scalari ed equazioni del prim’ordine
2. Assenza di “sorgenti” o “pozzi” di auto. Stiamo cioè assumendo che le auto non possano aumentare o diminuire all’interno del tratto di strada considerato, eccetto che attraverso i caselli di uscita/entrata. Un casello può essere modellato come nel caso della sorgente/pozzo puntiforme di inquinante. Qui considereremo, per semplicità, tratti privi di caselli. 3. La velocità non è costante e dipende dalla sola densità, cioè v = v (ρ) . Quest’ultima ipotesi, piuttosto controversa, implica che ogni autista viaggia alla stessa velocità in presenza di una data densità e che, se la densità cambia, la variazione in velocità è istantanea. Chiaramente v (ρ) =
dv ≤0 dρ
poiché ci aspettiamo che la velocità decresca al crescere della densità. Le ipotesi 2 e 3 conducono alla legge di conservazione: ρt + q(ρ)x = 0 dove q(ρ) = v (ρ) ρ. Ci serve una legge costitutiva per v = v (ρ). Quando ρ è piccola, è ragionevole ritenere che v sia sostanzialmente uguale alla velocità massima consentita vm . Quando ρ cresce, il traffico rallenta e si arresta alla densità massima ρm (quando la distanza tra le auto è minima). Adottiamo il più semplice modello in accordo con queste considerazioni: cioè che v sia proporzionale allo scarto (ρm − ρ) /ρm . In formule: ρ v (ρ) = vm 1 − . (4.15) ρm Abbiamo, dunque,
ρ q (ρ) = vm ρ 1 − ρm
e
q(ρ)x = q (ρ) ρx = vm
2ρ 1− ρm
ρx .
Pertanto, l’equazione finale è ρt + vm -
2ρ ρx = 0. 1− ρ ./ m 0 q (ρ)
(4.16)
4.3 Traffico su strada
187
Questa equazione non è lineare a causa del termine in ρρx ma è quasilineare, in quanto lineare rispetto alle derivate parziali. Notiamo anche che q (ρ) = −
2vm <0 ρm
e cioè che q è concava. All’equazione aggiungiamo la condizione iniziale ρ (x, 0) = g (x) .
(4.17)
4.3.2 Il metodo delle caratteristiche Vogliamo ora risolvere il problema ai valori iniziali (4.16), (4.17). Per calcolare la densità ρ nel punto (x, t) proviamo ad utilizzare l’idea che ha funzionato nel caso lineare omogeneo: connettere il punto (x, t) con un punto (x0 , 0) sull’asse x, portante il dato iniziale, mediante una curva lungo la quale ρ sia costante. Una curva di questo tipo prende ancora il nome di caratteristica, uscente da (x0 , 0) (Figura 4.5). È chiaro che se si riesce nell’impresa, il valore di ρ nel punto (x, t) coincide con il valore noto ρ (x0 , 0) = g (x0 ). Se poi il procedimento si può ripetere per ogni punto (x, t), x ∈ R, t > 0, possiamo calcolare ρ in ogni punto ed il problema è risolto. Questo è il metodo delle caratteristiche . L’idea si può esprimere assumendo un atteggiamento “lagrangiano”, che rovescia in un certo senso il punto di vista adottato prima: partiamo dal punto (x0 , 0) e muoviamoci lungo una curva caratteristica, per esempio di equazione x = x (t), in modo da osservare sempre la stessa densità iniziale g (x0 ). In formule, ciò che vogliamo è che ρ (x (t) , t) = g (x0 )
(4.18)
per ogni t > 0. Derivando l’identità (4.18) si ottiene d ρ (x (t) , t) = ρx (x (t) , t) x˙ (t) + ρt (x (t) , t) = 0 dt D’altra parte, la (4.16) dà ρt (x (t) , t) + q (g (x0 )) ρx (x (t) , t) = 0
Figura 4.5. Curva caratteristica
(t > 0).
188
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.6. Retta caratteristica
e quindi, sottraendo membro a membro le due ultime equazioni, si ha: ρx (x (t) , t) [x˙ (t) − q (g (x0 ))] = 0. Assumendo ρx (x (t) , t) = 0, otteniamo l’equazione x˙ (t) = q (g (x0 )) con la condizione iniziale x (0) = x0 . Integrando, si ottiene x (t) = q (g (x0 )) t + x0 .
(4.19)
Le caratteristiche sono dunque rette con pendenza q (g (x0 )). Valori diversi di x0 danno, in generale, valori diversi di g(x0 ). Noto g (x0 ), risulta nota la densità lungo la caratteristica uscente da x0 . Siamo ora in grado di assegnare una formula generale per ρ. Per calcolare ρ (x, t), t > 0, si considera la caratteristica che passa per il punto (x, t) e si va indietro nel tempo lungo la caratteristica, fino a determinare il punto (x0 , 0) nel quale essa interseca l’asse x (Figura 4.6); si ha allora ρ (x, t) = g (x0 ). Dalla (4.19) si ricava, essendo x (t) = x, x0 = x − q (g (x0 )) t da cui la formula
ρ (x, t) = g (x − q (g (x0 )) t)
(4.20)
che rappresenta un’onda progressiva che si muove con velocità q (g (x0 )) nella direzione positiva dell’asse x. Se, dato (x, t), si riesce a calcolare x0 , la (4.20) fornisce il valore di ρ in (x, t). In generale, la (4.20) determina ρ in forma implicita3 : ρ = g (x − q (ρ) t) . Notiamo espressamente che q (g (x0 )) è la velocità locale dell’onda e non va confusa con la velocità del traffico. Infatti dq d (ρv) dv = =v+ρ ≤v dρ dρ dρ essendo ρ ≥ 0 e 3
dv dρ
≤ 0.
Ricordare che g (x0 ) = ρ (x, t).
4.3 Traffico su strada
189
Figura 4.7. Intersezione di caratteristiche
La diversa natura delle due velocità diventa più evidente se si pensa che la velocità locale dell’onda può anche essere negativa. Questo significa che, mentre il traffico avanza nella direzione positiva dell’asse x, la perturbazione rappresentata dall’onda progressiva può muoversi in direzione opposta. Nel ρm modello (4.15), si ha infatti dv dρ < 0 per ρ > 2 . La (4.20) sembra essere una formula piuttosto soddisfacente poiché, apparentemente, dà la soluzione del problema (4.16), (4.17) in ogni punto. In realtà un’analisi più precisa mostra che anche se il dato iniziale g è regolare, la soluzione può dare origine a singolarità che rendono inefficace il metodo delle caratteristiche ed inutilizzabile la formula (4.20). Un caso tipico è quello rappresentato in Figura 4.7, in cui due caratteristiche uscenti da punti diversi (x1 , 0) e (x2 , 0) si intersecano in un punto (x, t). Se g (x1 ) = g (x2 ) il valore in (x, t) non è univocamente determinato, in quanto dovrebbe assumere simultaneamente i valori g (x1 ) e g (x2 ). In questo caso occorre rivedere il concetto di soluzione e la tecnica di calcolo. Ritorneremo più avanti su questa questione. Cominciamo comunque ad analizzare in dettaglio il metodo delle caratteristiche in qualche caso particolarmente significativo.
4.3.3 Coda al semaforo Immaginiamo che ad un semaforo rosso, posto in x = 0, si sia formata una coda, mentre la strada è libera per x > 0. Coerentemente, il profilo iniziale della densità è ρm x<0 g (x) = 0 x > 0. La scelta di un eventuale valore di g in x = 0 non è rilevante. Supponiamo che al tempo t = 0 il semaforo diventi verde. Analizziamo quel che succede. Al verde, il traffico comincia a muoversi: all’inizio, solo le macchine più vicine al semaforo lo superano mentre la maggior parte rimane ferma.
190
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.8. Traffico al verde del semaforo
Essendo q (ρ) = vm 1 − data da
2ρ ρm
, la velocità locale dell’onda progressiva è
q (g (x0 )) =
−vm vm
x0 < 0 x0 > 0
per cui le caratteristiche sono le rette x = −vm t + x0 x = vm t + x0
se x0 < 0 se x0 > 0.
Le rette x = vm t e x = −vm t dividono il piano in tre regioni, indicate in Figura 4.8 con R, S e T . In R si ha ρ (x, t) = ρm , mentre in T si ha ρ (x, t) = 0. Consideriamo i punti sulla retta orizzontale t = t (Figura 4.8). Nei punti x, t che si trovano in T la densità è nulla: il traffico non è ancora arrivato in x al tempo t = t. I punti che si trovano in R corrispondono alle auto che all’istante t = t non si sono ancora mosse. Nel punto x = vm t si trova l’auto in avanguardia, che si muove alla massima velocità, trovandosi davanti la strada completamente libera. Nel punto x = −vm t si trova la prima auto che comincia a muoversi all’istante t = t. Ne segue, in particolare, che il segnale di via libera si propaga a sinistra con velocità vm . Qual è il valore della densità nel settore S? Nessuna caratteristica entra in S a causa della discontinuità del dato iniziale nell’origine ed il metodo non sembra fornire alcuna informazione sul valore di ρ in S. Una strategia che potrebbe dare una risposta ragionevole è la seguente: a) approssimiamo il dato iniziale con una funzione continua gε , che converge a g per ε → 0 in ogni punto x, eccetto x = 0; b) costruiamo la soluzione ρε del problema approssimato col metodo delle caratteristiche;
4.3 Traffico su strada
191
Figura 4.9. Regolarizzazione del dato iniziale nel problema del traffico al semaforo
c) Passiamo al limite per ε → 0 e controlliamo che il limite di ρε sia effettivamente una soluzione del problema originale. Naturalmente corriamo il rischio di costruire soluzioni che dipendono dal modo di regolarizzare il dato iniziale, ma per il momento ci accontentiamo di costruire almeno una soluzione. a) Scegliamo come gε la funzione seguente (Figura 4.9) ⎧ x≤0 ⎪ ⎨ ρm x 0<x<ε gε (x) = ρm (1 − ) ε ⎪ ⎩ 0 x ≥ ε. Osserviamo che se ε → 0, gε (x) → g (x) per ogni x = 0. b) Le caratteristiche per il problema approssimato sono: x = −vm t + x0 x0 t + x0 x = −vm 1 − 2 ε x = vm t + x0 essendo, per 0 ≤ x0 < ε,
q (gε (x0 )) = vm
2gε (x0 ) 1− ρm
se x0 < 0 se 0 ≤ x0 < ε se x0 ≥ ε
x0 = −vm 1 − 2 . ε
Le caratteristiche nella regione −vm t < x < vm t + ε si distribuiscono a ventaglio (rarefaction fan, Figura 4.10). Abbiamo ρε (x, t) = 0 per x ≥ vm t +ε e ρε (x, t) = ρm per x ≤ −vm t. Sia ora (x, t) nella regione −vm t < x < vm t + ε. x0 Ricavando x0 nell’equazione della caratteristica x = −vm 1 − 2 t + x0 , ε troviamo x + vm t . x0 = ε 2vm t + ε Di conseguenza: x0 x + vm t . (4.21) ρε (x, t) = gε (x0 ) = ρm (1 − ) = ρm 1 − 2vm t + ε ε
192
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.10. Ventaglio di caratteristiche
c) Passando al limite per ε → 0 in (4.21) otteniamo ⎧ ρ per x ≤ −vm t ⎪ ⎪ ⎨ ρm x m ρ (x, t) = 1− per − vm t < x < vm t . ⎪ vm t 2 ⎪ ⎩ 0 per x ≥ vm t.
(4.22)
È facile verificare che ρ è soluzione dell’equazione (4.16) nelle regioni R, S, T . Per t fissato, la funzione ρ decresce linearmente da ρm a 0 quando x varia da −vm t a vm t.Inoltre, ρ è costante sul ventaglio di rette x = ht
− vm < h < v m .
Queste soluzioni prendono il nome di onde di rarefazione (rarefaction or simple waves), centrate nell’origine. La formula per ρ (x, t) nel settore S può essere ottenuta, a posteriori, con una procedura formale, che ne sottolinea la struttura generale. Infatti, l’equazione delle caratteristiche può essere scritta nella forma 2g (x0 ) 2ρ (x, t) t + x0 = vm 1 − t + x0 x = vm 1 − ρm ρm essendo ρ (x, t) = g (x0 ). Inserendo x0 = 0 otteniamo 2ρ (x, t) t. x = vm 1 − ρm Ricavando ρ si ritrova x ρm ρ (x, t) = 1− (t > 0). vm t 2 Poiché vm 1 − ρ2ρ = q (ρ), vediamo che la (4.23) equivale a m
ρ (x, t) = r
x t
(4.23)
4.3 Traffico su strada
193
Figura 4.11. Caratteristiche in un’onda di rarefazione
Figura 4.12. Profilo di un’onda di rarefazione al tempo t −1
dove r = (q ) è la funzione inversa di q . Infatti, questa è la forma generale di un’onda di rarefazione (centrata nell’origine) per una legge di conservazione ρt + q (ρ)x = 0. Abbiamo costruito una soluzione ρ, continua in tutto il piano, raccordando i due stati costanti ρm e 0 (corrispondenti a due onde progressive) con un’onda di rarefazione (Figure 4.11, 4.12). Si noti, comunque, che non è ancora chiaro in quale senso ρ sia soluzione attraverso le rette x = ±vm t, sulle quali le derivate di ρ hanno una discontinuità a salto. Dobbiamo dedurre che su queste rette l’equazione differenziale non ha senso? Torneremo in seguito su questa importante questione. 4.3.4 Traffico crescente con x Supponiamo ora che il dato iniziale sia 1 ρm g (x) = 8 ρm
x<0 x > 0.
In questa configurazione iniziale, per x > 0 le auto sono ferme, in quanto la densità è massima. Quelle a sinistra si muoveranno verso destra con velocità v = 78 vm per cui sarà inevitabile una collisione. Abbiamo: 3 vm se g (x0 ) = ρ8m q (g (x0 )) = 4 −vm se g (x0 ) = ρm
194
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.13. Ci si aspetta uno ... shock
e quindi le caratteristiche sono le rette 3 vm t + x0 4 x = −vm t + x0
x=
se x0 < 0 se x0 > 0.
La configurazione delle caratteristiche (Figura 4.13) indica che esse si intersecano in un tempo finito. Da questo istante in poi il metodo delle caratteristiche non funziona più. Occorre ammettere discontinuità a salto della soluzione. Ma in questo caso la derivazione dell’equazione di conservazione va rivista, in quanto è stata ricavata presupponendo condizioni di regolarità della soluzione. Ritorniamo dunque alla legge di conservazione d x2 ρ (x, t) dx = q [ρ (x1 , t)] − q [ρ (x2 , t)] , (4.24) dt x1 valida in ogni intervallo [x1 , x2 ], e sia ρ una soluzione che presenti al tempo t una discontinuità a salto nel punto x = s (t) . Se ciò succede per tutti i t appartenenti ad un intervallo temporale [t1 , t2 ] allora x = s (t) definisce una linea che prende il nome di linea d’urto o di shock. L’idea è che una discontinuità segnali un brusco cambiamento (shock) e che questo si propaghi lungo una linea nel piano x, t. Cerchiamo un’equazione per la funzione s (t), supponendola almeno differenziabile. Al di fuori della linea d’urto assumiamo che la nostra soluzione sia regolare, dotata di derivate continue. Per t fissato, consideriamo un intervallo [x1 , x2 ] che contenga il punto di discontinuità s (t). Dalla (4.24) abbiamo , x2 s(t) d ρ (y, t) dy + ρ (y, t) dy = −q [ρ (x2 , t)] + q [ρ (x1 , t)] . (4.25) dt s(t) x1 Osserviamo ora che s(t) d s(t) ρ (y, t) dy = ρt (y, t) dy + ρ− (s (t) , t) s˙ (t) dt x1 x1
4.3 Traffico su strada
e
d dt
x2
x2
ρ (y, t) dy = s(t)
195
ρt (y, t) dy − ρ+ (s (t) , t) s˙ (t)
s(t)
dove abbiamo posto ρ− (s (t) , t) = lim ρ (y, t) ,
ρ+ (s (t) , t) = lim ρ (y, t)
y↑s(t)
y↓s(t)
per cui la (4.25) diventa x2 ρt (y, t) dy + ρ− (s (t) , t) − ρ+ (s (t) , t) s˙ (t) = q [ρ (x1 , t)] − q [ρ (x2 , t)] . x1
Passando al limite per x2 ↓ s (t) e x1 ↑ s (t) otteniamo − ρ (s (t) , t) − ρ+ (s (t) , t) s˙ (t) = q ρ− (s (t) , t) − q ρ+ (s (t) , t) ossia s˙ (t) =
q [ρ+ (s (t) , t)] − q [ρ− (s (t) , t)] ρ+ (s (t) , t) − ρ− (s (t) , t)
(4.26)
che possiamo scrivere sinteticamente nella forma +
s˙ =
[q (ρ)]− +
[ρ]−
+
dove [·]− indica il salto da sinistra a destra della linea d’urto. La (4.26) è un’equazione differenziale per s = s (t) e prende il nome di condizione di Rankine-Hugoniot. Essa indica che la velocità di propagazione dello shock è determinata dal salto della funzione di flusso diviso per il salto della densità. Se quindi si conoscono i valori di ρ da entrambi i lati della linea d’urto ed il punto iniziale di quest’ultima, si può determinarne la locazione. Una soluzione discontinua che soddisfa la condizione di Rankine-Hugoniot prende il nome di onda d’urto (shock wave). Applichiamo queste considerazioni al nostro problema di traffico 4 . Si ha ρ+ = ρm , mentre
4
q ρ+ = 0
ρ− =
ρm 8
7 q ρ− = vm ρ m 64
Nel caso presente si può usare la formuletta (di facile verifica) q (w) − q (z) w+z = vm 1 − . w−z ρm
196
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.14. Onda d’urto
e quindi la (4.26) è s˙ =
q (ρ+ ) − q (ρ− ) 1 = − vm . ρ+ − ρ− 8
Essendo poi s (0) = 0, si trova che la linea d’urto è la retta di equazione 1 x = − vm t. 8 Si noti che la pendenza è negativa: lo shock si propaga all’indietro con velocità − 18 vm . Ciò è in perfetto accordo con l’esperienza: ad un improvviso rallentamento rileviamo che le luci dei freni delle auto davanti a noi si propagano all’indietro. La costruzione della soluzione discontinua è illustrata nella Figura 4.14, dove le caratteristiche sono separate questa volta da un’onda d’urto. La formula per la densità è 1 ρm x < − 18 vm t ρ (x, t) = 8 x > − 18 vm t. ρm
4.4 Soluzioni integrali 4.4.1 Riesame del metodo delle caratteristiche Il metodo delle caratteristiche usato per il modello di traffico funziona in generale per il problema ut + q (u)x = 0 (4.27) u (x, 0) = g (x) . La soluzione u è definita dalla (4.20) (con x0 = ξ): u(x, t) = g [x − q (g (ξ)) t]
q =
dq du
(4.28)
4.4 Soluzioni integrali
197
e rappresenta una famiglia di onde progressive con velocità locale q (g (ξ)). Essendo u (x, t) ≡ g (ξ) lungo la caratteristica x = q (g (ξ)) t + ξ
(4.29)
uscente dal punto (ξ, 0), la (4.28) indica che u è definita implicitamente dall’equazione (4.30) G (x, t, u) ≡ u − g [x − q (u) t] = 0. Se g e q sono funzioni regolari, il teorema delle funzioni implicite implica che la (4.30) definisce u come funzione di (x, t) finché vale la condizione Gu (x, t, u) = 1 + tq (u) g [x − q (u) t] = 0. Calcolando Gu lungo le caratteristiche (4.29), abbiamo u = g (ξ) eξ = x − q (g (ξ)) t, per cui
Gu (x, t, u) = 1 + tq (g (ξ))g (ξ).
(4.31)
Un’immediata conseguenza è che se q (g (ξ))g (ξ) ≥ 0 in R, ossia se q ◦ g e g hanno lo stesso segno, la soluzione costruita col metodo delle caratteristiche è definita e regolare per ogni t ≥ 0. Ciò non è sorprendente, in quanto q (g (ξ))g (ξ) =
d q (g (ξ)) dξ
e la condizione q (g (ξ))g (ξ) ≥ 0 esprime il fatto che le caratteristiche hanno pendenza crescente con ξ, cosicché non possono intersecarsi. Precisamente, abbiamo: Microteorema 4.1. Assumiamo che q ∈ C 2 (R), g ∈ C 1 (R) e q (g (ξ)) g (ξ) ≥ 0 in R. Allora la (4.30) definisce u = u (x, t) come l’unica soluzione del problema (4.3). Inoltre u ∈ C 1 (R × [0, +∞)). Dimostrazione. Sotto le ipotesi indicate, lungo ogni caratteristica ξ = x − q (u) t si ha Gu (x, t, u) = 1 + tq (u) g (x − q (u) t) ≥ 1,
∀t > 0
e inoltre, sempre dal teorema delle funzioni implicite, ut = −
Gt (x, t, u) g (x − q (u) t) q (u) =− Gu (x, t, u) 1 + tq (u) g (x − q (u) t)
e ux = −
Gx (x, t, u) g (x − q (u) t) = Gu (x, t, u) 1 + tq (u) g (x − q (u) t)
(4.32)
e quindi ut , ux sono rapporti di funzioni continue, con denominatore positivo.
198
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Abbiamo constatato che, se q ◦ g e g hanno lo stesso segno, le caratteristiche non si intersecano. Per esempio, nella ε−approssimazione del problema al semaforo, q è concava gε è decrescente. Sebbene gε non sia differenziabile nei due punti x = 0 e x = ε, le caratteristiche non si intersecano e ρε è ben definita per tutti i tempi t > 0. Nel passaggio al limite per ε → 0, la discontinuità di g riappare e il ventaglio di caratteristiche produce l’onda di rarefazione. Che cosa succede se q (g (ξ))g (ξ) ≤ 0 in un intervallo [a, b], per esempio? Il Microteorema 4.1 continua a valere per tempi piccoli, poiché Gu ∼ 1 se t ∼ 0, ma all’avanzare del tempo ci aspettiamo la formazione di uno shock. Infatti, supponiamo per esempio che q sia concava e g sia crescente, per cui q (g (ξ)) g (ξ) < 0. Quando ξ cresce, g cresce, mentre q (g (ξ)) decresce cosicché ci aspettiamo un’intersezione di caratteristiche lungo una linea d’urto. Il problema che si presenta è determinare l’istante ts (breaking time) e il punto xs in cui parte la linea d’urto. Osserviamo che, essendo q (g (ξ)) g (ξ) ≤ 0 in [a, b] l’espressione Gu (x, t, u) = 1 + tq (g(ξ))g (ξ) si azzera per t (ξ) = −[q (g(ξ))g (ξ)]−1 . L’istante ts è il più piccolo fra questi tempi. In altri termini, il punto (xs , ts ) si trova sulla caratteristica uscente dal punto ξ M che minimizza t (ξ). Consideriamo perciò la funzione nonnegativa z (ξ) = −q (g(ξ))g (ξ)
ξ ∈ [a, b]
e supponiamo che assuma il suo massimo (positivo) solo nel punto ξ M . Allora z (ξ M ) > 0 e 1 1 ts = min = . (4.33) z (ξ M ) ξ∈[a,b] z (ξ) Poiché xs appartiene alla caratteristica x = q (g (ξ M )) t + ξ M , troviamo xs =
q (g (ξ M )) + ξM . z (ξ M )
(4.34)
Il punto (xs , ts ) ha un’interessante significato geometrico. Infatti, se q (g (ξ)) g (ξ) < 0 in qualche intervallo, la famiglia di caratteristiche (4.29) ammette un inviluppo 5 e (xs , ts ) è il punto dell’inviluppo con la minima coordinata temporale (Problema 4.8). 5
Ricordiamo (si veda C. Pagani e S. Salsa, vol I, 1991) che l’ inviluppo di una famiglia di curve φ (x, t, ξ) = 0, dipendenti dal parametro ξ, è una curva ψ (x, t) = 0 tangente in ogni suo punto ad una curva della famiglia. Se la famiglia di curve φ (x, t, ξ) = 0 ha un inviluppo, le sue equazioni parametriche si ottengono risolvendo rispetto a x e t il sistema φ (x, t, ξ) = 0 φξ (x, t, ξ) = 0.
4.4 Soluzioni integrali
199
Figura 4.15. Breaking time per il problema (4.35)
Esempio 4.1. Consideriamo il problema ut + (1 − 2u)ux = 0 u (x, 0) = arctan x.
(4.35)
Abbiamo q(u) = u − u2 , q (u) = 1 − 2u, q (u) = −2 e g (ξ) = arctan ξ, g (ξ) = 1/ 1 + ξ 2 . La funzione 2 1 + ξ2
z (ξ) = −q (g(ξ))g (ξ) =
assume il massimo in ξ M = 0 e z (0) = 2. Il breaking-time è ts = 1/2 e xs = 1/2. Pertanto, l’onda d’urto parte dal punto (1/2, 1/2) . Per 0 ≤ t < 1/2 la soluzione u è regolare e definita implicitamente dall’equazione u − arctan [x − (1 − 2u) t] = 0.
(4.36)
Dopo t = 1/2, la (4.36) definisce u come funzione di (x, t) a più valori, che non ha più significato fisico. La Figura 4.15 mostra che cosa succede per t = 1/4, 1/2 e 1. Si noti che il punto comune di intersezione è (1/2, tan 1/2), che non è il punto di partenza dello shock. Come evolve la soluzione dopo t = 1/2? Dobbiamo inserire uno shock nel grafico in Figura 4.15 in modo da preservare la legge di conservazione. Vedremo che la posizione corretta di inserimento è quella prescritta dalla condizione di Rankine-Hugoniot. Si può mostrare che ciò corrisponde a tagliare dal grafico in Figura 4.15 due regioni A e B di aree uguali come descritto in Figura 4.16 (equal area rule, si veda G. B. Whitham, 1974). 4.4.2 Definizione di soluzione integrale Abbiamo visto che il metodo delle caratteristiche, usato nella sezione precedente per costruire una soluzione dell’equazione (4.1), può non essere sufficiente a determinarne il valore in tutto il semipiano t > 0 o, peggio, non è
200
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.16. Inserimento di uno shock con la regola di Whitham
applicabile in presenza di discontinuità (shock). Nell’esempio del traffico, nel primo caso, ce la siamo cavata utilizzando onde di rarefazione per costruire la soluzione nelle zone non coperte da caratteristiche. Nel secondo caso, abbiamo costruito una soluzione in tutto il piano, con uno shock che si propaga in accordo alla condizione di Rankine-Hugoniot. Alcuni dubbi e perplessità si presentano spontaneamente. •
• •
In che senso l’equazione differenziale è soddisfatta attraverso una linea d’urto o, più in generale, attraverso una linea di separazione tra onde ti tipo diverso, dove la soluzione costruita non è differenziabile? Un’alternativa potrebbe essere quella di rinunciare a dare un significato all’equazione in quei punti, ma questo darebbe la possibilità di costruire soluzioni che non hanno nulla a che vedere con il significato fisico che una legge di conservazione si porta dietro. La soluzione costruita è l’unica possibile? Se non è l’unica, esiste un criterio di scelta in base al quale si può scegliere la soluzione “giusta” dal punto di vista della “fisica” sottostante il problema?
Per rispondere, occorre innanzitutto introdurre una nozione di soluzione più flessibile di quella classica. Riprendiamo dunque il problema x ∈ R, t > 0 ut + q (u)x = 0 (4.37) u (x, 0) = g (x) x∈R e supponiamo che u sia una soluzione regolare, almeno di classe C 1 in R×[0, ∞). Diciamo allora che u è soluzione classica. Scegliamo ora una funzione v ∈ C 1 (R×[0, ∞)), a supporto compatto, che chiameremo funzione test. Moltiplichiamo l’equazione differenziale per v ed integriamo su R×(0, ∞). Si trova ∞ [ut + q (u)x ] v dxdt = 0. (4.38) 0
R
4.4 Soluzioni integrali
201
Integriamo per parti rispetto alla variabile t il primo termine; si ha (non ci sono problemi nello scambiare l’ordine di integrazione): ∞ ∞ ut v dxdt = − uvt dxdt − u (x, 0) v (x, 0) dx 0 R 0 ∞ R R =− uvt dxdt − g (x) v (x, 0) dx. 0
R
R
Integriamo per parti rispetto alla variabile x il secondo termine; si ha: ∞ ∞ q (u)x v dxdt = − q(u)vx dxdt. R
0
0
La (4.38) diventa ∞ 0
R
R
[uvt + q(u)vx ] dxdt +
g (x) v (x, 0) dx = 0.
(4.39)
R
Abbiamo ottenuto un’equazione integrale, valida qualunque sia la funzione test v. Osserviamo che nella (4.39) non compaiono derivate di u. D’altra parte, se u è regolare, integrando per parti in senso inverso, si arriva facilmente all’equazione ∞ [ut + q (u)x ] v dxdt + [g (x) − u (x, 0)] v (x, 0) dx = 0 (4.40) 0
R
R
vera per ogni funzione test v. Scegliendo le test che si annullano per t = 0, il secondo integrale è nullo per cui si ritrova la (4.38) che, per l’arbitrarietà di v, implica6 ut + q (u)x = 0 in R× (0, +∞) . La (4.40) si riduce allora a [g (x) − u (x, 0)] v (x, 0) dx = 0 R
che, ancora per l’arbitrarietà di v, implica u (x, 0) = g (x)
in R.
Conclusione: per funzioni regolari, il problema (4.37) equivale a richiedere che la (4.39) valga per ogni funzione test. 6
Useremo spesso il seguente lemma di annullamento: Sia f : Ω → R, Ω aperto di Rn , continua. Se f v dx = 0 Ω
per ogni v ∈ C 1 (Ω) a supporto compatto, allora f ≡ 0. Lasciamo la dimostrazione come (utile) esercizio.
202
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Poiché la (4.39) ha senso anche per funzioni non derivabili, essa costituisce una formulazione integrale o debole del problema (4.37). Ciò motiva la seguente definizione. Definizione 4.1. Una funzione u, limitata in R×[0, ∞), si dice soluzione integrale (o debole) del problema (4.37) se l’equazione (4.39) vale per ogni funzione test v in R×[0, ∞), a supporto compatto. Poiché richiediamo che una soluzione integrale sia solo limitata, può benissimo ammettere discontinuità. La Definizione 4.1 sembra dunque abbastanza soddisfacente, data la sua flessibilità. Occorre tuttavia capire quali informazioni sul comportamento di una soluzione debole, per esempio attraverso una linea d’urto, siano nascoste nella formulazione integrale.
4.4.3 Condizione di Rankine-Hugoniot Consideriamo un aperto V contenuto nel semipiano t > 0, diviso in due domini disgiunti V + e V − , separati, come mostrato in Figura 4.17, da una curva (regolare) Γ di equazione x = s (t). Supponiamo ora che u sia una soluzione integrale, di classe C 1 in V + e V − , separatamente, e che lungo Γ presenti una discontinuità a salto. Sappiamo, per quanto visto nella Sezione 4.2, che in V + e V − u è soluzione classica dell’equazione ut + q (u)x = 0. Scegliamo una funzione test v il cui supporto sia contenuto in V ma che intersechi la curva Γ . Possiamo allora scrivere, essendo v (x, 0) = 0:
∞
0= 0 = V+
[uvt + q(u)vx ] dxdt [uvt + q(u)vx ] dxdt + R
V−
[uvt + q(u)vx ] dxdt.
Utilizzando la formula di Gauss-Green e ricordando che v = 0 su ∂V + \Γ , si
Figura 4.17. Dominio diviso da una linea di discontinuità
4.4 Soluzioni integrali
203
ha:
V+
=−
V+
[uvt + q(u)vx ] dxdt =
[ut + q(u)x ] v dxdt + =
u+ n2 + q(u+ )n1 v dl
Γ
u+ n2 + q(u+ )n1 v dl
Γ
dove: u+ indica il valore a cui tende u quando ci si avvicina a Γ da destra, n = (n1 , n2 ) è il versore normale a Γ nel verso uscente da V + e dl indica la lunghezza d’arco su Γ . Analogamente: − [uvt + q(u)vx ] dxdt = − u n2 + q(u− )n1 v dl V−
Γ
dove u− indica il valore a cui tende u quando ci si avvicina a Γ da sinistra. Si deduce quindi che + q(u ) − q(u− ) n1 + u+ − u− n2 v dl = 0. Γ
L’arbitrarietà di v implica che su Γ vale la condizione + q(u ) − q(u− ) n1 + u+ − u− n2 = 0.
(4.41)
Scriviamo la (4.41) in modo più esplicito. Se x = s (t) è l’equazione di Γ ed s ∈ C 1 ([0, T ]), si può scrivere 1
n = (n1 , n2 ) =
1 + s˙ (t)
2
(−1, s˙ (t))
e quindi (4.41) diventa, dopo semplici riaggiustamenti, s˙ =
q(u+ (s, t)) − q(u− (s, t)) . u+ (s, t) − u− (s, t)
(4.42)
Abbiamo così ritrovato la condizione di Rankine-Hugoniot e quindi u è un’onda d’urto. Viceversa, è facile controllare che un’onda d’urto u è anche soluzione integrale. Così pure, raccordando con continuità soluzioni classiche e onde di rarefazione, si costruiscono soluzioni integrali. Le soluzioni che abbiamo trovato nell’esempio del traffico sono dunque soluzioni integrali. La Definizione 4.1 dà una risposta soddisfacente alla prima delle questioni poste all’inizio del Paragrafo 4.4.2. La seconda questione richiede un’ulteriore analisi, come dimostra il prossimo esempio. Esempio 4.2. Non unicità. Immaginiamo un flusso di particelle in moto lungo l’asse x, ciascuna con velocità costante, ed indichiamo con u = u (x, t) il
204
4 Leggi di conservazione scalari ed equazioni del prim’ordine
campo di velocità associato, che assegna la velocità della particella che si trova in x al tempo t. Adottiamo un punto di vista lagrangiano introducendo il cammino x = x (t) di una particella. La sua velocità al tempo t è allora assegnata dalla funzione costante x˙ (t) = u (x (t) , t). Differenziando, otteniamo d u (x (t) , t) = ut (x (t) , t) + ux (x (t) , t) x˙ (t) dt = ut (x (t) , t) + ux (x (t) , t) u (x (t) , t)
0=
che, ritornando ad una visione euleriana, si scrive nella forma 2 u ut + uux = ut + = 0. 2 x Questa equazione differenziale si chiama equazione di Burgers e corrisponde ad una legge di conservazione in cui q (u) =
u2 . 2
Si noti che q è strettamente convessa, q (u) = u e q (u) = 1. Vogliamo esaminare la soluzione del problema ai valori iniziali con condizioni iniziali iniziali u (x, 0) = g (x) dove 0 x<0 g (x) = 1 x > 0. Le caratteristiche sono le rette di equazione x = g (x0 ) t + x0 .
(4.43)
Pertanto, si trova u = 0 se x < 0 e u = 1 se x > t. Nel settore S = {0 < x < t} non passano caratteristiche. Procedendo come nel caso del modello per la coda al semaforo, in S definiamo u come un’onda di rarefazione che raccordi con −1 continuità i valori 0 e 1. Essendo r (s) = (q ) (s) = s, si perviene alla 7 soluzione continua ⎧ 0 x≤0 ⎪ ⎪ ⎨x 0<x
Vedremo più avanti un metodo generale per costruire onde di rarefazione.
4.4 Soluzioni integrali
205
Figura 4.18. Onda di rarefazione e shock non fisico nell’Esempio 4.2
la condizione di Rankine-Hugoniot dà s˙ (t) =
1 q(u+ ) − q(u− ) = . + − u −u 2
Dovendo poi essere s (0) = 0, la linea d’urto è la retta di equazione x= La funzione
w (x, t) =
t . 2 0 1
x< x>
t 2 t 2
è un’altra soluzione integrale (shock non fisico) illustrata in Figura 4.18, in basso. 4.4.4 Condizione di entropia. Problema di Riemann La risposta alla seconda questione posta all’inizio del Paragrafo 4.4.2 è dunque negativa: l’unicità di una soluzione integrale non è garantita. Si pone quindi il problema di stabilire un criterio che permetta di riconoscere quale tra le eventuali soluzioni è quella significativa dal punto di vista fisico. Ritorniamo alle osservazioni fatte a proposito del Microteorema 4.1. As sumiamo g > 0 e q ≥ qmin > 0. La soluzione è classica e unica e inoltre
206
4 Leggi di conservazione scalari ed equazioni del prim’ordine
dalla (4.32), ricaviamo che ux (x, t) =
1 E g (x − q (u) t) ≤ ≤ 1 + tq (u) g (x − q (u) t) tq (u) t
dove E = 1/qmin . Dal teorema del valor medio di Lagrange, deduciamo che vale la seguente condizione, detta di entropia.
Condizione di entropia Esiste E > 0 tale che, per ogni x, z ∈ R, z > 0, e per ogni t > 0, E (4.45) u (x + z, t) − u (x, t) ≤ z. t La condizione di entropia non coinvolge operazioni di derivazione ed ha senso anche per soluzioni discontinue, in particolare per una soluzione integrale. Se una soluzione integrale soddisfa la (4.45) diremo che è una soluzione entropica. Esaminiamone significato e conseguenze. Sia u una soluzione integrale che soddisfi la (4.45). • La funzione
E x t è non crescente. Infatti, posto x + z = x2 , x = x1 , se z > 0 si ha x2 > x1 e la (4.45) equivale a x −→ u (x, t) −
u (x2 , t) − •
E E x2 ≤ u (x1 , t) − x1 . t t
(4.46)
Se (x, t) è un punto di discontinuità per u allora u+ (x, t) < u− (x, t)
(4.47)
dove u± (x, t) = limy→x± u (y, t). Basta infatti scegliere x1 < x < x2 e passare al limite nella (4.46). Se q è strettamente convessa, si ha, dalla (4.47), q(u+ ) − q(u− ) < q u− . q u+ < + − u −u
(4.48)
La condizione di Rankine-Hugoniot implica allora che, se x = s (t) è una linea d’urto, (4.49) q u+ < s˙ < q u− che si chiama disuguaglianza dell’entropia. In termini geometrici: la pendenza di una linea d’urto è minore di quella delle caratteristiche che vi arrivano da sinistra e maggiore di quella delle caratteristiche che vi arrivano da destra. In termini un po’ pittoreschi, le caratteristiche entrano nella linea
4.4 Soluzioni integrali
207
d’urto, cosicché non è possibile percorrere a ritroso nel tempo una caratteristica e imbattersi in uno shock. Quest’ultima osservazione fornisce una vaga giustificazione del termine entropia, poiché esprime una sorta di irreversibilità degli eventi dopo un urto. Infatti, la denominazione ha le sue origini nella dinamica dei gas, dove una condizione come la (4.45) implica che l’entropia cresca attraverso uno shock, come richiesto dalla seconda legge della termodinamica. Queste considerazioni suggeriscono che le soluzioni entropiche sono le sole ad avere un significato fisico. Nell’Esempio 4.3 abbiamo esaminato un caso di non unicità. La soluzione w non soddisfa la condizione di entropia e va considerata come uno shock non fisico. La soluzione corretta in questo caso è l’onda di rarefazione (4.44). < 0 la (4.45) diventerebbe Nota 4.1. Nel caso g < 0 e q < qmax u (x + z, t) − u (x, t) ≥ −
E z t
con E =
1 |qmax |
.
Di conseguenza, in un punto (x, t) di discontinuità, si avrebbe u+ (x, t) > u− (x, t) mentre le (4.48) e (4.49) rimarrebbero invariate. Vale il seguente risultato, che ci limitiamo ad enunciare (per la dimostrazione, si veda e.g. Smoller, 1983). Teorema 4.2. Se q ∈ C 2 (R) è convessa (o concava) e g è limitata, esiste un’unica soluzione integrale del problema x ∈ R, t > 0 ut + q (u)x = 0 (4.50) u (x, 0) = g (x) x∈R che soddisfi la condizione di entropia. Applichiamo il Teorema 4.2 per risolvere esplicitamente il problema (4.50) con dati iniziali u+ x>0 g (x) = − x<0 u dove u+ e u− sono costanti, u+ = u− . Assumiamo q convessa; il caso q concava è analogo. Questo problema è noto come problema di Riemann e riveste particolare imortanza nell’approssimazione numerica per problemi più complessi. Teorema 4.3. Sia q strettamente convessa e di classe C 2 (R), con q ≥ h > 0. a) Se u+ < u− , l’unica soluzione integrale che soddisfa la condizione di entropia è l’onda d’urto + x > s (t) u u (x, t) = − u x < s (t) dove s (0) = 0 e s˙ =
q(u+ (s, t)) − q(u− (s, t)) . u+ (s, t) − u− (s, t)
208
4 Leggi di conservazione scalari ed equazioni del prim’ordine
b) Se u+ > u− , l’unica soluzione integrale che soddisfa la condizione di entropia è l’onda di rarefazione ⎧ − x − u ⎪ t < q (u ) ⎪ ⎨ q (u− ) < xt < q (u+ ) u (x, t) = r xt ⎪ ⎪ ⎩ + x + u t > q (u ) −1
dove r = (q ) , funzione inversa di q . Dimostrazione. a) u è ovviamente una soluzione integrale e poiché u+ < − u , vale certamente la condizione di entropia. La conclusione segue dal Teorema 4.2. b) Poiché r (q (u+ )) = u+ e r (q (u− )) = u− , u è continua nel semipiano t > 0. Controlliamo se u soddisfa l’equazione ut + q (u)x = 0 nella regione x S = (x, t) : q u− < < q u+ . t Posto u (x, t) = r
x t
si ha: ut + q (u)x = −r
x x 1 x2 x 1 x 1 = r q ≡0 + q (r) r (r) − t t2 t t t t t
−1
essendo r = (q ) . Ciò implica, in particolare, che u è una soluzione integrale. Controlliamo infine la condizione di entropia. Basta considerare il caso (perché?) q u− t ≤ x < x + z ≤ q u+ t. Poiché q ≥ h > 0, si ha r (s) =
q
1 1 ≤ (r) h
(s = q (r))
e quindi, per z ∗ opportuno, 0 < z ∗ < z, possiamo scrivere: x x+z u (x + z) − u (x, t) = r −r t t ∗ z 1z x+z = r ≤ t ht t che è la condizione di entropia con E = h1 .
4.4 Soluzioni integrali
209
4.4.5 Soluzioni nel senso della viscosità C’è un altro modo, forse più istruttivo e naturale, per costruire soluzioni discontinue di una legge di conservazione ut + q (u)x = 0,
(4.51)
il cosiddetto metodo di viscosità. Questo metodo consiste nel riguardare l’equazione (4.51) come limite per ε → 0+ dell’equazione ut + q (u)x = εuxx ,
(4.52)
che corrisponde ad una scelta della funzione di flusso q˜ (u, ux ) = q (u) − εux ,
(4.53)
dove ε è un numero positivo piccolo. Sebbene riconosciamo εuxx come un termine di diffusione, questo genere di modello si trova frequentemente in fluidodinamica, dove u e ε rappresentano, rispettivamente, velocità e viscosità del fluido, da cui la denominazione del metodo. Ci sono varie ragioni in favore del metodo di viscosità. Prima di tutto, l’inserimento di una diffusione o di una viscosità, seppur modeste, rende il modello matematico più realistico nella maggior parte delle applicazioni. Osserviamo che il termine εuxx diventa rilevante solo quando uxx è grande, cioè in regioni dove ux subisce rapide variazioni. Per esempio, nel modello di traffico, è naturale ritenere che un automobilista rallenterebbe alla vista di un aumento di traffico. Pertanto, un modello appropriato per la velocità è ρ v˜ (ρ, ρx ) = v (ρ) − ε x ρ che corrisponde a q˜ (ρ, ρx ) = ρv (ρ) − ερx per il flusso di auto. Un’altra ragione risiede nel fatto che un’onda d’urto costruita col metodo della viscosità soddisfa la condizione di entropia e quindi è sempre uno shock fisico. Come per l’equazione di diffusione, in teoria ci aspettiamo un effetto di regolarizzazione istantaneo, anche con dati iniziali discontinui. D’altra parte, il termine di trasporto non lineare q (u)x potrebbe forzare l’evoluzione verso un’onda d’urto. Ci proponiamo di esaminare l’esistenza di soluzioni della (4.52), che connettano due stati costanti uL e uR , ossia che soddisfino le condizioni lim u (x, t) = uL ,
x→−∞
lim u (x, t) = uR .
x→+∞
(4.54)
L’idea è che queste soluzioni, per ε piccolo, approssimino un’onda d’urto per l’equazione senza viscosità. Poiché un’onda d’urto è un’onda progressiva, dove lo shock si muove con la velocità prescritta dalla condizione di RankineHugoniot, cerchiamo soluzioni della (4.52), che siano onde progressive (limitate) che si muovano ad una velocità v, a priori incognita. Queste soluzioni
210
4 Leggi di conservazione scalari ed equazioni del prim’ordine
sono della forma u (x, t) = U (x − vt) ≡ U (ξ) dove abbiamo posto ξ = x − vt, tali che U (−∞) = uL
e
U (+∞) = uR
(4.55)
con uL = uR . Abbiamo: ut = −v
dU , dξ
ux =
dU , dξ
uxx =
d2 U dξ 2
per cui otteniamo per U l’equazione differenziale ordinaria (q (U ) − v)
dU d2 U =ε 2. dξ dξ
Integrando, si trova q (U ) − vU + A = ε
dU dξ
dove A è una costante arbitraria. Assumendo che
dU → 0 per ξ → ±∞ e dξ
usando (4.55), abbiamo q (uL ) − vuL + A = 0
e
q (uR ) − vuR + A = 0.
(4.56)
Sottraendo membro a membro queste due equazioni, si ottiene v=
q (uR ) − q (uL ) ≡ v¯. uR − uL
(4.57)
−q (uR ) uL + q (uL ) uR ¯ ≡ A. uR − uL Se dunque esiste un’onda progressiva soddisfacente le condizioni (4.54), essa si muove con la velocità v¯ predetta dalla formula di Rankine-Hugoniot. Tuttavia, non è ancora chiaro se questa soluzione esista o meno. Esaminiamo allora l’equazione dU ¯ ε = q (U ) − v¯U + A. (4.58) dξ e quindi A =
Dalla (4.56), l’equazione (4.58) ha due punti di equilibrio U = uR e U = uL . Un’onda progressiva limitata che connetta gli stati uR e uL corrisponde a una soluzione della (4.58) uscente da un punto ξ 0 tra uR e uL . D’altra parte, le condizioni (4.55) richiedono che uR sia asintoticamente stabile e che uL sia instabile. A questo punto occorrono informazioni sulla forma di q. Assumiamo q < 0. Allora il diagramma di fase per l’equazione (4.58) è descritto in Figura 4.19, nei due casi uL > uR e uL < uR . Tra uL e uR si ha q (U ) − v¯U + A¯ > 0
4.4 Soluzioni integrali
211
Figura 4.19. Solo il caso b) è compatibile con le (4.54)
e U è crescente, come indicano le frecce. Deduciamo allora che solo il caso uL < uR è compatibile con le condizioni (4.55) e ciò corrisponde precisamente alla formazione di uno shock fisico per l’equazione non viscosa. Di conseguenza, abbiamo q (uL ) − v¯ > 0 e q (uR ) − v¯ < 0 ossia
q (uR ) < v¯ < q (uL )
(4.59)
che è la disuguaglianza dell’entropia. Analogamente, se q > 0, un’onda progressiva che connetta i due stati uR e uL esiste solo se uL > uR e vale la (4.59). Vediamo che cosa succede quando ε → 0+ . Sia q < 0. Per ε piccolo, ci aspettiamo che l’onda progressiva cresca bruscamente da un valore U (ξ 1 ) vicino a uL ad un valore U (ξ 2 ) vicino a uR , in un piccolo intervallo [ξ 1 , ξ 2 ], detto regione di transizione. Per esempio, β > 0, molto vicino a 0 e siano ξ 1 e ξ 2 tali che U (ξ 2 ) − U (ξ 1 ) ≥ (1 − β)(uR − uL ). Definiamo il numero κ (β) = ξ 2 − ξ 1 come ampiezza della regione di transizione. Per calcolarlo, separiamo le variabili U e ξ in (4.58) e integriamo su (ξ 1 , ξ 2 ); si ottiene: ξ2 − ξ1 = ε
U (ξ 2 )
U (ξ 1 )
ds . q (s) − vs + A¯
L’ampiezza della regione di transizione è dunque proporzionale a ε. Quando ε → 0+ , l’intervallo di transizione diventa sempre più piccolo ed alla fine si forma un’onda d’urto che soddisfa la disuguaglianza dell’entropia. Questo fenomeno si vede chiaramente nell’importante caso dell’equazione di Burgers con viscosità che esamineremo in maggior dettaglio nella prossima sottosezione. Esempio 4.3. Onda d’urto per l’equazione di Burgers . Determiniamo un’onda progressiva per l’equazione di Burgers con viscosità ut + uux = εuxx ,
(4.60)
212
4 Leggi di conservazione scalari ed equazioni del prim’ordine
che connetta gli stati uL = 1 e uR = 0. Osserviamo che q (u) = u2 /2 è convessa. Allora v¯ = 1/2 e A¯ = 0. L’equazione (4.58) diventa 2ε
dU = U2 − U dξ
con U (−∞) = 1
e
U (+∞) = 0.
L’equazione differenziale è a variabili separabili è si trova facilmente la soluzione 1 . U (ξ) = ξ 1 + exp 2ε L’onda progressiva è dunque data da u (x, t) = U
x−
t 2
1
= 1 + exp
2x − t 4ε
.
(4.61)
Quando ε → 0+ , u (x, t) → w (x, t) =
0 1
x > t/2 x < t/2
che è l’onda d’urto entropica per l’equazione di Burgers senza viscosità, con dato iniziale 1 se x < 0 e 0 se x > 0.
Figura 4.20. L’onda progressiva dell’Esempio 4.3
4.4 Soluzioni integrali
213
4.4.6 L’equazione di Burgers con viscosità L’equazione di Burgers con viscosità è uno degli esempi più popolari di equazione di diffusione e trasporto nonlineare. La introdusse Burgers nel 1948, come semplificazione dell’equazione di Navier-Stokes, nel tentativo di studiare qualche aspetto della turbolenza. Appare anche in dinamica dei gas, nella teoria delle onde sonore, in alcuni modelli di traffico e costituisce un esempio fondamentale di competizione tra dissipazione (dovuto alla diffusione lineare) e formazione di singolarità (formazione di onde d’urto dovute al termine di trasporto nonlineare uux ). Il successo dell’equazione di Burgers è in larga misura dovuto al fatto, piuttosto sorprendente, che il problema di Cauchy globale può essere risolto analiticamente. Infatti, per mezzo della cosiddetta trasformazione di HopfCole, l’equazione di Burgers si converte nell’equazione del calore. Vediamo come si fa. Scriviamo l’equazione nella forma ∂ 1 2 ∂u (4.62) + u − εux = 0. ∂t ∂x 2 1 La (4.62) implica che il vettore piano −u, u2 − εux è irrotazionale e quindi 2 che esiste un potenziale ψ = ψ (x, t) tale che ψ x = −u
e
ψt =
1 2 u − εux . 2
Pertanto, ψ è soluzione dell’equazione ψt =
1 2 ψ + εψ xx . 2 x
(4.63)
Cerchiamo di liberarci del termine quadratico, ponendo ψ = g (ϕ) e scegliendo g opportunamente. Abbiamo: ψ t = g (ϕ) ϕt ,
ψ x = g (ϕ) ϕx ,
ψ xx = g (ϕ) (ϕx )2 + g (ϕ) ϕxx .
Sostituendo in (4.63) troviamo 1 g (ϕ) [ϕt − εϕxx ] = [ (g (ϕ))2 + εg (ϕ)](ϕx )2 . 2 Scegliendo g (s) = 2ε log s, il secondo membro si annulla e l’equazione per ϕ si riduce a ϕt − εϕxx = 0. (4.64) Se poniamo ψ = 2ε log ϕ, da u = −ψ x otteniamo u = −2ε
ϕx ϕ
(4.65)
214
4 Leggi di conservazione scalari ed equazioni del prim’ordine
che costituisce la trasformazione di Hopf-Cole . Un dato iniziale u (x, 0) = u0 (x)
(4.66)
si trasforma in8
1 ϕ (x, 0) = ϕ0 (x) = exp − 2ε
!
x
u0 (z) dz
(a ∈ R).
(4.67)
a
Se (Teorema 2.8.2) 1 x2
x
u0 (z) dz → 0
per |x| → ∞,
a
il problema di Cauchy (4.64), (4.67) ha un’unica soluzione regolare nel semipiano t > 0, data dalla formula (2.117): 1 ϕ (x, t) = √ 4πεt
+∞
−∞
#
2
(x − y) ϕ0 (y) exp − 4εt
$ dy.
Questa soluzione è continua con la sua derivata ϕx fino a t = 0 in ogni punto di continuità di u0 9 . Di conseguenza, ricordando la (4.65), il problema (4.60), (4.66) ha un’unica soluzione regolare nel semipiano t > 0, continua fino a t = 0 in ogni punto di continuità di u0 , data da # $ 2 +∞ " (x − y) x−y exp − ϕ0 (y) dy t 4εt −∞ # $ u (x, t) = . (4.68) 2 +∞ " (x − y) ϕ0 (y) exp − dy 4εt −∞ Usiamo la formula (4.68) per risolvere il problema di Cauchy per un impulso iniziale. Esempio 4.4. Impulso iniziale. Consideriamo il problema (4.60), (4.66) con la condizione iniziale u0 (x) = M δ (x) dove δ indica la misura di Dirac nell’origine. Abbiamo, scegliendo a = 1, ⎧ ! ⎨1 x x>0 u0 (y) M dy = ϕ0 (x) = exp − x < 0. ⎩ exp 2ε 1 2ε 8 9
La scelta di a è arbitraria e non influisce sul valore finale di u. Controllare.
4.5 Equazioni quasilineari
215
Figura 4.21. Evoluzione di un impulso iniziale per l’equazione di Burger con viscosità (M = 1, ε = 0.04)
La (4.68) dà, dopo qualche calcolo elementare, x2 exp − 4ε 4εt √ u (x, t) = πt 2 π x + 1 − erf √ exp (M/2ε) − 1 2 4εt dove
2 erf(x) = √ π
x
2
e−z dz
0
è la cosiddetta funzione errore.
4.5 Equazioni quasilineari Il metodo delle caratteristiche usato per le leggi di conservazione ha una portata più generale. Ci limitiamo ad illustrare il metodo per equazioni nonlineari in due variabili, dove l’intuizione è facilitata dall’interpretazione geometrica. La generalizzazione a dimensioni superiori non dovrebbe comportare troppe difficoltà e comunque si può consultare, per esempio, F. John, 1974. 4.5.1 Caratteristiche Consideriamo equazioni della forma a (x, y, u) ux + b (x, y, u) uy = c (x, y, u)
(4.69)
216
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.22. Superficie integrale
dove u = u (x, y) e a, b, c sono funzioni continue con le loro derivate prime in Ω × R, dove Ω ⊆ R2 è un aperto connesso. Vediamo subito l’interpretazione geometrica della (4.69). Sia u = u (x, y) una soluzione di classe C 1 (Ω) e consideriamo un punto (x0 , y0 , z0 ) sul suo grafico (quindi z0 = u (x0 , y0 )). Il piano tangente al grafico di u in questo punto ha equazione z − z0 = ux (x0 , y0 ) (x − x0 ) + uy (x0 , y0 ) (y − y0 ) e il vettore n0 = (−ux (x0 , y0 ) , −uy (x0 , y0 ) , 1) è normale al piano. Se introduciamo il vettore v0 = (a (x0 , y0 , z0 ) , b (x0 , y0 , z0 ) , c (x0 , y0 , z0 )) la (4.69) implica che n0 · v0 = 0 e cioè che v0 è tangente al grafico di u (Figura 4.22). In altri termini, la (4.69) indica che v = (a, b, c) definisce un campo di direzioni tangenti al grafico di ogni soluzione. Si dice allora che i grafici delle soluzioni sono superfici integrali del campo di vettori v. Possiamo dunque pensare di costruire queste ultime come unione di linee integrali del campo v, cioè linee tangenti in ogni punto ad un vettore del campo. Queste curve si trovano risolvendo il sistema autonomo di equazioni ordinarie dx = a (x, y, z) , dt
dy = b (x, y, z) , dt
dz = c (x, y, z) dt
(4.70)
4.5 Equazioni quasilineari
217
e si chiamano caratteristiche della (4.69). Si noti che z identifica u lungo le caratteristiche, cioè z (t) = u (x (t) , y (t)) . (4.71) Infatti differenziando la (4.71) ed usando le (4.70) e (4.69), abbiamo dz dx dy = ux (x (t) , y (t)) + uy (x (t) , y (t)) dt dt dt = a (x (t) , y (t) , z (t)) ux (x (t) , y (t)) + b((x (t) , y (t) , z (t)) uy (x (t) , y (t)) = c (x (t) , y (t) , z (t)) . Il calcolo appena fatto indica che, lungo una caratteristica, l’equazione a derivate parziali (4.69) degenera in un’equazione ordinaria. Il seguente teorema è conseguenza dei ragionamenti precedenti e del teorema di esistenza ed unicità per sistemi di equazioni differenziali ordinarie (lasciamo i dettagli della dimostrazione al lettore). Microteorema 5.1. a) Sia S il grafico di una funzione u = u (x, y) di classe C 1 (Ω). Se S è unione di caratteristiche, allora u è soluzione della (4.69). b) Ogni superficie integrale S del campo v è unione di caratteristiche; precisamente, per ogni punto di S passa una e una sola caratteristica, la quale giace interamente su S. c) Due superfici integrali che hanno un punto in comune, hanno in comune la caratteristica che passa per quel punto (esistenza ed unicità della soluzione del problema di Cauchy per equazioni differenziali ordinarie). 4.5.2 Il problema di Cauchy (I) Dal Microteorema 5.1 abbiamo una caratterizzazione generale per le superfici integrali della (4.69) come unione di curve caratteristiche. In situazioni concrete abbiamo avuto modo di constatare che si hanno a disposizione ulteriori informazioni, sotto forma di dati “iniziali”, mediante i quali è desiderabile selezionare una soluzione, possibilmente l’unica. Un modo semplice di assegnare i dati per la (4.69) consiste nel considerare una curva γ 0 nel piano x, y, contenuta in Ω, e prescrivere il valore che u assume su γ 0 . Se x (s) = f (s) ,
y (s) = g (s)
s∈I⊆R
sono le equazioni parametriche di γ 0 , si richiede che u (f (s) , g (s)) = h (s)
s ∈ I,
(4.72)
dove h = h (s) è una funzione assegnata. Assumeremo che I sia un intervallo contenente l’origine s = 0 e che f, g, h siano funzioni derivabili con continuità in I. Il sistema (4.69), (4.72) prende il nome di problema di Cauchy e h si chiama dato iniziale o di Cauchy.
218
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.23. Caratteristiche uscenti da un lato di Γ0
L’interpretazione geometrica del problema di Cauchy è la seguente. Consideriamo, invece della curva γ 0 , la curva Γ0 nello spazio tridimensionale di equazioni parametriche x (s) = f (s) ,
y (s) = g (s) ,
z (s) = h (s) ,
che, come si vede, incorporano il dato di Cauchy: si vuole determinare una superficie integrale che contenga Γ0 (Figura 4.23). La denominazione dato iniziale proviene dal caso particolare in cui si assegna il valore u (x, 0) = h (x) con y che gioca il ruolo di variabile temporale. In questo caso γ 0 è un segmento dell’asse y = 0 e come parametro s si può scegliere x. Le equazioni parametriche di Γ0 sono allora x = x,
y = 0,
z (x) = h (x) .
Per analogia, considereremo spesso Γ0 come curva iniziale. La strategia per risolvere il problema di Cauchy si ricava dal significato geometrico: il grafico di una soluzione u = u (x, y) si costruisce mediante l’unione delle caratteristiche uscenti da Γ0 . Non sempre tuttavia il metodo funziona, come vedremo tra breve. Per determinare le caratteristiche uscenti da Γ0 occorre risolvere il sistema dx = a (x, y, z) , dt
dy = b (x, y, z) , dt
dz = c (x, y, z) , dt
(4.73)
z (s, 0) = h (s) ,
(4.74)
con la famiglia di condizioni iniziali x (s, 0) = f (s) ,
y (s, 0) = g (s) ,
al variare del parametro s. Nelle nostre ipotesi, il problema di Cauchy (4.73),
4.5 Equazioni quasilineari
219
(4.74) ha esattamente una soluzione x = X (s, t) ,
y = Y (s, t) ,
z = Z (s, t)
(4.75)
per t in un intorno di 0 e per i valori del parametro s vicino a 0. Le questioni che si pongono sono le seguenti. a) L’unione delle caratteristiche definite dalla terna di equazioni (4.75) definisce sempre una superficie di equazione z = u (x, y)? b) Quand’anche la risposta alla questione a) fosse positiva, la u così trovata è veramente l’unica soluzione del problema di Cauchy (4.69), (4.72)? Ragioniamo in un intorno di s = t = 0, ponendo X (0, 0) = f (0) = x0 ,
X (0, 0) = g (0) = y0 ,
Z (0, 0) = h (0) = z0 .
La risposta alla questione a) è positiva quando dalle prime due relazioni in (4.75) si possono ricavare s = S (x, y) e t = T (x, y), di classe C 1 in un intorno di (x0 , y0 ), tali che S (x0 , y0 ) = 0,
T (x0 , y0 ) = 0
e che, sostituite nella terza, forniscano z = Z (S (x, y) , T (x, y)) = u (x, y) .
(4.76)
In base al Teorema di Dini sulle funzioni implicite, il sistema X (s, t) = x Y (s, t) = y definisce s = S (x, y)
and
t = T (x, y)
in un intorno di (x0 , y0 ) se ∂ X (0, 0) s J (0, 0) = ∂t X (0, 0)
∂s Y (0, 0) = 0. ∂t Y (0, 0)
(4.77)
Dalle (4.74) e (4.73) si ha ∂s X (0, 0) = f (0) ,
∂s Y (0, 0) = g (0)
e ∂t X (0, 0) = a (x0 , y0 , z0 ) , per cui la (4.77) equivale a f (0) J (0, 0) = a (x0 , y0 , z0 )
∂t Y (0, 0) = b (x0 , y0 , z0 ) , = 0. b (x0 , y0 , z0 ) g (0)
(4.78)
220
4 Leggi di conservazione scalari ed equazioni del prim’ordine
La (4.78) significa che i vettori (a (x0 , y0 , z0 ) , b (x0 , y0 , z0 )) e
(f (0) , g (0))
non sono paralleli. In conclusione: se vale (4.78), la (4.76) definisce una superficie di classe C 1 . Veniamo ora alla questione b). La superficie (4.76) di equazione z = u (x, y) è certamente una superficie integrale, per cui u è soluzione dell’equazione (4.69). Infatti essa è stata costruita in modo che il piano tangente in ogni suo punto contenga le direzioni caratteristiche. Inoltre contiene Γ0 e perciò è soluzione del problema di Cauchy. Infine, se ci fossero due soluzioni “passanti” per Γ0 , in base al Microteorema 5.1.c) dovrebbero contenere le stesse caratteristiche, per cui coinciderebbero. Sintetizziamo le conclusioni nel seguente teorema, dove, ricordiamo, (x0 , y0 , z0 ) = (f (0) , g (0) , h (0)) . Teorema 5.2. Siano a, b, c funzioni di classe C 1 in un intorno di (x0 , y0 , z0 ) e f, g, h di classe C 1 in I. Se J (0, 0) = 0, in un intorno del punto (x0 , y0 ) esiste un’unica soluzione u di classe C 1 del problema di Cauchy a (x, y, u) ux + b (x, y, u) uy = c (x, y, u) (4.79) u (f (s) , g (s)) = h (s) . Nota 5.1. Se i dati a, b, c ed f, g, h sono di classe C k , k ≥ 2, allora anche u è di classe C k (segue dal teorema delle funzioni implicite). Rimane da esaminare che cosa succede quando J (0, 0) = 0, cioè quando i vettori (a (x0 , y0 , z0 ) , b (x0 , y0 , z0 )) e (f (0) , g (0)) sono paralleli. Se supponiamo che esista una soluzione u di classe C 1 del problema di Cauchy, derivando la seconda delle (4.79) si trova h (s) = ux (f (s) , g (s)) f (s) + uy (f (s) , g (s)) g (s) .
(4.80)
Calcolando la (4.69) in x = x0 , y = y0 , z = z0 e la (4.80) in s = 0, otteniamo il sistema algebrico a (x0 , y0 , z0 ) ux (x0 , y0 ) + b (x0 , y0 , z0 ) uy (x0 , y0 ) = c (x0 , y0 , z0 ) (4.81) f (0) ux (x0 , y0 ) + g (0) uy (x0 , y0 ) = h (0) . Poiché u è una soluzione del problema di Cauchy il vettore (ux (x0 , y0 ) , uy (x0 , y0 )) deve essere soluzione del sistema (4.81) ed allora, dall’Algebra Lineare sappiamo che deve valere la seguente condizione di compatibilità: # $ a (x0 , y0 , z0 ) b (x0 , y0 , z0 ) c (x0 , y0 , z0 ) rango di = 1. (4.82) f (0) g (0) h (0)
4.5 Equazioni quasilineari
221
Di conseguenza, i due vettori (a (x0 , y0 , z0 ) b (x0 , y0 , z0 ) , c (x0 , y0 , z0 ))
e
(f (0) , g (0) , h (0)) (4.83)
sono paralleli. Ciò significa che la tangente a Γ0 è parallela alla direzione caratteristica nel punto P0 = (x0 , y0 , z0 ); si dice allora che Γ0 è caratteristica in P0 oppure che il punto P0 è caratteristico per Γ0 . Conclusione: Se J (0, 0) = 0, una condizione necessaria per l’esistenza di una soluzione di classe C 1 del problema di Cauchy è che Γ0 sia caratteristica in P0 = (x0 , y0 , z0 ). Supponiamo ora che l’intera curva Γ0 sia caratteristica e sia P0 = (x0 , y0 , z0 ) ∈ Γ0 . Se scegliamo una curva Γ ∗ trasversale (cioè non tangente) a Γ0 in P0 e risolviamo il problema di Cauchy con Γ ∗ come curva iniziale, dal Teorema 5.2 esiste un’unica superficie integrale che contiene Γ ∗ e che, in base al Microteorema 5.1 c), contiene anche tutta Γ0 . In questo modo possiamo costruire infinite superfici integrali che contengono Γ0 . Sottolineiamo che la condizione (4.82) è compatibile con l’esistenza di una soluzione di classe C 1 in un intorno di P0 solo se Γ0 è caratteristica in P0 . D’altra parte, potrebbe verificarsi il caso in cui J (0, 0) = 0, che Γ0 non sia caratteristica in P0 e che esistano ugualmente soluzioni del problema di Cauchy: naturalmente queste soluzioni non possono essere di classe C 1 . Riassumiamo i passi per risolvere il problema di Cauchy. 1. Al variare del parametro s, si determina la soluzione x = X (s, t) ,
y = Y (s, t) ,
z = Z (s, t)
(4.84)
del sistema di equazioni caratteristiche dx = a (x, y, z) , dt
dy = b (x, y, z) , dt
dz = c (x, y, z) , dt
con le condizioni iniziali x (s, 0) = f (s) ,
y (s, 0) = g (s) ,
z (s, 0) = h (s)
s ∈ I.
2. Si calcola J (s, t) sulla linea Γ0 portante i dati, cioè per t = 0: f (s) g (s) J (s, 0) = Xt (s, 0) Yt (s, 0) g (s) f (s) = . a (f (s) , g (s) , h (s)) b (f (s) , g (s) , h (s)) Si possono verificare i seguenti casi: a. J (s, 0) è sempre diverso da zero in I. In particolare, ciò implica che Γ0 non ha punti caratteristici (cioè punti in cui il vettore tangente è parallelo
222
4 Leggi di conservazione scalari ed equazioni del prim’ordine
ad una linea caratteristica). In tal caso, in un intorno di Γ0 , esiste un’unica soluzione u = u (x, y) del problema di Cauchy, definita dalle equazioni parametriche (4.84); b. J (s0 , 0) = 0 per qualche s0 ∈ I e Γ0 è caratteristica nel punto P0 = (f (s0 ), g (s0 ) , h (s0 )): una soluzione di classe C 1 in un intorno di P0 può esistere solo se la condizione (4.82) è verificata; c. J (s0 , 0) = 0 per qualche s0 ∈ I e Γ0 non è caratteristica nel punto P0 : non esistono soluzioni di classe C 1 in un intorno di P0 . Possono esistere soluzioni meno regolari; d. Γ0 è caratteristica: esistono infinite soluzioni di classe C 1 in un intorno di Γ0 . • Leggi di conservazione non omogenee. Consideriamo una legge di conservazione non omogenea (con t = y) q (u)x + uy = c (x, y, u) con condizione iniziale u (x, 0) = h (x)
x ∈ R.
(4.85)
Le linee caratteristiche sono le curve in R3 soluzioni del sistema dx = q (z) , dt
dy = 1, dt
dz = c (x, y, z) , dt
(4.86)
dove si pensa z (t) = u (x (t) , y (t)), mentre la curva Γ0 portante i dati ha equazioni parametriche x (s) = s,
y (s) = 0,
z (s) = h (s)
s ∈ R.
(4.87)
Le caratteristiche uscenti da Γ0 si ottengono integrando il sistema (4.86) con le condizioni iniziali (4.87). Nel caso omogeneo, cioè c ≡ 0, integrando si trova la famiglia di rette z = h (s) ,
x = q (h (s)) t + s,
y = t.
Essendo z costante, queste rette sono parallele al piano x, y e le loro proiezioni su tale piano, cioè x = q (h (s)) y + s, coincidono con le caratteristiche secondo la definizione data nel Paragrafo 4.3.2. Esempio 5.2. Consideriamo l’equazione di Burgers non omogenea uux + uy = 1
(4.88)
con la condizione iniziale (4.85). Come nell’Esempio 4.2, se y è la variabile temporale, u = u (x, y) rappresenta il campo di velocità di un flusso di particelle distribuite lungo l’asse x.
4.5 Equazioni quasilineari
223
La (4.88) equivale ad affermare che l’accelerazione di ogni particella sia uguale a 1. Le curve caratteristiche sono soluzioni del sistema dx = z (t) , dt
dy = 1, dt
dz =1 dt
(4.89)
e quelle uscenti da Γ0 si ottengono integrando il sistema (4.89) con le condizioni iniziali (4.87). Si trova: X (s, t) = s + Poiché
t2 + th (s) , 2
Y (s, t) = t,
1 + th (s) J (s, t) = t + h (s)
Z (s, t) = t + h (s) .
0 = 1 + th (s) , 1
abbiamo J (s, 0) = 1 e siamo nel caso 2a: in un intorno di Γ0 esiste un’unica soluzione di classe C 1 . Se per esempio h (s) = s, si trova la soluzione z=y+
2x − y 2 2 + 2y
(x ∈ R, y ≥ −1) .
Consideriamo ora il problema di Cauchy per la stessa equazione ma con la condizione iniziale u y 2 , 2y = y che equivale ad assegnare il valore di u sulla parabola x = trizzazione di Γ0 in questo caso è data da x = s2 ,
y = 2s,
y2 4 .
Una parame-
z = s.
Risolvendo il sistema (4.89) con queste condizioni iniziali si trova x = s2 + ts +
t2 , 2
y = 2s + t,
z = s + t.
(4.90)
Osserviamo che Γ0 non è caratteristica in nessun punto, in quanto il vettore tangente (2s, 2, 1) non è parallelo per alcun valore di s alla direzione caratteristica (s, 1, 1). Tuttavia 2s + t 2 = −t J (s, t) = s + t 1 che si annulla per t = 0 e cioè esattamente su Γ0 . Siamo nel caso 2c. Ricavando s, t in funzione di x, y dalle prime due equazioni in (4.90), per t = 0, e sostituendo nella terza troviamo y2 y u (x, y) = ± x − 4 2
224
4 Leggi di conservazione scalari ed equazioni del prim’ordine
e cioè due soluzioni del problema di Cauchy che, nella regione x > 1
y2 4
soddi-
sfano l’equazione differenziale. Nessuna delle due è però di classe C in x ≥ sulla parabola Γ0 non sono differenziabili.
y2 4 :
• Il caso delle equazioni lineari. C’è un altro caso in cui è sufficiente conoscere la proiezione delle caratteristiche 10 sul piano x, y per determinare le soluzioni ed è il caso lineare, in cui i coefficienti a, b e c non dipendono da u. Consideriamo un’equazione della forma a (x, y) ux + b (x, y) uy = 0.
(4.91)
Se introduciamo il vettore w = (a, b) l’equazione si può scrivere nella forma Dw u = ∇u · w = 0. Ogni soluzione è dunque costante lungo le linee di flusso del vettore w (proiezioni delle caratteristiche sul piano x, y), soluzioni del sistema caratteristico ridotto, dx dy = a (x, y) , = b (x, y) dt dt localmente equivalente all’equazione ordinaria b (x, y) dx − a (x, y) dy = 0. Se si riesce a trovare un integrale primo 11 della forma ψ = ψ (x, y), allora la famiglia delle caratteristiche è data in forma implicita da k∈R
ψ (x, y) = k,
e la soluzione generale della (4.91) è assegnata dalla formula u (x, y) = G (ψ (x, y)) , con G funzione arbitraria (regolare), che si seleziona in base ai dati di Cauchy. Esempio 5.3. Risolviamo il problema yux + xuy = 0 u (x, 0) = x4 . Abbiamo w = (y, x) ed il sistema caratteristico ridotto è dx = y, dt 10 11
dy = x, dt
Che continuiamo a chiamare caratteristiche se non c’è rischio di confusione. Un integrale primo (detto anche costante del moto) per un sistema di equazioni ordinarie, x˙ = f (x), è una funzione ϕ = ϕ (x) di classe C 1 , costante lungo le traiettorie del sistema, cioè tale che ∇ϕ · f ≡ 0.
4.5 Equazioni quasilineari
225
localmente equivalente a xdx − ydy = 0. Le linee di flusso di w (le caratteristiche) sono le iperboli di equazione ψ (x, y) = x2 − y 2 = costante. La generica soluzione dell’equazione è pertanto u (x, y) = G(x2 − y 2 ). Imponendo la condizione di Cauchy si trova G x2 = x4 da cui G (r) = r2 . La soluzione del problema di Cauchy è, dunque, u (x, y) = (x2 − y 2 )2 . Esempio 5.4. Un caso interessante si presenta quando si voglia risolvere il problema di Cauchy all’interno di una regione piana D, assegnando i dati su un sottoinsieme del bordo γ di D, che supponiamo sia una curva regolare. In Figura 4.24 è indicata una delle possibili situazioni. Dove occorre assegnare i dati affinché il problema sia ben posto? Poiché ogni soluzione è costante sulle linee di flusso di w, occorre assegnare i dati solo sul sottoinsieme γ − di γ in cui quelle linee entrano nel dominio (inflow boundary): γ − = {σ ∈ γ : w · ν <0} dove ν è il versore normale esterno a γ. I punti in cui w è tangente a γ sono caratteristici; si noti che la condizione di compatibilità (4.82) è sempre verificata, essendo c = 0, h = 0.
Figura 4.24. Frontiera outflow e inflow
226
4 Leggi di conservazione scalari ed equazioni del prim’ordine
4.5.3 Il metodo degli integrali primi Abbiamo visto che, nel caso lineare, possiamo costruire una soluzione generale, dipendente da una funzione arbitraria, dalla conoscenza di un integrale primo del sistema caratteristico ridotto. Il metodo (dovuto a Lagrange) può essere esteso ad equazioni della forma a (x, y, u) ux + b (x, y, u) uy = c (x, y, u) .
(4.92)
Se ϕ = ϕ (x, y, z) e ψ = ψ (x, y, z) sono due integrali primi del sistema caratteristico (4.70), ciòè ∇ϕ · (a, b, c) ≡ 0, ∇ψ · (a, b, c) ≡ 0, diciamo che essi sono indipendenti se ∇ϕ e ∇ψ sono ovunque linearmente indipendenti. Vale allora il seguente Teorema. Teorema 5.3. Siano ϕ = ϕ (x, y, z), ψ = ψ (x, y, z) due integrali primi indipendenti del sistema caratteristico ed F = F (h, k) una funzione di classe C 1 R2 . Se Fh ϕz + Fk ψ z = 0, l’equazione F (ϕ (x, y, z) , ψ (x, y, z)) = 0 definisce la soluzione generale z = u (x, y) di (4.92) in forma implicita. Dimostrazione. È basata sulle due osservazioni seguenti. Primo, la funzione w = F (ϕ (x, y, z) , ψ (x, y, z))
(4.93)
è un integrale primo per il sistema caratteristico. Infatti, ∇w = Fh ∇ϕ + Fk ∇ψ e quindi ∇w · (a, b, c) = Fh ∇ϕ · (a, b, c) + Fk ∇ψ · (a, b, c) ≡ 0 essendo ϕ e ψ integrali primi. Inoltre, per ipotesi, wz = Fh ϕz + Fk ψ z = 0. Secondo, se w è un integrale primo e wz = 0, per il teorema sulle funzioni implicite, l’equazione w (x, y, z) = 0 (4.94) definisce implicitamente, nell’intorno di ogni punto una superficie integrale z = u (x, y) of (4.92). Infatti, poiché w è un integrale primo, soddisfa l’equazione a (x, y, z) wx + b (x, y, z) wy + c (x, y, z) wz = 0.
(4.95)
4.5 Equazioni quasilineari
227
Inoltre, ancora dal teorema della funzioni implicite, abbiamo wx wy uy = − ux = − , wu wu e dalla (4.95) ricaviamo facilmente la (4.92). Nota 5.2. Come conseguenza della dimostrazione, si ricava che la soluzione generale dell’equazione (4.95) è data da w = F (ϕ (x, y, z) , ψ (x, y, z)). Nota 5.3. La ricerca di integrali primi è talvolta semplificata scrivendo il sistema caratteristico nella forma dx dy du = = . a (x, y, u) b (x, y, u) c (x, y, u) Esempio 5.3. Riprendiamo l’equazione uux + uy = 1
(4.96)
e consideriamo il problema di Cauchy con la condizione iniziale 1 2 y , y = y, u 2 che equivale ad assegnare il valore di u sulla caratteristica Γ0 data da 1 x = s2 , y = s, z = s. 2 Siamo dunque nel caso 2d. Per determinare le soluzioni del problema di Cauchy usiamo il metodo di Lagrange. Il sistema caratteristico si può scrivere nella forma dx = dy = dz z ossia dx = zdz, dy = dz. Integrando le due equazioni differenziali si trova, rispettivamente, 1 x − z 2 = c2 , y − z = c1 2 da cui gli integrali primi 1 ϕ (x, y, z) = x − z 2 , ψ (x, y, z) = y − z. 2 Poiché ∇ϕ = (1, 0, −z) e ∇ψ = (0, 1, −1) questi due integrali primi sono indipendenti. Ne segue che la formula 1 F x − z 2 , y − z = 0, 2 definisce implicitamente una famiglia soluzioni della (4.96), dipendente dalla funzione arbitraria (regolare) F . Se si sceglie F in modo che F (0, 0) = 0, anche la condizione di Cauchy è verificata. Si vede così che esistono infinite soluzioni z = u (x, y) del problema originale.
228
4 Leggi di conservazione scalari ed equazioni del prim’ordine
4.5.4 Moto di fluidi nel sottosuolo Consideriamo un fluido (tipo l’acqua) che scorra nel sottosuolo. In ogni volumetto V saranno presenti particelle solide e particelle di fluido, cosicché solo una frazione dello spazio è disponibile per il fluido. Questa frazione, che indichiamo con φ, si chiama porosità e in generale dipende da posizione, temperatura e pressione. Qui supponiamo che φ dipenda solo dalla posizione: φ = φ (x, y, z). Se ρ è la densità del fluido e q = (q1 , q2 , q3 ) è il flusso (velocità per unità di area, con la quale un volume di fluido attraversa una superficie trasversale), la legge di conservazione della massa dà: φρt + div(ρq) = 0. La legge costitutiva (sperimentale) adottata comunemente per q è la legge di Darcy: k q = − (∇p + ρg) μ dove p è la pressione, g è il vettore accelerazione di gravità, k > 0 è detta permeabilità del mezzo (adimensionale) e μ è la viscosità del fluido12 . Si ha allora ρk (∇p + ρg) = 0. φρt − div μ Supponiamo ora che due fluidi immiscibili scorrano nel sottosuolo. Immiscibilità significa che i due fluidi mantengono la loro identità, senza reazioni chimiche o dissoluzione di uno nell’altro. Il coefficiente di porosità φ indica la frazione di spazio disponibile che i due fluidi devono dividersi. Indichiamo con S1 ed S2 le frazioni dello spazio disponibile occupato dai due fluidi. L’ipotesi di immiscibilità implica che le masse dei due fluidi si conservino e quindi abbiamo: φ (S1 ρ1 )t + div(ρ1 q1 ) = 0 φ (S2 ρ2 )t + div(ρ2 q2 ) = 0. La legge di Darcy va modificata inserendo i coefficienti di permeabilità relativa k1 , k2 che dipendono in generale da S1 ed S2 : q1 = − k q2 = − k
k1 (∇p + ρ1 g) μ1
k2 (∇p + ρ2 g) . μ2
Mettismoci ora in condizioni di saturazione. Assumiamo cioè che tutto lo spazio disponibile sia occupato dai fluidi, ossia che S1 + S2 = 1. 12
Viscosità dell’acqua: μ = 1.14 ·
103
Kg × m−1 × s−1 .
4.5 Equazioni quasilineari
229
Poniamo S = S1 (cosicché S2 = 1 − S) e cerchiamo un’equazione per l’evoluzione di S sotto le seguenti ipotesi: – gli effetti gravitazionali e di capillarità sono trascurabili, – k, φ, ρ1 , ρ2 , μ1 , μ2 sono costanti, – k1 , k2 sono funzioni note di S. Le equazioni di conservazione della massa diventano −φSt + div q2 = 0
φSt + div q1 = 0,
(4.97)
e le leggi di Darcy si riducono a q1 = − k
k1 ∇p, μ1
q2 = − k
k2 ∇p. μ2
(4.98)
Sommando le (4.97) e ponendo q = q1 + q2 e si trova div q = 0. Sommando le (4.98) si ha 1 ∇p = − k
k1 k2 + μ1 μ2
da cui 1 div ∇p = Δp = − q · ∇ k
−1 (4.99)
q
k1 k2 + μ1 μ2
−1 .
Dalle prime delle (4.97) e (4.98) e dalla (4.99) si ha allora k1 k1 φSt = − divq1 = k∇ · ∇p + k Δp μ1 μ1 −1 −1 k1 k1 k1 k2 k2 k1 + q·∇ q·∇ + − =− μ1 μ2 μ1 μ1 μ1 μ2 = q · ∇H (S) = H (S) q · ∇S dove abbiamo posto k1 (S) H (S) = − μ1
k1 (S) k2 (S) + μ1 μ2
−1 .
Quando q è noto, la risultante equazione quasilineare per la saturazione S è φSt = H (S) q · ∇S, nota come equazione di Bukley-Leverett. In particolare, se il flusso può essere considerato unidimensionale e costante, cioè q = qi, abbiamo qH (S) Sx − φSt = 0
230
4 Leggi di conservazione scalari ed equazioni del prim’ordine
che è della forma (4.92), con u = S e y = t. Il sistema caratteristico è dx dt dS . =− = qH (S) S φ 0 Due integrali primi sono w1 = φx + qH (S) t
e
w2 = S.
La soluzione generale è quindi data da F (φx + qH (S) t, S) = 0. La scelta F (w1 , w2 ) = w2 − f (w1 ) dà S = f (φx + qH (S) t) che soddisfa la condizione iniziale S (x, 0) = f (φx) .
4.6 Equazioni generali del prim’ordine 4.6.1 Strisce caratteristiche Estendiamo ora il metodo delle caratteristiche a equazioni nonlineari della forma F (x, y, u, ux , uy ) = 0.
(4.100)
Assumiamo che F = F (x, y, u, p, q) sia di classe C 2 in un dominio D ⊆ R5 e, per evitare casi banali, che Fp2 + Fq2 = 0. Nel caso quasilineare F (x, y, u, p, q) = a (x, y, u) p + b (x, y, u) q e Fp = a (x, y, u) ,
Fq = b (x, y, u)
(4.101)
per cui Fp2 + Fq2 = 0 equivale ad affermare che a e b non siano entrambe nulle. Anche la (4.100) ha un’interpretazione geometrica. Sia u = u (x, y) una soluzione regolare e consideriamo un punto (x0 , y0 , z0 ) sul suo grafico. La (4.100) costituisce un legame tra le componenti ux e uy del vettore n0 = (−ux (x0 , y0 ) , −uy (x0 , y0 ) , 1) ,
4.6 Equazioni generali del prim’ordine
231
normale al grafico, ma è più complicato che nel caso quasilineare e non è chiaro a priori quale possa essere il sistema caratteristico 13 . Ragionando per analogia col caso lineare, dalle (4.101) siamo condotti alle equazioni dx = Fp (x, y, z, p, q) dt dy = Fq (x, y, z, p, q) ; dt
(4.102)
dove si deve intendere z = z (t) = u (x (t) , y (t)) e p = p (t) = ux (x (t) , y (t)) ,
q = q (t) = uy (x (t) , y (t)) .
(4.103)
Per z si ricava allora l’equazione differenziale dz dx dy = ux + uy = pFp + qFq . dt dt dt
(4.104)
Le (4.102) e la (4.104) corrispondono al sistema caratteristico (4.70), ma con due funzioni incognite in più : p (t) e q (t). Occorre trovare altre due equazioni differenziali. Procedendo formalmente e usando le (4.102), possiamo scrivere: dp dx dy = uxx + uxy = uxx Fp + uxy Fq . dt dt dt
(4.105)
Si noti che stiamo supponendo che la soluzione u abbia derivate seconde continue! D’altra parte, l’equazione coinvolge solo derivate prime e quindi è bene eliminare le derivate seconde di u dal sistema caratteristico. Poiché u è soluzione di (4.100), si ha l’identità. F (x, y, u (x, y) , ux (x, y) , uy (x, y)) ≡ 0.
(4.106)
Derivando la (4.106) rispetto ad x, si ottiene, essendo uxy = uyx : Fx + Fu ux + Fp uxx + Fq uxy ≡ 0. 13
(4.107)
Se, per esempio, Fq = 0 ed (x0 , y0 , z0 ) è fissato, per il Teorema di Dini l’equazione F (x0 , y0 , z0 , p, q) = 0 definisce q = q (p) per cui F (x0 , y0 , z0 , p, q (p)) ≡ 0. Quindi esiste una famiglia ad un parametro di piani tangenti al grafico di u nel punto (x0 , y0 , z0 ) , data da p (x − x0 ) + q (p) (y − y0 ) − (z − z0 ) = 0. In generale, questa famiglia inviluppa un cono con vertice in (x0 , y0 , z0 ) , detto cono di Monge. Ogni piano tangente tocca il cono di Monge lungo una generatrice.
232
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Calcolando lungo x = x (t), y = y (t), otteniamo uxx Fp + uxy Fq = −Fx − pFu . Ricordando la (4.105) deduciamo per p la seguente equazione differenziale (che non coinvolge derivate seconde): dp = −Fx (x, y, z, p, q) − pFu (x, y, z, p, q) . dt Con calcoli analoghi, si ricava dq = −Fy (x, y, z, p, q) − qFu (x, y, z, p, q) . dt In conclusione, abbiamo il seguente sistema caratteristico di 5 equazioni autonome: dx dy dz = Fp , = Fq , = pFp + qFq (4.108) dt dt dt e dp dq (4.109) = −Fx − pFu , = −Fy − qFu . dt dt Una soluzione (x (t) , y (t) , z (t) , p (t) , q (t)) di questo sistema si chiama striscia caratteristica (Figura 4.25). Le equazioni x = x (t) ,
y = y (t) ,
z = z (t)
rappresentano una curva caratteristica che giace sulla superficie soluzione, mentre p = p (t) , q = q (t) assegnano in ogni punto la direzione del vettore normale ad essa, che possiamo associare ad un pezzo di piano tangente, come mostrato in figura (da cui il nome ”striscia”). È importante osservare che la funzione F = F (x, y, u, p, q) è un integrale primo di (4.108), (4.109). Infatti: d F (x (t) , y (t) , z (t) , p (t) , q (t)) dt dx dy dz dp dq + Fy + Fu + Fp + Fq = Fx dt dt dt dt dt = Fx Fp + Fy Fq + Fu (pFp + qFq ) + Fp (−Fx − pFu ) + Fq (−Fy − qFu ) ≡0
Figura 4.25. Striscia caratteristica
4.6 Equazioni generali del prim’ordine
233
e quindi, se F (x (t0 ) , y (t0 ) , z (t0 ) , p (t0 ) , q (t0 )) = 0 in un punto t0 , allora F (x (t) , y (t) , z (t) , p (t) , q (t)) ≡ 0
(4.110)
su tutta la striscia caratteristica (Figura 4.25) passante per (x (t0 ) , y (t0 ) , z (t0 ) , p (t0 ) , q (t0 )) . 4.6.2 Il problema di Cauchy (II) Come nel caso quasilineare, il problema di Cauchy consiste nel cercare una soluzione u of (4.100), che assuma valori dati su una curva γ 0 assegnata nel piano x, y. Se γ 0 ha la parametrizzazione x = f (s) ,
y = g (s)
s ∈ I ⊆ R,
vogliamo che s ∈ I,
u (f (s) , g (s)) = h (s) ,
dove h = h (s) è una funzione assegnata. Assumiamo che 0 ∈ I e che f, g, h siano funzioni almeno di classe C 1 in I. Sia dunque Γ0 la curva iniziale, parametrizzata da x = f (s) ,
y = g (s) ,
z = h (s) .
(4.111)
Le equazioni (4.111) specificano la condizione “iniziale” solo per x, y e z. Per risolvere il sistema caratteristico dobbiamo prima associare a Γ0 una striscia (f (s) , g (s) , h (s) , ϕ (s) , ψ (s)) dove ϕ (s) = ux (f (s) , g (s)) e ψ (s) = uy (f (s) , g (s)). Le due funzioni ϕ (s) e ψ (s) rappresentano le condizioni iniziali per p e q e non possono essere assegnate arbitrariamente. Infatti, una prima condizione che ϕ (s) e ψ (s) devono soddisfare è (ricordare la (4.110)) F (f (s) , g (s) , h (s) , ϕ (s) , ψ (s)) ≡ 0.
(4.112)
Una seconda condizione si ricava differenziando la relazione h (s) = u (f (s) , g (s)). Il risultato è l’equazione h (s) = ϕ (s) f (s) + ψ (s) g (s) ,
(4.113)
detta condizione di aderenza (strip condition). Siamo ora in posizione per indicare una procedura (formale, per ora) per costruire una soluzione del nostro problema di Cauchy: Determinare una superficie integrale u = u (x, y) di F (x, y, u, ux , uy ) = 0, contenente la curva iniziale (f (s) , g (s) , h (s)), con s in un intorno di 0.
234
4 Leggi di conservazione scalari ed equazioni del prim’ordine
1. Per completare la striscia iniziale si determinano ϕ (s) e ψ (s) dal sistema F (f (s) , g (s) , h (s) , ϕ (s) , ψ (s)) = 0 (4.114) ϕ (s) f (s) + ψ (s) g (s) = h (s) . 2. Si risolve il sistema caratteristico (4.108), (4.109) con condizioni iniziali x (0) = f (s) , y (0) = g (s) , z (0) = h (s) , p (0) = ϕ (s) , q (0) = ψ (s) . Poiché F è di classe C 2 , esiste un’unica soluzione in un intorno di t = 0, per ogni s ∈ I. Supponiamo di aver trovato le soluzioni x = X (s, t) , y = Y (s, t) , z = Z (s, t) , p = P (s, t) , q = Q (s, t) . 3. Si risolve il sistema x = X (s, t) , y = Y (s, t) determinando s = S (x, y) e t = T (x, y). Sostituendo in z = Z (s, t), si ottiene una soluzione della forma z = u (x, y). Esempio 6.1 (accademico). Risolviamo l’equazione u = u2x − 3u2y con la condizione iniziale u (x, 0) = x2 . Abbiamo F (p, q) = p2 − 3q 2 − u e il sistema caratteristico è dx = 2p, dt
dy = −6q, dt
dz = 2p2 − 6q 2 = 2z dt
dp dq = p, = q. dt dt Una parametrizzazione della curva iniziale Γ0 è data da
(4.115) (4.116)
f (s) = s, g (s) = 0, h (s) = s2 . 1. Per completare la striscia iniziale, risolviamo il sistema 2 ϕ − 3ψ 2 = s2 ϕ = 2s. Si trovano le due soluzioni ϕ (s) = 2s,
ψ (s) = ±s.
2. Scegliamo prima ψ (s) = s e integriamo il sistema caratteristico con le condizioni iniziali x (0) = s, y (0) = 0, z (0) = s2 , p (0) = 2s, q (0) = s. Integrando le (4.116), si trova P (s, t) = 2set ,
Q (s, t) = set
4.6 Equazioni generali del prim’ordine
235
e quindi, dalle (4.115), x = X (t, s) = 4s(et − 1) + s,
y = Y (t, s) = −6s(et − 1),
z = Z (t, s) = s2 e2t . 3. Ricavando s, t in funzione di x, y dalle prime due equazioni e sostituendo nella terza si ottiene y 2 . u (x, y) = x + 2 Scegliendo ψ (s) = −s si trova y 2 u (x, y) = x − . 2 Come si vede non ci si può aspettare in generale unicità per la soluzione del problema di Cauchy, a meno che il sistema (4.114) abbia un’unica soluzione. D’altro canto, se questo sistema non ha soluzioni (reali), allora anche il problema di Cauchy non ha soluzioni. Osserviamo, inoltre, che, posto (x0 , y0 , z0 ) = (f (0) , g (0) , h (0)), se (p0 , q0 ) è una soluzione del sistema F (x0 , y0 , z0 , p0 , q0 ) = 0 (4.117) p0 f (0) + q0 g (0) = h (0) , per il teorema delle funzioni implicite, la condizione f (0) Fp (x0 , y0 , z0 , p0 , q0 ) = 0 g (0) Fq (x0 , y0 , z0 , p0 , q0 )
(4.118)
assicura l’esistenza di una soluzione ϕ (s) e ψ (s) di (4.114) in un intorno di s = 0. Se f , g, h, sono di classe C 2 , ϕ e ψ risultano di classe C 1 . La (4.118) corrisponde alla (4.78) nel caso quasilineare. Il seguente teorema formalizza e raccoglie i rsultati sul problema di Cauchy F (x, y, u, ux , uy ) = 0
(4.119)
con curva iniziale Γ0 di equazioni parametriche x = f (s) , y = g (s) , z = h (s) .
(4.120)
Teorema 6.1. Assumiamo che: i) F ha due derivate continue rispetto a tutti i suoi argomenti in un dominio D ⊆ R5 e Fp2 + Fq2 = 0, ii) f, g, h hanno due derivate continue in un intorno di 0, iii) (p0 , q0 ) è soluzione del sistema (4.117) e vale la (4.118). Allora, in un intorno del punto (x0 , y0 ), esiste una soluzione z = u (x, y) di classe C 2 del problema (4.119), (4.120).
236
4 Leggi di conservazione scalari ed equazioni del prim’ordine
4.6.3 Ottica geometrica • Ottica geometrica. In ottica geometrica si studia la propagazione di un’onda in termini della posizione del fronte d’onda. Ragionando per semplicità in due dimensioni spaziali, supponiamo che un’onda si propaghi nel piano x, y con velocità c, costante, e che i fronti d’onda siano curve γ t descritte al variare del tempo t dall’equazione u (x, y) = t. Vogliamo ricavare un’equazione per u. Osserviamo che le traiettorie luminose (raggi )˙ costituiscono la famiglia delle traiettorie ortogonali ai fronti d’onda. Pertanto, se (x (t) , y (t)) è la posizione di un punto generico su un raggio luminoso al tempo t, vale l’identità u (x (t) , y (t)) = t
(4.121)
e il vettore velocità v (t) = (x˙ (t) , y˙ (t)) soddisfa le condizioni ' |v| = x˙ 2 + y˙ 2 = c v parallelo a ∇u.
(4.122)
Differenziando la (4.121), si ha ∇u · v = ux x˙ + uy y˙ = 1. Essendo v parallelo a ∇u deve essere |∇u · v| = |∇u| |v| = c |∇u| e quindi c |∇u| = 1, ossia c2 u2x + u2y = 1 (4.123) che si chiama equazione eikonale. Osserviamo che, fissato il punto (x0 , y0 , z0 ), l’equazione c2 (p2 + q 2 ) = 1 definisce una famiglia di piani passanti per (x0 , y0 , z0 ), di equazione z − z0 = p (x − x0 ) + q (y − y0 ) che formano con l’asse z un angolo fisso θ = arctan c. Questi piani sono i possibili piani tangenti alla superficie soluzione nel punto (x0 , y0 , z0 ) e inviluppano un cono, detto cono di luce 14 , con asse coincidente con l’asse z e apertura 2θ. L’equazione di questo cono è, dunque, 2
2
2
(x − x0 ) + (y − y0 ) = c2 (z − z0 ) . L’equazione eikonale è della forma (4.100) con 15 1 2 2 c (p + q 2 ) − 1 . 2 Il sistema caratteristico è, usando τ come parametro per evitare confusioni con la variabile temporale: F (x, y, u, p, q) =
dx = c2 p, dτ 14 15
dy = c2 q, dτ
dz = c2 p2 + c2 q 2 = 1 dτ
Per equazioni generali coincide col cono di Monge. Il fattore 12 è inserito per ragioni estetiche.
4.6 Equazioni generali del prim’ordine
237
dp dq = 0, = 0. dτ dτ Dalle ultime due equazioni, p e q risultano costanti lungo le caratteristiche. Dati i valori iniziali (x0 , y0 , z0 , p0 , q0 ) con p0 , q0 tali che c2 (p20 + q02 ) = 1, la caratteristica corrispondente è la retta x = x0 + c2 p0 τ ,
y = y 0 + c2 q 0 τ ,
z = z0 + τ
(4.124)
ed è naturale identificare il parametro τ con il tempo trascorso da un tempo iniziale z0 . Una curva iniziale Γ di equazioni parametriche x = f (s) ,
y = g (s) ,
z = h (s)
può essere completata in una striscia iniziale, scegliendo φ e ψ in modo da soddisfare il sistema 2 2 c2 φ (s) + ψ (s) = 1 (4.125) φ (s) f (s) + ψ (s) g (s) = h (s) . Ci si convince facilmente che tale sistema ha due soluzioni distinte se 2
2
f (s) + g (s) > c2 h (s)
2
(4.126)
mentre non ha soluzioni se16 2
2
2
f (s) + g (s) < c2 h (s) .
(4.127)
Se vale la (4.126), il vettore tangente a Γ in ogni suo punto forma un angolo maggiore di θ con l’asse z e quindi Γ si trova all’esterno del cono di luce, ad eccezione ovviamente del vertice. In questo caso Γ si dice spacelike ed esistono due soluzioni distinte del problema di Cauchy. Se vale la (4.127), la curva Γ è interna al cono di luce e non esistono superfici passanti per Γ , tangenti ad una generatrice del cono di luce (Figura 4.26). La curva si dice timelike e non esistono soluzioni del problema di Cauchy. Date una curva space-like Γ e due soluzioni φ, ψ del sistema (4.125), la striscia caratteristica corrispondente è, per s fissato: x (t) = f (s) + c2 φ (s) t,
y (t) = g (s) + c2 ψ (s) t,
p (t) = φ (s) , 16
z (t) = h (s) + t (4.128)
q (t) = ψ (s) .
Risolvere il sistema (??) equivale a determinare l’intersezione tra la circonferenza ξ 2 + η 2 = c−2 e la retta f ξ + g η = h . La distanza del centro (0, 0) dalla retta è data da |h | d= (f )2 + (g )2 per cui ci sono sue intersezioni d < c−1 , nessuna se d > c−1 .
238
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.26. Curve space-like e time-like
Osserviamo che il punto (x (t) , y (t)) si muove lungo la caratteristica con velocità ' x˙ 2 (t) + y˙ 2 (t) = φ2 (s) + ψ 2 (s) = c e direzione (φ (s) , ψ (s)) = (p (t) , q (t)) . Le linee caratteristiche sono dunque coincidenti con i raggi di luce. Inoltre i fronti d’onda γ t possono essere costruiti a partire da γ 0 spostando ogni punto di γ 0 lungo una caratteristica alla distanza ct. I fronti d’onda costituiscono dunque una famiglia di curve “parallele”. Esempio 6.2. Risolviamo il problema di Cauchy con condizioni iniziali date da x = cos s, y = sin s, z=0 che corrisponde al cerchio unitario nel piano x, y. Questa curva è certamente 2 2 spacelike, essendo h (s) = 0 e (− sin s) + (cos s) = 1. Per completare la striscia iniziale, occorre scegliere φ e ψ tali che 2 2 c2 φ (s) + ψ (s) = 1, φ (s) (− sin s) + ψ (s) (cos s) = 0. Si trovano le due soluzioni φ (s) = ±
cos s , c
ψ (s) = ±
sin s . c
Dalle (4.124) si trovano le caratteristiche x = cos s(1 ± cτ ),
y = sin s(1 ± cτ ),
z = τ.
Quadrando e sommando le prime due equazioni e tenendo conto della terza, si trova 2 x2 + y 2 = (1 ± cz) da cui le due soluzioni (coni) z ± = u± (x, y) =
' ±1 1 − x2 + y 2 . c
Problemi
239
Figura 4.27. Fronti d’onda nell’Esempio 6.2
I fronti d’onda di u+ = t sono cerchi concentrici che convergono all’origine al tempo t = 1/c; quelli di u− si allontanano dall’origine (Figura 4.27). Problemi 4.1. Usando il metodo di Duhamel (Paragrafo 2.8.3) risolvere il problema x ∈ R, t > 0 ct + vcx = f (x, t) c(x, 0) = 0 x ∈ R. [Suggerimento. Per s ≥ 0 fissato e t > s, risolvere il problema wt + vwx = 0 w (x, s; s) = f (x, s) . Integrare poi w rispetto ad s su (0, t)]. 4.2. Si consideri il seguente problema ⎧ ⎪ ⎨ ut + aux = f (x, t) u (0, t) = 0 ⎪ ⎩ u (x, 0) = 0 Dimostrare la stima di stabilità t R u2 (x, t) dx ≤ et 0
0
R
(a > 0): 0 < x < R, t > 0 t>0 0 < x < R.
f 2 (x, s) dxds,
t > 0.
0
[Suggerimento. Moltiplicare per u l’equazione. Usare a > 0 e la disuguaglianza 2f u ≤ f 2 + u2 per ottenere R R d R 2 u (x, t) dx ≤ f 2 (x, t) dx + u2 (x, t) dx. dt 0 0 0
240
4 Leggi di conservazione scalari ed equazioni del prim’ordine
"R "R Porre E (t) = 0 u2 (x, t) dx, G (t) = 0 f 2 (x, t) dx. Dimostrare che se E (t) soddisfa le condizioni E (t) ≤ G (t) + E (t) , allora E (t) ≤ et
"t 0
G (s) ds].
4.3. Studiare il problema ut + uux = 0 u (x, 0) = g (x) con dato iniziale
E (0) = 0
⎧ ⎨2 g (x) = 1 ⎩ 0
x ∈ R, t > 0 x∈R x<0 0<x<1 x > 1.
4.4. Nel caso del traffico al semaforo della Sezione 4.3, calcolare: a) la densità di auto al semaforo per t > 0; b) il tempo impiegato da un’auto che si trova al tempo t0 nel punto x0 = −vm t0 per superare il semaforo. [Suggerimento. b) Se x = x (t) è la posizione dell’auto al tempo t, mostrare che x˙ (t) = v2m + x(t) 2t ]. 4.5. Supponiamo che la densità iniziale di traffico sia data da ρ1 x<0 ρ0 (x) = ρm x > 0. Al variare di 0 < ρ1 < ρm , determinare le caratteristiche, le eventuali onde d’urto e costruire una soluzione in tutto il piano (x, t). Interpretare il risultato. 4.6. Traffico al semaforo seguito da luce verde. Utilizzando il modello di traffico della Sezione 4.3, considerare il seguente problema, in cui un semaforo è posto nell’origine. All’istante t = 0, la luce al semaforo diventa rossa e ridiventa verde al tempo t = 2. 1) Scrivere il modello matematico del problema. Analizzarlo nei due casi in cui la densità iniziale di traffico per x < 0 è uguale a ρ (x, 0) = ρm /2 oppure a ρ (x, 0) = ρm /8. In particolare, determinare le caratteristiche e la linea di schock prima e dopo t = 2. 2) Disegnare le traiettorie della auto, al variare della loro posizione iniziale x0 < 0. [Risposta parziale. 1) L’equazione della linea d’urto è −v m t 0 4.
Problemi
241
2) La traiettoria dell’auto che si trova in x0 = −4vm al√ tempo t = 0 ha equazione x (t) = v2m t − 4vm per 0 < t ≤ 4 e x (t) = −2vm t − 2 + vm (t − 2) per t > 4]. 4.7. Traffico in un tunnel. Un modello realistico per la velocità in un tunnel molto lungo è il seguente vm 0 ≤ ρ ≤ ρc v (ρ) = ρm λ log ρ ρc ≤ ρ ≤ ρm dove λ = log(ρvm/ρ ) . Si noti che v è continua anche nel punto ρc = ρm e−vm /λ , m c che rappresenta una densità critica, al di sotto della quale gli automobilisti sono liberi di viaggiare alla velocità massima. Valori attendibili sono ρc = 7 auto/Km, vm = 90 Km/h, ρm = 110 auto/Km, vm /λ = 2.75. Supponiamo che l’ingresso del tunnel sia in x = 0, che il tunnel apra al traffico al tempo t = 0 e che precedentemente si sia accumulata una coda prima dell’ingresso. Il dato iniziale è quindi ρm x<0 ρ= 0 x > 0. a) Determinare densità e velocità del traffico e disegnarne i grafici in funzione del tempo. b) Determinare e disegnare nel piano x, t la traiettoria di un’auto che si trova inizialmente in x = x0 < 0 e calcolare quanto tempo impiega ad entrare nel tunnel. 4.8. Consideriamo l’equazione ut + q (u) ux = 0, con condizione iniziale u (x, 0) = g (x). Supponiamo che g, q ∈ C 1 (R) e g (ξ) q (g (ξ)) < 0 in [a, b] . Mostrare che la famiglia di caratteristiche x = q (u) t + ξ,
ξ ∈ [a, b]
(4.129)
ammette inviluppo e che il punto (xs , ts ) di partenza dello shock, dato dalle formule (4.33) e (4.34), è il punto dell’inviluppo con la minima coordinata temporale (Figura 4.28). 4.9. Sia dato il seguente problema nel quadrante x > 0, t > 0 : ⎧ x > 0, t > 0 ⎨ ut + uux = 0 u (x, 0) = 1 − x x>0 ⎩ u (0, t) = 1 t > 0. a) Scrivere l’equazione delle caratteristiche uscenti sia dall’asse x, sia dal’asse t. b) Controllare che si forma uno shock e determinare l’equazione della linea d’urto.
242
4 Leggi di conservazione scalari ed equazioni del prim’ordine
Figura 4.28. Inviluppo di caratteristiche e formazione di uno shock
4.10. Disegnare le caratteristiche e descrivere qualitativamente l’evoluzione per t → +∞ della soluzione del seguente problema: ⎧ ⎨ ut + uux =0 sin x ⎩ u (x, 0) = 0
t > 0, x ∈ R 0<x<π x ≤ 0 o x ≥ π.
Figura 4.29. La soluzione del Problema 4.10. Visibili l’onda di rarefazione e la successiva formazione di un’onda d’urto
4.11. Mostrare che, per ogni α > 1, la funzione ⎧ −1 ⎪ ⎪ ⎨ −α uα (x, t) = α ⎪ ⎪ ⎩ 1
2x < (1 − α) t (1 − α) t < 2x < 0 0 < 2x < (α − 1) t (α − 1) t < 2x
Problemi
è soluzione debole del problema ⎧ ⎨ ut + uux =0 −1 ⎩ u (x, 0) = 1
243
t > 0, x ∈ R x<0 x > 0.
È anche una soluzione entropica, almeno per qualche α? 4.12. Usando la trasformazione di Hopf-Cole, determinare la soluzione del seguente problema: t > 0, x ∈ R ut + uux = εuxx u (x, 0) = 1 − H (x) x ∈ R, dove H è la funzione di Heaviside. Mostrare poi che u (x, t) converge ad un’onda progressiva simile alla (4.61) per t → +∞. [Risposta. La soluzione è u (x, t) =
1 erfc −x/ 4εt x − t/2 √ exp 1+ 2ε erfc (x − t)/ 4εt √
dove 2 erfc (s) = √ π
+∞ exp −z 2 dz s
è la funzione errore complementare ].
Figura 4.30. Evoluzione della soluzione del Problema 4.12 verso un’onda progressiva per t = 0.5, 2, 10, 20, 30, 40, 50, 60, con ε = 2
4.13. Determinare la soluzione dell’equazione lineare ux + xuy = y soddisfacente la condizione iniziale u (0, y) = g (y), y ∈ R, con (a) g (y) = cos y
e
(b) g (y) = y 2 .
244
4 Leggi di conservazione scalari ed equazioni del prim’ordine
3 2 [Risposta. (a): u (x, y) = xy − x3 + cos y − x2 ]. 4.14. Sia D = (x, y) : y > x2 e a = a (x, y) sia una funzione continua in D. 1) Studiare la risolubilità del problema semilineare a (x, y) ux − uy = −u (x, y) ∈ D 2 x ∈ R. u x, x = g (x) 2) Esaminare il caso a (x, y) = y/2
g (x) = exp −γx2 ,
e
dove γ è un parametro reale. 4.15. Risolvere il problema di Cauchy xux − yuy = u − y u y2 , y = y
x > 0, y > 0 y > 0.
Esistono soluzioni in un intorno dell’origine? [Risposta: u (x, y) = y + x2/3 y −1/3 /2. Non possono esistere soluzioni in alcun intorno dell’origine]. 4.16. Si consideri un tubo cilindrico con asse lungo l’asse x, occupato da un fluido che si muove nel verso destra. Siano ρ = ρ (x, t) and q = 12 ρ2 la densità del fluido e la funzione flusso, rispettivamente. Assumiamo che le pareti del tubo siano composte da materiale poroso, da cui il fluido esce al tasso (densità su tempo) H = kρ2 . a) Seguendo la derivazione della legge di conservazione data nella prima sezione, mostrare che ρ soddisfa l’equazione ρt + ρρx = −kρ2 . b) Risolvere il problema di Cauchy con ρ (x, 0) = 1. [Risposta. b) ρ (x, t) = 1/ (1 + kt)]. 4.17. Risolvere il problema di Cauchy ux = −(uy )2 x > 0, y ∈ R , u (0, y) = 3y y ∈ R. 4.18. Risolvere il problema di Cauchy u2x + u2y = 4u u (x, −1) = x2 2
[Risposta: u (x, y) = x2 + (y + 1) ].
x ∈ R.
5 Onde e vibrazioni
5.1 Concetti generali Quotidianamente abbiamo a che fare con onde sonore, onde elettromagnetiche (come le onde radio o quelle luminose), onde d’acqua, in superficie o in profondità, onde elastiche nei solidi. Fenomeni ondosi emergono anche in contesti e in modi meno macroscopici e noti, come nel caso di onde di rarefazione e d’urto in un flusso di traffico o in quello delle onde elettrochimiche che regolano il battito del cuore o il controllo dei movimenti attraverso impulsi nervosi. La fisica quantistica, poi, ci ha rivelato che tutto può essere descritto in termini di onde, ad una scala sufficientemente piccola. Sorprendentemente, la definizione di onda non è così facile da confezionare in modo da comprendere, per esempio, tutti i fenomeni appena citati. Consultando lo Zingarelli, alla voce onda o meglio onde (fis.) si trova: Movimenti periodici oscillatori e vibratori propagati attraverso un mezzo continuo. Possiamo certamente adottare un un atteggiamento pragmatico e accontentarci di questa definizione anche se: le onde stazionarie non si propagano; nelle onde di rarefazione o d’urto in un flusso di traffico ciò che si propaga non è un movimento, ma un segnale (aumento o diminuzione della densità d’auto); l’interazione con il mezzo circostante è molto diversa quando si tratti di onde d’acqua in uno stagno, che lasciano invariato il mezzo al loro passaggio, o quando si tratti di onde chimiche che mutano lo stato delle specie reagenti al loro passaggio; vi sono onde che non hanno bisogno di un mezzo che le “sostenga” per propagarsi, per esempio le onde elettromagnetiche. Forse, semplicemente, non esiste una singola definizione di onda! 5.1.1 Tipi di onde In questa sezione introduciamo un po’ di terminologia ed alcuni concetti generali. Cominciamo in dimensione spaziale n = 1. a. Onde progressive (travelling waves). Sono onde descritte da una Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
246
5 Onde e vibrazioni
funzione del tipo u (x, t) = g (x − ct) . Per t = 0, si ha u (x, 0) = g (x), che è il profilo “iniziale” della perturbazione. Questo profilo si propaga inalterato nella forma con velocità |c|, verso destra (sinistra) se c > 0 (c < 0). Abbiamo già incontrato onde di questo tipo nei capitoli 2 e 4. b. Fra le onde progressive, hanno particolare importanza le onde armoniche, della forma u (x, t) = A exp {i (kx − ωt)} ,
A, k, ω ∈ R
(5.1)
con la tacita intesa di considerarne solo la parte reale A cos (kx − ωt) . La forma esponenziale complessa è spesso più maneggevole nei calcoli. Nella Figura 5.1 distinguiamo, considerando per semplicità ω e k positivi: • l’ampiezza dell’onda |A|; • il numero d’onde k, ossia il numero di oscillazioni complete nell’intervallo [0, 2π], e la lunghezza d’onda 2π λ= k ossia la distanza tra successivi massimi (creste) o minimi; • la frequenza angolare ω e la frequenza f=
ω 2π
ossia il numero di oscillazioni complete nell’unità di tempo (Hertz); • la velocità dell’onda o velocità di fase, cp =
ω k
ossia la velocità con cui viaggiano le creste (per esempio);
Figura 5.1. Onda sinusoidale
5.1 Concetti generali
247
c. Onde stazionarie. Sono onde descritte da espressioni del tipo u (x, t) = B cos kx cos ωt. Queste onde presentano un’onda base sinusoidale cos kx, modulata nel tempo in ampiezza da B cos ωt. Un’onda stazionaria si ottiene, per esempio, sovrapponendo due onde armoniche con ampiezza identica, propagantisi in direzioni opposte: A cos(kx − ωt) + A cos(kx + ωt) = 2A cos kx cos ωt.
(5.2)
Passiamo in dimensione spaziale n > 1. d. Onde piane. Le onde progressive scalari sono della forma u (x,t) = f (k · x−ωt) . La perturbazione si propaga nella direzione k con velocità cp = ω/ |k|. I piani ortogonali a k di equazione θ (x, t) = k · x−ωt = costante, costituiscono i fronti d’onda. Il caso particolare u (x, t) = A exp {i (k · x−ωt)} corrisponde alle onde piane armoniche o monocromatiche. Qui k è il vettore numero d’onde e ω è la frequenza angolare. Gli scalari |k| /2π e ω/2π danno, rispettivamente, numero d’onde per unità di lunghezza e numero di oscillazioni complete al secondo (Hertz) in una posizione fissata. e. Le onde sferiche hanno la forma u (x,t) = v (r, t) dove r = |x − x0 | e x0 ∈ Rn è un punto fisso. In particolare, u (x,t) = eiωt v (r) rappresenta un’onda stazionaria sferica mentre u (x,t) = v (r − ct) è un’onda progressiva i cui fronti d’onda coincidono con le sfere di equazione r − ct = costante, in moto a velocità |c| (uscenti o outgoing se c > 0, entranti o incoming se c < 0). 5.1.2 Velocità di gruppo e relazione di dispersione. Molti sistemi fisici possono essere modellati da equazioni che hanno onde armoniche come soluzioni ma con la frequenza angolare funzione nota del numero d’onde, in generale non lineare: ω = ω (k) .
(5.3)
248
5 Onde e vibrazioni
Un esempio tipico è il sistema d’onde prodotto da un sasso che cade in uno stagno. Nel caso lineare, se cioè ω (k) = ck, c costante, le creste si muovono con velocità c indipendente dal numero d’onde (quindi indipendente dalla lunghezza d’onda). Se però ω (k) non è proporzionale a k, le creste si muovono con velocità cp = ω (k) /k, che dipende dal numero d’onde. In altri termini, le creste si muovono con velocità diverse in corrispondenza a diverse lunghezze d’onda. In un pacchetto d’onde costituito dalla sovrapposizione di onde armoniche di diversa lunghezza d’onda, ciò comporta, a regime, una separazione o dispersione delle varie componenti. Per questa ragione, la relazione ω = ω (k) è detta relazione di dispersione. Nella teoria delle onde dispersive, la velocita di gruppo, data da cg = ω (k) , è un concetto centrale, per i seguenti motivi. 1. È la velocità alla quale viaggia (come insieme) un pacchetto d’onde isolato. Un pacchetto d’onde si ottiene dalla sovrapposizione di onde armoniche dispersive, per esempio attraverso un integrale di Fourier del tipo +∞ a (k) ei[kx−ω(k)t] dk (5.4) u (x, t) = −∞
dove sempre s’intende che si debba considerare solo la parte reale. Consideriamo un pacchetto d’onde localizzato, con numero d’onde quasi costante k ≈ k0 e con ampiezze lentamente variabili rispetto a x. Allora il pacchetto contiene un grande numero di creste e le ampiezze |a (k)| delle varie componenti di Fourier saranno molto piccole, tranne che in prossimità di k0 , diciamo in un intervallo (k0 − δ, k0 + δ). La Figura 5.2 mostra il profilo iniziale, al tempo t = 0, di un pacchetto d’onde Gaussiano, 2! 3 x √ Re u (x, 0) = cos 14x, exp − 32 2 lentamente modulato in x, con k0 = 14, e la sua trasformata di Fourier: 2 a (k) = 6 exp −8 (k − 14) . Come si vede, le ampiezze |a (k)| delle componenti di Fourier sono apprezzabilmente non nulle solo per k in prossimità di k0 . Possiamo allora scrivere, al prim’ordine, ω (k) ≈ ω (k0 ) + ω (k0 ) (k − k0 ) = ω (k0 ) + cg (k − k0 ) e quindi u (x, t) ≈ ei{k0 x−ω(k0 )t}
k0 +δ
k0 −δ
a (k) ei(k−k0 )(x−cg t) dk.
(5.5)
5.1 Concetti generali
249
Figura 5.2. Pacchetto d’onde e sua trasformata di Fourier
Dunque, u risulta essere ben approssimata dal prodotto di due onde. La prima è un’onda armonica pura di lunghezza d’onda relativamente piccola 2π/k0 e velocità di fase ω (k0 ) /k0 . La seconda dipende da x, t attraverso la combinazione (x−cg t) ed è la sovrapposizione di onde con numeri d’onda k −k0 , molto piccoli, e quindi con lunghezza d’onda molto grande. Possiamo interpretare il secondo fattore come l’inviluppo del pacchetto d’onde (quindi il pacchetto nel suo insieme), che pertanto si muove con la velocità di gruppo. 2. Spariti gli effetti di una perturbazione iniziale localizzata (tipo il sasso che entra nello stagno) cg è la velocità alla quale un osservatore deve viaggiare se vuole vedere onde della stessa lunghezza 2π/k. In altri termini, cg è la velocità di propagazione dei numeri d’onda. Immaginiamo di lanciare un sasso in uno stagno. Nei primi istanti dopo il lancio, la perturbazione è molto complicata ma, dopo un tempo sufficientemente lungo, le varie componenti di Fourier si disperdono e la perturbazione si presenta come un treno d’onde lentamente modulato, quasi sinusoidale in prossimità di ogni punto, con un numero d’onde locale k (x, t) e una frequenza locale ω (x, t), che cambiano gradualmente con x e t. Se l’acqua è abbastanza profonda, ci aspettiamo che ad ogni istante t fissato, la lunghezza d’onda aumenti con la distanza dal punto in cui è entrato il sasso (onde più lunghe si propagano più velocemente) e, nello stesso tempo, ad ogni punto x la lunghezza d’onda tenderà a diminuire col tempo. Ciò significa che le caratteristiche essenziali del sistema di onde possono essere osservate solo dopo un transitorio e ad una distanza relativamente grande dalla perturbazione iniziale. Tipicamente, assumendo che il profilo della superficie libera u sia dato da un integrale di Fourier come (5.4), interessa esaminare il comportamento di u per t 1. Un importante strumento d’indagine è costituito dal metodo della fase stazionaria 1 , che fornisce una formula asintotica per t → +∞, per integrali del tipo +∞ I (t) = f (k) eitϕ(k) dk. (5.6) −∞ 1
Vedere il Paragrafo 5.10.6.
250
5 Onde e vibrazioni
Possiamo porre u nella forma (5.6) scrivendo +∞ x a (k) eit[k t −ω(k)] dk, u (x, t) = −∞
muovendosi dall’origine ad una velocità fissata V (quindi x = V t) ed infine definendo ϕ (k) = kV − ω (k) . Assumiamo per semplicità che ϕ abbia solo un punto stazionario k0 , cioè ω (k0 ) = V , e che ω (k0 ) = 0. Allora, il metodo della fase stazionaria dà π a(k0 ) √ exp {it [k0 V − ω (k0 )]} + O t−1 . u (V t, t) = |ω (k0 )| t
(5.7)
Quindi, a meno di errori dell’ordine di t−1 , muovendosi con velocità V = ω (k0 ) = cg , nella posizione x = cg t si osserva sempre lo stesso numero d’onde k0 . Si noti che l’ampiezza u decresce come t−1/2 per t → +∞. Questo è un importante aspetto dei fenomeni di dispersione. 3. cg è la velocità alla quale l’energia viene trasportata da onde di lunghezza 2π/k. In un pacchetto d’onde come (5.5), l’energia è proporzionale a 2 k0 +δ 2 2 |a (k)| dk 2δ |a (k0 )| k0 −δ
cosicchè ha la stessa velocità di propagazione di k0 , cioè cg . Un osservatore di onde d’acqua di superficie tende a concentrare l’attenzione sul movimento delle creste, che si muovono con la velocità di fase. Ma la propagazione di energia ha un ruolo generalmente più importante. Per esempio è la velocità d’arrivo dell’energia che determina il danno provocato da esplosioni o terremoti. In ogni sistema fisico supporto di un moto ondoso è la velocità di gruppo e non quella di fase che determina quanto rapido sia il fronte di propagazione. Inoltre, poiché l’energia viaggia alla velocità di gruppo, vi sono significative differenze nel moto ondoso a seconda che la velocità di gruppo sia maggiore o minore di quella di fase. Nel primo caso (risp. secondo) l’energia viaggia nella stessa direzione (in direzione opposta) rispetto al sistema di creste. Poiché kω (k) − ω (k) ∂ ω (k) 1 = (cg − cp ) , = 2 ∂k k k k si vede che (k > 0) cg < c p 2
Si veda A. Segel, 1987.
5.2 Onde trasversali in una corda
251
se e solo se la velocità di fase è una funzione decrescente del numero d’onde (ovvero crescente della lunghezza d’onda ). Per onde d’acqua in superficie 3 , le forze di richiamo all’equilibrio sono sostanzialmente la gravità (onde di gravità) e/o la tensione superficiale (onde di capillarità). Quando prevale l’effetto gravitazionale (sasso nello stagno) si ha cg < cp e le onde aumentano la velocità con la lunghezza. Nel secondo caso (gocce di pioggia nello stagno) vale la disuguaglianza opposta e le onde corte sono più veloci. La configurazione del sistema di onde è molto diversa nei due casi e si nota molto bene quando sono presenti entrambi gli effetti, per esempio nel caso di un rametto tenuto in verticale e fatto scorrere in acqua ferma e abbastanza profonda. Dietro il ramo dominano gli effetti gravitazionali con onde che si allungano e si allontanano, davanti domina la tensione superficiale con onde corte che precedono il ramo e si attenuano rapidamente per effetto della viscosità (si veda il Paragrafo 5.10.4).
5.2 Onde trasversali in una corda 5.2.1 Derivazione del modello Vogliamo ricavare un modello per le piccole vibrazioni trasversali di una corda, come può essere quella di un violino. Assumiamo le seguenti ipotesi. 1. Le vibrazioni della corda sono piccole. Ciò significa che abbiamo piccoli cambiamenti nella forma della corda rispetto all’orizzontale. 2. Lo spostamento di un punto della corda è considerato verticale. Vibrazioni orizzontali sono trascurate. 3. Lo spostamento verticale di un punto dipende dal tempo e dalla sua posizione sulla corda. Se si indica con u lo spostamento verticale di un punto che si trova in posizione x quando la corda è a riposo, abbiamo dunque u = u (x, t) e, per la 1, |ux (x, t)| 1. 4. La corda è perfettamente flessibile. Non offre cioè nessuna resistenza alla flessione. In particolare, lo sforzo può essere modellato con una forza T diretta tangenzialmente alla corda 4 , di intensità τ , detta tensione. 5. L’attrito è trascurabile. Sotto le ipotesi indicate, l’equazione del moto può essere dedotta dalla legge di conservazione della massa e da quella del bilancio del momento lineare. Sia ρ0 = ρ0 (x) la densità lineare di massa della corda in posizione di equilibrio e ρ = ρ (x, t) la densità al tempo t. Consideriamo il tratto di corda corrispondente ad un arbitrario intervallo [x, x + Δx] e indichiamo con Δs l’elemento di lunghezza corrispondente al tempo t. La legge di conservazione 3 4
Di ampiezza molto minore della lunghezza d’onda; si veda la Sezione 9. Consequenza dell’assenza di momenti distribuiti lungo la corda.
252
5 Onde e vibrazioni
Figura 5.3. Tensione agli estremi di un piccolo arco di corda
della massa implica che ρ0 (x) Δx = ρ (x, t) Δs
t ≥ 0.
(5.8)
L’equazione del bilancio del momento si ricava uguagliando la forza totale agente sul generico tratto considerato al tasso di variazione del momento lineare. Poiché il moto è verticale, le componenti orizzontali delle forze devono bilanciarsi. Se τ (x, t) indica la tensione (scalare) in x, deve essere (in riferimento alla Figura 5.3) τ (x + Δx, t) cos α (x + Δx, t) − τ (x, t) cos α (x, t) = 0. Dividendo per Δx e passando al limite per Δx → 0, si ha ∂ [τ (x, t) cos α (x, t)] = 0 ∂x da cui τ (x, t) cos α (x, t) = τ 0 (t)
(5.9)
dove τ 0 (t) è positiva, essendo l’intensità della componente orizzontale della tensione. Calcoliamo le componenti verticali delle forze agenti sul tratto in esame. Per la tensione si ha, usando la (5.9): τ vert (x, t) = τ (x, t) sin α (x, t) = τ 0 (t) tan α(x, t) = τ 0 (t) ux (x, t) . Quindi, la componente verticale (scalare) della tensione è data da τ vert (x + Δx, t) − τ vert (x, t) = τ 0 (t) [ux (x + Δx, t) − ux (x, t)].
5.2 Onde trasversali in una corda
253
Possiamo poi considerare forze (verticali) di volume come il peso ed eventuali carichi. Sia f (x, t) l’intensità per unità di massa della risultante di tali forze. Usando la (5.8), la forza agente sul tratto di corda è data da ρ (x, t) f (x, t) Δs = ρ0 (x) f (x, t) Δx. Usando ancora la (5.8) e osservando che utt è l’accelerazione scalare, la legge di Newton dà: ρ0 (x) Δx utt = τ 0 (t) [ux (x + Δx) − ux (x)] + ρ0 (x) f (x, t) Δx. Dividendo per Δx e passando al limite per Δx → 0, si ha infine utt − c2 uxx = f
(5.10)
dove c2 (x, t) = τ 0 (t) /ρ0 (x). Se la corda è omogenea ρ0 è costante; se inoltre è perfettamente elastica5 allora anche τ 0 è costante, poiché la tensione orizzontale è praticamente la stessa della corda a riposo, in posizione orizzontale. 5.2.2 Energia Supponiamo che al tempo t = 0, una corda perfettamente flessibile ed elastica sia a riposo, in posizione orizzontale, ed occupi l segmento [0, L] sull’asse x. Poiché ut (x, t) è la velocità di vibrazione verticale della particella di corda localizzata in x, l’espressione 1 2
Ecin (t) =
L
0
ρ0 u2t dx
rappresenta l’energia cinetica totale durante la vibrazione. La corda immagazzina anche energia potenziale dovuta al lavoro delle forze elastiche. Poiché stiamo trattando piccole vibrazioni, abbiamo visto che la tensione τ non dipende da x. In un elemento di corda con lunghezza a riposo Δx, queste forze provocano un allungamento pari a6
x+Δx
'
x+Δx
1 + u2x dx − Δx =
x
x
1 1 + u2x − 1 dx ≈ u2x Δx. 2
'
Pertanto, il lavoro compiuto dalle forze elastiche su questo elemento di corda è dW = 5 6
1 τ 0 u2x Δx. 2
Per esempio, corde di chitarra e violino possono essere considerate omogenee, perfettamente flessibili ed elastiche. √ Ricordiamo che, al prim’ordine, se ε 1, si ha 1 + ε − 1 ε/2.
254
5 Onde e vibrazioni
Sommando i contributi di tutti gli elementi di corda si ottiene per l’energia potenziale totale l’espressione 1 L Epot (t) = τ 0 u2x dx. (5.11) 2 0 In conclusione, l’energia meccanica totale della corda è 1 L [ρ u2 + τ 0 u2x ] dx. E (t) = Ecin (t) + Epot (t) = 2 0 0 t
(5.12)
Calcoliamo la variazione di energia. Si ha, derivando sotto il segno di integrale (ricordiamo che ρ0 = ρ0 (x) e τ 0 è costante),
L
E˙ (t) = 0
[ρ0 ut utt + τ 0 ux uxt ] dx.
Integrando per parti il secondo termine si trova L τ 0 ux uxt dx = τ 0 [ux (L, t) ut (L, t) − ux (0, t) ut (0, t)] − τ 0 0
L
0
ut uxx dx
per cui
L
E˙ (t) = 0
[ρ0 utt − τ 0 uxx ]ut dx + τ 0 [ux (L, t) ut (L, t) − ux (0, t) ut (0, t)].
Usando l’equazione (5.10), si ha infine:
L
E˙ (t) = 0
ρ0 f ut dx + τ 0 [ux (L, t) ut (L, t) − ux (0, t) ut (0, t)].
(5.13)
In particolare, se f = 0 e agli estremi u è costante (quindi ut (L, t) = ut (0, t) = 0) si deduce E˙ (t) = 0 da cui E (t) = E (0) che esprime la conservazione dell’energia.
5.3 L’equazione delle onde unidimensionale 5.3.1 Condizioni iniziali e al bordo La (5.10) si chiama equazione delle onde (unidimensionale). Il coefficiente c (che d’ora in poi riterremo costante) ha le dimensioni di una velocità ed è infatti la velocità della perturbazione. Se f ≡ 0, l’equazione si dice omogenea e vale il principio di sovrapposizione (si veda la Sezione 2.1).
5.3 L’equazione delle onde unidimensionale
255
Per l’equazione del calore, nella quale appare una derivata rispetto al tempo, è appropriato assegnare una condizione che descriva la distribuzione di temperatura allo stato iniziale. Nell’equazione (5.10) appare una derivata seconda rispetto al tempo ed è quindi appropriato (ricordando il problema di Cauchy per le equazioni ordinarie del secondo ordine) assegnare oltre alla posizione della corda, anche la sua velocità iniziale. Supponiamo, per esempio, di pizzicare una corda di violino e di lasciarla vibrare un paio di secondi. Poi, all’istante t = 0, fotografiamo la situazione “iniziale” che prevede posizione e velocità istantanea della corda. Questi sono i dati iniziali. In formule, se la corda occupa a riposo il segmento [0, L] dell’asse x, le condizioni iniziali si scrivono: u (x, 0) = g (x) ,
ut (x, 0) = h (x) ,
x ∈ [0, L] .
Veniamo alle condizioni agli estremi della corda, che sono formalmente dello stesso tipo di quelle considerate per l’equazione del calore. Come vedremo, si ottengono problemi che sono ben posti, sotto ragionevoli ipotesi sui dati. Condizioni di Dirichlet. Tipicamente si bloccano gli estremi della corda: u (0, t) = u (L, t) = 0,
t>0
oppure si può descrivere come gli estremi si muovano verticalmente: u (0, t) = a (t) ,
u (L, t) = b (t) ,
t > 0.
Condizioni di Neumann. La condizione di Neumann descrive la tensione (verticale) esercitata agli estremi della corda, che possiamo modellare con τ 0 ux ; per esempio τ 0 ux (0, t) = a (t) ,
−τ 0 ux (L, t) = b (t) ,
t>0
indica che la tensione applicata agli estremi varia nel tempo secondo le funzioni a e b. Nel caso molto speciale a (t) = b (t) = 0, entrambi gli estremi della corda sono fissati ad una guida e sono liberi di muoversi verticalmente senza attrito. Condizioni di Robin. Descrivono un tipo di attacco elastico agli estremi che si può realizzare, per esempio, fissando gli estremi ad una molla (lineare) di costante elastica k. Analiticamente, ciò si traduce nelle condizioni τ 0 ux (0, t) = ku (0, t) ,
τ 0 ux (L, t) = −ku (L, t) ,
t>0
dove k (positiva) è la costante elastica della molla. Condizioni miste. In molte situazioni concrete occorre assegnare condizioni miste ossia condizioni diverse nei due estremi, per esempio del tipo descritto sopra. Problema di Cauchy globale. Si può idealmente pensare ad una corda di lunghezza infinita ed assegnare solo i dati iniziali u (x, 0) = g (x) ,
ut (x, 0) = h (x) ,
x ∈ R.
256
5 Onde e vibrazioni
Anche se questa situazione è irrealistica, la soluzione del problema di Cauchy globale è di estrema importanza e ce ne occuperemo prossimamente. Intanto, cominciamo ad esaminare un problema classico. 5.3.2 Separazione delle variabili Supponiamo che le vibrazioni di una corda di violino siano governate dal problema di Cauchy-Dirichlet, ⎧ 2 0 < x < L, t > 0 ⎪ ⎨ utt − c uxx = 0 u (0, t) = u (L, t) = 0 t≥0 (5.14) ⎪ ⎩ u (x, 0) = g (x) , ut (x, 0) = h (x) 0 ≤ x ≤ L dove c2 = τ 0 /ρ0 è costante. Vogliamo controllare se il problema è ben posto, se cioè una soluzione esiste, è unica e se dipende con continuità dai dati g ed h. Per ora non preoccupiamoci troppo delle ipotesi sui dati g ed h né della regolarità della soluzione. • Esistenza. Poiché le condizioni di Dirichlet sono omogenee 7 , proviamo a trovare una soluzione usando il metodo di separazione delle variabili. Passo 1. Si comincia a cercare soluzioni della forma U (x, t) = w (t) v (x) con v (0) = v (L) = 0. Sostituendo U nell’equazione delle onde, si trova 0 = Utt − c2 Uxx = w (t) v (x) − c2 w (t) v (x) da cui, separando le variabili, v (x) 1 w (t) = . 2 c w (t) v (x)
(5.15)
Abbiamo raggiunto una situazione familiare: la (5.15) è un’identità tra una funzione della sola variabile t ed una della sola variabile x. Ciò è possibile unicamente nel caso in cui entrambi i membri siano uguali ad una costante comune, diciamo λ. Abbiamo, dunque, l’equazione w (t) − λc2 w (t) = 0
(5.16)
v (x) − λv (x) = 0,
(5.17)
v (0) = v (L) = 0.
(5.18)
e il problema agli autovalori
7
Ricordiamo che questa è una condizione essenziale per usare il metodo di separazione delle variabili.
5.3 L’equazione delle onde unidimensionale
257
Passo 2. Soluzione del problema agli autovalori. Vi sono tre possibili forme dell’integrale generale della (5.17). a) Se λ = 0, v (x) = A + Bx e le condizioni (5.18) implicano A = B = 0. b) Se λ = μ2 > 0, v (x) = Ae−μx + Beμx e ancora le condizioni (5.18) implicano A = B = 0. c) Se infine λ = −μ2 < 0, v (x) = A sin μx + B cos μx. Imponendo le condizioni (5.18) si trova v (0) = B = 0 v (1) = A sin μL + B cos μL = 0 da cui A arbitrario, B = 0, μL = mπ, m = 1, 2, ... . Solo il terzo caso produce soluzioni non nulle, del tipo vm (x) = Am sin μm x,
μm =
mπ . L
(5.19)
Passo 3. Con i valori λ = −μ2m = −m2 π 2 /L2 , la (5.16) ha come integrale generale, wm (t) = Cm cos (μm ct) + Dm sin (μm ct) . (5.20) Da (5.19) e (5.20) otteniamo la famiglia di soluzioni Um (x, t) = [am cos(μm ct) + bm sin(μm ct)] sin μm x
m = 1, 2, ...
con am e bm costanti arbitrarie. Ciascuna delle Um rappresenta un possibile moto della corda, noto come m − esimo modo di vibrazione o m − armonica, e rappresenta un’onda stazionaria di frequenza mc/2L. La prima armonica e la sua frequenza c/2L, la più bassa, si dicono fondamentali, mentre le altre frequenze sono multipli interi di quella fondamentale: sembra la capacità di una corda di produrre toni di buona qualità musicale sia dovuta a questa proprietà che (così non è, come vedremo, per una membrana vibrante). Passo 4. Se le condizioni iniziali sono del tipo u (x, 0) = am sin μm x
ut (x, 0) = cbm μm sin μm x
allora la soluzione del nostro problema è esattamente Um e la corda vibra nel suo m − esimo modo. In generale, l’idea è di costruire la soluzione sovrapponendo le infinite armoniche Um mediante la formula u (x, t) =
∞
m=1
[am cos(μm ct) + bm sin(μm ct)] sin μm x
(5.21)
258
5 Onde e vibrazioni
dove i coefficienti am e bm devono essere scelti in modo che le condizioni iniziali u (x, 0) =
∞
am sin μm x = g (x)
(5.22)
m=1
e ut (x, 0) =
∞
cμm bm sin μm x = h (x)
(5.23)
m=1
siano soddisfatte per 0 ≤ x ≤ L. Le (5.22) e (5.23) indicano che è naturale assumere che le funzioni g e h siano sviluppabili in serie di Fourier di soli seni nell’intervallo [0, L]. Siano dunque 2 gˆm = L
L
0
mπ x dx g (x) sin L
ˆm = 2 e h L
L
h (x) sin 0
mπ x dx L
i coefficienti di Fourier di g e h. Se scegliamo am = gˆm ,
bm =
ˆm h , cμm
allora la (5.21) diventa + * ∞
ˆm h sin(μm ct) sin μm x gˆm cos(μm ct) + u (x, t) = cμm m=1
(5.24)
(5.25)
e soddisfa le (5.22), (5.23). Sebbene ogni Um sia una soluzione regolare dell’equazione delle onde, in linea di principio la (5.25) è solo una soluzione formale, a meno che si possa derivare termine a termine due volte rispetto a x e t. Infatti, in tal caso, si può scrivere 2 (∂tt − c2 ∂xx )u (x, t) =
∞
2 (∂tt − c2 ∂xx )Um (x, t) = 0.
(5.26)
m=1
ˆ m si annullano abbastanza rapidamente per m → +∞. Ciò è possibile se gˆm e h Infatti, derivando due volte termine a termine, si ha: + * ∞
ˆm h μ m sin(μm ct) sin μm x (5.27) uxx (x, t) = − μ2m gˆm cos(μm ct) + c m=1 e utt (x, t) = −
2 ˆ m c sin(μ ct) sin μ x. μ2m gˆm c2 cos(μm ct) + μm h m m
∞ 1
m=1
(5.28)
5.3 L’equazione delle onde unidimensionale
259
Se, per esempio, si ha che |ˆ gm | ≤
K ˆ hm ≤ 3 , m
K , m4
(5.29)
allora 2 2 μm gˆm cos(μm ct) ≤ Kπ , 2 L m2
e
cK ˆ μm hm c sin(μm ct) ≤ Lm2
cosicché, per il test di Weierstrass, le serie (5.27), (5.28) convergono uniformemente in [0, L] × [0, +∞). Poiché anche la serie (5.25) è uniformemente convergente in [0, L] × [0, +∞), la derivazione termine a termine è permessa ed u è una soluzione regolare dell’equazione delle onde in (0, L) × (0, +∞). Inoltre, sotto le stesse ipotesi, non è difficile controllare che u (y, t) → g (x) , ut (y, t) → h (x) ,
as (y, t) → (x, 0)
(5.30)
per ogni x ∈ [0, L] per cui concludiamo che u è una soluzione regolare del problema (5.14). Quando valgono le (5.29)? Dipende dalla regolarità dei dati. Si può dimostrare8 che: se g ∈ C 4 ([0, L]) , h ∈ C 3 ([0, L]) e inoltre valgono le condizioni di compatibilità g (0) = g (L) = g (0) = g (L) = 0 h (0) = h (L) = 0 allora le (5.29) sono valide. • Unicità. Per mostrare che (5.25) è l’unica soluzione del problema (5.14) usiamo la formula dell’energia (5.13). Siano u e v soluzioni di (5.14). Allora w = u−v è soluzione dello stesso problema con dati iniziali e di Dirichlet nulli. Vogliamo dimostrare che w ≡ 0. Ricordiamo che l’energia meccanica totale è data dalla formula 1 L E (t) = Ecin (t) + Epot (t) = [ρ w2 + τ 0 wx2 ] dx. 2 0 0 t Poiché f = 0 e wt (L, t) = wt (0, t) = 0, si ha E˙ (t) = 0 8
È un esercizio di integrazione per parti. Per esempio, se f ∈ C 4 ([0, L]) e f (0) = f (L) = f (0) = f (L) = 0, allora, integrando per parti quattro volte, si ha: L L mπ mπ 1 dx = 4 dx fˆm = f (x) sin f (4) (x) sin L m L 0 0 e L ˆ fm ≤ max f (4) 4 . m
260
5 Onde e vibrazioni
e cioè l’energia totale si conserva: E (t) = E (0)
(5.31)
per ogni t ≥ 0. Essendo wt (x, 0) = wx (x, 0) = 0 deduciamo E (t) = E (0) = 0 per ogni t > 0. D’altra parte, poiché Ecin (t) ≥ 0, Epot (t) ≥ 0, deve essere Ecin (t) = 0, Epot (t) = 0 che implicano wt = wx = 0 e cioè che w è costante. Essendo w (x, 0) = 0, deve essere w (x, t) = 0 per ogni t > 0, che significa u = v. La soluzione trovata è quindi l’unica. • Dipendenza continua. Per stabilire se la soluzione dipende con continuità dai dati dobbiamo chiarire come si intende valutare la distanza dei dati e delle soluzioni corrispondenti. Un buon criterio di misura per funzioni indipendenti dal tempo (da usarsi sui dati iniziali, per esempio) è la distanza in media quadratica. Definiamo cioè9 # $1/2 L
g1 − g2 0 =
2
|g1 (x) − g2 (x)| dx
0
.
Per funzioni dipendenti dal tempo si può allora valutare il massimo al variare del tempo della distanza in media quadratica : # $1/2 L
u − v0,∞ = sup t>0
0
2
|u (x, t) − v (x, t)| dx
.
Siano ora u1 e u2 soluzioni del problema (5.14), corrispondenti ai dati g1 , g2 e h1 , h2 , rispettivamente. La differenza w = u1 − u2 soddisfa lo stesso problema con dati iniziali g = g1 − g2 e h = h1 − h2 . Dalla (5.25) sappiamo che + * ∞
ˆm h w (x, t) = gˆm cos(μm ct) + sin(μm ct) sin μm x. μm c m=1 2
Dall’identità di Parseval ed usando la disuguaglianza elementare (a + b) ≤ 2 a2 + b2 , possiamo scrivere: +2 * L ∞ ˆm L L h 2 |w (x, t)| dx = gˆm cos(μm ct) + sin(μm ct) 2 0 m=1 μm c 0 ⎡ # $2 ⎤ ∞
ˆm h 2 ⎣gˆm ⎦. ≤L + μm c m=1 9
Il simbolo g0 si legge norma di g in L2 (0, L) (si veda il Capitolo 6).
5.4 La formula di d’Alembert
261
Essendo μm ≥ π/L, abbiamo ! ∞ L 2 L 1 2 2 ˆ2 |w (x, t)| dx ≤ L max 1, gˆm + h m πc m=1 0 , 2 1 2 L 2 2 = 2 max 1, g0 + h0 πc da cui la stima di stabilità u1 −
2 u2 0,∞
, 2 1 2 L 2 2 ≤ 2 max 1, g1 − g2 0 + h1 − h2 0 πc
(5.32)
che mostra come dati “vicini” generino soluzioni “vicine”. Nota 3.1. La formula (5.25) indica che la vibrazione della corda è costituita dalla sovrapposizione di quelle armoniche la cui ampiezza corrisponde ai coefficienti di Fourier non nulli dei dati iniziali. La presenza o meno di varie armoniche conferisce al suono emesso da una corda una particolare caratteristica nota come “timbro”, in contrasto col “tono puro” prodotto da uno strumento elettronico, corrispondente ad una singola frequenza. Nota 3.2. Le ipotesi che abbiamo assunto su g ed h sono troppo restrittive. Se si pizzica una corda di violino, il profilo iniziale ha un punto angoloso: è continuo ma non ha neppure una derivata. Un’ipotesi realistica per il profilo iniziale g è la continuità. Analogamente, una corda messa in vibrazione da un urto corrisponde ad un dato h discontinuo. Un’ipotesi realistica è che h sia limitata. Sotto queste ipotesi, il metodo di separazione delle variabili non funziona. Siamo di fronte ad una situazione analoga a quella che abbiamo trovato nel caso delle leggi di conservazione, dove la necessità di ammettere soluzioni discontinue ha condotto ad una formulazione più generale e flessibile del problema. Anche nel caso dell’equazione delle onde, occorre una riformulazione del problema che legittimi soluzioni e dati “poco” regolari. Una prima definizione di soluzione generalizzata si trova nel Paragrafo 5.4.2. Una formulazione debole più generale ed adatta ai metodi numerici è presentata nel Capitolo 10.
5.4 La formula di d’Alembert 5.4.1 L’equazione omogenea In questa sezione ricaviamo la celebre formula di d’Alembert per la soluzione del seguente problema di Cauchy globale: x ∈ R, t > 0 utt − c2 uxx = 0 (5.33) u (x, 0) = g (x) , ut (x, 0) = h (x) x ∈ R.
262
5 Onde e vibrazioni
Per prima cosa, fattorizziamo l’equazione delle onde nel modo seguente: (∂t − c∂x ) (∂t + c∂x ) u = 0.
(5.34)
v = ut + cux
(5.35)
Se poniamo allora v soddisfa l’equazione del trasporto vt − cvx = 0 e quindi, dalla Sezione 4.2, v (x, t) = ψ (x + ct) con ψ arbitraria, differenziabile. Da (5.35) ut + cux = ψ (x + ct) e dal Microteorema 4.1.1 sappiamo che la soluzione generale è
t
ψ (x − c (t − s) + cs) ds + ϕ (x − ct) = x+ct 1 [x − ct + 2cs = y] = ψ (y) dy + ϕ (x − ct) 2c x−ct u (x, t) =
(5.36)
0
con ϕ, ψ da scegliere mediante le condizioni iniziali. Si ha: u (x, 0) = ϕ (x) = g (x) e
ut (x, 0) = ψ (x) − cϕ (x) = h (x)
da cui
ψ (x) = h (x) + cg (x) .
Sostituendo nella (5.36) si trova: u (x, t) =
1 2c
1 = 2c
x+ct
x−ct x+ct
[h (y) + cg (y)] dy + g (x − ct) h (y) dy +
x−ct
1 [g (x + ct) − g (x − ct)] + g (x − ct) 2
e infine l’importante formula di d’Alembert u (x, t) =
1 1 [g(x + ct) + g (x − ct)] + 2 2c
x+ct
h (y) dy. x−ct
(5.37)
5.4 La formula di d’Alembert
263
Esaminiamo subito alcune informazioni contenute nella (5.37) attraverso una serie di osservazioni. Altre sono inserite nella prossima sezione. La prima indica che il problema di Cauchy è ben posto se g ed h sono sufficientemente regolari. Nota 4.1. Unicità e dipendenza continua. Se g ∈ C 2 (R) e h ∈ C 1 (R) la (5.37) definisce una soluzione di classe C 2 nel semipiano R×[0, +∞). Viceversa, una soluzione u di classe C 2 nel semipiano R×[0, +∞) deve essere data dalla (5.37), proprio per il ragionamento fatto per arrivare alla formula. La soluzione è quindi unica. Osserviamo che nessun effetto regolarizzante ha luogo: la soluzione non diventa più di C 2 per ogni t > 0. Questa è una notevole differenza con i fenomeni di diffusione retti dall’equazione del calore Inoltre, la soluzione dipende con continuità dai dati h e g. Siano u1 and u2 le soluzioni corrispondenti ai dati g1 , h1 and g2 , h2 , rispettivamente. Usiamo la seguente distanza (si chiama norma in L∞ ): h1 − h2 ∞ = sup |h1 (x) − h2 (x)| x∈R
g1 − g2 ∞ = sup |g1 (x) − g2 (x)| . x∈R
Allora, direttamente dalla formula di d’Alembert, si ha, per ogni x ∈ R e t ∈ [0, T ], |u1 (x, t) − u2 (x, t)| ≤ g1 − g2 ∞ + T h1 − h2 ∞ e quindi una piccola variazione sui dati provoca piccola variazione sulle soluzioni, almeno su un intervallo temporale fissato. Nota 4.2. Onde progressive. Riordinando i termini della (5.36) si deduce che ogni soluzione dell’equazione delle onde si può scrivere nella forma 10 u (x, t) = F (x + ct) + G (x − ct)
(5.38)
ossia come sovrapposizione di un’onda progressiva che si muove verso sinistra con velocità c e di una che si muove verso destra con la stessa velocità, senza effetti di dispersione. La (5.38) indica che le famiglie di rette γ + e γ − di equazione x + ct = costante, x − ct = costante “trasportano i dati iniziali” e si chiamano caratteristiche. Sono infatti le caratteristiche dei due fattori del prim’ordine nella fattorizzazione (5.34). 10
Per esempio: F (x + ct) = e G (x − ct) =
1 1 g (x + ct) + 2 2c 1 1 g (x − ct) + 2 2c
x+ct
h (y) dy
0
0
x−ct
h (y) dy.
264
5 Onde e vibrazioni
Figura 5.4. Quadrilatero caratteristico
Nota 4.3. Consideriamo il parallelogramma caratteristico con vertici nei punti A, B, C, D in Figura 5.4. Dalla (5.38) si ha F (A) = F (C) , G (A) = G (B) F (D) = F (B) , G (D) = G (C) . Sommando queste quattro relazioni si ottiene [F (A) + G (A)] + [F (D) + G (D)] = [F (C) + G (C)] + [F (B) + G (B)] , equivalente a u (A) + u (D) = u (C) + u (B) .
(5.39)
Conoscendo il valore di u in tre vertici di un rettangolo caratteristico si può dunque calcolarne il valore nel quarto. Nota 4.4. Domini di dipendenza e di influenza. Dalla formula di d’Alembert, il valore di u nel punto (x, t) è determinato dai valori di h nell’intervallo [x − ct, x + ct] e da quelli di g agli estremi x − ct e x + ct. Questo intervallo prende il nome di dominio di dipendenza del punto (x, t) (Figura 5.5). Da un altro punto di vista, i valori di g e h nel punto (z, 0) sull’asse x influenzano il valore di u nei punti (x, t) del settore z − ct ≤ x ≤ z + ct che si chiama dominio di influenza di z (Figura 5.5). Dal punto di vista fisico, ciò significa che il segnale viaggia con velocità c lungo le caratteristiche − γ+ z , di equazione x + ct = z e γ z , di equazione x − ct = z: una perturbazione inizialmente localizzata in z non viene avvertita nel punto x fino al tempo t=
|x − z| . c
5.4 La formula di d’Alembert
265
Figura 5.5. Domini di dipendenza e di influenza
Nota 4.5. Consideriamo il secondo termine della (5.37) e facciamone la derivata rispetto al tempo; si trova: x+ct ∂ 1 1 h (y) dy = [ch (x + ct) − (−c)h (x − ct)] ∂t 2c x−ct 2c 1 = [h (x + ct) + h (x − ct)] 2 che ha la forma del primo termine con h al posto di g. Da questa semplice osservazione segue che, per risolvere il problema di Cauchy completo, è sufficiente saperlo risolvere con dati u (x, 0) = 0 e ut (x, 0) = h (x) generico. Infatti, se wϕ = wϕ (x, t) indica la soluzione del problema wtt − c2 wxx = 0 x ∈ R, t > 0 (5.40) w (x, 0) = 0, wt (x, 0) = ϕ (x) x ∈ R allora la (5.37) può essere scritta nella forma seguente x+ct x+ct 1 ∂ 1 ∂ u (x, t) = g (y) dy + h (y) dy = wg (x, t) + wh (x, t) . 2c ∂t x−ct 2c x−ct ∂t Riprenderemo questa formula nel Paragrafo 5.9.2. 5.4.2 Soluzioni generalizzate e propagazione delle singolarità Nella Nota 3.2 abbiamo sottolineato la necessità di includere dati realistici. D’altra parte, osserviamo che la formula di d’Alembert ha perfettamente senso anche per g continua e h limitata. Il problema è allora capire in quale senso la (5.37) è soluzione dell’equazione dell’equazione delle onde, non essendo differenziabile ma solo continua. Esistono vari modi di indebolire la nozione di soluzione per includere questo caso; qui imitiamo il procedimento usato per le leggi di conservazione, nel Capitolo 4.
266
5 Onde e vibrazioni
Assumiamo per il momento che u sia una soluzione regolare del problema di Cauchy globale. Diremo che u è soluzione classica. Moltiplichiamo l’equazione delle onde per una funzione test v ∈ C 2 (R × [0, +∞)) a supporto compatto. Integrando su R × [0, +∞) otteniamo ∞ [utt − c2 uxx ]v dxdt = 0. 0
R
Integriamo due volte per parti entrambi i termini, scaricando le derivate da u su v. Essendo v nulla al di fuori di un sottoinsieme compatto di R × [0, +∞), si trova: ∞ ∞ 0
e
∞ 0
R
c2 uxx v dxdt =
R
0
R
c2 uvxx dxdt
utt v dxdt = − =−
R
ut (x, 0) v (x, 0) dx −
0
∞
R
ut vt dxdt
[ut (x, 0) v (x, 0) − u (x, 0) vt (x, 0)] dx ∞ + uvtt dxdt. R
0
R
Usando i dati di Cauchy u (x, 0) = g (x) e ut (x, 0) = h (x), arriviamo all’equazione integrale ∞ 2 u[vtt − c vxx ] dxdt − [h (x) v (x, 0) − g (x) vt (x, 0)] dx = 0. (5.41) 0
R
R
Notiamo che la (5.41) ha senso anche per u continua, g continua e h limitata. Viceversa, se u ∈ C 2 (R × [0, +∞)) soddisfa la (5.41) per ogni funzione test v, allora (il lettore è invitato a controllare) u è una soluzione classica di (5.33). Pertanto, possiamo introdurre la seguente definizione. Definizione 4.1. Siano g ∈ C (R) e h limitata in R. Diciamo che u, continua in R × [0, +∞) è una soluzione generalizzata del problema (5.33) se (5.41) vale per ogni funzione test v. Se g ∈ C (R) e h limitata in R, non è difficile dimostrare che la (5.37) costituisce precisamente una soluzione generalizzata. La Figura 5.6 illustra in vari istanti la propagazione di onde in una corda infinita, “pizzicata” in un punto e inizialmente a riposo, governata dal problema utt − uxx = 0 x ∈ R, t > 0 u (x, 0) = g (x) , ut (x, 0) = 0 x ∈ R dove g ha un profilo triangolare. Come si vede, questa soluzione generalizzata mostra linee di discontituità del gradiente, mentre al di fuori di queste linee è una funzione regolare.
5.4 La formula di d’Alembert
267
Figura 5.6. Corda pizzicata in un punto (c = 1)
Vogliamo mostrare che queste linee sono linee caratteristiche. Più generalmente, consideriamo una regione G ⊂ R× (0, +∞), divisa in due domini G(1) e G(2) da una curva regolare Γ di equazione x = s (t), come in Figura 5.7. Sia 1
ν = ν 1 i+ν 2 j = '
1 + (s˙ (t))2
(−i + s˙ (t) j)
(5.42)
il versore normale a Γ , interno rispetto a G(1) . Data una qualunque funzione f definita in G, indichiamo con f (1) e f (2) le restrizioni di f su G
(1)
eG
(2)
, rispettivamente, e usiamo il simbolo
[f (s (t) , t)] = f (1) (s (t) , t) − f (2) (s (t) , t) per indicare il salto di f attraverso Γ , o semplicemente [f ], ove non vi sia rischio di confusione.
Figura 5.7. Linee di discontinuità del gradiente
268
5 Onde e vibrazioni
Sia ora u una soluzione generalizzata del nostro problema di Cauchy che (1) (2) sia di classe C 2 separatamente11 in G e G , il cui gradiente ha una discontinuità a salto attraverso Γ . Vogliamo dimostrare il seguente risultato. Microteorema 4.1. Γ è una caratteristica. Dimostrazione. Osserviamo innanzitutto che, dalle nostre ipotesi, abbiamo [u] = 0 e [ux ] , [ut ] = 0. Inoltre, i salti [ux ] e [ut ] sono funzioni continue su Γ . Per analogia con le leggi di conservazione, ci aspettiamo che la formulazione integrale (5.41) debba implicare una condizione del tipo Rankine-Hugoniot, che colleghi il salto delle derivate con la pendenza di Γ ed esprima il bilancio del momento lineare attraverso Γ . Infatti, sia v una funzione test con supporto compatto in G. Inserendo v nella (5.41), possiamo scrivere 2 0= (...) dxdt + (...) dxdt. (5.43) c uvxx − uvtt dxdt = G(2)
G
G(1)
Integrando per parti, essendo v = 0 su ∂G (dl denota il differenziale d’arco su Γ ), si ricava c2 u(2) vxx − u(2) vtt dxdt (2) G (2) = (ν 1 c2 u(2) vx − ν 2 u(2) vt ) dl − (c2x u(2) vx − ut vt ) dxdt Γ G(2) 2 (2) (2) ν 1 c vx − ν 2 vt u dl − (ν 1 c2 u(2) = x − ν 2 ut )v dl, Γ
poiché
"
Γ (2)
G(2)
(2)
[c2 uxx − utt ]v dxdt = 0. Analogamente, G(1)
=−
(c2 u(1) vxx − u(1) vtt ) dxdt
ν 1 c2 vx − ν 2 vt u(1) dl +
Γ
poiché anche
"
Γ (1)
G(2)
(1)
(ν 1 c2 u(1) x − ν 2 ut )v dl,
(1)
[c2 uxx − utt ]v dxdt = 0.
Pertanto, essendo [u] = 0 su Γ , o più esplicitamente [u (s (t) , t)] ≡ 0, la (5.43) dà 2 c [ux ] ν 1 − [ut ] ν 2 v dl = 0. Γ
Data l’arbitrarietà di v e la continuità di [ux ] [ut ] on Γ , deduciamo che c2 [ux ] ν 1 − [ut ] ν 2 = 0, 11
su Γ .
Ciò significa che le derivate prime e seconde di u si estendono con continuità fino a Γ , da entrambi i lati di Γ , separatamente.
5.4 La formula di d’Alembert
269
Essendo per la (5.42) s˙ = −ν 2 /ν 1 ricaviamo s˙ = −c2
[ux ] [ut ]
su Γ ,
(5.44)
che è l’analogo della condizione di Rankine-Hugoniot per le leggi di conservazione. D’altra parte, differenziando l’identità [u (s (t) , t)] ≡ 0, troviamo d [u (s (t) , t)] = [ux (s (t) , t)]s˙ (t) + [ut (s (t) , t)] ≡ 0 dt ossia s˙ = −
[ut ] [ux ]
su Γ .
(5.45)
Le (5.44) e (5.45) implicano s˙ (t) = ±c cioè s (t) = ±ct + costante
per cui Γ è una caratteristica. 5.4.3 Soluzione fondamentale
È piuttosto istruttivo risolvere il problema di Cauchy con g ≡ 0 ed un dato h molto particolare: la delta di Dirac in un punto z e cioè h (x) = δ(x − z). In pratica, stiamo considerando le vibrazioni di una corda generate da un impulso unitario localizzato nel punto z. La soluzione corrispondente si chiama soluzione fondamentale e svolge un ruolo analogo a quella dell’equazione di diffusione. Vedremo infatti che la conoscenza di questa soluzione permette di costruire la soluzione del problema di Cauchy globale. Scegliere come dato la delta di Dirac non rientra certo nella teoria svolta finora, ma non ci preoccupiamo troppo: procediamo formalmente, fiduciosi che i calcoli si potranno rendere rigorosi in seguito. Indichiamo dunque la soluzione con K = K (x, z, t) e applichiamo la formula di d’Alembert; si trova K (x, z, t) =
1 2c
x+ct
δ (y − z) dy
(5.46)
x−ct
che a prima vista assomiglia molto ad " xun UFO. Per ricavarne un’espressione esplicita, cominciamo a calcolare −∞ δ (y) dy. Per farlo, ricordiamo dal Capitolo 2 che se 1 se x ≥ 0 H (x) = 0 se x < 0
270
5 Onde e vibrazioni
Figura 5.8. La soluzione fondamentale
è la funzione di Heaviside e 1 H (x + ε) − H (x − ε) 2ε = Iε (x) = 2ε 0
se − ε ≤ x < ε
(5.47)
altrove
è un impulso unitario " x di durata ε, allora limε↓0 Iε (x) = δ (x). Sembra allora coerente calcolare −∞ δ (y) dy mediante la formula
x
x
δ (y) dy = lim ε↓0
−∞
−∞
Iε (y) dy
"x che ha un’aria innocua. Infatti, se x < −ε, −∞ Iε (y) dy = 0 mentre se x > "x ε, −∞ Iε (y) dy = 1. Se facciamo tendere ε a zero otteniamo 0 se x > 0 ed 1 se x > 0, che è la funzione di Heaviside. Il risultato è dunque x δ (y) dy = H (x) (5.48) −∞
neppure tanto sorprendente, se si ricorda che H = δ. Tutto quadra. Torniamo all’UFO, ormai identificato; scriviamo 12 x+ct x+ct x−ct δ (y − z) dy = δ (y − z) dy − δ (y − z) dy −∞
x−ct
−∞
da cui, usando (5.46) e (5.48): K (x, z, t) =
1 {H (x − z + ct) − H (x − z − ct)} . 2c
(5.49)
La funzione K prende il nome di soluzione fondamentale dell’equazione delle onde unidimensionale e il suo grafico è illustrato in Figura 5.8. Si noti come la discontinuità iniziale (t = 0) in x = z si “trasporti” lungo le caratteristiche x = z ± ct. Per ricavare la (5.49) abbiamo utilizzato la formula di d’Alembert. Ma la procedura si può rovesciare: dalla conoscenza della soluzione fondamentale si può ricavare la formula di d’Alembert. Vediamo come si fa. 12
Come se fossero ... i soliti integrali!
5.4 La formula di d’Alembert
Risolviamo il problema wtt − c2 wxx = 0 w (x, 0) = 0, wt (x, 0) = h (x)
x ∈ R, t > 0 x ∈ R.
271
(5.50)
Pensiamo il dato h come sovrapposizione di impulsi e scriviamo
+∞
h (x) = −∞
δ (x − z) h (z) dz.
Possiamo allora ottenere la soluzione di (5.50) dalla sovrapposizione delle soluzioni dello stesso problema con dato δ (x − z) h (z). Essendo queste date da K (x, z, t) h (z), troviamo
+∞
w (x, t) =
K (x, z, t) h (z) dz. −∞
Sostituendo nell’integrale l’espressione analitica di K, abbiamo 1 w (x, t) = 2c = =
1 2c 1 2c
+∞
{H (x − z + ct) − H (x − z − ct)} h (z) dz
−∞ x+ct −∞ x+ct
h (z) dz −
1 2c
x−ct
h (z) dz −∞
h (y) dy. x−ct
Dalla Nota 4.6, la soluzione del problema completo (5.33) è u (x, t) = =
1 2c 1 2c
x+ct
h (y) dy + x−ct x+ct
h (y) dy + x−ct
∂ 1 ∂t 2c
x+ct
g (y) dy x−ct
1 {g (x + ct) + g (x − ct)} 2
che è la formula di d’Alembert. Useremo un metodo analogo per ricavare le formule per la soluzione del problema di Cauchy globale in dimensione 3. 5.4.4 L’equazione non omogenea. Metodo di Duhamel Consideriamo ora il problema non omogeneo utt − c2 uxx = f (x, t) u (x, 0) = 0, ut (x, 0) = 0
x ∈ R, t > 0 x ∈ R.
(5.51)
272
5 Onde e vibrazioni
Per risolverlo usiamo il metodo di Duhamel. Per s fissato, sia w = w (x, t; s) soluzione del problema wtt − c2 wxx = 0 x ∈ R, t > s w (x, s; s) = 0, wt (x, s; s) = f (x, s) x ∈ R. Poiché l’equazione delle onde omogenea è invariante per traslazioni (temporali e spaziali), dalla (5.37) abbiamo 1 w (x, t; s) = 2c
x+c(t−s)
f (y, s) dy. x−c(t−s)
La soluzione di (5.51) è
t
1 2c
w (x, t; s) ds =
u (x, t) = 0
t
x+c(t−s)
ds 0
f (y, s) dy. x−c(t−s)
Infatti, u (x, 0) = 0 e ut (x, t) = w (x, t; t) +
t 0
wt (x, t; s) ds =
t
0
wt (x, t; s) ds
poiché w (x, t; t) = 0. Dunque ut (x, 0) = 0. Inoltre, t t utt (x, t) = wt (x, t; t) + wtt (x, t; s) ds = f (x, t) + wtt (x, t; s) ds 0
e
0
uxx (x, t) =
t
0
wxx (x, t; s) ds.
Ne segue che, essendo wtt − c2 wxx = 0, t t wtt (x, t; s) ds − c2 wxx (x, t; s) ds utt (x, t) − c2 uxx (x, t) = f (x, t) + 0
0
= f (x, t) . Tutto funziona e dà l’unica soluzione in C 2 (R × [0, +∞)), sotto ipotesi ragionevoli su f : richiediamo che f e fx siano continue R × [0, +∞). La formula mostra come il valore di u nel punto (x, t) dipenda dai valori della forzante esterna in tutto il settore triangolare Sx,t indicato in Figura 5.5. 5.4.5 Effetti di dispersione e dissipazione Nei fenomeni di propagazione ondosa sono importanti gli effetti di dissipazione e dispersione. Ritorniamo al modello della corda vibrante, assumendo che il suo peso sia trascurabile e che non vi siano carichi esterni.
5.4 La formula di d’Alembert
273
• Dissipazione esogena. Forze dissipative (esogene) quali l’attrito esterno possono benissimo essere incluse nel modello. La loro espressione analitica è determinata sperimentalmente. Se, per esempio, si ritiene ragionevole una resistenza proporzionale alla velocità, sul tratto di corda tra x e x + Δx agisce una forza data da −kρut Δs j = −kρ0 ut Δx j dove k > 0 è costante, e l’equazione finale prende la forma ρ0 utt − τ 0 uxx + kρ0 ut = 0. Se la corda è fissata agli estremi, con gli stessi calcoli del Paragrafo 5.2.2, troviamo L ˙ E (t) = − kρ0 u2t = −2kEcin (t) ≤ 0 0
che mostra una velocità di dissipazione dell’energia proporzionale all’energia cinetica. Il corrispondente problema ai valori iniziali è ancora ben posto, sotto ragionevoli ipotesi sui dati. In particolare, l’unicità della soluzione segue ancora dal fatto che, se E (0) = 0, essendo E (t) decrescente e non negativa, deve essere nulla per ogni t > 0. • Dissipazione interna. La derivazione dell’equazione della corda vibrante conduce all’equazione ρ0 utt = (τ vert )x dove τ vert è la componente verticale della tensione. L’ipotesi di piccola ampiezza delle vibrazioni corrisponde sostanzialmente ad assumere che τ vert τ 0 ux
(5.52)
dove τ 0 è la componente orizzontale (costante) della tensione. In altri termini, s’è assunto che le forze verticali agenti agli estremi di un elemento di corda fossero proporzionali allo spostamento relativo delle particelle che la compongono. D’altra parte queste particelle sono costantemente in frizione tra loro quando la corda vibra, convertendo energia cinetica in calore. Più rapida è la vibrazione (quindi più rapido è lo spostamento relativo tra le particelle) più calore è generato13 . Ciò implica una diminuzione della tensione e uno smorzamento della vibrazione. La tensione verticale nella corda dipende dunque anche dalla velocità di variazione di ux e siamo portati a modificare la (5.52) inserendo un termine proporzionale a uxt : τ vert = τ 0 ux + γuxt .
(5.53)
La costante γ è da ritenersi non negativa: infatti se in un punto si ha, per esempio, ux > 0 e l’energia decresce, ci aspettiamo che la pendenza della corda 13
Nel film La leggenda del pianista sull’oceano c’è una dimostrazione pratica del fenomeno.
274
5 Onde e vibrazioni
decresca nel tempo e cioè che (ux )t < 0. Poiché anche la tensione decresce, coerentemente deve essere γ ≥ 0. Si ottiene allora l’equazione del terz’ordine ρ0 utt − τ 0 uxx − γuxxt = 0.
(5.54)
Nonostante la presenza del termine uxxt i problemi ben posti per l’equazione della corda continuano ad essere ben posti per la (5.54). In particolare, i problemi di Cauchy-Dirichlet e di Cauchy-Neumann sono ben posti sotto ragionevoli condizioni sui dati. L’unicità della soluzione segue ancora una volta dal fatto che l’energia meccanica totale decresce; infatti, con i soliti calcoli si trova14 L γρ0 u2xt ≤ 0. E˙ (t) = − 0
• Dispersione. Se la corda è sottoposta ad una forza elastica di richiamo proporzionale ad u, l’equazione diventa utt − c2 uxx + λu = 0
(λ > 0)
rilevante anche in meccanica quantistica relativistica, dove prende il nome di equazione di Klein-Gordon linearizzata. Per sottolineare l’effetto del termine λu, cerchiamo soluzioni che siano onde armoniche del tipo u (x, t) = Aei(kx−ωt) . Sostituendo nell’equazione differenziale si trova la relazione di dispersione ' ω 2 − c2 k 2 = λ =⇒ ω (k) = ± c2 k 2 + λ. Abbiamo dunque onde che si propagano verso destra e verso sinistra con velocità di fase e di gruppo date rispettivamente da √ c2 k 2 + λ dω c2 |k| , cg = =√ . cp (k) = |k| dk c2 k 2 + λ Osserviamo che cg < cp . Possiamo ottenere un pacchetto d’onde con un integrazione su tutti i possibili numeri d’onda k : +∞ A (k) ei[kx−ω(k)t] dk (5.55) u (x, t) = −∞
dove A (k) è la trasformata di Fourier della condizione iniziale:
+∞
A (k) = −∞ 14
Il lettore è invitato a sviluppare i calcoli.
u (x, 0) e−ikx dx.
5.5 Equazioni lineari del secondo ordine
275
Ciò significa che, anche se la condizione iniziale è localizzata in un intervallo molto piccolo, tutte le lunghezze d’onda contribuiscono al valore della soluzione. Si noti che la dispersione non comporta effetti di dissipazione di energia. Per esempio, nel caso della corda fissata agli estremi, l’energia meccanica totale è data da L 2 ρ E (t) = 0 ut + c2 u2x + λu2 dx 2 0 ed è facile verificare che E˙ (t) = 0, per ogni t > 0. Nella prossima sezione ci occupiamo di equazioni più generali, in particolare, con termini di dissipazione e reazione. Nell’ultima sezione esamineremo effetti di dispersione in onde d’acqua superficiali.
5.5 Equazioni lineari del secondo ordine 5.5.1 Classificazione Alla formula (5.38) si può arrivare usando l’equazione delle caratteristiche nel modo seguente. Cambiamo variabili nell’equazione utt − c2 uxx = 0 ponendo ξ = x + ct,
η = x − ct
(5.56)
o
ξ−η ξ+η , t= . 2 2c ξ−η Posto poi U (ξ, η) = u ξ+η , , si ha 2 2c x=
Uξ =
1 1 ux + ut , 2 2c
Uξη =
1 1 1 1 uxx − uxt + uxt − 2 utt = 0. 4 4c 4c 4c
L’equazione utt − c2 uxx = 0 diventa dunque Uξη = 0
(5.57)
e si chiama (seconda) forma canonica 15 dell’equazione delle onde; la soluzione è immediata: U (ξ, η) = F (ξ) + G (η) da cui, ritornando alle variabili originali, la (5.38). Consideriamo ora un’equazione lineare generale della forma seguente: autt + 2buxt + cuxx + dut + eux + hu = f 15
La prima è l’equazione originale.
(5.58)
276
5 Onde e vibrazioni
con x, t variabili, in generale, in un aperto Ω del piano. Assumiamo che i coefficienti a, b, c, d, e, h, f siano funzioni di classe C 2 (Ω). Il complesso dei termini del second’ordine a (x, t) ∂tt + 2b (x, t) ∂xt + c (x, t) ∂xx
(5.59)
si chiama parte principale dell’operatore differenziale a primo membro della (5.58) e determina il tipo di equazione secondo la classificazione seguente, in analogia con la classificazione delle coniche. Nel piano p, q consideriamo l’equazione (a > 0). H (p, q) = ap2 + 2bpq + cq 2 = 1 Essa definisce un’iperbole se b2 − ac < 0, una parabola se b2 − ac = 0 e un’ellisse se b2 − ac > 0. Coerentemente, l’equazione (5.58) si dice: a) iperbolica se b2 − ac < 0, b) parabolica se b2 − ac = 0, c) ellittica se b2 − ac > 0. Si noti che la forma quadratica H (p, q) è, nei tre casi, indefinita, semidefinita positiva, definita positiva, rispettivamente. In quest’ultima forma, la classificazione si generalizza ad equazioni in n variabili, come vedremo nel Capitolo 9. Come casi particolari ritroviamo quasi tutte le equazioni trattate finora; in particolare: • l’equazione delle onde utt − c2 uxx = 0 è iperbolica: a (x, t) = 1, c (x, t) = −c2 , gli altri coefficienti sono nulli; • l’equazione di diffusione ut − Duxx = 0 è parabolica: e (x, t) = 1, c (x, t) = −D, gli altri coefficienti sono nulli; • l’equazione di Laplace (con y al posto di t) uxx + uyy = 0 è ellittica: a = 1, c = 1, gli altri coefficienti sono nulli. Può succedere che un’equazione sia di tipo diverso in domini diversi. Per esempio, l’equazione di Tricomi utt − tuxx = 0 è iperbolica se t > 0, parabolica se t = 0, ellittica se t < 0. Ci chiediamo: possiamo ridurre ad una forma simile alla (5.57) anche l’equazione di diffusione e di Laplace? Proviamo a cercare le caratteristiche per queste equazioni, rivedendo prima brevemente il procedimento per l’equazione delle onde. Scomponiamo l’operatore differenziale (che coincide con la sua parte principale) in fattori del prim’ordine nel modo seguente: ∂tt − c2 ∂xx = (∂t + c∂x ) (∂t − c∂x ).
(5.60)
5.5 Equazioni lineari del secondo ordine
277
Se introduciamo i vettori v = (c, 1) e w = (−c, 1), allora possiamo riscrivere la (5.60) nella forma ∂tt − c2 ∂xx = ∂v ∂w . D’altra parte, le caratteristiche x − ct = costante
x + ct = costante, delle due equazioni del prim’ordine φt − cφx = 0
and
ψ t + cψ t = 0,
corrispondenti ai due fattori in (5.60), sono rette nella direzione di w e v, rispettivamente. Il cambio di variabili ξ = φ (x, t) = x + ct
η = ψ (x, t) = x − ct
trasforma queste rette nelle rette ξ = 0 e η = 0 e ∂ξ =
1 1 (∂t + c∂x ) = ∂v , 2c 2c
∂η =
1 1 (∂t − c∂x ) = ∂w . 2c 2c
Di conseguenza, l’operatore differenziale ∂tt −c2 ∂xx si trasforma in un multiplo della sua forma canonica: ∂tt − c2 ∂xx = ∂v ∂w = 4c2 ∂ξη . Note le caratteristiche, il cambio di variabili (5.56) riduce l’equazione alla forma (5.57). Procedendo in modo analogo, per l’operatore di diffusione si avrebbe, dovendo considerare solo la parte principale, ∂xx = ∂x ∂x , per cui troviamo una sola famiglia di linee caratteristiche, data da t = costante16 . Perciò l’equazione di diffusione è già nella sua unica forma “canonica”. Per l’operatore di Laplace abbiamo ∂tt + ∂xx = (∂t + i∂x ) (∂t − i∂x ) per cui le caratteristiche sono costituite dalla doppia famiglia di rette complesse ϕ (x, t) = x + it = costante, 16
ψ (x, t) = x − it = costante.
L’equazione delle caratteristiche per l’equazione del prim’ordine ux = 0 è (si veda la Nota 4.5.3): dx dt = 1 0 da cui dt = 0, ossia t = costante.
278
5 Onde e vibrazioni
Il cambio di variabili z = x + it,
z = x − it
conduce all’equazione ∂zz U = 0 con soluzione generale U (z, z) = F (z) + G (z) che può essere considerata una caratterizzazione delle funzioni armoniche nel piano complesso. Dovrebbe risultare chiaro, comunque, che le caratteristiche per le equazioni di diffusione e di Laplace non svolgono un ruolo così rilevante come per l’equazione delle onde. 5.5.2 Caratteristiche e forma canonica Torniamo all’equazione (5.58): qual è la forma canonica della sua parte principale? Ci sono almeno due ragioni sostanziali, strettamente collegate, per cercare una risposta. La prima è legata al tipo di problema ben posto associato alla (5.58): quali tipi di dati occorre assegnare e dove, per produrre un’unica soluzione che dipenda con continuità dai dati? Per equazioni ellittiche, paraboliche o iperboliche i problemi ben posti sono esattamente quelli per i loro prototipi: le equazioni di Laplace, di diffusione e delle onde, rispettivamente. Naturalmente, ciò influisce anche sulla scelta dei metodi numerici da usarsi per calcolare una soluzione approssimata, in assenza di formule esplicite. La seconda ragione è legata alle differenti caratteristiche che i tre tipi di equazione presentano. Le equazioni iperboliche modellano fenomeni oscillatori con velocità di propagazione finita del segnale, mentre per equazioni paraboliche come quella del calore, l’ informazione si trasmette con velocità infinita. Infine, le equazioni ellittiche modellano situazioni stazionarie, senza evoluzione nel tempo. Per arrivare alla forma canonica della parte principale, seguiamo il procedimento usato prima. Anzitutto, se a = c = 0, la parte principale è già nella forma canonica (5.57); supponiamo dunque a > 0. Il caso c > 0 si tratta in modo analogo. Scomponiamo ora la parte principale (5.59) in fattori di primo grado; si trova17 a ∂t − Λ+ ∂x ∂t − Λ− ∂x (5.61) dove
√
b2 − ac . a Caso 1: b2 − ac > 0, equazioni iperboliche. I due fattori nella (5.61) sono operatori di derivazione lungo i campi vettoriali v (x, t) = −Λ+ (x, t) , 1 e w (x, t) = −Λ− (x, t) , 1 , Λ± =
17
−b ±
Scomposizione di un trinomio di secondo grado.
5.5 Equazioni lineari del secondo ordine
279
rispettivamente, per cui possiamo scrivere a∂tt + 2b∂xt + c∂xx = a∂v ∂w . I campi vettoriali v e w sono tangenti in ogni punto alle caratteristiche φ (x, t) = k1
and ψ (x, t) = k2
(5.62)
delle seguenti equazioni quasilineari del prim’ordine φ t − Λ+ φx = 0
e
ψ t − Λ− ψ x = 0.
(5.63)
Coerentemente, le curve (5.62) sono dette caratteristiche per la (5.58) e sono le soluzioni delle equazioni ordinarie dx dx = −Λ+ , = −Λ− , dt dt
(5.64)
che possiamo compattare nella seguente equazione (delle caratteristiche ) a
dx dt
2 − 2b
dx + c = 0. dt
(5.65)
Si noti che anche le (5.63) si possono compattare nell’unica equazione avt2 + 2bvx vt + cvx2 = 0.
(5.66)
Per analogia col caso dell’equazione delle onde, ci aspettiamo che il cambio di variabili ξ = φ (x, t) , η = ψ (x, t) . (5.67) dovrebbe “spianare” le caratteristiche, almeno localmente, trasformando ∂v ∂w in un multiplo di ∂ξη . Prima di tutto, dobbiamo accertarci che la trasformazione (5.67) sia invertibile, almeno localmente, ossia, in altri termini, che lo jacobiano della trasformazione non si annulli: φt ψ x − φx ψ t = 0.
(5.68)
D’altra parte, ciò segue dal fatto che i vettori ∇φ e ∇ψ sono ortogonali a v e w, rispettivamente, e che v, w non sono paralleli in alcun punto (poiché b2 − ac > 0). Pertanto, almeno localmente, esiste la trasformazione inversa. Poniamo U (ξ, η) = u (Φ (ξ, η) , Ψ (ξ, η)) . Allora ux = Uξ φx + Uη ψ x ,
ut = Uξ φt + Uη ψ t
e inoltre (con un poco di pazienza) utt = φ2t Uξξ + 2φt ψ t Uξη + ψ 2t Uηη + φtt Uξ + ψ tt Uη
280
5 Onde e vibrazioni
uxx = φ2x Uξξ + 2φx ψ x Uξη + ψ 2x Uηη + φxx Uξ + ψ xx Uη uxt = φx φt Uξξ + (φx ψ t + φt ψ x )Uξη + ψ x ψ t Uηη + φxt Uξ + ψ xt Uη . Allora autt + 2buxy + cuxx = AUξξ + 2BUξη + CUηη + DUξ + EUη dove18 A = aφ2t + 2bφt φx + cφ2x ,
C = aψ 2t + 2bψ t ψ x + cψ 2x
B = aφt ψ t + b(φx ψ t + φt ψ x ) + cφx ψ x D = aφtt + 2bφxt + cφxx ,
E = aψ tt + 2bψ xt + cψ xx .
Poiché entrambe φ e ψ sono soluzioni di (5.66), si ha A = C = 0 per cui autt + 2buxt + cuxx = 2BUξη + DUξ + EUη . Osserviamo ora che B = 0; infatti, ricordando che Λ+ Λ− = c/a, Λ+ + Λ+ = −2b/a e φt = Λ+ φx , ψ t = Λ− ψ x , si trova
2 ac − b2 φx ψ x a e dalla (5.68) deduciamo che B = 0. La (5.58) diventa dunque un’equazione del tipo Uξη = F (ξ, η, U, Uξ , Uη ) B=
che costituisce la sua forma canonica. Esempio 5.1. Consideriamo l’equazione utt − 5uxt + 6uxx = 0.
(5.69)
Essendo 52 − 4 · 6 = 1 > 0, l’equazione è iperbolica. L’equazione delle caratteristiche è 2 dx dx +6=0 +5 dt dt da cui
dx dx = −2, = −3. dt dt Integrando troviamo la doppia famiglia di caratteristiche φ (x, t) = x + 2t = k1 ,
ψ (x, t) = x + 3t = k2 .
Cambiamo variabili ponendo: ξ = x + 2t, 18
η = x + 3t
Tutte le funzioni si intendono calcolate in x = Φ (ξ, η) e t = Ψ (ξ, η) .
5.5 Equazioni lineari del secondo ordine
281
ovvero x = 3ξ − 2η,
t = η − ξ.
Sia U (ξ, η) = u (3ξ − 2η, η − ξ); l’equazione per U è Uξη = 0 da cui U (ξ, η) = F (ξ) + G (η) con F , G arbitrarie. Ritornando alle variabili orginali si ottiene u (x, t) = F (x + 2t) + G (x + 3t) che è la soluzione generale della (5.69). Caso 2: b2 − ac ≡ 0, equazioni paraboliche. Esiste una sola famiglia di linee caratteristiche φ (x, t) = k, dove φ è soluzione dell’equazione di prim’ordine aφt + bφx = 0. Nota φ, scegliamo una qualunque funzione regolare ψ in modo che ∇φ e ∇ψ siano indipendenti e che aψ 2t + 2bψ t ψ x + cψ 2x = C = 0. Effettuiamo il cambio di variabili ξ = φ (x, t) , η = ψ (x, t) e, come nel caso 1, poniamo U (ξ, η) = u (Φ (ξ, η) , Ψ (ξ, η)) . Osserviamo ora che, essendo b2 − ac = 0, si ha B = aφt ψ t + b(φx ψ t + φt ψ x ) + cφx ψ x = ψ t (aφt + bφx ) + ψ x (bφt + cφx ) c b b = bψ x φt + φx = bψ x φt + φx = ψ x (aφt + bφx ) = 0. b a a Come nel caso 1, abbiamo A = 0 e si arriva ad un’equazione del tipo CUηη = F (ξ, η, U, Uξ , Uη ) che costituisce la forma canonica. Esempio 5.2. L’equazione utt − 6uxt + 9uxx = 0 è parabolica, con l’unica famiglia di caratteristiche φ (x, t) = 3t+x = costante. Poniamo ξ = 3t + x, η=x
e U (ξ, η) = u
ξ−η ,x . 3
282
5 Onde e vibrazioni
Si trova per U l’equazione Uηη = 0 che ha come soluzione generale U (ξ, η) = F (ξ) + ηG (ξ) con F , G arbitrarie. Tornando alle variabili originali, si trova infine u (x, t) = F (3t + x) + xG (3t + x) . Caso 3: b2 − ac < 0, equazioni ellittiche. In questo caso non vi sono caratteristiche reali. Se i coefficienti a, b, c sono funzioni analitiche19 si può procedere come nel caso 1, però con due famiglie complesse di caratteristiche, pervenendo ad una forma canonica del tipo z, w ∈ C.
Uzw = G (z, w, U, Uz , Uw ) Per eliminare le variabili complesse si pone
z = ξ + iη, w = ξ − iη 8 (ξ, η) = U (ξ + iη, ξ + iη). Si arriva infine alla forma canonica reale eU 8ξξ + U 8ηη = G ξ, η, U 8, U 8ξ , U 8η . U
5.6 Sistemi iperbolici a coefficienti costanti È sempre possibile e a volte conveniente ridurre un’equazione del second’ordine ad un sistema di due equazioni del prim’ordine. Per esempio, il cambio di variabili ux = w1 and ut = w2 trasforma l’equazione delle onde utt − c2 uxx = f nel sistema wt + Awx = f ,
dove20 w = (w1 , w2 ) , f = (0, f )
A=
e
0 −1 −c2 0
(5.70)
.
Si noti che la matrice A ha due autovalori reali e distinti λ± = ±c, con autovettori r1 = (1, −c) e r2 = (1, c) 19 20
Rappresentabili cioè localmente come serie di Taylor. Il simbolo significa trasposto.
5.6 Sistemi iperbolici a coefficienti costanti
283
normali alle caratteristiche, in accordo con la natura iperbolica dell’equazione delle onde. Più in generale, consideriamo il problema di Cauchy ut + Aux = Bu + f (x, t) x ∈ R, t > 0 (5.71) u (x, 0) = g (x) x ∈ R, dove u e f sono vettori (colonna) in Rm e A, B sono matrici costanti, quadrate di ordine m, con la condizione iniziale u (x, 0) = g (x)
x ∈ R.
Nell’analisi dei modelli scalari (m = 1) un ruolo importante è svolto dalle linee caratteristiche, lungo le quali si trasmettono le informazioni sui dati. Ci si può chiedere se il concetto di linea caratteristica si estenda al caso vettoriale e se possa essere usato per risolvere il problema ai valori iniziali. La risposta è affermativa se il sistema è iperbolico cioè se A ha m autovalori reali e distinti λ1 , λ2 , ..., λm . In questo caso, infatti, esiste una base in Rm costituita da m autovettori (colonna) r1 , r2 , ..., rm . Se introduciamo la matrice non singolare Γ = r1 | r2 | ... | rm allora
Γ−1 AΓ = Λ = diag (λ1 , λ2 , ..., λm ) .
Ponendo ora v = Γ−1 u, è facile controllare che v soddisfa il problema di Cauchy x ∈ R, t > 0 vt + Λvx = B∗ v + f ∗ (x, t) (5.72) v (x, 0) = g∗ (x) x∈R dove B∗ = Γ−1 BΓ, f ∗ (x, t) = Γ−1 f (x, t) e g∗ (x) = Γ−1 g (x) . Nel sistema (5.72), i primi membri delle equazioni sono disaccoppiati e l’equazione per ogni componente vk di v ha la forma ∂t vk + λk ∂x vk =
m
b∗kj vj + fk∗
k = 1, ..., m.
(5.73)
j=1
Coerentemente col caso scalare, chiamiamo caratteristiche le m rette γ k di equazione. k = 1, ..., m. x − λk t = k, Sotto opportune ipotesi sui vettori f e g il problema (5.72) ha una e una sola soluzione, che può essere costruita mediante lo schema iterativo seguente:
284
5 Onde e vibrazioni
1. Scegliamo
v0 = 0.
2. Per n ≥ 1, noto vn−1 si ricava vn risolvendo il sistema lineare disaccoppiato n x ∈ R, t > 0 vt + Λvnx = B∗ vn−1 + f ∗ (x, t) (5.74) x ∈ R. vn (x, 0) = g∗ (x) Ogni equazione del sistema (5.74) ha il secondo membro noto e quindi può essere risolta col metodo delle caratteristiche (Sezione 4.5). Si dimostra che, per n → ∞, la successione {vn } converge uniformemente a un vettore v, insieme alle sue derivate prime, in ogni sottoinsieme compatto del semipiano t ≥ 0. Ciò permette di passare al limite in (5.74) e di concludere che v è la soluzione cercata. La soluzione del sistema originale si trova da u = Γv. Il tutto è sintetizzato nel seguente teorema, che ci limitiamo ad enunciare. Teorema 6.1. Supponiamo che: i) la matrice A sia strettamente iperbolica, ii) i vettori f e g siano limitati e di classe C 2 (R× [0, T ]) e C 2 (R), rispettivamente. Allora il problema di Cauchy (5.71) ha una e una sola soluzione di classe C 2 (R× [0, T ]). Vale la pena segnalare un caso particolare notevole, in cui è possibile esibire una formula esplicita per la soluzione. Sia B∗ matrice diagonale. In questo caso, essendo b∗kj = 0 per j = k, il problema (5.72) si spezza negli m problemi di Cauchy indipendenti ∂t vk + λk ∂x vk = b∗kk vk + fk∗ x ∈ R, t > 0 k = 1, ..., m (5.75) ∗ vk (x, 0) = gk (x) x ∈ R, t > 0 che possono essere risolti col metodo delle caratteristiche come descritto nella Sezione 4.5. Se ulteriormente f ∗ = 0, cioè se il sistema originale è ut + Aux = Bu
x ∈ R, t > 0,
ognuna delle equazioni in (5.75) si riduce a ∂t vk +λk ∂x vk = di ogni problema di Cauchy è data dall’onda progressiva
(5.76) b∗kk vk
e la soluzione
∗
vk (x, t) = gk∗ (x − λk t)ebkk t , smorzata se b∗kk < 0 o amplificata se b∗kk > 0 (Paragrafo 4.2.3). Ne segue che, essendo u = Γv, la soluzione di (5.76) con condizione iniziale u (x, 0) = g (x) è data dalla seguente combinazione di onde progressive: u (x, t) =
m
k=1
∗
gk∗ (x − λk t)ebkk t rk .
(5.77)
5.6 Sistemi iperbolici a coefficienti costanti
285
Esempio 6.1. Il sistema dei telegrafi. Consideriamo il flusso elettrico in un cavo coassiale con dispersione a terra. Siano I = I (x, t) la corrente e V = V (x, t) il voltaggio, dove la variabile x è la coordinata lungo il cavo. Siano, inoltre, R ed L (costanti positive) la resistenza e l’induttanza del cavo, C e G (costanti positive) la capacità e la conduttanza al suolo. Le due leggi di Kirchhoff si traducono nel seguente sistema lineare: Ix + CVt + GV = 0
(5.78)
Vx + LIt + RI = 0
(5.79)
al quale possiamo associare le condizioni iniziali I (x, 0) = I0 (x) ,
V (x, 0) = V0 (x) .
Se introduciamo il vettore colonna u = (V, I) e le matrici 0 1/L −R/L 0 A= , B= 1/C 0 0 −G/L il sistema si può scrivere nella forma ut + Aux = Bu.
(5.80)
1 La matrice A possiede due autovalori distinti λ± = ± √LC con autovettori
r1 =
√
C,
√ L
r2 =
√ C, − L
√
per cui il sistema (5.80) è iperbolico. Poniamo √ √ C √C Γ= √ L− L e w=Γ
−1
1 u= 2
√ √ 1/√C 1/ √L u1 , u2 1/ C −1/ L
allora w è soluzione del sistema wt + Λwx = B∗ w dove
√ 0 1/ LC √ , Λ= 0 − LC 1 RC + GL RC − GL . B∗ = Γ−1 BΓ = − 2LC RC − GL RC + GL
(5.81)
286
5 Onde e vibrazioni
Il primo membro del sistema (5.81) è ora disaccoppiato; nel caso speciale RC = GL, anche il secondo membro è disaccoppiato e il sistema si riduce alle due equazioni 1 R wt± ± √ wx± = − w± L LC con le condizioni iniziali 1 I0 (x) V0 (x) ± √ ± √ ≡ w0± (x) . w (x, 0) = 2 C L Le soluzioni delle due equazioni scalari sono (Paragrafo 4.2.3): R 1 w± (x, t) = w0± x ± √LC t e− L t e successivamente, da u = Γw, troviamo √ √ ! √ √ R C + − √ √C u (x, t) = w0 (x + t/ LC) + w0 (x − t/ LC) e− L t . − L L Si vede che la soluzione è costituita dalla sovrapposizione di onde progressive attenuate. Se RC = GL, la soluzione non si trova con una formula esplicita. Nota 6.1. Se differenziamo la (5.78) rispetto ad x, moltiplichiamo per C la (5.79) differenziandola rispetto a t e sottraiamo membro a membro, otteniamo LCItt − Ixx − GVx + CRIt = 0 e dalla (5.79): LCItt − Ixx + (RC + GL)It + RGI = 0.
(5.82)
Questa equazione è del tipo utt − c2 uxx + hut + ku = 0. Se h = k = 0 (nel nostro caso, per esempio, G ∼ 0 e R ∼ 0), modella le piccole vibrazioni di una corda (equazione delle onde unidimensionale ); se k = 0 e h = 0 le vibrazioni sono smorzate (a causa dell’ attrito, per esempio). Si noti infine che, se nel cavo la dissipazione al suolo e l’autoinduzione sono trascurabili, cioè G ∼ 0 e L ∼ 0, l’equazione che regola il flusso elettrico è It =
1 Ixx RC
e cioè l’equazione di diffusione! Nota 6.2. Quando si voglia risolvere un problema in un quadrante, diciamo x > 0, t > 0, oppure in una semistriscia (a, b) × (0 + ∞), occorre un po’ di cautela nell’assegnare i dati al bordo. Per esempio, consideriamo il problema ut + Aux = 0
x ∈ [0, R] , t > 0
(5.83)
5.7 Equazione delle onde (n > 1)
287
con la condizione iniziale. u (x, 0) = g (x)
x ∈ [0, R] .
Quali altri dati occorre assegnare per determinare univocamente u? Esaminiamo la k−esima equazione del sistema disaccoppiato ∂t vk + λk ∂x vk = 0. Supponiamo λk > 0, cosicché la caratteristica γ k è entrante su x = 0 e uscente su x = R. Guidati dal caso scalare (Paragrafo 4.2.4), sappiamo che dobbiamo assegnare vk solo su x = 0. Al contrario, se λk < 0, til valore di vk deve essere assegnato su x = R. In conclusione: supponiamo che r autovalori (diciamo λ1 , λ2 , ..., λr ) siano positivi e che gli altri m−r autovalori siano negativi. Allora i valori di v1 , ..., vr devono essere assegnati su x = 0 mentre i valori di vr+1 , ..., vm su x = R. In termini del vettore incognito originale u, ciò equivale ad assegnare su x = 0, r combinazioni lineari indipendenti delle componenti di u: m
−1 cjk uj Γ u k=
k = 1, 2, ..., r,
j=1
mentre altre m − r vanno assegnate su x = R.
5.7 Equazione delle onde (n > 1) 5.7.1 Soluzioni speciali L’equazione delle onde
utt − c2 Δu = f
(5.84)
dove u = u (x,t), x ∈R , costituisce il modello base per descrivere un notevole numero di fenomeni vibratori in dimensione spaziale n > 1, in particolare n = 2, 3. Come nel caso unidimensionale, il coefficiente c ha le dimensioni di una velocità ed è infatti la velocità della perturbazione. Se f ≡ 0, l’equazione si dice omogenea e vale il principio di sovrapposizione. Esaminiamo subito qualche importante soluzione della (5.84). n
2
• Onde progressive piane. Se k ∈Rn e ω 2 = c2 |k| , la funzione u (x,t) = w (x · k − ωt) è soluzione dell’equazione omogenea. Infatti, 2
utt (x,t) − c2 Δu (x,t) = ω 2 w (x · n − ωt) − c2 |k| w (x · n − ωt) = 0. I piani di equazione x · k − ωt = costante
288
5 Onde e vibrazioni
rappresentano i fronti d’onda, che si muovono con velocità ω/ |k| nella direzione k. Il numero λ = 2π/ |k| è la lunghezza d’onda. Se w (z) = Aeiz , l’onda si dice monocromatica o armonica. • Onde cilindriche (n = 3). Sono della forma u (x,t) = w (r, t) '
dove x = (x1 , x2 , x3 ), r = x21 + x22 . In particolare, soluzioni del tipo u (x,t) = eiωt w (r) rappresentano onde cilindriche stazionarie. Queste ultime si trovano risolvendo la (5.84) con f = 0 per separazione di variabili in domini Ω a simmetria assiale. Se l’asse coincide con l’asse x3 , conviene usare le coordinate cilindriche x1 = r cos θ, x2 = r sin θ, x3 , nelle quali l’equazione si può scrivere (Appendice C) 1 1 2 utt − c urr + ur + 2 uθθ + ux3 x3 = 0. r r Cercando onde stazionarie della forma u (x,t) = eiλct w (r), λ ≥ 0, si trova, semplificando per c2 eiλct , 1 w (r) + w + λ2 w = 0. r Questa è un’equazione di Bessel di ordine zero. Le soluzioni limitate in r = 0 sono del tipo w (r) = aJ0 (λr) , a∈R k ∞ x 2k dove, ricordiamo, J0 (x) = k=0 (−1) è la funzione di Bessel di ordine 2 (k!)2 zero. Si ottengono così onde cilindriche stazionarie della forma w (r, t) = aJ0 (λr) eiλct . • Onde sferiche (n = 3). Sono della forma u (x,t) = w (r, t) ' dove x = (x1 , x2 , x3 ), r = |x| = x21 + x22 + x23 . In particolare, soluzioni del tipo u (x,t) = eiωt w (r) rappresentano onde sferiche stazionarie. Anche queste soluzioni si trovano risolvendo la (5.84) omogenea per separazione di variabili, questavolta in domini Ω a simmetria sferica. Conviene in tal caso usare le coordinate sferiche x1 = r cos θ sin ψ, x2 = r sin θ sin ψ, x3 = cos ψ, nelle quali l’equazione si può scrivere (Appendice C) ! 1 2 1 1 cos ψ u u u − u − − u + u + = 0. tt rr r θθ ψψ ψ c2 r r2 (sin ψ)2 sin ψ
(5.85)
5.7 Equazione delle onde (n > 1)
289
Cerchiamo onde stazionarie del tipo w (r, t) = eiλct w (r), λ ≥ 0. Si trova, semplificando per c2 eiλct , 2 w (r) + w + λ2 w = 0 r che si può scrivere nella forma21 (rw) + λ2 rw = 0. Se dunque poniamo v = rw, v è soluzione dell’equazione v + λ2 v = 0 da cui v (r) = a cos (λr)+b sin (λr). Si ottengono così onde sferiche stazionarie del tipo cos (λr) sin (λr) , eiλct (5.86) eiλct r r smorzate all’infinito, di cui le seconde limitate nell’origine. Cerchiamo ora di determinare la forma generale di un’onda sferica in R3 . Sostituendo u (x,t) = w (r, t) nella (5.85), si trova ! 2 wtt − c2 wrr (r) + wr = 0. r Che si può scrivere nella forma (rw)tt − c2 (rw)rr = 0.
(5.87)
Dalla (5.38) troviamo w (r, t) =
F (r + ct) G (r − ct) + ≡ wi (r, t) + wo (r, t) r r
(5.88)
che rappresenta la sovrapposizione di due onde sferiche progressive smorzate. I fronti d’onda di wo sono le sfere r −ct = costante, che hanno raggio crescente con t, per cui uo rappresenta un’onda che si allontana dall’origine (outgoing wave). La wi rappresenta invece un’onda che si avvicina all’origine (incoming wave) poiché i suoi fronti d’onda sono dati dalle sfere r + ct = costante, che hanno raggio decrescente col tempo. In molti problemi concreti che coinvolgono onde progressive, per esempio in presenza di onde generate da una sorgente localizzata (si veda l’Esempio 7.1), si impone una condizione, detta di radiazione, che esclude l’esistenza di onde di quest’ultimo tipo22 . 21 22
Grazie alla miracolosa presenza del 2 nel coefficiente di w . Che implicherebbero sorgenti lontane o “all’infinito”.
290
5 Onde e vibrazioni
5.7.2 Problemi ben posti. Unicità I problemi ben posti più comuni sono gli stessi del caso unidimensionale. Sia QT = Ω × (0, T ) un cilindro spazio-temporale, dove Ω è un dominio limitato in Rn . Una soluzione u (x,t) è univocamente determinata assegnando le condizioni iniziali e opportune condizioni sul bordo ∂Ω del dominio Ω, che supponiamo di classe C 1 secondo la Definizione 1.6.1. 23 Sintetizzando, abbiamo i seguenti tipi di problemi: determinare u = u (x, t) tale che: ⎧ 2 x ∈ Ω, 0 < t < T ⎪ ⎪ utt − c Δu = f ⎨ u (x, 0) = g (x) , ut (x,0) = h (x) x ∈ Ω (5.89) ⎪ ⎪ ⎩ + condizioni al bordo σ ∈ ∂Ω, 0 ≤ t < T dove le condizioni al bordo sono le solite, per esempio: a) Dirichlet: u = h, b) Neumann: ∂ν u = h, c) Robin:∂ν u + αu = h (α ≥ 0), d) Miste Dirichlet/Neumann: u = h1 su ∂D Ω e ∂ν u = h2 su ∂N Ω, con ∂Ω = ∂D Ω ∪ ∂N Ω, ∂D Ω e ∂N Ω aperti in ∂Ω. Anche in dimensione n > 1 ha particolare importanza il problema di Cauchy globale. utt − c2 Δu = f x ∈ Rn , t > 0 (5.90) u (x, 0) = g (x) , ut (x,0) = h (x) x ∈ Rn che avremo modo di esaminare in dettaglio. Vedremo, in particolare che per n = 1, 2, 3 le soluzioni hanno proprietà molto diverse tra loro. Sotto ipotesi abbastanza naturali sui dati si può provare che il problema (5.89) ha al massimo una soluzione. Usiamo ancora la conservazione dell’energia, che definiamo con la formula 24 1 2 E (t) = u2t + c2 |∇u| dx. 2 Ω Calcoliamo la derivata di E: ˙ ut utt + c2 ∇u · ∇ut dx. E (t) = Ω 23 24
Possiamo anche ammettere domini Lipschitziani (Sezione 1.6). Nei casi concreti possono apparire altre costanti legate alla natura del problema.
5.7 Equazione delle onde (n > 1)
291
Integrando per parti il secondo termine si ha: 2 2 c ∇ut · ∇u dx = c uν ut dσ − c2 ut Δu dx Ω
∂Ω
Ω
da cui, essendo utt − c2 Δu = f , 2 2 ˙ E (t) = ut uν dσ utt − c Δu ut dx + c ∂Ω Ω = f ut dx + c2 ut uν dσ. Ω
∂Ω
È ora semplice dimostrare il seguente risultato. Microteorema 7.1. Il problema (5.89), con le condizioni al bordo indi cate, ha al massimo una soluzione in C 2 (QT ) ∩ C 1 QT . Dimostrazione. Siano u1 e u2 soluzioni dello stesso problema con gli stessi dati iniziali e al bordo. La differenza w = u1 − u2 è soluzione del problema omogeneo, cioè con dati nulli. Dimostriamo che w ≡ 0. Nel caso di dati di Dirichlet, Neumann e misti, poiché o wν = 0 oppure wt = 0 su ∂Ω × (0, T ), si ha E˙ (t) = 0. Pertanto E (t) è costante e, dato che inizialmente è zero, deve essere sempre uguale a zero: 1 2 wt2 + c2 |∇w| dx = 0, ∀t > 0. E (t) = 2 Ω Quindi, per ogni t > 0, sia wt sia |∇w (x,t)| sono nulli per cui w (x,t) è costante; essendo nulla inizialmente deve essere nulla per ogni t > 0. Nel caso del problema di Robin, si ha c2 d 2 ˙ E (t) = −c αwwt dσ = − αw2 dσ 2 dt ∂Ω ∂Ω ! d c2 E (t) + αw2 dσ = 0. dt 2 ∂Ω 2 " La quantità E (t) + c2 ∂Ω αw2 dσ è dunque costante ed essendo nulla inizialmente, è nulla per t > 0. Poiché α ≥ 0, si conclude ancora che w ≡ 0. L’unicità per il problema di Cauchy globale segue da un’altra disuguaglianza dell’energia, che ha altre importanti conseguenze. Prima, un’osservazione. Per maggior chiarezza ragioniamo per n = 2. Supponiamo che una perturbazione ondosa, governata dall’equazione delle onde omogenea (f = 0) è avvertita in un punto x0 all’istante t0 . Poiché la perturbazione si muove con velocità c, il valore u (x0 , t0 ) dipende dal valore dei dati iniziali all’interno del cerchio Bct0 (x0 ). Più in generale, u (x0 , t0 ) è determinato dai suoi valori all’istante t0 − t all’interno del cerchio Bc(t0 −t) (x0 ). e cioè
292
5 Onde e vibrazioni
Al variare di t da 0 a t0 , l’unione dei cerchi Bc(t0 −t) (x0 ) nello spazio-tempo x,t coincide con il cono caratteristico retrogrado o backward , con vertice in (x0 , t0 ) e apertura θ = tan−1 c, dato da (Figura 5.9): Cx0 ,t0 = {(x,t) : |x − x0 | ≤ c(t0 − t), 0 ≤ t ≤ t0 } .
(5.91)
Pertanto, dato un punto x0 , è naturale introdurre un’energia associata al cono retrogrado Cx0 ,t0 mediante la formula 1 2 u2t + c2 |∇u| dx. e (t) = 2 Bc(t −t) (x0 ) 0
Vogliamo dimostrare che e (t) è decrescente. Infatti: Lemma 7.2. Sia u una soluzione dell’equazione omogenea delle onde, di classe C 2 in Rn × [0, +∞). Allora e˙ (t) ≤ 0. Dimostrazione. Possiamo scrivere (si veda la (B.1)) 1 e (t) = 2
c(t0 −t)
dr 0
Br (x0 )
u2t + c2 |∇u|
2
dσ
cosicché c e˙ (t) = − 2
∂Bc(t0 −t) (x0 )
+
u2t + c2 |∇u|
∂Bc(t0 −t) (x0 )
e˙ (t) = Bc(t0 −t) (x0 )
=
c 2
c + 2
dσ
ut utt + c2 ∇u · ∇ut dx.
Integrando per parti, abbiamo: ∇u · ∇ut dx = da cui
Bc(t0 −t) (x0 )
Bc(t0 −t) (x0 )
2
ut uν dσ −
Bc(t0 −t) (x0 )
ut Δu dx
ut (utt − c2 Δu)dx
∂Bc(t0 −t) (x0 )
2cut uν − u2t − c2 |∇u|
∂Bc(t0 −t) (x0 )
2cut uν − u2t − c2 |∇u|
Ora, |ut uν | ≤ |ut | |∇u|
2
2
dσ.
dσ
5.8 Due modelli classici
293
Figura 5.9. Cono retrogrado
quindi 2
2
2
2cut uν − u2t − c2 |∇u| ≤ 2 |ut | |∇u| − u2t − c2 |∇u| = − (ut − c |∇u|) ≤ 0 e infine e˙ (t) ≤ 0. Due conseguenze immediate sono contenute nel seguente teorema di unicità. Teorema 7.3. Sia u ∈ C 2 (Rn × [0, +∞)) una soluzione del problema di Cauchy (5.90). Allora: a) Se g ≡ h ≡ 0 in Bct0 (x0 ) e f ≡ 0 in Cx0 ,t0 allora u ≡ 0 in Cx0 ,t0 ; b) Il problema (5.90) ha al più una soluzione in C 2 (Rn × [0, +∞)) .
5.8 Due modelli classici 5.8.1 Piccole vibrazioni di una membrana elastica Nel Paragrafo 5.3.2 abbiamo ricavato un modello per le piccole vibrazioni di una corda. Analogamente, possiamo ricavare le equazioni che governano le vibrazioni di piccola ampiezza di una membrana la cui posizione a riposo è orizzontale, come per esempio nel caso di un tamburo. Presentiamo brevemente la derivazione, invitando il lettore a completare i dettagli. Assumiamo le seguenti ipotesi. 1. Le vibrazioni della membrana sono piccole e verticali. Ciò significa che abbiamo piccoli cambiamenti nella forma della membrana rispetto al piano orizzontale e che spostamenti orizzontali sono trascurati. 2. Lo spostamento verticale di un punto sulla membrana dipende dal tempo e dalla sua posizione a riposo. Se dunque si indica con u lo spostamento verticale di un punto che si trova in posizione (x, y) quando la membrana è a riposo, abbiamo u = u (x, y, t).
294
5 Onde e vibrazioni
3. La membrana è perfettamente flessibile ed elastica. Non offre, in particolare, nessuna resistenza alla flessione. Inoltre, lo sforzo nella membrana durante la vibrazione può essere modellato con una forza T diretta tangenzialmente alla membrana, di intensità τ , detta tensione 25 . 4. Gli attriti sono trascurabili. Sotto queste ipotesi, l’equazione di moto della membrana può essere dedotta dalle leggi di conservazione della massa e di Newton. Sia ρ0 = ρ0 (x, y) la densità superficiale di massa della membrana in posizione di equilibrio e consideriamo una piccola porzione “rettangolare” della membrana, con vertici nei punti A, B, C, D di coordinate (x, y), (x + Δx, y), (x, y + Δy) e (x + Δx, y + Δy), rispettivamente. Indichiamo con ΔS l’area corrispondente all’istante t. La legge di conservazione della massa dà ρ0 (x, y) ΔxΔy = ρ (x, y, t) ΔS.
(5.92)
Per scrivere la legge di Newton occorre determinare le forze che agiscono sulla porzione di membrana. Poiché il moto è verticale, le forze orizzontali devono bilanciarsi. Le forze verticali sono costituite da forze di volume (e.g. la gravità o carichi esterni) e dalla componente verticale della tensione. Sia f (x, y, t) k la risultante delle forze di volume per unità di massa. Allora, usando la (5.92), le forze di volume agenti sulla porzione di membrana sono date da: ρ (x, y, t) f (x, y, t) ΔS k = ρ0 (x, y) f (x, y, t) ΔxΔy k. Lungo i lati AB e CD, la tensione è normale all’asse x e, con buona approssimazione, parallela all’asse y. Con ragionamenti analoghi a quelli fatti per la corda vibrante, si trova che le componenti verticali (scalari) sono date da τ vert (x, y, t) τ uy (x, y, t) Δx,
τ vert (x, y + Δy, t) τ uy (x, y + Δy, t) Δx
rispettivamente su AB e CD. Analogamente, lungo i lati AC e BD la tensione è perpendicolare all’asse y e, con buona approssimazione, parallela all’asse x. Le componenti verticali sui due lati sono date rispettivamente da: τ vert (x, y, t) τ ux (x, y, t) Δy, τ vert (x + Δx, y, t) τ ux (x + Δx, y, t) Δy. 25
La tensione T ha il seguente significato. Consideriamo una piccola porzione di membrana, delimitato da una curva chusa γ. Il materiale da un lato di γ esercita sul materiale dall’altro lato una forza (traente) per unità di lunghezza T lungo γ. Una legge costitutiva per T è T (x, y,t) =τ (x, y,t) N (x, y,t) (x, y) ∈ γ dove N è il versore normale esterno a γ, tangente alla membrana. La tangenzialità della tensione è dovuta ancora una volta all’assenza di momenti distribuiti nella membrana.
5.8 Due modelli classici
295
Usando ancora la (5.92) e osservando che utt è l’accelerazione (scalare) verticale, la legge di Newton dà: ρ0 (x, y) ΔxΔy utt = = τ [uy (x, y + Δy, t) − uy (x, y, t)]Δx + τ [ux (x + Δx, y, t) − ux (x, y, t)]Δy + +ρ0 (x, y) f (x, y, t) ΔxΔy. Dividendo per ΔxΔy e passando al limite per Δx, Δy → 0, otteniamo l’equazione (5.93) utt − c2 Δu = f dove c2 (x, y, t) = τ /ρ0 (x, y). • Membrana quadrata. Consideriamo una membrana quadrata di lato a, fissata al bordo; studiamone le vibrazioni quando la membrana, inizialmente nella sua posizione di riposo (orizzontale), è sollecitata in modo in modo che la sua velocità iniziale sia h = h (x, y). Se il peso della membrana è trascurabile e non vi sono carichi esterni, le vibrazioni della membrana sono governate dal seguente problema: ⎧ 2 0 < x < a, 0 < y < a, t > 0 ⎪ ⎪ utt − c Δu = 0 ⎪ ⎪ ⎪ ⎨ u (x, y, 0) = 0, 0 < x < a, 0 < y < a ut (x, y, 0) = h (x, y) ⎪ ⎪ ⎪ u (0, y, t) = u (a, y, t) = 0 0 < y < a, t ≥ 0 ⎪ ⎪ ⎩ u (x, 0, t) = u (x, a, t) = 0 0 < x < a, t ≥ 0. Come nel caso della corda vibrante, usiamo il metodo di separazione delle variabili, cercando prima soluzioni della forma u (x, y, t) = v (x, y) q (t) . Sostituendo nell’equazione delle onde troviamo q (t) v (x, y) − c2 q (t) Δv (x, y) = 0 ossia, separando le variabili 26 , q (t) Δv (x, y) = −λ2 = c2 q (t) v (x, y) da cui il problema agli autovalori Δv + λ2 v = 0 26
(5.94)
I due rapporti devono essere uguali ad una costante, che, guidati dall’esperienza unidimensionale, chiamiamo −λ2 .
296
5 Onde e vibrazioni
v (0, y) = v (a, y) = v (x, 0) = v (x, a) = 0, e l’equazione
0 ≤ x, y ≤ a
q (t) + c2 λ2 q (t) = 0.
(5.95)
Occupiamoci prima del problema agli autovalori. Separiamo ancora le variabili ponendo v (x, y) = X (x) Y (y), con le condizioni X (0) = X (a) = 0,
Y (0) = Y (a) = 0.
Sostituendo nella (5.94), si trova che deve essere X (x) Y (y) + λ2 = − = μ2 Y (y) X (x) dove μ è una nuova costante. Ponendo ν 2 = λ2 − μ2 , occorre risolvere i due sottoproblemi seguenti, in 0 < x < a e 0 < y < a, rispettivamente: Y (y) + ν 2 Y (y) = 0 X (x) + μ2 X (x) = 0 X (0) = X (a) = 0 Y (0) = Y (a) = 0. Le soluzioni si trovano senza eccessivo sforzo: X (x) = Am sin μm x, Y (y) = Bn sin ν n y,
mπ a nπ νn = a μm =
con m, n = 1, 2, ... e Am , Bm costanti arbitrarie. Poiché λ2 = ν 2 +μ2 , abbiamo λ2mn =
π2 2 m + n2 , 2 a
m, n = 1, 2, ...
(5.96)
corrispondenti alle soluzioni vmn (x, y) = sin μm x sin ν n y. Quando λ è uno dei valori λmn , l’integrale generale della (5.95) è qmn (t) = amn cos cλmn t + bm sin cλmn t. Abbiamo così trovato la seguente successione doppia di soluzioni, che si annullano al bordo: umn = (amn cos cλmn t + bmn sin cλmn t) sin μm x sin ν n y. della Ciascuna delle umn corrisponde ad un particolare modo di vibrazione √ membrana. La frequenza fondamentale di vibrazione è f11 = c 2/2a, corrispondente a m = n = 1, mentre le frequenze degli altri modi di vibrazione
5.8 Due modelli classici
297
√ sono fmn = c m2 + n2 /2a. Quando un tamburo è sollecitato in maniera arbitraria, molti modi di vibrazione sono simultaneamente presenti. Il fatto che le frequenze di tali modi non siano multipli interi di quella fondamentale sembra essere la causa della bassa qualità musicale dei toni emessi. Tornando al problema di partenza, per trovare la soluzione che soddisfi anche i dati iniziali, sovrapponiamo le umn , definendo u (x, y, t) =
∞
(amn cos cλmn t + bmn sin cλmn t) sin μm x sin ν n y.
m,n=1
Da u (x, y, 0) = 0 deduciamo amn = 0 per ogni m, n ≥ 1. Da ut (x, y, 0) = h (x, y) deduciamo ∞
cbmn λmn sin μm x sin ν n x = h (x, y) .
(5.97)
m,n=1
Se, quindi, h è sviluppabile nella serie doppia di Fourier: h (x, y) =
∞
hmn sin μm x sin ν n y,
m,n=1
dove i coefficienti hmn sono dati da 4 mπ nπ h (x, y) sin x sin y dxdy, hmn = 2 a Q a a basterà scegliere bmn = hmn /cλmn affinché la (5.97) sia soddisfatta. In conclusione, la candidata soluzione è u (x, y, t) =
∞
hmn sin cλmn t sin μm x sin ν n y. cλ mn m,n=1
(5.98)
Se poi i coefficienti hmn /cλmn tendono a zero abbastanza rapidamente, si può provare che la (5.98) è effettivamente l’unica soluzione. 5.8.2 Onde sonore nei gas La propagazione di onde sonore in un gas isotropo, proprio in virtù dell’isotropia del gas, può essere descritta in termini di una singola quantità scalare. Le onde sonore sono perturbazioni di piccola ampiezza nella pressione e nella densità di un gas. Il fatto che l’ampiezza sia piccola permette la linearizzazione delle equazioni della Meccanica dei Continui entro limiti ragionevoli. Due di queste equazioni entrano in maniera rilevante. La prima è l’equazione di conservazione della massa che esprime la relazione tra la densità ρ del gas e la sua velocità v: ρt + div (ρv) = 0. (5.99)
298
5 Onde e vibrazioni
La seconda è l’equazione del momento lineare, che descrive come un volume di gas reagisce alla pressione esercitata su di esso dal resto del gas. Assumendo di poter trascurare la viscosità del gas, la forza esercitata su un volumetto dal resto del gas è data dalla pressione normale −pν sul bordo del volume (ν è la normale esterna). In assenza di forze di volume significative, l’equazione del momento lineare è Dv 1 ≡ vt + (v·∇) v = − ∇p. (5.100) Dt ρ Una terza ed ultima equazione, l’equazione di stato (una legge costitutiva empirica) esprime la relazione tra pressione e densità. Come Laplace fece osservare già nel 19-esimo secolo, le fluttuazioni della pressione in un’onda sonora sono così rapide che la temperatura del gas non rimane costante. Infatti, la compressione/espansione del gas avviene in modo adiabatico, senza perdita di calore. In queste condizioni, se γ = cp /cv è il rapporto tra i calori specifici del gas (γ = 1.4 circa per l’aria).si può ritenere che il rapporto p/ργ sia costante, e quindi che l’equazione di stato abbia la forma (5.101) p = f (ρ) = Cργ dove C è una costante. Il sistema di equazioni (5.99), (5.100), (5.101) è piuttosto complicato e difficile da risolvere nella sua forma generale. Tuttavia, il fatto che le onde sonore siano piccole perturbazioni delle normali condizioni atmosferiche permette notevoli semplificazioni ed in particolare la linearizzazione delle equazioni del sistema. Consideriamo uno stato atmosferico in quiete, dove ρ0 e p0 (costanti) indicano densità e pressione, nel quale si ha ovviamente v = 0. In seguito ad una piccola perturbazione di questo stato, possiamo scrivere ρ = (1 + s) ρ0 ≈ ρ0 dove s è una quantità piccola e adimensionale che si chiama condensazione e che rappresenta lo scostamento relativo della densità dall’equilibrio. Per la pressione abbiamo allora dalla (5.101): p − p0 ≈ f (ρ0 ) (ρ − ρ0 ) = sρ0 c20 e
(5.102)
∇p ≈ ρ0 f (ρ0 ) ∇s = ρ0 c20 ∇s
. dove abbiamo posto c20 = f (ρ0 ) = Cγργ−1 0 Se ora anche v è piccola, possiamo trascurare nelle equazioni di stato i termini non lineari in ρ e v. Di conseguenza, possiamo trascurare l’accelerazione convettiva (v·∇) v e, dopo aver semplificato in entrambe per ρ0 , approssimare le (5.100) e (5.99) con le equazioni lineari vt = −c20 ∇s
(5.103)
5.8 Due modelli classici
299
e la conservazione della massa con st + div v = 0.
(5.104)
Nota 8.1. Pausa di riflessione. Fermiamoci un momento ad esaminare quali implicazioni ha la linearizzazione effettuata. Supponiamo che V e S siano valori medi di |v| e s, rispettivamente, e che λ e T siano ordini di grandezza medi per spazio e tempo nella propagazione ondosa, tipicamente la lunghezza d’onda e il periodo. Riscaliamo v, s, x e t introducendo corrispondenti variabili adimensionali: x t ξ= , τ= , λ T
U (ξ, τ ) =
v (λξ, T τ ) , V
σ (ξ, τ ) =
s (λξ, T τ ) . S
(5.105)
Sostituendo le (5.105) nelle (5.103) e (5.104) si trova: c2 S V Uτ + 0 ∇σ = 0 T λ
e
S V σ τ + divU =0. T λ
(5.106)
In queste equazioni adimensionali, essendovi solo due termini, i coefficienti devono essere dello stesso ordine di grandezza e perciò V c2 S ≈ 0 T λ
e
S V ≈ T λ
che implicano λ ≈ c0 . T Si vede perciò che c0 è la velocità di propagazione ed infatti è la velocità del suono. Nella derivazione delle equazioni abbiamo trascurato: 1) il termine (v·∇)v che corrisponde all’accelerazione convettiva; 2) la viscosità; 3) la gravità. Ora, l’accelerazione convettiva è trascurabile, per esempio rispetto a vt , se V2 V U · ∇U Uτ T λ V2 V ossia e cioè |v| c0 . T λ Ciò significa che se la velocità del gas è molto più piccola di quella del suono, la linearizzazione è giustificata. Il rapporto M = |v| /c0 si chiama numero di Mach. Se non si trascura la viscosità del gas, a secondo membro dell’equazione del momento lineare occorre inserire il termine μΔv, dove μ è la viscosità cinematica. Con conti analoghi ai precedenti, ci si convince che questo termine è molto piccolo rispetto, per esempio, al gradiente di pressione, quando λ μ/ρ0 c0 .
300
5 Onde e vibrazioni
Nell’aria μ/ρ0 c0 ∼ 3 × 10−7 m. In termini di frequenza dell’onda richiediamo che f = c0 /λ 109 Hertz, ampiamente sopra la soglia dell’udibile. Si può poi mostrare che trascurare la gravità è ragionevole non appena f 0.03 Hertz, ampiamente sotto la soglia dell’udibile. Vogliamo ora mostrare il seguente risultato. Microteorema 8.1. a) La condensazione s soddisfa l’equazione delle onde stt − c20 Δs = 0 dove c0 =
'
f (ρ0 ) =
(5.107)
'
γp0 /ρ0 è la velocità del suono.
b) Se v (x,0) = 0, allora v è irrotazionale e, in particolare, esiste un potenziale φ di velocità (potenziale acustico), tale cioè che v =∇φ, che soddisfa la stessa equazione. Dimostrazione. a) Calcoliamo la divergenza in entrambi i membri della (5.103) e la derivata rispetto a t di entrambi i membri della (5.104); troviamo: div vt = −c20 Δs e stt = − (div v)t . Scambiando l’ordine di derivazione, (div v)t = div vt , e sommando le due equazioni si ottiene subito la (5.107). b) Dalla (5.103) si ha vt = −−c20 ∇s. Poniamo φ (x,t) =
−c20
t
s (x,z) dz. 0
Allora φt = −c20 s e possiamo scrivere la (5.103) nella forma ∂ [v − ∇φ] = 0. ∂t Ne segue che, essendo φ (x,0) = 0, v (x,0) = 0, v (x,t) − ∇φ (x,t) = v (x,0) − ∇φ (x,0) = 0 e quindi v =∇φ. Infine, dalla (5.104), φtt = −c20 st = c20 div v = c20 Δφ che è ancora l’equazione (5.107).
5.8 Due modelli classici
301
Nota 8.2. Una volta noto il potenziale φ di velocità, si possono calcolare la velocità v, la condensazione s e la fluttuazione della pressione p − p0 dalle formule 1 p − p0 = −ρ0 φt . v =∇φ, s = − 2 φt , c0 Consideriamo per esempio un’onda piana rappresentata da un potenziale del tipo φ (x,t) = w (x · k − ωt) . 2
Sappiamo che se c20 |k| = ω 2 , φ è soluzione dell’equazione (5.107). Per questo potenziale si ha: ω v =w k, s = − 2 w , p − p0 = ρ0 ωw . c0 Esempio 8.1. Moto di un gas generato da un pistone. Consideriamo un tubo rettilineo di sezione costante con asse parallelo all’asse x1 , contenente gas nella regione x1 > 0. Il movimento di un pistone mette in moto il gas. Assumiamo che la posizione della superficie del pistone a contatto col gas sia descritta dall’equazione x1 = h (t), che essa rimanga molto vicina a x1 = 0, cioè |h (t)| 1, e che la sua velocità sia piccola rispetto a quella del suono nel gas, cioè |h (t)| c0 . In tal caso il moto del pistone genera onde sonore di piccola ampiezza e il potenziale di velocità φ del gas soddisfa l’equazione delle onde tridimensionale omogenea. Per calcolare φ occorrono condizioni al bordo. La velocità normale del gas sulla superficie del pistone deve coincidere con quella del pistone stesso e quindi φx1 (h (t) , x2 , x3 , t) = h (t) . Essendo h (t) ∼ 0, possiamo approssimare questa condizione con φx1 (0, x2 , x3 , t) = h (t) .
(5.108)
Sulle pareti del tubo la velocità normale del gas è nulla per cui ∇φ · ν = 0
(5.109)
sulle pareti del tubo. Infine, poiché le onde sono generate dal movimento del pistone, non ci aspettiamo onde “provenienti da lontano”. Cerchiamo dunque soluzioni sotto forma di onda piana, che si allontanano lungo il tubo: φ (x,t) = w (x · n − c0 t) con n versore. Dalla (5.109) si ha ∇φ · ν = w (x · n − c0 t) n · ν = 0 per cui n · ν = 0 per ogni versore ν ortogonale alla superficie del tubo. Deve dunque essere n = (1, 0, 0) e, di conseguenza φ (x,t) = w (x1 − c0 t) .
302
5 Onde e vibrazioni
Imponendo la (5.108) si ottiene w (−c0 t) = h (t) da cui, (assumendo h (0) = 0), s . w (s) = −c0 h − c0 Il potenziale acustico è quindi dato da
x1 φ (x,t) = −c0 h t − c0
che rappresenta l’onda sonora generata dal pistone. Abbiamo quindi v = c0 i,
1 x1 s= h t− , c0 c0
p = c0 ρ0 h
x1 t− c0
+ p0 .
Nota 8.3. Un’ultima osservazione riguarda la velocità iniziale. Se v (x,0)
= 0, il termine convettivo (v · ∇)v non è più trascurabile e i ragionamenti precedenti non sono più validi. Infatti, v non è più irrotazionale ed effetti di dispersione possono entrare pesantemente in gioco. È una situazione che si riscontra per esempio quando, in presenza di vento forte, occorre avvicinare l’orecchio ad un nostro interlocutore per distinguerne le parole.
5.9 Il problema di Cauchy 5.9.1 Soluzione fondamentale in dimensione n = 3 e principio di Huygens In questa sezione consideriamo il problema di Cauchy globale utt − c2 Δu = 0 x ∈ R3 , t > 0 u (x, 0) = g (x) , ut (x,0) = h (x) x ∈ R3 .
(5.110)
Dal Teorema 7.3 sappiamo che il problema (5.110) ha al più una soluzione u ∈ C 2 R3 × [0, +∞) . Il nostro scopo è trovare una formula esplicita per la soluzione u in termini dei dati g e h. La derivazione ha un carattere euristico per cui, per il momento, non ci preoccupiamo troppo delle corrette ipotesi su h e g, che assumiamo sufficientemente regolari da giustificare i calcoli. Per il momento supporremo che la soluzione sia di classe C 2 in tutto il semispazio R3 × [0, +∞).
5.9 Il problema di Cauchy
303
L’osservazione contenuta nel seguente lemma (che vale in ogni dimensione) permette di ricondursi ad un problema con g = 0. Indichiamo con wϕ la soluzione del problema x ∈ R3 , t > 0 wtt − c2 Δw = 0 (5.111) w (x, 0) = 0, wt (x,0) = ϕ (x) x ∈ R3 . Lemma 9.1. Se wϕ è di classe C 3 nel semispazio R × [0, +∞), allora v = ∂t wϕ è soluzione del problema vtt − c2 Δv = 0 x ∈ R3 , t > 0 (5.112) x ∈ R3 . v (x, 0) = ϕ (x) , vt (x,0) = 0 Di conseguenza, La soluzione del problema (5.110) è data da u = ∂t wg + wh .
(5.113)
Dimostrazione. Sia v = ∂t wϕ . Derivando l’equazione delle onde rispetto a t abbiamo 0 = ∂t (∂tt wϕ − c2 Δwϕ ) = (∂tt − c2 Δ)∂t wϕ = (∂tt − c2 Δ)v. Inoltre, v (x,0) = ∂t wϕ (x,0) = ϕ (x) ,
vt (x,0) = ∂tt wϕ (x,0) = c2 Δwϕ (x,0) = 0.
Di conseguenza, v è soluzione di (5.112) e u = v + wh soddisfa (5.110).
Il Lemma indica che, trovata una formula per la soluzione di (5.111), la soluzione del problema completo (5.110) si deduce dalla (5.113). Ci concentriamo quindi sul problema (5.111). Cominciamo a considerare un dato h particolare, che corrisponde, per esempio nel caso delle onde sonore, ad un improvviso cambiamento di densità dell’aria concentrato in un punto, diciamo y, rispetto ad un livello costante di riferimento. Se w rappresenta la variazione di densità rispetto a tale livello e l’intensità della perturbazione iniziale è unitaria, allora w è soluzione del problema wtt − c2 Δw = 0 x ∈ R3 , t > 0 (5.114) w (x, 0) = 0, wt (x,0) = δ (x − y) x ∈ R3 dove δ (x − y) è la distribuzione di Dirac in y, tridimensionale. La soluzione di questo problema si chiama soluzione fondamentale dell’equazione delle onde, che indichiamo con K (x, y,t). Poiché il dato è tutto fuorché regolare, per risolvere il problema approssimiamo la distribuzione di Dirac con una funzione opportuna riservandoci poi di passare al limite. Come approssimante possiamo scegliere la soluzione fondamentale dell’equazione di diffusione in
304
5 Onde e vibrazioni
dimensione n = 3; sappiamo infatti che (Paragrafo 2.3.4, con t = ε, D = 1, n = 3) , 2 1 |x − y| Γ (x − y,ε) = → δ (x − y) exp − 4ε (4πε)3/2 se ε → 0. Indichiamo con wε la soluzione del problema (5.114) con Γ (x − y,ε) al posto di δ (x − y). Poiché Γ (x − y,ε) ha simmetria radiale con centro in y, ci aspettiamo che wε abbia lo stesso tipo di simmetria e cioè che wε = wε (r, t), r = |x − y|, ovvero che sia un’onda sferica. Abbiamo visto nel Paragrafo 5.7.1 che le onde sferiche hanno la forma generale F (r + ct) G (r − ct) + . r r
w (r, t) =
(5.115)
Le condizioni iniziali richiedono F (r) + G (r) = 0
e
Pertanto F = −G
e
c(F (r) − G (r)) = rΓ (r,ε) . G (r) = −rΓ (r,ε) /2c.
Integrando la seconda relazione, troviamo 2! 2! r r s 1 1 1 √ exp − s exp − ds = − 1 G (r) = − 4πc 4πε 4ε 4ε 2c(4πε)3/2 0 e infine 1 wε (r, t) = 4πcr
! !! (r − ct)2 (r + ct)2 1 1 √ exp − exp − −√ . 4ε 4ε 4πε 4πε
Osserviamo ora che la funzione 2! 1 r Γ8 (r, ε) = √ exp − 4ε 4πε è la soluzione fondamentale dell’equazione di diffusione in dimensione n = 1, con x = r e t = ε. Passando al limite per ε → 0 si trova27 wε (r, t) →
1 {δ(r − ct) − δ(r + ct)} . 4πcr
Essendo r + ct > 0, si ha δ(r + ct) = 0, da cui la formula K (x, y,t) = 27
La δ è ora unidimensionale!
δ(r − ct) 4πcr
r = |x − y| .
(5.116)
5.9 Il problema di Cauchy
305
Figura 5.10. Il principio di Huygens
La soluzione fondamentale rappresenta quindi un’onda sferica progressiva smorzata (outgoing wave), concentrata inizialmente in y e successivamente sulla superficie sferica ∂Bct (y) = {x : |x − y| = ct} . L’unione delle superfici ∂Bct (y) costituisce il supporto di K e coincide con la frontiera del cono caratteristico forward , con vertice in (y, 0) e apertura θ = tan−1 c, definito da ∗ Cy,0 = {(x, t) : |x − y| ≤ ct, t > 0} . ∗ Nella terminologia della Sezione 4, ∂Cy,0 costituisce il dominio di influenza del punto y. Il fatto che tale dominio sia costituito solo dalla frontiera del cono forward e non da tutto il cono ha importanti conseguenze sulla natura della perturbazione governata dall’equazione delle onde tridimensionale. Il fenomeno più notevole è che una perturbazione generata all’istante t = 0 da una sorgente concentrata in un punto y è avvertita in un punto x0 soltanto all’istante t0 = |x0 −y| /c (Figura 5.10). Questo è noto come principio di Huygens forte e spiega come segnali istantanei (sharp signals) possono essere propagati da una sorgente puntiforme. Vedremo che non sarà così in dimensione due.
5.9.2 Formula di Kirchhoff Procedendo come per il caso unidimensionale nel Paragrafo 5.4.3, possiamo facilmente scrivere una formula per la soluzione del problema (5.111) con dato h generale. Poiché h (x) = R3
δ (x − y) h (y) dy,
possiamo pensare h come sovrapposizione di impulsi δ (x − y) h (y), concentrati in y e di intensità h (y). La soluzione di (5.111) è allora la sovrapposizione
306
5 Onde e vibrazioni
delle corrispondenti soluzioni K (x, y,t) h (y), cioè δ(|x − y| − ct) h (y) dy wh (x,t) = K (x, y,t) h (y) dy = 4πc |x − y| R3 R3 che scriviamo subito meglio. Infatti, si può scrivere, usando coordinate sferiche con polo in x: ∞ δ(r − ct) 1 wh (x,t) = h (σ) dσ = h (σ) dσ, dr 4πcr 4πc2 t ∂Bct (x) ∂Br (x) 0 (5.117) dove, nell’ultima ugueglianza, abbiamo usato la formula ∞ δ (r − ct) f (r) dr = f (ct) . 0
Il Lemma 9.1 e il nostro ragionamento euristico portano al seguente enunciato. Teorema 9.2 (Formula di Kirchhoff). Siano g ∈ C 3 R3 e h ∈ C 2 R3 . Allora, + * ∂ 1 1 g (σ) dσ + h (σ) dσ (5.118) u (x,t) = ∂t 4πc2 t ∂Bct (x) 4πc2 t ∂Bct (x) è l’unica soluzione u ∈ C 2 R3 × [0, +∞) del problema (5.110). Dimostrazione. Poiché g ∈ C 3 R3 , la funzione 1 wg (x,t) = g (σ) dσ 4πc2 t ∂Bct (x) soddisfa le ipotesi del Lemma 9.1 e quindi è sufficiente controllare che 1 h (σ) dσ wh (x,t) = 4πc2 t ∂Bct (x) sia soluzione del problema (5.111) con ϕ = h. Ponendo σ = x + ctω, con ω ∈ ∂B1 (0), abbiamo dσ = c2 t2 dω e 1 t wh (x,t) = h (σ) dσ = h (x + ctω) dω. 4πc2 t ∂Bct (x) 4π ∂B1 (0) Quindi ∂t wh (x,t) =
1 4π
h (x + ctω) dω + ∂B1 (0)
ct 4π
∂B1 (0)
∇h (x + ctω) · ω dω. (5.119)
Pertanto wh (x,0) = 0
e
∂t wh (x,0) = h (x) .
5.9 Il problema di Cauchy
307
Inoltre, dalla formula della divergenza, possiamo scrivere, tornando alla variabile originale σ: ct 1 ∇h (x + ctω) · ω dω = ∂ν h (σ) dσ 4π ∂B1 (0) 4πct ∂Bct (x) 1 = Δh (y) dy 4πct Bct (x) ct 1 dr Δh (σ) dσ = 4πct 0 ∂Br (x) per cui, dalla (5.119), c 1 ∂tt wh (x,t) = ∇h (x + ctω) · ω dω − Δh (y) dy 4π ∂B1 (0) 4πct2 Bct (x) 1 Δh (σ) dσ + 4πt ∂Bct (x) 1 = Δh (σ) dσ. 4πt ∂Bct (x) D’altra parte, Δwh (x,t) =
t 4π
Δh (x + ctω) dω = ∂B1 (0)
1 4πc2 t
Δh (σ) dσ ∂Bct (x)
e quindi ∂tt wh − c2 Δwh = 0. Usando la (5.119) con g al posto di h„ si vede che possiamo scrivere la formula di Kirchhoff nella forma seguente: 1 {g (σ) + ∇g (σ) · (σ − x) + th (σ)} dσ. (5.120) u (x,t) = 4πc2 t2 ∂Bct (x) La presenza del gradiente di g nella (5.120) indica che, in contrasto col caso unidimensionale, la soluzione può essere più irregolare dei dati. Infatti, se g ∈ C k R3 e h ∈ C k−1 R3 possiamo garantire solo che u è di classe C k−1 e ut di classe C k−2 negli istanti successivi. Si noti poi che la (5.120) ha perfettamente senso anche se g ∈ C 1 R3 e h è solo limitata; naturalmente, sotto queste ipotesi più deboli, la (5.120) soddisfa l’equazione in un appropriato senso generalizzato, come nel Paragrafo 5.4.2, per esempio. In questo caso, irregolarità sparse nei dati si possono focalizzare in insiemi più piccoli dando luogo a singolarità più forti (Problema 5.17). Le formule (5.118) o (5.120) contengono importanti informazioni. Anzitutto, il valore di u nel punto (x0 ,t0 ) dipende solo dai valori di g e h sulla superficie sferica ∂Bct0 (x0 ) = {|σ − x0 | = ct0 }
308
5 Onde e vibrazioni
che si chiama dominio di dipendenza del punto (x0 , t0 ). Questa superficie è l’intersezione della superficie del cono retrogrado Cx0 ,t0 con l’iperpiano t = 0. Supponiamo ora che i dati iniziali g e h abbiano supporto in un compatto D ⊂ R3 . Allora u (x, t) è diversa da zero solo per tmin < t < tmax , dove tmin e tmax sono, rispettivamente, il primo e l’ultimo tempo t tale che D ∩ ∂Bct (x) = ∅. In altri termini, una perturbazione inizialmente localizzata in D, comincia ad essere avvertita nel punto x all’istante tmin , mentre il suo effetto scompare dopo il tempo tmax . Questo è un altro modo di esprimere il principio di Huygens forte. Fissato t, consideriamo l’unione di tutte le superfici sferiche di raggio ct e centro in un punto di ∂D. L’inviluppo di queste sfere costituisce il fronte d’onda28 al tempo t e si espande alla velocità c. Al di fuori della regione che ha come bordo il fronte d’onda, si ha u = 0. 5.9.3 Il problema di Cauchy in dimensione n = 2 La soluzione del problema di Cauchy bidimensionale può essere ottenuta dalla formula di Kirchhoff utilizzando il cosiddetto metodo della discesa di Hadamard. Per maggior chiarezza, poniamo Δn = ∂x1 x1 +· · ·+∂xn xn . Consideriamo prima il problema wtt − c2 Δ2 w = 0 x ∈ R2 , t > 0 (5.121) w (x, 0) = 0, wt (x,0) = h (x) x ∈ R2 . L’idea consiste nel considerare il problema bidimensionale come un problema in dimensione n = 3, pensando di aggiungere una terza variabile. Aggiungiamo ora la variabile x3 e indichiamo con (x,x3 ) i punti di R3 . Sia la soluzione w = w (x, t) del problema (5.121) che il dato h (x) possono essere pensati come funzioni di (x,x3 ) ed allora w è soluzione del problema wtt − c2 Δ3 w = 0,
(x,x3 ) ∈ R3 , t > 0
con le stesse condizioni iniziali, ma pensate in R3 : w (x, 0) = 0,
wt (x,0) = h (x) ,
(x,x3 ) ∈ R3 .
Usiamo ora la formula di Kirchhoff. Per x3 fissato, qualunque, possiamo scrivere: 1 w (x, t) = h dσ. 4πc2 t ∂Bct (x,x3 ) Si noti che la dipendenza da x3 nell’integrale è solo apparente, come evidenziato dai calcoli che seguono. La superficie sferica ∂Bct (x,x3 ) è unione dei due emisferi di equazione ' y3 = F (y1 , y2 ) = x3 ± c2 t2 − r2 , 28
Questo fatto è noto come principio di Huygens in forma debole.
5.9 Il problema di Cauchy 2
309
2
dove r2 = (y1 − x1 ) + (y2 − x2 ) . Su entrambi gli emisferi si ha: r2 2 dσ = 1 + |∇F | dy1 dy2 = 1 + 2 2 dy1 dy2 c t − r2 ct = √ dy1 dy2 2 c t2 − r 2 e quindi i contributi dei due emisferi al valore di w sono uguali. Abbiamo perciò (dy = dy1 dy2 ) 1 h (y) dy w (x, t) = 2πc Bct (x) 2 c2 t2 − |x − y| dove Bct (x) è il cerchio di centro x e raggio ct. Usando ancora una volta il Lemma 9.1, deduciamo il seguente teorema. Teorema 9.3. (Formula di Poisson). Siano g ∈ C 3 R2 e h ∈ C 2 R2 . Allora ⎫ ⎧ ⎬ 1 ⎨∂ g (y) h (y) dy + dy u (x,t) = ⎭ 2πc ⎩ ∂t Bct (x) 2 2 Bct (x) c2 t2 − |x − y| c2 t2 − |x − y| è l’unica soluzione di classe C 2 nel semipiano R2 × [0, +∞) del problema (5.121). Anche la formula di Poisson si può rendere più esplicita se osserviamo che, ponendo y − x = ctz, si ha 2
dy = c2 t2 dz,
|x − y| = c2 t2 |z|
2
e quindi Bct (x)
g (y)
c2 t2 − |x − y|
Allora
∂ ∂t
=c B1 (0)
2
dy = ct B1 (0)
g (x + ctz) dz. 2 1 − |z|
g (y)
dy 2 c2 t2 − |x − y| g (x + ctz) ∇g (x + ctz) · z 2 dz + c t dz 2 2 B1 (0) 1 − |z| 1 − |z| Bct (x)
e, ritornando agli integrali su Bct (x), si ottiene
u (x,t) =
1 2πct
Bct (x)
g (y) + ∇g (y) · (y − x) + th (y) dy. 2 c2 t2 − |x − y|
(5.122)
310
5 Onde e vibrazioni
La formula per la soluzione in dimensione n = 2 presenta un’importante differenza rispetto al caso tridimensionale. Infatti il dominio di dipendenza della soluzione è costituito dal cerchio pieno Bct (x). Ciò comporta che una perturbazione localizzata in un punto ξ del piano comincia a far sentire il suo effetto nel punto x all’istante tmin = |x − ξ| /c, ma questo effetto continua anche dopo in quanto, per t > tmin , ξ continua ad appartenere al cerchio Bct (x). Di conseguenza il principio di Huygens forte non vale in dimensione 2 e non esistono segnali istantanei. Il fenomeno si può osservare ponendo un turacciolo in acqua calma e lasciando cadere un sasso poco distante. Il tappo rimane in quiete fino all’arrivo del primo fronte d’onda ma persiste nell’oscillazione anche dopo che questo è passato. 5.9.4 Equazione non omogenea. Potenziali ritardati La soluzione del problema di Cauchy non omogeneo si può risolvere col metodo di Duhamel (Problema 5.4). È istruttivo segnalare un altro metodo che consiste nell’usare la trasformata di Laplace rispetto al tempo e quella di Fourier rispetto alle variabili spaziali. Il metodo funziona particolarmente bene in dimensione 3. Il problema è x ∈ R3 , t > 0 utt − c2 Δu = f (5.123) u (x, 0) = 0, ut (x,0) = 0 x ∈ R3 . Per semplicità, supponiamo che f sia un funzione regolare a supporto compatto, contenuto nel semispazio t > 0. La trasformata di Laplace L[v] di una funzione v = v (t), definita in R e nulla per t < 0, è definita dalla formula ∞ L[v] (p) = e−pt v (t) dt, 0
dove p è un numero complesso, ed in generale esiste solo in un semipiano del tipo Re p > α. Ci interessano solo due di proprietà della trasformata di Laplace. La trasformata di una derivata e la formula del ritardo. Abbiamo in particolare le seguenti formule: L[v ] (p) = pL[v] (p) − v (0) , e
L[v ] (p) = p2 L[v] (p) − pv (0) − v (0)
L[v (t − t0 )] (p) = e−pt0 L[v] (p) .
(5.124)
La trasformata tridimensionale di Fourier di una funzione w definita in R3 è w < (ξ) = w (x) e−ix·ξ dξ. R3
5.9 Il problema di Cauchy
311
Le proprietà della trasformata che ci servono sono: = (ξ) = − |ξ|2 w Δw < (ξ) .
< (ξ) , w = xj (ξ) = iξ j w
Se w e w < sono integrabili in modulo29 , allora w è la trasformata inversa di w < e cioè 1 w < (ξ) eix·ξ dξ. w (x) = 3 (2π) R3 Per esempio abbiamo w (x) =
1 e−a|x| 4π |x|
e
w < (ξ) =
1 a2
+ |ξ|
2.
(5.125)
< è a quadrato sommabile in R3 . Si noti che w è integrabile in R3 e che w Infine ricordiamo che la trasformata di una convoluzione w (x − y) v (y) dy (w ∗ v) (x) = R3
è il prodotto delle trasformate w < (ξ) v< (ξ). Siamo ora pronti per risolvere il problema di Cauchy. Poniamo U (x,p) = L[u] (x,p)
e
F (x,p) = L[f ] (x,p)
ricordando che f (x,t) = 0 per t < 0. Eseguendo la trasformata di Laplace (rispetto a t) di entrambi i membri dell’equazione utt − c2 Δu = f si trova p2 U − c2 ΔU = F essendo u (x, 0) = 0, ut (x,0) = 0. Eseguiamo ora la trasformata di Fourier dell’equazione così ottenuta; si trova 2 < (ξ,p) = F< (ξ,p) p2 + c2 |ξ| U ovvero
1 < (ξ, p) = 1 U F< (ξ,p) . c2 |ξ|2 + p2 /c2
1 1 −(p/c)|x| Dalla (5.125), |ξ|2 +p e quindi 2 /c2 è la trasformata di Fourier di 4π|x| e il teorema sulla convoluzione dà 1 1 e−(p/c)|x−y| F (y,p) dy. U (x,p) = 4πc2 R3 |x − y|
Infine, usando la formula del ritardo (5.124) con t0 = |x − y| /c, si ottiene 1 1 |x − y| f y,t − dy. (5.126) u (x,t) = 4πc2 R3 |x − y| c 29
O anche a quadrato sommabile.
312
5 Onde e vibrazioni
La (5.126) definisce la soluzione del problema (5.123) come potenziale ritardato. Infatti, la perturbazione al tempo t nel punto x non dipende dai contributi della sorgente nei singoli punti y al tempo t, bensì da questi contributi ad un tempo precedente t = t − |x − y| /c. La differenza t − t è il tempo necessario alla perturbazione per propagarsi da y a x. Si noti che, essendo f = 0 per t < 0, l’integrale è in realtà esteso alla sfera Bct (x) = {y : |x − y| ≤ ct}. L’integrale nella (5.126) si può scrivere nella forma (Appendice B): ct t · · · dy = ds · · · dσ = c ds · · · dσ. Bct (x)
0
∂Br (x)
0
∂Bc(t−s) (x)
Poiché su ∂Bc(t−s) (x) si ha |x − y| = c (t − s), troviamo infine: t 1 ds u (x,t) = f (σ,s) dσ. 4πc2 0 t − s ∂Bc(t−s) (x) Questa formula indica che il valore della soluzione in (x,t) dipende dai valori di f nel cono caratteristico all’indietro Cx,t , troncato a t ≥ 0.
5.10 Onde d’acqua lineari Nello studio delle onde d’acqua si presenta una miriade di fenomeni interessanti. Analizzeremo brevemente alcune tipi di onde di superficie, costituite da perturbazioni della superficie libera risultanti dal bilancio tra forze che tendono a ripristinare l’equilibrio, come la gravità e la tensione superficiale, e l’inerzia del fluido, provvocata da un’agente esterno, come per esempio il vento, il passaggio di un’imbarcazione o un maremoto. In particolare, ci concentreremo su onde lineari, la cui ampiezza è molto minore della lunghezza d’onda, analizzando la relazione di dispersione nel caso di acque profonde. 5.10.1 Un modello per onde di superficie Cominciamo col ricavare un modello base per onde d’acqua di superficie, assumendo le seguenti ipotesi. 1. Il fluido ha densità costante ρ e viscosità trascurabile. In particolare, la forza esercitata su un volumetto di fluido dal fluido circostante è data dalla pressione normale −pν sul bordo del volume. 2. Il moto è laminare (assenza di rottura di onde o turbolenza) e bidimensionale. Ciò significa che in un opportuno sistema di coordinate x, z, dove l’asse x è orizzontale e l’asse z è verticale, possiamo descrivere la superficie libera con una funzione z = h (x, t) mentre il vettore velocità nella direzione ortogonale alla sezione è praticamente uniforme ed ha la forma w = u (x, z, t) i + v (x, z, t) k.
5.10 Onde d’acqua lineari
313
Figura 5.11. Sezione verticale della regione occupata dal fluido
3. Il moto è irrotazionale e quindi il vettore velocità può essere scritto come gradiente di un potenziale φ = φ (x, z, t): w = ∇φ = φx i + φy k. Le nostre incognite sono il profilo della superficie libera h = h (x, t) e il potenziale φ. Occorrono equazioni differenziali per h e φ oltre a condizioni sul bordo del dominio occupato dal fluido, in particolare sulla superficie libera e sul fondo rigido. Assumiamo che i lati del nostro dominio siano molto lontani e che la loro influenza possa essere trascurata. Possiamo allora supporre che il dominio si estenda lungo tutto l’asse x. Inoltre, per semplicità, supponiamo che il fondo sia piatto, al livello z = −H (H > 0). Le equazioni per h e φ si ricavano dalle leggi di conservazione di massa e del momento lineare. Tenendo conto delle ipotesi 2 e 3, possiamo scrivere: Conservazione della massa: div w = Δφ = 0
x ∈ R, − H < z < h (x, t)
(5.127)
e quindi φ è una funzione armonica. Conservazione del momento lineare: 1 wt + (w · ∇)w = g − ∇p ρ
(5.128)
dove g è l’accelerazione di gravità. Riscriviamo la (5.128) in termini del potenziale φ. Dall’identità (Appendice C) (w · ∇)w =
1 2 ∇(|w| ) − w× rot w 2
otteniamo, essendo rot w = 0, (w · ∇)w =
1 2 ∇(|∇φ| ). 2
314
5 Onde e vibrazioni
Inoltre, scrivendo g = ∇(−gz), la (5.128) diventa ∂ 1 1 2 (∇φ) + ∇(|∇φ| ) = − ∇p + ∇(−gz) ∂t 2 ρ
ossia
1 p 2 ∇ φt + |∇φ| + + gz 2 ρ
! = 0.
Di conseguenza φt +
1 p 2 |∇φ| + + gz = C (t) 2 ρ
con C = C (t) funzione arbitraria. Poiché il potenziale φ è definito a meno di "t una funzione additiva di t, aggiungendo a φ la funzione 0 C (s) ds ci si riporta a C (t) = 0. Otteniamo dunque l’equazione di Bernoulli φt +
1 p 2 |∇φ| + + gz = 0. 2 ρ
(5.129)
Consideriamo ora le condizioni al bordo. Sul fondo, la componente verticale della velocità si annulla e perciò abbiamo la condizione di Neumann φz (x, −H, t) = 0,
x ∈ R.
(5.130)
Più delicata è la condizione sulla superficie libera z = h (x, t); infatti, poiché questa superficie è essa stessa un’incognita del problema, occorrono in realtà due condizioni su di essa. La prima si deduce dall’equazione di Bernoulli. Infatti, la pressione totale sulla superficie libera è data da −3/2 p = pat − σhxx 1 + h2x .
(5.131)
Nella (5.131) il termine pat è la pressione atmosferica, che possiamo sempre supporre nulla, mentre il secondo termine è dovuto alla tensione superficiale, come sarà chiaro più avanti. Inserendo la (5.131) e z = h (x, t) nell’equazione di Bernoulli, otteniamo la seguente condizione dinamica in superficie: φt +
σhxx 1 2 + gh = 0, |∇φ| − 3/2 2 ρ {1 + h2x }
x ∈ R, z = h (x, t) .
(5.132)
Una seconda condizione si ricava imponendo che una particella di fluido in superficie rimanga sempre in superficie. Se il cammino di una particella è descritto dalle equazioni x = x (t), z = z (t), imporre che la particella rimanga in superficie equivale a richiedere che, per ogni t, si abbia z (t) − h (x (t) , t) ≡ 0.
5.10 Onde d’acqua lineari
315
Differenziando questa equazione si ottiene z˙ (t) − hx (x (t) , t) x˙ (t) − ht (x (t) , t) = 0 cioè, essendo x˙ (t) = φx (x (t) , z (t) , t) e z˙ = φz (x (t) , z (t) , t), φz − ht − φx hx = 0,
x ∈ R, z = h (x, t) ,
(5.133)
che chiamiamo condizione cinematica in superficie. Infine, richiediamo un comportamento ragionevole di φ e h per x → ±∞, per esempio, |φ (x, t)| dx < ∞, |h (x, t)| dx < ∞ e φ, h → 0 per x → ±∞. R
R
(5.134) L’equazione (5.127) e le condizioni al bordo (5.130), (5.132), (5.133) costituiscono il nostro modello per onde di superficie. Dopo una breve giustificazione della Formula (5.131), nel prossimo paragrafo ritorneremo al modello, ricavandone una formulazione adimensionale e successivamente una versione linearizzata. • Effetto della tensione superficiale. In una molecola d’acqua i due atomi d’idrogeno mantengono una posizione asimmetrica rispetto all’atomo di ossigeno e questa asimmetria genera un momento di dipolo elettrico. Sotto la superficie libera questi momenti si bilanciano cosicché la loro risultante è nulla. In superficie essi tendono a diventare paralleli, creando una forza intermolecolare, confinata in superficie. È questa forza che permette ad un ago di galleggiare o ad un insetto di camminare sull’acqua ed è nota come tensione superficiale. Il modo con cui tale forza si manifesta è simile all’azione esercitata su una piccola porzione di un materiale elastico dal materiale circostante, descritta mediante il vettore sforzo (stress), che è una forza per unità di area, definito sul bordo della porzione. Analogamente, possiamo pensare che, isolata una regione sulla superficie di un fluido delimitata da una curva chiusa γ, l’influenza del fluido circostante su di essa sia descritta da una forza (traente) f per unità di lunghezza agente lungo la curva γ. Siano n un versore normale alla superficie e τ un versore tangente a γ. Una ragionevole legge costitutiva per f è f (x,t) = σ (x,t) N (x,t) dove x ∈ γ e N = τ ∧ n. La forza f agisce dunque nella direzione di N, in modo indipendente da N stesso e puntando fuori da γ (Figura 5.12a). Lo scalare σ, modulo della forza f , prende il nome di tensione superficiale. Cerchiamo ora di determinare la relazione tra tensione superficiale e pressione alla superficie libera di un fluido (non viscoso) imponendo che la tensione
316
5 Onde e vibrazioni
Figura 5.12. Tensione superficiale σN
superficiale e le forze dovute alla differenza di pressione attraverso la superficie si bilancino. Consideriamo la sezione verticale ds di un piccolo elemento di superficie come quello indicato in Figura 5.12b. Ai due estremi agisce tangenzialmente la tensione superficiale di modulo σ (forza per unità di lunghezza). A meno di infinitesimi di ordine superiore, la componente verticale è data da 2σ sin (α/2). La forza verso il basso, dovuta alla differenza di pressione attraverso la superficie, è (sempre al prim’ordine) (pat − p)ds dove p è la pressione del fluido appena sotto la superficie. Deve dunque essere (pat − p)ds = 2σ sin (α/2) . Poiché per α → 0, ds ≈ Rdα e 2 sin (α/2) ≈ α, si ha σ pat − p = = σκ R
(5.135)
dove κ = R−1 è la curvatura della superficie. Se la pressione atmosferica prevale, la curvatura è positiva e la superficie è convessa altrimenti la curvatura è negativa e la superficie concava, come in Figura 12.b. Se la superficie è descritta da z = h (x, t), si ha κ=
hxx 3/2
{1 + h2x }
.
Avendo scelto nel nostro caso pat = 0, abbiamo dunque per la pressione in superficie −3/2 p = −σhxx 1 + h2x che, inserita nella (5.135), dà la (5.131). 5.10.2 Adimensionalizzazione e linearizzazione Il problema (5.127), (5.130), (5.132), (5.133) è molto complesso sia per le nonlinearità presenti sia perché le condizioni al bordo sono imposte su una curva
5.10 Onde d’acqua lineari
317
che è un’incognita del problema. Se però restringiamo le nostre considerazioni al caso delle onde lineari, in cui l’ampiezza delle onde sia piccola rispetto alla lunghezza d’onda, entrambe le difficoltà spariscono. Nonostante la semplificazione, la teoria risultante ha un campo piuttosto vasto di aplicazione. Non è raro infatti, osservare onde di ampiezza di uno o due metri con lunghezza d’onda dell’ordine di un chilometro. Per meglio renderci conto dell’effetto di questa ipotesi, adimensionalizziamo il problema introducendo una lunghezza d’onda media L, un’ampiezza media A e un periodo medio P (tempo impiegato da una cresta per percorrere una distanza dell’ordine di L). Poniamo ora τ=
t , P
ξ=
x , L
η=
z . L
Il potenziale φ ha dimensioni lunghezza2 ×tempo−1 mentre h ha le dimensioni di una lunghezza; riscaliamo φ ed h ponendo Φ(ξ, η, τ ) =
P φ(Lξ, Lη, P τ ), LA
Γ (ξ, τ ) =
1 h(Lξ, Lη, P τ ). A
In termini di queste nuove variabili adimensionali, il sistema diventa, dopo calcoli elementari: ΔΦ = 0, Φτ +
ε 2
2
|∇Φ| + F
3/2 Γ − BΓξξ 1 + ε2 Γξ2
− H0 < η < εΓ (ξ, τ )
! = 0,
Φη − Γτ − εΦξ Γξ = 0,
η = εΓ (ξ, τ ) η = εΓ (ξ, τ )
Φη (ξ, −H0 , τ ) = 0, dove ξ ∈ R e dove abbiamo messo in evidenza i parametri adimensionali ε=
A , L
H0 =
H , L
F =
gP 2 , L
B=
σ . ρgL2
Incidentalmente si osservi che, da sette parametri iniziali A, L, P, H, g, σ, ρ si è passati a quattro combinazioni adimensionali. I primi due parametri sono di natura geometrica. Il parametro B, detto numero di Bond, misura l’importanza della tensione superficiale mentre F, numero di Froude, misura l’importanza della gravità. A questo punto, l’ipotesi che l’ampiezza della perturbazione della superficie libera sia molto minore della sua lunghezza d’onda si traduce semplicemente con A ε= 1 L
318
5 Onde e vibrazioni
e il sistema di equazioni adimensionali si linearizza semplicemente ponendo ε = 0: ΔΦ = 0, − H0 < η < 0 Φτ + 0F {Γ − BΓξξ } = 0,
η=0
Φη − Γτ = 0,
η=0
Φη (ξ, −H0 , τ ) = 0. Ritornando a variabili dimensionali, il sistema linearizzato si scrive: − H < z < 0, x ∈ R (Laplace)
φxx + φzz = 0 φt + gh −
z = 0, x ∈ R
(Bernoulli)
φ z − ht = 0
z = 0, x ∈ R
(Cinematica)
φz (x, −H, t) = 0
x∈R
(Neumann).
σ ρ hxx
=0
(5.136)
È possibile ricavare un’equazione nella sola φ. Deriviamo due volte rispetto ad x l’equazione cinematica ed usiamo φxx = −φzz ; si trova: htxx = φzxx = −φzzz .
(5.137)
Deriviamo l’equazione di Bernoulli rispetto a t ed usiamo la (5.137) e ht = φz . Si trova la seguente equazione nella sola φ: φtt + gφz +
σ φ = 0, ρ zzz
z = 0, x ∈ R.
(5.138)
5.10.3 Onde lineari in acqua profonda Risolviamo ora il problema linearizzato (5.136) con le seguenti condizioni iniziali φ (x, z, 0) = 0,
h (x, 0) = h0 (x) ,
ht (x, 0) = 0.
(5.139)
Le (5.139) corrispondono ad un fluido inizialmente (t = 0) a riposo, con la superficie libera “perturbata” che assume un profilo h0 , non orizzontale. Per semplicità assumiamo che h0 sia regolare, pari (i.e. h0 (−x) = h0 (x)) e a supporto compatto (cioè la perturbazione iniziale è localizzata). Inoltre, consideriamo il caso di acqua profonda (H 1), cosicchè la condizione di Neumann può essere sostituita da 30 φz (x, z, t) → 0
as z → −∞.
(5.140)
Il problema risultante non rientra in una delle classi di problemi che abbiamo studiato finora e non è chiaro che sia ben posto. Controlliamo se le condizioni poste individuano una sola soluzione. 30
Per il caso di profondità finita si veda il Problema 5.20.
5.10 Onde d’acqua lineari
319
Poiché x varia su tutto R, possiamo usare la trasformata di Fourier rispetto ad x, definita da < (k, z, t) = < φ e−ikx φ (x, z, t) dx, h (k, t) = e−ikx h (x, t) dx. R
R
h0 (k) = < h0 (k, 0) si annulli rapidamente per Le potesi su h0 implicano che < < < |k| → ∞ e che h0 (−k) = h0 (k). < = −k 2 φ, < l’equazione di Laplace si trasforma nell’equazione Essendo φ xx differenziale ordinaria <=0 < − k2 φ φ zz la cui soluzione generale è < (k, y, t) = A (k, t) e|k|z + B (k, t) e−|k|z . φ Dalla (5.140) deduciamo che deve essere B (k, t) ≡ 0 cosicché < (k, z, t) = A (k, t) e|k|z . φ
(5.141)
Trasformando la (5.138) otteniamo < < + σφ < + gφ = 0, φ tt z ρ zzz
z = 0, k ∈ R.
< la formula (5.141), si ricava per A l’equazione Inserendo per φ σ 3 Att + g |k| + |k| A = 0 ρ il cui integrale generale è A (k, t) = a (k) eiωt + b (k) e−iωt , dove abbiamo posto (relazione di dispersione) σ 3 ω = ω (k) = g |k| + |k| . ρ Troviamo, dunque, < (k, z, t) = a (k) eiω(k)t + b (k) e−iω(k)t e|k|z . φ Determiniamo ora a (k) e b (k) usando le condizioni iniziali. Anzitutto osserviamo che dall’equazione di Bernoulli si ha ! < (k, 0, t) + g + σ k 2 < h (k, t) = 0, k∈R (5.142) φ t ρ
320
5 Onde e vibrazioni
da cui σ h = 0, iω a (k) eiωt − b (k) e−iωt + g + k 2 < ρ e per t = 0
k∈R
σ 2 < iω {a (k) − b (k)} + g + k h0 = 0. ρ
(5.143)
Analogamente, dalla condizione cinematica φz = ht si ha < (k, 0, t) + < ht (k, t) = 0, φ z Poiché
k ∈ R.
(5.144)
< (k, 0, t) = |k| a (k) eiω(k)t + b (k) e−iω(k)t φ z
ed essendo dalla (5.139) < ht (k, 0) = 0, otteniamo da (5.144) per t = 0 e k = 0, a (k) + b (k) = 0.
(5.145)
Da (5.143) e (5.145) si ha allora (k = 0) a (k) = −b (k) = e quindi
i g + σρ k 2 2ω (k)
< h0 (k)
< (k, z, t) = φ
i g + σρ k 2 2ω
eiωt − e−iωt e|k|z < h0 (k) .
< e da (5.142) ricaviamo Dall’espressione di φ < h (k, t) =
σ g + k2 ρ
−1
< (k, 0, t) = 1 eiωt + e−iωt < h0 (k) φ t 2
e infine, antitrasformando 31 : 1 h (x, t) = 4π 31
R
ei(kx−ω(k)t) + ei(kx+ω(k)t) < h0 (k) dk.
Notiamo che, poiché anche ω (k) è pari, possiamo scrivere 1 ˆ 0 (k) dk. h (x, t) = cos [kx − ω (k) t] h 2π R
(5.146)
5.10 Onde d’acqua lineari
321
5.10.4 Interpretazione della soluzione La (5.146) si presenta in forma di pacchetto d’onde. La relazione di dispersione σ 3 ω (k) = g |k| + |k| ρ indica che ogni componente di Fourier del profilo iniziale si propaga lungo l’asse x in entrambe le direzioni. Le velocità di fase e di gruppo sono date da (considerando solo k > 0, per semplicità) σk ω g + cp = = k k ρ e
g + 3σk 2 /ρ cg = ' . 2 gk + σk 3 /ρ
Vediamo quindi che la velocità di un’onda di lunghezza λ = 2π/k dipende dalla sua lunghezza. Il parametro fondamentale è B ∗ = 4π 2 B =
σk 2 ρg
dove B è il numero di Bond. Per l’acqua (in condizioni “normali”), 2
ρ = 1 gr/cm3 , σ = 72 gr/sec , g = 980 cm/sec2
(5.147)
per cui B ∗ = 1 quando la lunghezza d’onda è circa λ = 1.7 cm. Per lunghezze d’onda molto maggiori di 1.7 cm, si ha B ∗ < 1, k = 2π λ 1 e l’effetto della tensione superficiale è trascurabile. In questo caso si parla di onde di gravità e le loro velocità di fase e di gruppo sono ben approssimate da g gλ cp = = k 2π e 1 cg = 2
g 1 = cp . k 2
Si vede che onde di lunghezza maggiore viaggiano ad una velocità superiore. D’altra parte, se λ 1.7 cm, allora B ∗ > 1, k = 2π λ 1 e l’effetto della tensione superficiale è dominante. In questo caso si parla di onde di capillarità e le loro velocità di fase e di gruppo sono ben approssimate da σ |k| 2πσ = cp = ρ λρ
322
5 Onde e vibrazioni
Figura 5.13. c2p in funzione di λ
e 3 cg = 2
σk 3 = cp . ρ 2
Si vede che onde di lunghezza minore viaggiano ad una velocità superiore. È interessante il caso in cui gravità e tensione superficiale sono entrambe rilevanti. La figura mostra il grafico di c2p in funzione di λ (con i parametri (5.147)): 452.39 . c2p = 156.97 λ + λ La caratteristica principale del grafico è la presenza del minimo cmin ∼ 23 cm/sec proprio in corrispondenza del valore λ ∼ 1.7 cm. La conseguenza è curiosa: onde di gravità e di capillarità di piccola ampiezza (relativamente alla lunghezza d’onda) possono apparire simultaneamente solo quando cp > 23 cm/sec. Una situazione tipica, ricordata nel Paragrafo 5.1.2, si osserva nel caso di un rametto tenuto in verticale e fatto scorrere a velocità costante v in acqua ferma e abbastanza profonda. Nel sistema di onde che si genera, dietro il ramo dominano gli effetti gravitazionali con onde che si allungano e si allontanano, mentre davanti domina la tensione superficiale con onde corte che precedono il ramo. Il risultato precedente implica che si può sostenere questo sistema di onde solo se v > 23 cm/sec. 5.10.5 Comportamento asintotico Come abbiamo già osservato nel Paragrafo 5.1.2, il comportamento di un pacchetto d’onde è dominato nel breve periodo dalle condizioni iniziali e solo dopo un tempo relativamente lungo è possibile osservare le caratteristiche intrinseche della perturbazione. Per questa ragione, risulta significativo analizzare il comportamento del pacchetto per t → +∞. A tale scopo occorre una buona formula asintotica per l’integrale nella (5.146) quando t 1.
5.10 Onde d’acqua lineari
323
Per brevità, consideriamo solo onde di gravità, per le quali ' ω (k) = g |k|. Seguiamo il cammino x = x (t) di una particella in moto nella direzione positiva dell’asse x con velocità costante v > 0, cosicché x = vt. Inserendo x = vt nella (5.146) abbiamo 1 1 eit(kv−ω(k)) < eit(kv+ω(k)) < h (vt, t) = h0 (k) dk + h0 (k) dk 4π R 4π R ≡ h1 (vt, t) + h2 (vt, t) . Dal Teorema 10.1 nel prossimo paragrafo, con ϕ (k) = kv − ω (k), deduciamo che se esiste esattamente un punto k0 tale che ω (k0 ) = v
ϕ (k0 ) = −ω (k0 ) = 0,
e
allora il comportamento di h1 per t 1 è descritto dalla formula seguente: 1 A (k0 ) exp {it[k0 v − ω (k0 )]} + O (5.148) h1 (vt, t) = t t
dove A (k0 ) = < h0 (k0 )
π sign ω (k ) . exp i − 0 8π |ω (k0 )| 4 1
Nel nostro caso abbiamo (possiamo escludere k = 0) ω (k) =
1√ −1/2 sign (k) g |k| 2
e
ω (k) = −
√
g −3/2 . |k| 4
Poiché v > 0, l’equazione ω (k0 ) = v dà l’unico punto di fase stationaria k0 =
gt2 g = . 4v 2 4x2
Inoltre, k0 v − ω (k0 ) = −
g gt =− 4v 4x
e
ω (k0 ) = −
2v 3 2x3 =− 3 <0 g gt
per cui, dalla (5.148), troviamo 1 g h0 h1 (vt, t) = < 4 4v 2
! gt g π + O t−1 . exp i − + 3 πtv 4v 4
Analogamente, ricordando che < h0 (k0 ) = < h0 (−k0 ), troviamo ! gt 1 g g π h0 − + O t−1 . exp i h2 (vt, t) = < 2 3 4 4v πtv 4v 4
324
5 Onde e vibrazioni
Infine, usando la formula di Eulero cos θ = (eiθ + e−iθ )/2 : h (vt, t) = h1 (vt, t) + h2 (vt, t) ! 1 g g π gt = < h0 − + O t−1 . cos 2 3 2 4v πtv 4v 4 Questa formula mostra che, se x 1 e t 1, il pacchetto d’onde è localmente sinusoidale in un intorno del punto x = vt, con numero d’onde k (x, t) = gt2 /4x2 . In altri termini, un osservatore che si muove alla velocità v = x/t registra una lunghezza d’onda dominante pari a 2π/k0 , dove k0 è la soluzione di ω (k0 ) = x/t. L’ampiezza decresce con una velocità dell’ordine di t−1/2 . Ciò è dovuto alla dispersione delle componenti di Fourier della configurazione iniziale, dopo un tempo sufficientemente lungo. 5.10.6 Il metodo della fase stazionaria Il metodo della fase stazionaria, dovuto a Laplace, dà una formula asintotica per t → +∞ per integrali della forma f (k) eitϕ(k) dk I (t) = R
dove ϕ è una funzione con un numero finito di punti stazionari. In realtà, interessa solo la parte reale di I(t), in cui appare il fattore cos[tϕ (k)]. Ora, al crescere di t, la frequenza delle oscillazioni dell funzione k −→ cos[tϕ (k)] aumenta e prima o poi supera ampiamente quella di f . Per questa ragione si crea un effetto di cancellazione tra i contributi all’integrale corrispondenti agli intervalli dove cos[tϕ (k)] > 0 e quelli in cui cos[tϕ (k)] < 0. Ci aspettiamo quindi che I (t) → 0 per t → +∞, proprio come nel caso dei coefficienti di Fourier di una funzione integrabile quando la frequenza tende all’infinito. L’informazione che si vuole ottenere è: qual è la velocità con la quale I (t) converge a zero ? Per rispondere, occorre capire quali siano gli intervalli che contribuiscono in misura maggiore al valore di I (t). Dal ragionamento precedente, si capisce che per t 1, i contributi rilevanti a I (t) provengono dagli intervalli in cui ϕ è quasi costante, in quanto, in questi intervalli, anche la funzione k −→ cos[tϕ (k)] è quasi costante e quindi oscillazioni e cancellazioni avvengono in misura minore. Queste considerazioni, a loro volta, suggeriscono che un intervallo comunque piccolo, ma contenente un punto k0 , stazionario per ϕ, contribuirà al valore di I (t) molto di più di ogni altro intervallo, limitato o meno, privo di punti stazionari per ϕ. Il metodo della fase stazionaria precisa le argomentazioni fatte sopra, attraverso il seguente teorema, in cui, per brevità, assumiamo che ϕ abbia un solo punto stazionario e non degenere. Teorema 10.1. Siano f ∈ C 1 (R), |f | ≤ K, e ϕ ∈ C 2 (R). Assumiamo che ϕ (k0 ) = 0, ϕ (k0 ) = 0 e ϕ (k) = 0 per k = k0 .
5.10 Onde d’acqua lineari
325
Inoltre, sia:
|ϕ (±∞)| > 0 Allora, per t → +∞,
−2
e R
|f ϕ − f ϕ | (ϕ )
dk = K < ∞.
f (k) eitϕ(k) dk
R
1 2 π 1 2π f (k0 ) √ exp i tϕ(k0 ) + sign ϕ (k0 ) + O . = |ϕ (k0 )| 4 t t Essendo O t−1 una quantità che va a zero come t−1 (o più rapidamente), si vede che la velocità con cui I (t) converge a zero è dell’ordine di t−1/2 . Per la dimostrazione ci serviamo del seguente lemma “di localizzazione”. Lemma 10.2. Siano f, g e ϕ come nel Teorema 10.1. Sia inoltre |ϕ (k)| ≥ C > 0 in (c, +∞). Allora +∞ 1 itϕ(k) f (k) e dk = O per t → +∞. (5.149) t c Dimostrazione. Sia d > c. Moltiplicando e dividendo per ϕ ed integrando per parti, abbiamo: , d d f itϕ 1 f (d) eitϕ(d) f ϕ − f ϕ itϕ f (c) eitϕ(c) ϕ e dk = e dk . − − 2 it ϕ (d) ϕ (c) (ϕ ) c ϕ c Poiché eitϕ(k) ≤ 1, dalle nostre ipotesi, possiamo scrivere ! 1 2K d K0 itϕ(k) f (k) e dk ≤ +K ≡ . c t C t Passando al limite per d → ∞ si ottiene la (5.149). Un risultato analogo vale per l’integrale su (−∞, c) se |ϕ (k)| ≥ C > 0 in (−∞, c). Dimostrazione del Teorema 10.1. Essendo molto tecnica, la facciamo solo nel caso in cui ϕ è un polinomio di secondo grado. Il caso generale si riduce a questo con opportuni cambi di variabile. Senza perdere in generalità, possiamo supporre che sia k0 = 0, cosicché ϕ (0) = 0, ϕ (0) = 0 e ϕ (k) = ϕ (0) + Ak 2 ,
A=
1 ϕ (0) . 2
Dal Lemma 10.2, è sufficiente considerare l’integrale ε f (k) eitϕ(k) dk. −ε
326
5 Onde e vibrazioni
Scriviamo f (k) = f (0) +
f (k) − f (0) k ≡ f (0) + q (k) k, k
e osserviamo che, essendo f ∈ C 2 ([−ε, ε]), q (k) è limitata in [−ε, ε]. Allora abbiamo:
ε
ε
f (k) eitϕ(k) dk = 2f (0)eitϕ(0) −ε
2
ε
eitAk dk + eitϕ(0) 0
2
q (k) keitAk dk. −ε
Ora, integrando per parti il secondo integrale, si trova
ε
2
q (k) keitAk dk (5.150) −ε ! ε 2 2 1 q (k) eitAk dk = O (1/t) [q (ε) − q (−ε)] eitAε − = 2iAt −ε per t → ∞, poiché la quantità tra parentesi graffe è limitata. Nel primo integrale, se A > 0, poniamo tAk 2 = y 2 . Allora
ε
itAk2
e 0
1 dk = √ tA
√ ε tA
2
eiy dy. 0
Poiché32
√ ε tA
e 0
32
iy 2
√
π iπ e 4 +O dy = 2
1 √ ε tA
,
Valgono le seguenti formule (Courant, Hilbert, 1953): √ π √ − 2 2
λ 0
1 , cos(y 2 )dy ≤ λ
√ π √ − 2 2
λ 0
1 sin(y 2 )dy ≤ . λ
Problemi
otteniamo
ε
f (k) e 0
itϕ(k)
dk =
1 2π f (0) π 2 √ exp i ϕ(0)t + +O |ϕ (0)| t 4
327
1 . (5.151) t
Le (5.151), (5.150) provano il teorema quando A > 0. Il caso A < 0 è simile. Problemi 5.1. Una corda di chitarra di lunghezza L è pizzicata nel suo punto medio e poi rilasciata. Formulare il modello matematico ed esaminare i modi di vibrazione. Calcolare l’energia E (t). 5.2. Usando il metodo dell’energia come nel Paragrafo 5.3.2, dimostrare un risultato di unicità per i problemi di Cauchy-Neumann, Cauchy-Robin e misto. 5.3. Risolvere il problema ⎧ ⎨ utt − uxx = 0 u (x, 0) = ut (x, 0) = 0 ⎩ ux (0, t) = 1, u (1, t) = 0
0 < x < 1, t > 0 0≤x≤1 t ≥ 0.
5.4. Vibrazioni forzate. Risolvere il problema ⎧ 0 < x < π, t > 0 ⎨ utt − uxx = g (t) sin x u (x, 0) = ut (x, 0) = 0 0≤x≤π ⎩ u (0, t) = u (π, t) = 0 t ≥ 0. [Risposta: u (x, t) = sin x
"t 0
g (t − τ ) sin τ dτ ].
5.5. Equipartizione dell’energia. Sia u la soluzione del problema x ∈ R, t > 0 utt − c2 uxx = 0 u (x, 0) = g (x) , ut (x, 0) = h (x) x ∈ R. Supponiamo che g ed h siano funzioni regolari, nulle fuori da un intervallo chiuso e limitato [a, b]. Dimostrare che esiste T tale che, per t ≥ T , Ecin (t) = Epot (t) . 5.6. Risolvere il problema di Cauchy globale per l’equazione utt −cuxx = 0 con i seguenti dati iniziali e analizzare l’andamento della soluzione: a) u (x, 0) = 1 se |x| < a, u (x, 0) = 0 se |x| > a; ut (x, 0) = 0, b) u (x, 0) = 0; ut (x, 0) = 1 se |x| < a, ut (x, 0) = 0 se |x| > a.
328
5 Onde e vibrazioni
5.7. Verificare che la formula (5.39) può essere scritta nella forma seguente: u (x + cξ − cη, t + ξ + η) − u (x + cξ, t + ξ) − u (x − cη, t + η) + u (x, t) = 0. Mostrare che se u = u (x, t) è una funzione di classe C 2 nel semipiano R × (0, +∞) e soddisfa la (5.39), allora utt − c2 uxx = 0. La (5.39) può pertanto essere considerata una formulazione debole dell’equazione delle onde. 5.8. Le piccole vibrazioni longitudinali di una sbarra elastica cilindrica sono governate dalla seguente equazione: ∂ ∂u ∂2u E (x) σ (x) (5.152) ρ (x) σ (x) 2 = ∂t ∂x ∂x dove u = u (x, t) è lo spostamento longitudinale della sezione di sbarra di ascissa x, ρ è la densità lineare del materiale, σ è la sezione ed E è il suo modulo di Young 33 . Assumiamo che la sbarra abbia sezione costante ma che sia costruita saldando due sbarre con diversi moduli di Young E1 , E2 (costanti) e densità ρ1 , ρ2 (costanti), rispettivamente. Poiché le due sbarre sono saldate, lo spostamento u è continuo attraverso la saldatura, che localizziamo in x = 0. In questo caso: a) dare una formulazione debole del problema di Cauchy globale per l’equazione (5.152), b) dedurre che in x = 0 deve valere la condizione E1 ux (0−, t) = E2 ux (0+, t)
t>0
(5.153)
e darne l’interpretazione fisica, c) poniamo c2j = Ej /ρj , j = 1, 2. Sia uinc (x, t) = exp [i (x − c1 t)] un’onda armonica proveniente da sinistra verso l’origine che genera alla giunzione un’onda riflessa uref (x, t) = a exp [iα (x + c1 t)] e un’onda rifratta utr (x, t) = b exp [iβ (x − c2 t)] . Determinare a, b, α, β e interpretare il risultato. [Suggerimento. (c) Cercare una soluzione della forma uinc + uref per x < 0 u= per x > 0. u = utr Usare la continuità di u e la condizione (5.153)]. 33
E è il fattore di proporzionalità nella relazione sforzo-deformazione data dalla legge di Hooke: T (deformazione) = E ε (sforzo). Qui ε ux . Per l’acciaio, E = 2 × 1011 dine/cm2 , per l’alluminio, E = 7 × 1012 dine/cm2 .
Problemi
329
5.9. Determinare le caratteristiche dell’equazione di Tricomi utt − tuxx = 0. [Risposta: 3x ± 2t3/2 = k, for t > 0]. 5.10. Classificare l’equazione t2 utt + 2tuxt + uxx − ux = 0 e determinarne le caratteristiche. Trovare la forma canonica e scrivere la soluzione generale. [Risposta: u (x, t) = F te−x + G te−x ex , con F , G arbitrarie, due volte differenziabili]. 5.11. Considerare il seguente problema di Cauchy caratteristico per l’equazione delle onde nel semipiano x > t: ⎧ x>t ⎨ utt − uxx = 0 u (x, x) = f (x) x∈R ⎩ uν (x, x) = g (x) x∈R √ dove ν = (1, −1) / 2. Stabilire se il problema è ben posto. Si noti che i dati sono i valori di u e della sua derivata normale lungo la caratteristica y = x. 5.12. Considerare il seguente problema detto di Goursat per l’equazione delle onde nel settore −t < x < t: ⎧ −t<x0 ⎩ f (0) = g (0) . Stabilire se il problema è ben posto. Si noti che i dati sono costituiti dai valori di u sulle caratteristiche y = x e y = −x, per x > 0. 5.12. Problema di Cauchy non-caratteristico e mal posto per l’equazione del calore. Verificare che per ogni intero k, la funzione uk (x, t) =
1 [cosh kx cos kx cos 2k 2 t − sinh kx sin kx sin 2k 2 t] k
è soluzione dell’equazione ut = uxx e che inoltre sulla linea non caratteristica t = 0 si ha: 1 u (0, t) = cos 2k 2 t, ux (0, t) = 0. k Dedurre che il corrispondente problema di Cauchy per l’equazione del calore nel semipiano x > 0 è mal posto.
330
5 Onde e vibrazioni
5.13. In riferimento all’equazione LCItt − 1Ixx + (RC + GL) It + RGI = 0 nella Nota 6.1, porre I = e−kt v e scegliere k in modo che v soddisfi un’equazione della forma vtt −
1 vxx + hv = 0. LC
Controllare che la condizione RC = GL è necessaria per avere onde non dispersive (distorsionless transmission line). 5.14. Membrana circolare. Supponiamo che una membrana elastica e per fettamente flessibile occupi a riposo il cerchio B1 = (x, y) : x2 + y 2 ≤ 1 e sia mantenuta fissa agli estremi. Se il peso della membrana è trascurabile e non vi sono carichi esterni, le vibrazioni della membrana sono descritte dal seguente problema che conviene scrivere in coordinate polari, data la simmetria circolare: ⎧ utt − c2 urr + 1r ur + r12 uθθ = 0 0 < r < 1, 0 ≤ θ ≤ 2π, t > 0 ⎪ ⎪ ⎨ u (r, θ, 0) = g (r, θ) , ut (r, 0) = h (r, θ) 0 < r < 1, 0 ≤ θ ≤ 2π ⎪ ⎪ ⎩ u (1, θ, t) = 0 0 ≤ θ ≤ 2π, t ≥ 0. Mostrare che nel caso h = 0 e g = g (r), usando il metodo di separazione delle variabili si trova la soluzione u (r, t) =
∞
an J0 (λn r) cos λn t
n=1
dove J0 è la funzione di Bessel di ordine zero, λ1 , λ2 , ... sono gli zeri di J0 e i coefficienti an sono dati da 1 2 sg (s) J0 (λn s) ds an = 2 J1 (λn ) 0 dove cn =
2k+1 (−1) λn k! (k + 1)! 2 n=1 ∞
k
(ricordare la Nota 2.7.1). 5.15. Guida d’onda circolare. Considerare l’equazione utt − c2 Δu = 0 nel cilindro CR = {(r, θ, z) : 0 ≤ r ≤ R, 0 ≤ θ ≤ 2π, − ∞ < z < +∞} .
Problemi
331
Determinare le soluzioni a simmetria assiale della forma u (r, z, t) = v (r) w (z) h (t) che soddisfino la condizione di Neumann ur = 0 sul bordo r = R. [Risposta: un (r, z, t) = exp {−i (ωt − kz)} J0 (μn r/R) ,
n ∈ N.
dove J0 è la funzione di Bessel di prima specia e ordine zero, μn sono i suoi punti stazionari (J0 (μn ) = 0) e μ2n ω2 2 = k + ]. c2 R2 5.16. Sia u la soluzione del problema utt − c2 Δu = 0
x ∈ R3 , t > 0
u (x, 0) = g (x) , ut (x, 0) = h (x)
x ∈ R3
¯ρ (0). Descrivere il supporto di u per dove g ed h hanno supporto nella sfera B t > 0. [Risposta. La corona sferica {ct − ρ ≤ |x| ≤ ct + ρ}, di larghezza 2ρ, che si espande con velocità c]. 5.17. Effetto di focalizzazione. Risolvere il problema wtt − c2 Δw = 0 x ∈ R3 , t > 0 w (x, 0) = 0, wt (x,0) = h (|x|) x ∈ R3 dove (r = |x|)
h (r) =
1
0≤r≤1
0
r > 1.
Controllare che w (r, t) ha una discontinuità nell’origine all’istante t = 1/c. 5.18. Soluzione fondamentale in dimensione 2. Esaminando la formula di Poisson, scrivere l’espressione della soluzione fondamentale in dimensione 2. [Risposta: 1 H c2 t2 − r2 √ K (x, y,t) = 2πc c2 t2 − r2 dove r = |x − y| e H è la funzione di Heaviside]. 5.19. Dimostrare che la soluzione del problema di Cauchy globale wtt − c2 Δw = f x ∈ R2 , t > 0 w (x, 0) = 0, wt (x,0) = 0 x ∈ R2
332
5 Onde e vibrazioni
è data da u (x,t) =
1 2πc
t 0
Bc(t−s) (x)
1
2
2
f (y,s) dyds.
c2 (t − s) + |x − y|
5.20. Per onde di gravità lineari (σ = 0), esaminare il caso di profondità uniforme e finita, sostituendo la condizione (5.140) con φz (x, −H, t) = 0 e con la condizione iniziale (5.139). a) Scrivere la relazione di dispersione. Dedurre che: b) La velocità di fase e di gruppo hanno una limitazione da sopra. c) Il quadrato della velocità di fase in acqua profonda (H λ) è proporzionale alla lunghezza d’onda. d) Le onde lineari in acqua bassa (H λ) non sono dispersive. [Risposta: a) ω 2 = gk tanh (kH), √ b) cp max = kH, c) c2p ∼ gλ/2π, d) c2p ∼ gH]. 5.21. Determinare soluzioni del sistema linearizzato (5.136) della forma φ (x, z, t) = F (x − ct) G (z) . Ritrovare la relazione di dispersione nel Problema 5.20 (a). [Risposta: φ (x, z, t) = cosh k (z + H) {A cos k (x − ct) + B sin k (x − ct)} , A, B costanti arbitrarie e c2 = g tanh (kH) /k].
6 Elementi di analisi funzionale
6.1 Motivazione L’obiettivo principale nei capitoli precedenti è stata l’introduzione di una parte della teoria classica di alcune importanti equazioni della fisica matematica. L’enfasi sugli aspetti fenomenologici e la connessione con un punto di vista probabilistico dovrebbe aver sviluppato nel lettore un po’ di intuizione e di “feeling” sull’interpretazione e sui limiti dei modelli presentati. Abbiamo enunciato pochi teoremi con relativa dimostrazione, con lo scopo di mettere in luce le principali proprietà qualitative delle soluzioni e giustificare, almeno in parte, la buona posizione dei problemi considerati. Tuttavia, questi obiettivi contrastano in certo modo con uno dei ruoli più importanti della matematica moderna, che consiste nel raggiungere una visione unificata di una vasta classe di problemi, evidenziandone una struttura comune, capace non solo di accrescere la comprensione teorica ma anche di fornire la flessibilità necessaria allo sviluppo dei metodi numerici usati nel calcolo approssimato delle soluzioni. Si tratta di un salto concettuale che richiede un cambio di prospettiva, basato sull’introduzione di metodi astratti, originati storicamente da vani tentativi di risolvere alcuni problemi fondamentali (e.g. in elettrostatica) alla fine del 19◦ secolo. Il nuovo livello di conoscenza permette di affrontare questioni di notevole complessità, poste dalla tecnologia moderna. I metodi astratti di cui parliamo costituiscono il nocciolo di un settore della matematica, noto come Analisi Funzionale, in cui si fondono aspetti analitici e geometrici. Per capire lo sviluppo della teoria, può essere utile esaminare in modo informale come hanno origine le idee fondamentali, lavorando su un paio di esempi specifici. Ritorniamo alla derivazione dell’equazione di diffusione, nella Paragrafo 2.1.2. Se il conduttore è eterogeneo e anisotropo, con eventuali discontinuità nei parametri termici (e.g. dovute alla mistura di due materiali diversi),
Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
334
6 Elementi di analisi funzionale
la legge di Fourier per il flusso q assegna la relazione q = − A (x) ∇u, dove la matrice A soddisfa la condizione q · ∇u = −A (x) ∇u · ∇u ≤ 0
(condizione di ellitticità ),
che riflette la tendenza del flusso di calore a muoversi da regioni più calde a più fredde. Se ρ = ρ (x) e cv = cv (x) sono la densità ed il calore specifico del materiale e f = f (x) è l’intensità della sorgente esogena, siamo condotti all’equazione di diffusione ρcv ut − div (A (x) ∇u) = f. In condizioni stazionarie si ha u (x,t) = u (x) e ci si riduce a −div (A (x) ∇u) = f.
(6.1)
Poiché la matrice A codifica le proprietà di conduzione di un materiale “discontinuo”, ci aspettiamo un basso grado di regolarità di A ed allora sorge un problema: qual è il significato della (6.1) se non si può calcolare la divergenza ? Abbiamo già affrontato situazioni del genere nel Paragrafo 4.4.2, quando abbiamo introdotto soluzioni discontinue di una legge di conservazione, e nel Paragrafo 5.4.2, dove abbiamo considerato soluzioni dell’equazione delle onde con dati iniziali irregolari. Seguiamo le stesse idee. Supponiamo di voler risolvere l’equazione (6.1) in un dominio limitato Ω, con condizioni di Dirichlet omogenee. Procedendo formalmente, moltiplichiamo l’equazione differenziale per una funzione test che si annulla su ∂Ω e integriamo su Ω: −div (A (x) ∇u) v dx = f v dx. (6.2) Ω
Ω
Poiché v = 0 su ∂Ω, usando la formula di Gauss otteniamo l’equazione A (x) ∇u · ∇v dx = f v dx, (6.3) Ω
Ω
valida per ogni funzione test v nulla su ∂Ω, che adottiamo come formulazione debole del nostro problema di Dirichlet. Si noti che la (6.3) ha senso se A e f sono limitate (anche discontinue) e ˚1 Ω , l’insieme delle funzioni in C 1 Ω che si annullano su ∂Ω. Posu, v ∈ C ˚1 Ω è una soluzione debole del nostro problema siamo dire allora che u ∈ C ˚1 Ω . di Dirichlet se (6.3) vale per ogni v ∈ C
6.1 Motivazione
335
Occorre naturalmente sincerarsi che, se A e f sono funzioni regolari, una soluzione debole dotata di due derivate continue sia soluzione del problema originale, rendendo di fatto le due formulazioni equivalenti. Questo è facile da controllare: procedendo in senso inverso con la formula di Gauss, dalla (6.3) ricaviamo la (6.2) che scriviamo nella forma [−div (A (x) ∇u) − f ]v dx =0. Ω
A questo punto, l’arbitrarietà di v forza −div(A (x) ∇u) − f = 0, recuperando l’equazione in forma originale. Bene, ma: il problema in forma debole è ben posto? Le cose non sono così semplici, come abbiamo sperimentato nella Sezione ˚1 Ω non è appropriato, 4.4.3, e in realtà cercare soluzioni nello spazio C sebbene all’apparenza lo sembri. Per rendersene conto, consideriamo un altro esempio, in un certo senso più rivelatore. Consideriamo la posizione di equilibrio di una membrana elastica, perfettamente flessibile, avente la forma di un quadrato Ω, soggetta ad un carico esterno f (forza per unità di massa) e mantenuta a livello zero su ∂Ω. Poiché non c’è evoluzione nel tempo, la posizione della membrana è descritta da una funzione u = u (x), soluzione del problema di Dirichlet −Δu = f in Ω (6.4) u=0 su ∂Ω. Per il problema (6.4), la (6.3) diventa ∇u · ∇v dx = f v dx Ω
˚1 Ω . ∀v ∈ C
(6.5)
Ω
Ora, questa equazione ha un’interessante interpretazione fisica. L’integrale a primo membro rappresenta il lavoro compiuto dalle forze elastiche interne, " dovuto ad uno spostamento virtuale v. D’altra parte, Ω f v esprime il lavoro compiuto dalla forze esterne per lo spostamento v. La formulazione debole (6.5) stabilisce il bilancio tra questi due lavori e costituisce una versione del principio dei lavori virtuali. C’è di più, se entra in gioco l’energia. Infatti, l’energia potenziale totale è proporzionale a 1 2 |∇v| dx − f v dx . (6.6) E (v) = 2 Ω Ω ./ 0 - ./ 0 energia elastica interna
energia potenziale esterna
Poiché la natura tende a risparmiare energia, la posizione di equilibrio u è quella che minimizza (6.6) rispetto a tutte le configurazioni ammissibili v.
336
6 Elementi di analisi funzionale
Questo fatto è strettamente connesso al principio dei lavori virtuali ed in realtà vedremo che è equivalente ad esso (si veda il Paragrafo 8.4.1). Pertanto, cambiando punto di vista, invece di cercare una soluzione debole della (6.5) possiamo, equivalentemente, cercare un elemento che minimizzi ˚1 Ω . E (v), al variare di v in C Anche così, c’è un inconveniente. Infatti, così posto, il problema di minimo non ha soluzione, tranne che in casi banali. La ragione è che stiamo considerando un insieme troppo ristretto di funzioni ammissibili. E allora: qual è lo spazio giusto di funzioni ammissibili? ˚1 Ω non è la scelta corretta. Per essere minimalisti, è Vediamo perché C come cercare tra i numeri razionali quello che minimizza la funzione f (x) = (x − π)2 . É vero che inf x∈Q f (x) = 0 ma non è il minimo! Se però allarghiamo l’insieme numerico da Q ad R ovviamente minx∈R f (x) = f (π) = 0. abbiamo ˚1 Ω è troppo ristretto per avere una speranza di Analogamente, lo spazio C trovarvi una minimizzante di E e di conseguenza siamo costretti ad allargare l’insieme delle funzioni ammissibili. A tale scopo, osserviamo che E (v) richiede solo che il gradiente di v sia a quadrato integrabile, cioè |∇v| ∈ L2 (Ω). Non c’è bisogno di richiedere a priori la continuità delle derivate, in realtà neppure di v, per cui l’insieme corretto di funzioni ammissibili risulta essere il cosiddetto spazio di Sobolev H01 (Ω), i cui elementi sono esattamente le funzioni appartenenti ad L2 (Ω), insieme con le loro derivate prime, che si annullano su ∂Ω. Ricordando che E (v) rappresenta un’energia, potremmo chiamarle funzioni ad energia finita! Sebbene la sensazione sia quella di essere sulla strada giusta, c’è un prezzo da pagare per inquadrare rigorosamente ogni concetto ed evitare rischi di contraddizioni o affermazioni senza senso. Infatti, numerose questioni sorgono immediatamente. Per esempio, una funzione a quadrato sommabile può avere molte discontinuità e allora: che cosa intendiamo per gradiente di una funzione che è “solo” in L2 (Ω)? Di più: una funzione in L2 (Ω) è, in linea di principio, definita a meno di insiemi di misura nulla. Ma allora, essendo ∂Ω precisamente un insieme di misura nulla, qual è il significato della frase “f si annulla su ∂Ω”? Risponderemo a queste domande nel Capitolo 7. Possiamo anticipare che, riguardo alla prima domanda, l’idea è la stessa usata per definire la delta di Dirac come derivata della funzione di Heaviside, che conduce a una nozione più debole di derivata (diremo nel senso delle distribuzioni ), basata sulla
6.1 Motivazione
337
miracolosa formula di Gauss e sull’introduzione di un opportuno insieme di funzioni test. Riguardo alla seconda domanda, c’è un modo di introdurre un operatore di traccia che associa a una funzione u ∈ L2 (Ω), con gradiente in L2 (Ω), una funzione u|∂Ω che rappresenta i suoi valori su ∂Ω e che si riduce alla restrizione di u su ∂Ω quando u è continua in Ω (si veda il Paragrafo 6.6.1). Coerentemente, gli elementi di H01 (Ω) si annullano su ∂Ω nel senso che hanno traccia nulla su ∂Ω. Un altro punto da chiarire è: che cosa rende lo spazio H01 (Ω) così speciale? È qui che la fusione tra aspetti geometrici ed analitici entra in gioco. Prima di tutto, sebbene H01 (Ω) sia uno spazio vettoriale infinito-dimensionale, possiamo dotarlo di una struttura che riflette il più possibile quella di uno spazio finito-dimensionale come Rn , dove la vita scorre ovviamente più serena. Infatti, in questo spazio, come vedremo nel Capitolo 7, possiamo introdurre un prodotto interno (o scalare) dato da (u, v)1 = ∇u · ∇v Ω
che possiede le stesse proprietà del prodotto scalare classico in Rn . Ha senso allora, parlare di ortogonalità tra due funzioni u e v in H01 (Ω), espressa dall’annullarsi del loro prodotto interno: (u, v)1 = 0. Avendo definito il prodotto interno (·, ·)1 , possiamo definire la lunghezza (norma) di un elemento u con la formula u1 = (u, u)1 nonché la distanza tra due elementi u e v, assegnata da: dist (u, v) = u − v1 . Da qui è facile introdurre una nozione di limite e/o di convergenza per successioni o funzioni: per esempio, una successione {un } ⊂ H01 (Ω) converge a u in H01 (Ω) se dist (un , u) → 0 per n → ∞. Si potrebbe osservare che tutto ciò può essere fatto, e anche più comodamente, ˚1 Ω . Questo è vero, ma con una differenza fondamentale. nello spazio C Usiamo ancora un’analogia con un fatto elementare. Tra i numeri razionali Q non ne esiste alcuno che minimizzi la funzione f (x) = (x − π)2 sebbene π, possa essere approssimato con accuratezza arbitraria da numeri razionali.
338
6 Elementi di analisi funzionale
Se da un punto di vista strettamente operativo, ci si potrebbe limitare ai razionali, certamente non è così dal punto di vista dello sviluppo della scienza e della tecnologia, poiché, per esempio, non sarebbero concepibili i successi del calcolo infinitesimale senza i numeri reali. Così come R è il completamento di Q, nel senso che R contiene tutti i punti delle successioni in Q, lo stesso è vero per H01 (Ω) rispetto limite 1 ˚ Ω . Ciò conferisce a H 1 (Ω) una struttura di spazio di Hilbert, che a C 0 ˚1 Ω . Ci spieghiamo lo rende molto più vantaggioso da usare rispetto a C riesaminando il problema della membrana e precisamente l’equazione (6.5). Questa volta usiamo un’interpretazione geometrica. Infatti, la (6.5) significa che stiamo cercando un elemento u, il cui prodotto interno con ogni altro elemento v di H01 (Ω) riproduce “l’azione di f su v”, data dalla funzione lineare f v. v −→ Ω
Ricorriamo ora ad un’analogia finito-dimensionale. In Algebra Lineare, ad ogni funzione L : Rn → R, che sia lineare, tale cioè che L (ax + by) = aLx + bLy
∀a, b ∈ R, ∀x, y ∈ Rn ,
corrisponde un unico elemento uL ∈ Rn tale che Lx = uL · x per ogni x ∈ Rn (Teorema di Rappresentazione). In altri termini, esiste un’unica soluzione uL dell’equazione uL · x = Lx per ogni x ∈ Rn . (6.7) La struttura delle due equazioni (6.5), (6.7) è la stessa: a primo membro si trova un prodotto interno e a secondo membro una funzione lineare. La domanda naturale è allora: c’è un analogo del Teorema di Rappresentazione in H01 (Ω)? La risposta è affermativa (Teorema 6.3, di Riesz) e vale in ogni spazio di Hilbert, non solo in H01 (Ω). La dimensione dello spazio, in generale infinita, richiede lo studio dell’insieme delle funzioni lineari e continue (in questo contesto chiamati funzionali lineari e continui ) e l’introduzione del relativo concetto di spazio duale. Si vede allora, come un risultato astratto di natura geometrica implichi la buona posizione di problemi applicativi concreti. Che cosa si può dire dell’equazione (6.3)? Bene, se la matrice A è simmetrica e definita positiva, il primo membro della (6.3) definisce ancora un prodotto interno in H01 (Ω) e il Teorema di Riesz implica la buona posizione del problema di Dirichlet in forma debole. Se A non è simmetrica le cose non cambiano molto. Varie generalizzazioni del Teorema di Riesz (e.g. il Teorema 6.4 di Lax-Milgram) permettono un trattamento unificato di problemi molto generali, attraverso la loro formulazione variazionale o debole. In realtà, come abbiamo constatato con l’equazione (6.3), la formulazione variazionale è spesso l’unico modo di formulare e risolvere un problema, senza perderne le caratteristiche originali.
6.2 Spazi normati, metrici e topologici. Spazi di Banach
339
Le argomentazioni precedenti dovrebbero aver convinto il lettore dell’esistenza di una struttura generale (quella di spazio di Hilbert), comune ad una vasta classe di problemi che nascono dalle scienze applicate. In questo capitolo sviluppiamo gli strumenti di Analisi Funzionale, essenziali per una corretta formulazione variazionale dei più comuni problemi di valori al bordo. I risultati che presentiamo costituiscono la base teorica per metodi di approssimazione numerica quali gli elementi finiti o, più in generale, i metodi di Galerkin, e ciò rende la teoria ancor più attraente ed importante. Risultati più avanzati, legati a questioni generali di risolubilità e alle cosiddette proprietà spettrali degli operatori ellittici (formalizzando i concetti di autovalore ed autofunzione) sono inclusi alla fine del capitolo. Un commento finale. Consideriamo ancora il problema di minimizzazione di cui sopra. Abbiamo allargato la classe delle configurazioni ammissibili da un insieme ristretto di funzioni regolari ad una classe di funzioni piuttosto ampia. Ma: che tipo di soluzioni troviamo con i metodi variazionali? Se i dati del problema (e.g. Ω e f , per la membrana) sono regolari, può essere che la soluzione variazionale sia irregolare? Se così fosse, la teoria non sembrerebbe molto promettente! In realtà, sebbene lavoriamo in un insieme di configurazioni anche molto irregolari, la soluzione variazionale possiede il grado di regolarità naturale, confermando ancora una volta l’intrinseca coerenza del metodo. La conoscenza della regolarità massima possibile della soluzione svolge un ruolo importante nel controllo degli errori nei metodi numerici e quindi non è un mero esercizio teorico. Tuttavia, questa parte di teoria è piuttosto tecnica e non abbiamo spazio per un trattamento adeguato. Ci limiteremo ad enunciare alcuni dei risultati più comuni. La potenza dei metodi astratti non è ristretta a problemi stazionari. Come vedremo, si possono introdurre spazi di Sobolev dipendenti dal tempo, adatti al trattamento di problemi di evoluzione per equazioni sia di diffusione sia delle onde (Capitolo 9). In questo testo introduttivo, l’enfasi è maggiormente sui problemi lineari.
6.2 Spazi normati, metrici e topologici. Spazi di Banach Può essere utile per sviluppi futuri introdurre brevemente le nozioni di norma e di distanza indipendentemente da quella di prodotto interno, per metterne meglio il luce le proprietà assiomatiche. Sia X uno spazio vettoriale sul campo reale o complesso. Una norma in X è un’applicazione · : X → R
340
6 Elementi di analisi funzionale
tale che, per ogni scalare λ e ogni x,y ∈ X, valgano le seguenti proprietà: N1 ) x ≥ 0; x = 0 se e solo se x = 0 N2 ) λx = |λ| x N3 ) x + y ≤ x + y
(annullamento) (omogeneità) (disuguaglianza triangolare).
Una norma vuole rappresentare una misura della lunghezza di un vettore x ∈ X, per cui le proprietà 1, 2, 3 dovrebbero apparire come una naturale richiesta. Una coppia (X, ·), composta da uno spazio vettoriale X e da una norma in esso introdotta prende il nome di spazio normato. Uno spazio normato è anche metrico, con la distanza indotta dalla norma: d (x, y) = x − y .
(6.8)
Per spazio metrico si intende una coppia (M, d) dove M è un insieme (non necessariamente uno spazio vettoriale!) e d una distanza in M , ossia una funzione d:M ×M →R tale che, per ogni scalare λ e ogni x,y,z ∈ M , valgano le seguenti proprietà, che il lettore non avrà difficoltà a riconoscere come naturali: D1 ) d (x, y) ≥ 0 e d (x, y) = 0 se e solo se x = y D2 ) d (x, y) = d (x, y) D3 ) d (x, z) ≤ d (x, y) + d (y, z)
(annullamento) (simmetria)
(disuguaglianza triangolare).
Usando le proprietà della norma, non è diffficile controllare che la (6.8) soddisfa le proprietà di una distanza e quindi (X, ·) è anche spazio metrico. La presenza di una distanza permette a sua volta di introdurre in X una struttura topologica (o in breve, una topologia) che rende X uno spazio topologico. In generale, uno spazio topologico è costituito da una coppia (T , A) dove T è un insieme ed A è una famiglia di sottoinsiemi di T , ai quali si conferisce lo status di aperti, con le seguenti proprietà. T1 ) E e ∅ (l’insieme vuoto) appartengono ad A. T1 ) Una qualunque unione di elementi di A appartiene ad A. T3 ) L’intersezione di un numero finito di elementi di A appartiene ad A. Si possono ora definire tutti gli altri concetti topologici come si fa in Rn . Per esempio, un insieme E ⊂ T si dice chiuso se il suo complementare è aperto. Un intorno di un punto x ∈ T è definito come un aperto che contiene x. Rispetto a un insieme E ⊂ T , un punto x si dice: – di accumulazione per E se ogni intorno di x contiene infiniti punti di E; – interno ad E, se esiste un intorno di x contenuto in E;
6.2 Spazi normati, metrici e topologici. Spazi di Banach
341
– di frontiera per E, se ogni intorno di x contiene sia punti di E sia punti del complementare. L’insieme dei punti di frontiera è indicato con ∂E. Si dimostra facilmente che un insieme è chiuso se e solo se contiene tutti i suoi punti di accumulazione ed anche se e solo se contiene tutti i suoi punti di frontiera. L’insieme E = E ∪ ∂E si chiama chiusura di E. Se U ⊂ E, diciamo che U è denso in E se U = E. Vi sono altre possibilità per introdurre una topologia. Per esempio, si può introdurre la famiglia dei chiusi anziché degli aperti (quali proprietà dovrebbe avere tale famiglia?). Tornando agli spazi normati (X, ·), la famiglia di aperti si definisce nel modo seguente. Prima si definisce la sfera (aperta) con raggio r > 0 e centro in x, data dall’insieme Br (x) = {y ∈ X : x − y < r} e conseguentemente si definisce aperto un insieme A tale che per ogni x∈A esiste Br (x) ⊂ A. Un insieme E si dice limitato se esiste una sfera Br (0) che lo contiene, ossia se esiste r tale che x < r per ogni x ∈ E. La nozione di convergenza si introduce in modo molto semplice. Diciamo che una successione {xm } ⊂ X converge a x in X, e scriviamo xm → x in X, se d (xm , x) = xm − x → 0 per m → ∞. Un’importante distinzione è quella tra successioni convergenti e successioni di Cauchy o fondamentali. Una successione {xn } di elementi di X si dice fondamentale o di Cauchy se d (xm , xn ) = xm − xn → 0
per m, n → ∞.
In ogni spazio metrico, {xn } convergente implica {xn } fondamentale.
(6.9)
Ciò segue subito dalla disuguaglianza triangolare per la distanza: d (xm , xn ) ≤ d (xm , x) + d (xn , x) . Infatti, se {xn } è convergente, i due addendi a destra tendono a 0 e quindi anche d (xm , xn ) → 0, per cui {xn } è fondamentale. Per convincersi che l’implicazione opposta non è sempre vera, basta pensare allo spazio metrico Q dei numeri razionali, con la solita distanza d(x, y) = |x − y|, ed alla successione n 1 xn = 1 + n che è fondamentale ma non convergente in Q (converge in R al numero e ∈ / Q).
342
6 Elementi di analisi funzionale
Se nella (6.9) vale l’implicazione opposta, lo spazio metrico si dice completo. Definizione 2.1. Uno spazio normato completo prende il nome di spazio di Banach. In linea di principio, in uno spazio vettoriale è possibile introdurre norme diverse. La scelta “giusta” è spesso dettata proprio dalla proprietà di completezza, come si vedrà dagli esempi che seguono. La definizione di limite per funzioni operanti tra spazi metrici o normati si riconduce a limiti per funzioni reali (le distanze). Siano X, Y spazi normati, con rispettive norme ·X e ·Y , e sia F una funzione da X a Y . F si dice continua in x ∈ X quando F (y) − F (x)Y → 0
se y − xX → 0
o, equivalentemente, quando, per ogni successione {xn } ⊂ X, xn − xX → 0
implica
F (xn ) − F (x)Y → 0.
F si dice continua in X quando è continua in ogni x ∈ X. Microteorema 2.1. Ogni norma in uno spazio X è continua in X. Dimostrazione. Sia · una norma in X. Dalla disuguaglianza triangolare, si ha y ≤ y − x + x e x ≤ y − x + y da cui |y − x| ≤ y − x . Perciò, se y − x → 0 anche |y − x| → 0, che esprime la continuità della norma. • Due norme ·1 e ·2 definite nello stesso spazio vettoriale X si dicono equivalenti quando esistono due numeri positivi c1 e c2 tali che c1 x2 ≤ x1 ≤ c2 x2
per ogni x ∈ X.
In tal caso, una successione {xn } ⊂ X è fondamentale rispetto alla norma ·1 se e solo se lo è rispetto alla norma ·2 . In particolare, X è completo rispetto alla norma ·1 se e solo se lo è rispetto alla norma ·2 . Vediamo qualche esempio significativo.
6.2 Spazi normati, metrici e topologici. Spazi di Banach
343
Spazi di funzioni continue. Sia Ω un dominio limitato di Rn . Lo spazio C Ω . Il simbolo C Ω , o anche C 0 Ω , indica lo spazio vettoriale delle funzioni reali o complesse, continue in Ω. Con la norma f C (Ω ) = max |f | Ω
C Ω è uno spazio di Banach. Infatti, una successione di funzioni {fm } converge a f in C Ω se max |fm − f | → 0, Ω
cioè se fm converge uniformemente a f in Ω. Una successione {fm } ⊂ C Ω è fondamentale se max |fm − fk | → 0,
per m, k → +∞
Ω
per cui esiste una funzione limite f alla quale fm converge uniformemente. Poiché il limite uniforme di funzioni continue è continuo, segue che f ∈ C Ω , per cui C Ω è completo. Si noti che altre norme sono possibili in C Ω ; infatti 1/2 2 f 2 = ( |f | Ω
è un’altra possibile norma, detta norma integrale di ordine 2 o norma L2 (Ω), rispetto alla quale, però, lo spazio non è completo. Per provarlo, sia per esempio Ω = (−1, 1) ⊂ R. La successione ⎧ t≤0 ⎪ ⎨ 0 1 (m ≥ 1) fm (t) = mt 0 < t ≤ m ⎪ ⎩ 1 1 t> m è contenuta in C ([−1, 1]) ed è di Cauchy rispetto alla norma integrale di ordine 2. Infatti (m > k) si ha 1 2 2 fm − fk L2 (Ω) = |fm (t) − fk (t)| dt −1
= (m − k)
2
1/m
2
t dt + 0
2
=
1 1 (m − k) < + 3 3k 3 3m
0
1/k
2
(1 − kt) dt
1 1 + m k
→0
per m, k → ∞.
Tuttavia fn converge nella norma L2 (−1, 1) alla funzione di Heaviside 1 t≥0 H(t) = 0 t<0
344
6 Elementi di analisi funzionale
che è discontinua in t = 0 e quindi non appartiene a C ([−1, 1]). Naturalmente, la successione {fm } non è di Cauchy rispetto alla norma f C (Ω ) . Gli spazi C k Ω . Più in generale, consideriamo lo spazio C k Ω , k ≥ 1 intero naturale, costituito dalle funzioni differenziabili con continuità in Ω fino all’ordine k incluso. Per indicare una generica derivata di ordine m, è comodo introdurre l’n − upla di interi non negativi (o multi-indice) α = (α1 , ..., αn ), di lunghezza |α| = α1 + ... + αn = m, e porre Dα =
∂ α1 ∂ αn . α1 ... n ∂x1 ∂xα n
Naturalmente, ricorreremo a questo simbolo solo in caso di stretta necessità! Introduciamo in C k Ω la norma (norma Lagrangiana di ordine k): f C k (Ω ) = f C (Ω ) +
k |α|=1
Dα f C (Ω ) .
Se {fn } è di Cauchy in C k Ω , tutte le successioni {Dα fn } con 0 ≤ |α| ≤ k sono di Cauchy in C Ω . Dai teoremi di derivazione termine a termine, segue che lo spazio risultante è di Banach. Gli spazi C 0,α Ω , 0 ≤ α ≤ 1. Diciamo che una funzione f è Hölderiana in Ω con esponente α se sup
x,y∈Ω x=y
|f (x) − f (y)| ≡ CH (f ; Ω) < ∞. α |x − y|
(6.10)
A primo membro della (6.10) appare un “rapporto incrementale di ordine α”. Il numero CH (f ; Ω) si chiama costante di Hölder di f in Ω. Se α = 1, f è Lipschitziana. Tipiche funzioni Hölderiane in Rn con esponente α sono le α potenze |x| . Il simbolo C 0,α Ω indica il sottospazio di C Ω costituito dalle funzioni Hölderiane in Ω con esponente α. Con la norma f C 0,α (Ω ) = f C (Ω ) + CH (f ; Ω) C 0,α Ω risulta uno spazio di Banach (perché?). Gli spazi C k,α Ω , k ≥ 1 intero naturale, 0 ≤ α ≤ 1. C k,α Ω indica il sottospazio di C k Ω costituito dalle funzioni che hanno tutte derivate di ordine k Hölderiane in Ω con esponente α. Con la norma
f C k,α (Ω ) = f C k (Ω ) + CH Dβ f ; Ω |β|=k C k,α Ω diventa uno spazio di Banach.
6.2 Spazi normati, metrici e topologici. Spazi di Banach
345
Vedremo più avanti l’utilità di tutti questi spazi. Nota 2.1. Con l’introduzione degli spazi funzionali stiamo facendo un importante passo verso l’astrazione, riguardando le singole funzioni da una diversa prospettiva. Nei corsi introduttivi di Analisi Matematica una funzione è un’applicazione univoca da un insieme in un altro (una point map); qui una funzione è un singolo elemento o punto o vettore di uno spazio. Spazi di funzioni sommabili e di funzioni limitate. Sia Ω un insieme aperto in Rn e p ≥ 1 un numero reale. Indichiamo col simbolo Lp (Ω) l’insieme delle funzioni f che sono p−sommabili in Ω secondo Lebesgue, tali cioè " p che Ω |f | < ∞, ritenendo due funzioni identiche quando sono uguali quasi ovunque1 . Lp (Ω) è uno spazio di Banach2 con la norma integrale di ordine p: f Lp (Ω) =
1/p p
|f |
.
Ω
L’identificazione di due funzioni uguali q.o. implica che ogni elemento di Lp (Ω) non è una singola funzione bensì una classe di equivalenza di funzioni, che differiscono a due a due solo su un insieme di misura nulla. Una situazione perfettamente analoga è quella dei numeri razionali. Infatti, rigorosamente, un numero razionale è definito come una classe di equivalenza di frazioni: per esempio, le frazioni 2/3, 4/6, 8/12 .... rappresentano lo stesso numero, anche se per un uso concreto ci si può riferire al rappresentante (la frazione) più conveniente. Lo stesso accade con le funzioni di Lp anche se vedremo che in alcune circostanze occorre cautela. Una funzione f : Ω → R (o C) si dice essenzialmente limitata 3 se esiste un numero reale M tale che |f (x)| ≤ M
q.o. in Ω.
(6.11)
Indichiamo col simbolo L∞ (Ω) l’insieme delle funzioni essenzialmente limitate in Ω, ritenendo due funzioni identiche quando differiscono su un insieme di misura (di Lebesgue) nulla. L’estremo inferiore dei numeri M con la proprietà (6.11) si chiama estremo superiore essenziale di f ed è una norma su L∞ (Ω), che indicheremo con f L∞ (Ω) = ess sup |f | . Ω
Si noti che l’estremo superiore essenziale può differire dall’estremo superiore (Problema 1.2). Rispetto alla norma f L∞ (Ω) , L∞ (Ω) risulta uno spazio di Banach. 1
2 3
Precisamente, si passa al quoziente nell’insieme delle funzioni p−sommabili rispetto alla relazione di equivalenza di uguaglianza quasi ovunque. Si ottiene un nuovo spazio che si indica con Lp (Ω), i cui elementi sono classi di equivalenza. Ad ogni classe appartengono tutte le funzioni p−sommabili che differiscono a due a due solo su un insieme di misura nulla. Si veda e.g. Yoshida, 1965. Appendice B.
346
6 Elementi di analisi funzionale
• Disuguaglianza di Hölder . La disuguaglianza (1.9) può essere riscritta in termini di norme: f g ≤ f p (6.12) L (Ω) gLq (Ω) , Ω
dove q = p/(p−1) è l’esponente coniugato di p, includendo anche il caso p = 1, q = ∞. Si noti che, se Ω ha misura finita e 1 ≤ p1 < p2 ≤ ∞, dalla (6.12) si deduce, scegliendo g ≡ 1, p = p2 /p1 e q = p2 /(p2 − p1 ): |f |p1 ≤ |Ω|1/q f p1p2 L (Ω) Ω
e quindi Lp2 (Ω) ⊂ Lp1 (Ω). Se la misura di Ω è infinita, questa inclusione non è vera, in generale; per esempio, f ≡ 1 appartiene a L∞ (R) ma non a Lp (R) per 1 ≤ p < ∞. Infine, osserviamo che, se Ω è limitato, C Ω ⊂ Lp (Ω) per ogni 1 ≤ p ≤ ∞. Se inoltre, p < ∞, dal Teorema B.6 si deduce che C Ω è denso in Lp (Ω). p Ciò significa che se f ∈ L (Ω), 1 ≤ p < ∞, esiste una successione {fk } ⊂ C Ω tale che fk → f in Lp (Ω). C Ω risulta dunque un sottospazio non chiuso di Lp (Ω), 1 ≤ p < ∞.
6.3 Spazi di Hilbert Veniamo ora agli spazi di Hilbert. Sia X uno spazio vettoriale sul campo reale. Si dice che X è uno spazio pre-Hilbertiano oppure uno spazio dotato di prodotto interno se è definita una funzione (·, ·) : X × X → R detta prodotto interno o scalare, tale che, per ogni x, y, z ∈ X e ogni λ, μ ∈ R si abbia H1 ) (x, x) ≥ 0 e x, x = 0 se e solo se x = 0 H2 ) (x, y) = (y, x) H3 ) (μx + λy, z) = μ (x, z) + λ (y, z)
(annullamento) (simmetria) (bilinearità).
La H3 indica che il prodotto interno è lineare rispetto al primo argomento. Dalla 2 si deduce che esso è lineare anche rispetto al secondo. Si dice allora che (·, ·) è una forma bilineare simmetrica da X × X in R. Se sono coinvolti spazi pre-Hilbertiani differenti, useremo notazioni come (·, ·)X , (·, ·)Y per evitare confusioni. Nota 3.1. Se il campo di scalari è quello dei numeri complessi C, allora si ha (·, ·) : X × X → C
6.3 Spazi di Hilbert
347
e la proprietà di simmetria 2 è sostituita dalla seguente: H2 )bis . (x, y) = (y, x) dove la barra sta per coniugato. La proprietà di linearità rispetto al secondo argomento si modifica di conseguenza nel modo seguente: (z, μx + λy) = μ (z, x) + λ (z, y) . Si dice allora che (·, ·) è antilineare rispetto al secondo argomento e che è una forma sesquilineare da X × X in C. Un prodotto interno induce nello spazio una norma tramite la formula ' x = (x, x) ben definita grazie alla proprietà 1 del prodotto scalare. Pertanto uno spazio pre-Hilbertiano è anche normato. Valgono le seguenti importanti proprietà. Teorema 3.1. Siano X pre-Hilbertiano e x, y ∈ X. Allora: (1) Disuguaglianza di Schwarz |(x, y)| ≤ x y con uguaglianza se e solo se x e y sono linearmente dipendenti. (2) Legge del parallelogramma 2
2
2
2
x + y + x − y = 2 x + 2 y . Se si interpreta x come la lunghezza del vettore x, la legge del parallelogramma generalizza un risultato della geometria Euclidea elementare: la somma dei quadrati delle lunghezze delle diagonali di un parallelogramma uguaglia la somma dei quadrati della lunghezza dei suoi lati. Dimostrazione. (1) La dimostrazione ricalca quella valida in spazi vettoriali a dimensione finita. Per ogni t ∈ R ed ogni x, y ∈ X, si ha, utilizzando le proprietà del prodotto interno, 2
2
0 ≤ (tx + y, tx + y) = t2 x + 2t (x, y) + y ≡ P (t) . Ciò significa che il trinomio P (t) è sempre non negativo e pertanto deve avere discriminante non positivo, ossia 2
2
2
(x, y) − x y ≤ 0, che equivale alla disuguaglianza di Schwarz. L’uguaglianza si ha solo se tx+y = 0 ossia se x e y sono dipendenti. (2) Basta osservare che 2
2
2
x ± y = (x ± y, y ± y) = x ± 2 (x, y) + y .
(6.13)
348
6 Elementi di analisi funzionale
La disuguaglianza di Schwarz implica che il prodotto interno è continuo. Precisamente: sia X pre-Hilbertiano. Allora, per ogni y ∈ X, fissato, la funzione x −→ (x, y) è continua in X. Dimostrazione. Dalla linearità e dalla disuguaglianza di Schwarz: |(z, y) − (x, y)| = |(z − x, y)| ≤ z − x y e quindi, se z − x → 0, anche il primo membro tende a zero, da cui la continuità richiesta. Definizione 3.1. Si chiama spazio di Hilbert uno spazio dotato di prodotto interno, completo rispetto alla norma indotta. Due spazi di Hilbert H1 e H2 sono isomorfi se esiste un’applicazione lineare biunivoca L : H1 → H2 , detta isomorfismo. Se inoltre L preserva le norme, cioè xH1 = LxH2 , H1 e H2 si dicono isometrici. In questo caso l’applicazione L si chiama isometria e permette a tutti gli effetti pratici di identificare H1 ed H2 , in quanto L conserva anche i prodotti interni (esercizio): ∀x, y ∈ H1 .
(x, y)H1 = (Lx, Ly)H2
Esempio 3.1. Rn è uno spazio di Hilbert rispetto al prodotto scalare usuale
n xi yi , x = (x1 , ..., xn ) , y = (y1 , ..., yn ). (x, y)Rn = x · y = i=1
La norma indotta è |x| =
√
x·x=
n i=1
x2i .
Più in generale, se A = (aij )i.j=1,...,n è una matrice quadrata di ordine n, simmetrica e definita positiva, l’espressione
n (x, y)A = aij xi yj (6.14) i=1
definisce un prodotto scalare in R . Anzi, si può mostrare che ogni prodotto scalare in Rn si può scrivere nella forma (6.14), con un’opportuna matrice A. Cn è uno spazio di Hilbert rispetto al prodotto scalare
n (x, y)Cn = xi y i x = (x1 , ..., xn ) , y =(y1 , ..., yn ). n
i=1
N.B. Non è difficile dimostrare che ogni spazio vettoriale reale (risp. complesso) di dimensione n è isometrico a Rn (risp. Cn ).
6.3 Spazi di Hilbert
349
Esempio 3.2. Lo spazio L2 (Ω) è uno spazio di Hilbert rispetto al prodotto scalare (u, v)L2 (Ω) =
uv. Ω
C 0 Ω è spazio pre-Hilbertiano rispetto allo stesso prodotto interno, ma, come abbiamo già visto, non è completo. Notazioni. Se Ω è fissato, useremo le notazioni (u, v)0 anziché (u, v)L2 (Ω) e u0 anziché uL2 (Ω) . Esempio 3.3. Sia lC2 l’insieme delle successioni x = {xm } a valori in C, tali che
∞ 2 |xm | < ∞. i=1
Per x = {xm } e y = {ym }, definiamo (x, y)l2 =
∞
C
xi y¯j .
i=1
Allora (x, y)l2 definisce un prodotto interno rispetto al quale lC2 risulta uno C spazio di Hilbert su C (Problema 6.3) che costituisce l’analogo discreto (detto spazio delle frequenze) di L2 (0, 2π). Infatti, ogni u ∈ L2 (0, 2π) ha uno sviluppo in serie di Fourier
u <m,n eimx , u(x) = m∈Z
dove u <m =
1 2π
2π
u (x) e−imx dx.
0
<m = u <−m , poiché u è una funzione reale. Dall’identità di Parseval Si noti che u (Nota 1.5.1) abbiamo (u, v)0 =
2π
uv = (2π) 0
u <m v<−m
m∈Z
e (equazione di Bessel) 2
u0 =
0
2π
u2 = (2π)
2
|< um | .
m∈Z
Esempio 3.4. Uno spazio di Sobolev . È possibile usare lo spazio delle frequenze introdotto nell’esempio precedente per definire le derivate di una funzione in L2 (0, 2π) in senso debole o generalizzato. Per cominciare, sia u ∈
350
6 Elementi di analisi funzionale
C 1 (R), 2π−periodica. I coefficienti di Fourier di u sono dati da u< m = im< um e possiamo scrivere 2 u 0
2π
=
(u )2 = (2π)
0
2
m2 |< um | .
(6.15)
m∈Z
Pertanto, entrambe le successioni {< um } and {m< um } appartengono a lC2 . Ma il secondo membro in (6.15) non coinvolge u direttamente, cosicché ha senso definire lo spazio 1 Hper (0, 2π) = u ∈ L2 (0, 2π) : {< um } , {m< um } ∈ lC2 e introdurre il prodotto interno
1 + m2 u <m v<−m
(u, v)1,per = (2π)
m∈Z 1 rispetto al quale Hper (0, 2π) è uno spazio di Hilbert. 1 (0, 2π) si può associare biunivocaPoiché {m< um } ∈ lC2 , a ogni u ∈ Hper 2 mente la funzione v ∈ L (0, 2π) data da
im< um eimx . v(x) = m∈Z
Confrontando con (6.15), si vede che v può essere considerata come la derivata 1 debole di u e che quindi uno spazio Hper (0, 2π) diventa lo spazio di funzioni 2 che appartengono ad L (0, 2π), insieme alla loro derivata prima debole. 1 Sia u ∈ Hper (0, 2π) e u(x) =
u <m eimx .
(6.16)
m∈Z
Poiché
1 1 u um | ≤ <m eimx = m |< m 2
1 2 + m2 |< um | m2
il test di Weierstrass implica che la serie (6.16) converge uniformemente in R. Dunque, u ha un prolungamente continuo e 2π−periodico in tutto R. Infine, osserviamo che, se usiamo il simbolo u anche per la derivata debole 1 di u, il prodotto interno in Hper (0, 1) può essere scritto nella forma (u, v)1,per =
1
(u v + uv).
0
1 Lo spazio Hper (0, 1) è un esempio dei cosiddetti spazi di Sobolev, sui quali torneremo nel Capitolo 7.
6.4 Ortogonalità e proiezioni negli spazi di Hilbert
351
6.4 Ortogonalità e proiezioni negli spazi di Hilbert 6.4.1 Il Teorema di Proiezione Gli spazi di Hilbert sono l’ambiente ideale per risolvere problemi in dimensione infinita. Unificano, attraverso il prodotto interno e la norma indotta, le strutture di spazio vettoriale e metrico in un modo molto più efficiente di quanto non faccia una norma generica. Si può parlare di ortogonalità e di proiezioni, di un Teorema di Pitagora infinito dimensionale (un’istanza ne è la formula di Bessel per le serie di Fourier) e di altre operazioni che rendono la struttura estrememente ricca e comoda da usare. È in questo ambiente che inquadreremo e risolveremo i problemi al contorno per equazioni a derivate parziali. In analogia a quanto accade negli spazi vettoriali a dimensione finita, due elementi x, y di uno spazio dotato di prodotto interno (·, ·) si dicono ortogonali se (x, y) = 0 e si scrive x⊥y. Ora, se si considera un sottospazio V di Rn , per esempio un iperpiano passante per l’origine, ogni elemento x ∈ Rn ha una proiezione ortogonale su V . Infatti, se dimV = k e i versori v1 , v2 , ..., vk costituiscono una base ortonormale per V , si può trovare una base ortonormale per Rn data da v1 , v2 , ..., vk , wk+1 , ..., wn dove wk+1 , ..., wn sono opportuni versori. Dunque, se x=
k
n
x j vj +
j=1
xj wj ,
j=k+1
la proiezione di x su V è data da PV x =
k
xj vj .
j=1
D’altra parte, è possibile caratterizzare PV x evitando il ricorso ad una base dello spazio4 ; infatti, PV x è l’elemento di V a minima distanza da x, nel senso che: |PV x − x| = inf |y − x| . (6.17) y∈V
Per provarlo, sia y = 2
|y − x| =
k
k
j=1
4
j=1
yj vj ; si ha
(yj − xj )2 +
n
j=k+1
x2j ≥
n
2
x2j = |PV x − x| .
j=k+1
... che in dimensione infinita potrebbe diventare non agevole.
352
6 Elementi di analisi funzionale
In questo caso, si vede che l’estremo inferiore in (6.17) è in realtà un minimo. Si noti che l’unicità di PV x segue dal fatto che, se y∗ ∈ V e |y∗ −x| = |PV x − x| , necessariamente deve essere k
(yj∗ − xj )2 = 0,
j=1
da cui yj∗ = xj per j = 1, ..., k e quindi y∗ = PV x. Poiché (x − PV x)⊥v,
∀v ∈ V,
ogni x ∈ Rn può essere scritto in modo unico nella forma x=y+z con y = PV x ∈ V e z ∈ V ⊥ , dove V ⊥ indica il sottospazio dei vettori ortogonali a V . Si dice allora che Rn è somma diretta dei sottospazi V e V ⊥ e si scrive Rn = V ⊕ V ⊥ . 2
2
2
Inoltre, |x| = |y| + |z| , che è il Teorema di Pitagora in Rn . Tutto quanto si può estendere agli spazi di Hilbert a dimensione non finita, pur di considerare sottospazi chiusi (nella topologia indotta dalla norma). Si noti che i sottospazi di dimensione k, finita, sono automaticamente chiusi, essendo isometrici a Rk (o Ck ). D’altra parte, abbiamo visto chepossono esistere anche sottospazi non chiusi; per esempio, se Ω è limitato, C Ω è un sottospazio non chiuso di L2 (Ω). Osserviamo infine che un sottospazio chiuso V di uno spazio di Hilbert H è anch’esso uno spazio di Hilbert rispetto allo stesso prodotto interno di H. Infatti, se {xn } ⊂ V è di Cauchy, esiste x ∈ H tale che xn → x. Essendo V chiuso, x ∈ V e perciò V è completo. Salvo avviso contrario considereremo spazi di Hilbert sul campo reale, con prodotto interno (·, ·) e norma indotta ·. Iniziamo con il seguente importante teorema.
Figura 6.1. Teorema di Proiezione
6.4 Ortogonalità e proiezioni negli spazi di Hilbert
353
Teorema 4.1 (di Proiezione). Sia V un sottospazio chiuso di uno spazio di Hilbert H. Allora, per ogni x ∈ H, esiste un unico elemento PV x ∈ V tale che PV x − x = inf v − x .
(6.18)
v∈V
Valgono inoltre le seguenti proprietà: 1. PV x = x se e solo se x ∈ V . 2. Posto QV x = x − PV x, si ha QV x ∈ V ⊥ e 2
2
2
x = PV x + QV x . Dimostrazione. Sia d = inf v − x . v∈V
Dalla definizione di estremo inferiore, per ogni intero n ≥ 1 esiste vn ∈ V tale che 1 d ≤ vn − x < d + n e quindi vn − x → d, se n → ∞. Facciamo vedere che la successione {vn } è di Cauchy. Infatti, utilizzando la legge del parallelogramma per i vettori vn − x e vm − x, si ha 2
2
2
2
vn + vm − 2x + vn − vm = 2 vn − x + 2 vm − x . Poiché
vn +vm 2
(6.19)
∈ V , si può scrivere > >2 > vn + vm > 2 > ≥ 4d2 vn + vm − 2x = 4 > − x > > 2
e quindi, dalla (6.19) 2
2
2
2
2
vn − vm = 2 vn − x + 2 vm − x − vn + vm − 2x
2
≤ 2 vn − x + 2 vm − x − 4d2 . Passando al limite per m, n → ∞, il secondo membro tende a zero, forzando vn − vm → 0.
354
6 Elementi di analisi funzionale
Pertanto {vn } è di Cauchy. Essendo H completo, vn converge ad un elemento v ∈ H, che appartiene anche a V , essendo V chiuso. Usando la continuità della norma (e l’unicità del limite...), deduciamo vn − x → v − x = d e quindi v realizza la minima distanza da x, tra gli elementi di V . Proviamo ora che l’elemento v di V tale che v − x = d è unico. Se infatti ci fosse un altro elemento w ∈ V tale che w − x = d, usando ancora la legge del parallelogramma, si avrebbe > >2 >w + v > 2 2 2 > − x w − v = 2 w − x + 2 v − x − 4 > > 2 > ≤ 2d2 + 2d2 − 4d2 = 0 da cui w = v. Abbiamo così dimostrato che esiste un unico elemento v = PV x ∈ V tale che x − PV x = d. Per dimostrare la 1, osserviamo che, poiché V è chiuso, x ∈ V se e solo se d = 0 ossia se e solo se x = PV x. Rimane da dimostrare la 2. Siano QV x = x − PV x, w ∈ V e t ∈ R. Poiché PV x + tw ∈ V per ogni t, si ha 2
2
d2 ≤ x − (PV x + tw) = QV x − tw 2
= QV x − 2t (QV x, w) + t2 w = d2 − 2t (QV x, w) + t2 w ossia
2
2
2
P (t) ≡ t2 w − 2t (QV x, w) ≥ 0.
Il trinomio P (t) è sempre non negativo e pertanto deve avere discriminante non positivo, per cui 2 (QV x, w) ≤ 0. Pertanto (QV x, w) = 0 per ogni w ∈ V , che significa QV x ∈ V ⊥ e implica 2
2
2
2
x = PV x + QV x = PV x + QV x .
La dimostrazione è conclusa.
Gli elementi PV x, QV x si chiamano proiezioni ortogonali di x su V e V ⊥ , rispettivamente. L’estremo inferiore in (6.18) è in realtà un minimo; inoltre, le 1, 2 equivalgono all’affermazione che H è somma diretta di V e V ⊥ : H = V ⊕ V ⊥. Dalla 1 si ricava poi che, se V è chiuso, V ⊥ = {0}
se e solo se
V = H.
6.4 Ortogonalità e proiezioni negli spazi di Hilbert
355
Nota 4.1. Nelle stesse ipotesi del Teorema 4.1, un’altra caratterizzazione di PV x è la seguente (Problema 6.4): u = PV x se e solo se
1. u ∈ V 2. (x − u, v) = 0 ∀v ∈ V.
(6.20)
Nota 4.2. È utile sottolineare che anche se V è un sottospazio non chiuso di H, il sottospazio V ⊥ dei vettori ortogonali a V è sempre chiuso. Infatti se yn → y e {yn } ⊂ V ⊥ , si ha, per ogni x ∈ V , (y, x) = lim (yn , x) = 0 e quindi y ∈ V ⊥ . Esempio 4.1. Sia Ω ⊂ Rn , con misura di Lebesgue finita. In L2 (Ω), consideriamo il sottospazio V delle funzioni costanti. Una base di V è data per esempio dalla funzione f ≡1
in Ω
per cui V ha dimensione 1 ed è chiuso in L2 (Ω) . Data f ∈ L2 (Ω), la proiezione PV f si ottiene risolvendo il problema
(f − λ)2 .
min λ∈R
Essendo
(f − λ)2 =
Ω
Ω
f 2 − 2λ
Ω
f + λ2 |Ω| ,
Ω
si vede che il valore di λ minimizzante è λ=
1 |Ω|
f Ω
e cioè la media di f . Quindi 1 PV f = |Ω|
f,
1 QV f = f − |Ω|
e
Ω
f. Ω
Il sottospazio V ⊥ è dunque costituito dalle funzioni g ∈ L2 (Ω) a media nulla. Infatti, queste funzioni (e solo queste) sono ortogonali a f ≡ 1: (g, 1)0 =
g = 0. Ω
356
6 Elementi di analisi funzionale
6.4.2 Basi ortonormali Anche in spazi a dimensione infinita si può, a volte, parlare di base, per esempio quando H è separabile, ossia quando esiste un sottoinsieme di H numerabile e denso. Una successione {ek }k≥1 di elementi di H costituisce una base ortonormale se (ek , ej ) = δ kj k, j ≥ 1 ek = 1 k≥1 e se ogni x ∈ H si può scrivere nella forma x=
∞
(x, ek ) ek .
(6.21)
k=1
La (6.21) si chiama serie di Fourier generalizzata ed i numeri x ˆk = (x, ek ) si chiamano coefficienti di Fourier di x rispetto alla base considerata. Inoltre (Teorema di Pitagora!) ∞
2 x = x ˆ2k . k=1
Avendo a disposizione una base ortonormale {ek }k≥1 , la proiezione di un elemento x ∈ H sul sottospazio VN generato, diciamo, da e1 , ..., eN è PVN x =
N
x ˆk ek .
k=1
Un classico esempio di spazio di Hilbert separabile è L2 (Ω), Ω ⊆ Rn . In particolare, l’insieme di funzioni 1 cos x sin x cos 2x sin 2x cos mx sin mx √ , √ , √ , √ , √ , ..., √ , √ , ... π π π π π π 2π costituisce una base numerabile ortonormale in L2 (0, 2π) (Sezione 1.5). Vale il seguente risultato. Teorema 4.2. Ogni spazio di Hilbert separabile ammette una base ortonormale. Dimostrazione (cenno). Poiché H è separabile, esiste una successione {zk }k≥1 densa in H. Eliminando, se necessario, gli elementi che sono generati da combinazioni lineari di altri elementi della successione, possiamo assumere che {zk }k≥1 costituisca un insieme indipendente, tale cioè che ogni sottoinsieme finito di {zk }k≥1 è composto da elementi indipendenti. Allora, si può costruire una base ortonormale {ek }k≥1 applicando a {zk }k≥1 il cosiddetto procedimento di Gram-Schmidt , che consiste in due passi. Primo passo: si definisce per induzione la successione {˜ ek }k≥1 nel modo seguente. Si pone e˜1 = z1 . Noto e˜k−1 si costruisce e˜k sottraendo da zk la sua
6.4 Ortogonalità e proiezioni negli spazi di Hilbert
357
proiezione sul sottospazio generato da e˜1 , ..., e˜k−1 : e˜k = zk −
(zk , e˜k−1 ) ˜ ek−1
2
e˜k−1 − · · · −
(zk , e˜1 ) ˜ e1
2
e˜1 .
In questo modo, e˜k è ortogonale a e˜1 , ..., e˜k−1 . Secondo passo: sia wk = e˜k / ˜ ek−1 . Poiché {zk }k≥1 è denso in H, allora anche {wk }k≥1 risulta denso in H. Non è ora difficile mostrare che {wk }k≥1 è una base ortonormale. Nelle applicazioni, le basi ortonormali intervengono nella soluzione di particolari problemi per equazioni a derivate parziali, spesso in relazione al metodo di separazione delle variabili. Tipici esempi vengono dallo studio delle vibrazioni di una corda nonomogenea oppure dalla diffusione in una sbarra con proprietà termiche non costanti (e.g. col coefficiente di condttività termica κ = κ (x, t)). Il primo esempio conduce all’equazione delle onde ρ (x) utt − τ uxx = 0. Separando le variabili, ponendo cioè u(x, t) = v (x) z (t), per il fattore v troviamo l’equazione τ v + λρ (x) v = 0. Il secondo esempio conduce all’equazione del calore ρcv ut − (κu ) = 0. Separando le variabili, troviamo, sempre per il fattore spaziale, (κv ) + λcv ρv = 0. Le equazioni trovate appartengono ad una classe di equazioni differenziali ordinarie della forma (6.22) (pu ) + qu + λwu = 0 dette equazioni di Sturm-Liouville. In generale si cercano soluzioni della (6.22) in un intervallo (a, b), −∞ ≤ a < b ≤ +∞, soddisfacenti particolari condizioni agli estremi (problema ai limiti). Ipotesi naturali su p e q sono p, q continue in (a, b), con p > 0; La funzione w, detta funzione peso, è anch’essa continua e positiva in (a, b). In generale, il problema ai limiti ha soluzioni non banali (cioè non identicamente nulle) solo per particolari valori di λ, detti autovalori . Le soluzioni corrispondenti si chiamano autofunzioni, che, opportunamente normalizzate, costituiscono una base ortonormale nello spazio di Hilbert L2w (a, b), l’insieme delle funzioni misurabili (secondo Lebesgue) in (a, b) tali che 2
uL2w =
a
b
u2 (x) w (x) dx < ∞.
358
6 Elementi di analisi funzionale
L2w (a, b) è uno spazio di Hilbert rispetto al prodotto interno definito da (u, v)w =
b
u (x) v (x) w (x) dx. a
Vediamo alcuni esempi5 . • Polinomi di Chebyshev. Consideriamo il problema 1 − x2 u − xu + λu = 0 in (−1, 1) |u (−1)| < ∞,
|u (1)| < ∞.
L’equazione differenziale è nota come equazione di Chebyshev e può essere scritta nella forma (6.22): −1/2 u=0 ((1 − x2 )1/2 u ) + λ 1 − x2 −1/2 che evidenzia la funzione peso w (x) = 1 − x2 . Gli autovalori sono λn = n2 , n = 0, 1, 2, .... Le corrispondenti autofunzioni sono i polinomi di Chebyshev Tn , definiti ricorsivamente dalla relazione Tn+1 = 2xTn − Tn−1
(n > 1)
con T0 (x) = 1, T1 (x) = x. Per esempio, T2 (x) = 2x2 − 1, T3 (x) = 4x3 − 3x, T4 (x) = 8x4 − 8x2 − 1. ' ' ' I polinomi normalizzati 1/πT0 , 2/πT1 , ..., 2/πTn , ... costituiscono una base ortonormale in L2w (−1, 1). • Polinomi di Legendre. Consideriamo il problema (si veda anche il Problema 8.5) in (−1, 1) 1 − x2 u + λu = 0 con le condizioni di Neumann pesate: 1 − x2 u (x) → 0
per x → ±1.
L’equazione differenziale è nota come equazione di Legendre. Gli autovalori sono λn = n (n + 1), n = 0, 1, 2, ... Le corrispondenti autofunzioni sono i polinomi di Legendre, definiti ricorsivamente dalla relazione (n + 1) Ln+1 = (2n + 1)xLn − nLn−1
(n > 1)
con L0 (x) = 1, L1 (x) = x, oppure dalla formula (di Rodrigues) Ln (x) = 5
1 2n n!
n dn 2 x −1 n dx
(n ≥ 0) .
Per le dimostrazioni si può consultare per esempio, Courant-Hilbert, Vol I, 1953.
6.4 Ortogonalità e proiezioni negli spazi di Hilbert
359
Per esempio, L2 (x) = 12 (3x2 − 1), L3 (x) = 12 (5x3 − 3x). I polinomi normalizzati 2n + 1 Ln 2 costituiscono una base ortonormale in L2 (−1, 1) (cioè con funzione peso w (x) = 1). Ogni funzione f ∈ L2 (−1, 1) ha uno sviluppo +∞
f (x) =
fn Ln (x)
n=0
dove fn =
2n + 1 2
1
−1
f (s) Ln (s) ds,
con convergenza in L2 (−1, 1). • Polinomi di Hermite. Consideriamo il problema in (−∞, +∞) u − 2xu + 2λu = 0 2
e−x
/2
u (x) → 0
per x → ±∞.
L’equazione differenziale è nota come equazione di Hermite e può essere scritta nella forma (6.22): 2 2 (e−x u ) + 2λe−x u = 0 2
che mostra la funzione peso w (x) = e−x . Gli autovalori sono λn = n, n = 0, 1, 2, .... Le corrispondenti autofunzioni sono i polinomi di Hermite, importanti in Meccanica Quantistica (si veda il Problema 6.6), definiti dalla seguente formula di Rodrigues: n
2
Hn (x) = (−1) ex
dn −x2 e dxn
(n ≥ 0) .
Per esempio H0 (x) = 1, H1 (x) = 2x,
H2 (x) = 4x2 − 2, H3 (x) = 8x3 − 12x. −1/2
Hn costituiscono una base ortonorI polinomi normalizzati π −1/4 (2n n!) 2 male in L2w (R), con w (x) = e−x . Ogni f ∈ L2w (R) ha uno sviluppo f (x) =
∞
fn Hn (x)
n=0
dove fn = [π 1/2 2n n!]−1 con convergenza in L2w (R).
R
2
f (x) Hn (x) e−x dx,
360
6 Elementi di analisi funzionale
Figura 6.2. Le funzioni di Bessel J0 , J1 , J2
• Funzioni di Bessel. Dopo aver separato le variabili nel modello per la vibrazione di una membrana circolare si perviene alla seguente equazione di Bessel parametrica di ordine p (si veda il Problema 6.8): x2 u + xu + λx2 − p2 u = 0 x ∈ (0, a) (6.23) dove p ≥ 0, λ ≥ 0, con le condizioni agli estremi |u (0)| < ∞,
u (a) = 0.
(6.24)
La (6.23) si può scrivere come equazione di Sturm-Liouville: p2 (xu ) + λx − u=0 x che evidenzia il peso w (x) = x. Il cambiamento di variabili z = la (6.23) all’equazione di Bessel di ordine p z2
d2 u du 2 + z − p2 u = 0 +z 2 dz dz
√
λx reduce
(6.25)
dove la dipendenza dal parametro λ è rimossa. Le sole soluzioni di (6.25) sono le funzioni di Bessel di primo genere, di ordine p, date da Jp (z) =
∞
k=0
z p+2k (−1) Γ (k + 1) Γ (k + p + 1) 2 k
dove
∞
Γ (s) =
e−t ts−1 dt
0
è la funzione Γ di Eulero. In particolare, se p = n ≥ 0, intero Jn (z) =
∞
k=0
z n+2k (−1) . k! (k + n)! 2 k
(6.26)
6.5 Operatori lineari. Spazio duale
361
Per ogni p, esiste una successione infinita {αpj }j≥1 di zeri positivi di Jp : Jp (αpj ) = 0
(j = 1, 2, ...).
Ne segue che gli autovalori del problema (6.23), (6.24) sono dati da λpj = α 2 α pj pj , con corrispondenti autofunzioni upj (x) = Jp x . Le autofuna a zioni normalizzate √ αpj 2 Jp x aJp+1 (αpj ) a costituiscono una base ortonormale in L2w (0, a), con w (x) = x. Ogni funzione f ∈ L2w (0, a) ha uno sviluppo in serie di Fourier-Bessel, dato da f (x) =
∞
fj Jp
j=1
dove fj = convergente in
L2w
2 2 a2 Jp+1 (αpj )
0
α
pj
a
x ,
a
xf (x) Jp
α
pj
a
x dx,
(0, a).
6.5 Operatori lineari. Spazio duale 6.5.1 Operatori lineari Siano H1 e H2 spazi di Hilbert. Un operatore lineare da H1 in H2 è una funzione L : H1 → H2 tale che6 ∀α, β ∈ R e ∀x, y ∈ H1 L(αx + βy) = αLx + βLy. Per ogni operatore lineare sono definiti nucleo e immagine. Il nucleo di L, indicato con N (L) o anche Ker(L), è la controimmagine del vettore nullo (in H2 ): N (L) = {x ∈ H1 : Lx = 0} e risulta un sottospazio di H1 . L’immagine di L, indicata con R (L) o anche Im (L), è l’insieme delle immagini dei punti di H1 : R (L) = {y ∈ H2 : ∃x ∈ H1 , Lx = y} 6
Se un operatore L è lineare, si può scrivere Lx anziché L (x), quando ciò non generi confusione.
362
6 Elementi di analisi funzionale
e risulta un sottospazio di H2 . Gli operatori lineari che ci interessano sono quelli continui. Se la dimensione di H è finita, ogni operatore lineare è continuo (il lettore se ne convinca). Non è così in dimensione infinita: un operatore lineare non è necessariamente continuo. D’altro canto, per un operatore lineare, la continuità equivale alla limitatezza, secondo la definizione seguente. Definizione 5.1. Un operatore L si dice limitato se esiste una costante C tale che LxH2 ≤ C xH1 ∀x ∈ H1 . (6.27) La (6.27) indica che la sfera di raggio R in H1 viene trasformata da L in un insieme contenuto nella sfera di raggio CR in H2 . La costante C si può dunque interpretare come un controllo del “tasso di espansione” operato da L. Se, in particolare, C < 1, L opera una contrazione delle norme dei vettori in H1 . Se x = 0, usando la linearità di L si può scrivere la (6.27) nella forma > # $> > > x > > > ≤C >L > xH1 > H2
che, poiché
x xH
1
ha norma unitaria in H1 , equivale a richiedere sup xH =1
LxH2 = K < ∞.
(6.28)
1
Evidentemente K ≤ C. Veniamo ora all’equivalenza tra limitatezza e continuità. Microteorema 5.1. Un operatore lineare L : H1 → H2 è limitato se e solo se è continuo. Dimostrazione. Sia L limitato. Dalla (6.27) si ha, ∀x, x0 ∈ H1 , L (x − x0 )H2 ≤ C x − x0 H1 e quindi, se x − x0 H1 → 0, anche Lx − Lx0 H2 = L (x − x0 )H2 → 0. Ciò mostra la continuità di L. Sia L continuo. In particolare L è continuo in x = 0 e quindi esiste δ tale che LxH2 ≤ 1
se xH1 ≤ δ.
Sia ora y ∈ H1 con yH1 = 1. Posto z = δy, si ha zH1 = δ che implica δ LyH2 = LzH2 ≤ 1 e cioè LyH2 ≤ che implica la (6.28) con K ≤ 1δ .
1 δ
6.5 Operatori lineari. Spazio duale
363
Nota 5.1. Se L ∈ L (H1 , H2 ) allora N (L) è un sottospazio chiuso di H1 . Infatti, se {xn } ⊂ N (L) e xn → x, allora 0 = Lxn → Lx e perciò x ∈ N (L); dunque N (L) contiene tutti i suoi punti limite e quindi è chiuso. Dati due spazi di Hilbert H1 and H2 , indichiamo con L (H1 , H2 ) l’insieme di tutti gli operatori lineari limitati da H1 in H2 . Se H1 = H2 scriviamo semplicemente L (H). Dati due operatori L, G ∈ L (H1 , H2 ), si possono definire in modo naturale altri due operatori nella stessa classe, somma e prodotto per uno scalare: se x ∈ H1 e λ ∈ R, definiamo (G + L) (x) = Gx + Lx (λL) x = λLx. L’insieme L (H1 , H2 ) risulta così dotato di una struttura di spazio vettoriale. Inoltre, possiamo usare il numero K nella (6.28) come norma in L (H1 , H2 ): LL(H1 ,H2 ) =
sup xH =1
LxH2 .
(6.29)
1
Qualora non vi sia confusione, scriveremo semplicemente L invece di LL(H1 ,H2 ) . Sottolineiamo che, per ogni L ∈ L (H1 , H2 ), si ha LxH2 ≤ L xH1 . Lo spazio che ne risulta è completo; infatti: Microteorema 5.2. Con la norma (6.29) lo spazio L (H1 , H2 ) è di Banach. Lasciamo la prova delle affermazioni precedenti e del Microteorema 5.2 al lettore. Ci concentriamo invece su alcuni esempi importanti. Esempio 5.1. Sia A una matrice di ordine m × n ad elementi reali. Dall’Algebra Lineare segue che l’operatore L : x −→ Ax è lineare e continuo da Rn in Rm . Per calcolarne la norma, osserviamo che: 2
Ax = Ax · Ax = A Ax · x. La matrice A A è quadrata di ordine n ed è simmetrica e semidefinita positiva. Ora, sup A Ax · x = sup A Ax · x = ΛM x≤1
x=1
364
6 Elementi di analisi funzionale
√ dove ΛM è il massimo autovalore di A A. Pertanto L = ΛM . Esempio 5.2. Sia V sottospazio chiuso di uno spazio di Hilbert H. Le proiezioni definite nel Teorema 2.1, x −→ QV x = x − PV x
x −→ PV x,
sono operatori lineari continui da H in H. La linearità di P , e quindi anche quella di Q, segue subito dalla caratterizzazione (6.20) nella Nota 4.1. Infatti, dati x, y ∈ H, poniamo u = PV x e w = PV y. Si ha u + w ∈ V e dalla (6.20), (x − u, v) = 0, (y − w, v) = 0
∀v ∈ V .
(6.30)
Dunque, sommando le due equazioni nella (6.30) si ottiene (x + y − (u + v) , v) = 0,
∀v ∈ V
che implica, u + v = PV (x + y), ovvero la linearità di P . 2
2
2
Inoltre, da x = PV x + QV x segue subito che PV x ≤ x ,
QV x ≤ x
per cui vale la (6.27) con C = 1. Poiché PV x = x se x ∈ V e QV x = x se x ∈ V ⊥ , segue che PV = QV = 1. Infine, osserviamo che N (PV ) = R (QV ) = V ⊥
e
N (QV ) = R (PV ) = V.
Esempio 5.3. Siano V e H spazi di Hilbert, V ⊂ H. Un elemento di V può essere pensato anche come elemento di H. In tal modo risulta definito l’operatore IV →H : V → H tale che IV →H (u) = u, che si chiama iniezione canonica di V in H. IV →H è chiaramente un operatore lineare ed è continuo se esiste un numero C tale che uH ≤ C uV ,
per ogni u ∈ V.
In tal caso si dice che V è immerso con continuità in H e si scrive V → H. 1 Per esempio, Hper (0, 2π) → L2 (0, 2π) e se Ω è limitato, C Ω → L2 (Ω) . 6.5.2 Funzionali e spazio duale Nel caso in cui H2 = R (oppure C, per gli spazi di Hilbert sui complessi), invece di operatore si usa il termine funzionale. La seguente definizione è importante.
6.5 Operatori lineari. Spazio duale
365
Definizione 5.2. L’insieme dei funzionali lineari e continui su uno spazio di Hilbert H prende il nome di spazio duale di H e si indica col simbolo H ∗ (anziché L (H, R)). La norma di L ∈ H ∗ si indica col simbolo LH ∗ . Dalla (6.29) LH ∗ = sup |Lx| . x=1
Esempio 5.4. Sia H uno spazio di Hilbert. Fissato y ∈ H, il funzionale Ly : x −→ (x, y) è continuo. Infatti, la disuguaglianza di Schwarz dà |(x, y)| ≤ x y e quindi Ly ∈ H ∗ e Ly H ∗ ≤ y. In realtà si ha Ly H ∗ = y
(6.31)
poiché, scegliendo x = y, si trova 2
y = |Ly y| ≤ Ly H ∗ y da cui Ly H ∗ ≥ y. Esempio 5.5. Il funzionale x −→ x è continuo ma non lineare. La determinazione del duale di uno spazio di Hilbert è un problema importante che verrà risolto grazie al prossimo Teorema di Riesz. L’esempio 5.4 mostra che il prodotto scalare con un elemento y fissato è un elemento del duale la cui norma è esattamente x. Dall’Algebra Lineare è ben noto che tutti i funzionali lineari in uno spazio finito-dimensionale possono essere rappresentati in questo modo. Precisamente, se L è lineare in Rn , esiste un vettore uL ∈ Rn tale che Lx = uL · x
per ogni x ∈ Rn .
Negli spazi di Hilbert vale un risultato analogo per i funzionali lineari e continui. Teorema 5.3 (di Rappresentazione di Riesz). Sia H uno spazio di Hilbert. Per ogni L ∈ H ∗ esiste un unico elemento uL ∈ H tale che : Lx = (uL , x)
per ogni x ∈ H.
(6.32)
Inoltre LH ∗ = uL .
(6.33)
366
6 Elementi di analisi funzionale
Dimostrazione. Iniziamo dall’esistenza di uL . Sia N il nucleo di L. Se N = H, la tesi segue scegliendo uL = 0. Se N ⊂ H, allora (Nota 5.1) N è un sottospazio chiuso di H. Dal Teorema di Proiezione si deduce che esiste un elemento non nullo z ∈ N ⊥ . Allora Lz = 0, e, dato un qualunque elemento x ∈ H, l’elemento Lx z Lz
w =x− appartiene a N . Infatti
Lx Lx z = Lx − Lz = 0. Lw = L x − Lz Lz Essendo z ∈ N ⊥ , si ha 0 = (z, w) = (z, x) −
Lx 2 z Lz
ossia Lx =
L (z) z
2
(z, x) . −2
La (6.32) vale dunque con uL = L (z) z z. Per l’unicità, osserviamo che, se esistesse v ∈ H, v = uL , tale che Lx = (v, x)
per ogni x ∈ H,
sottraendo quest’equazione dalla (6.32), seguirebbe che (uL − v, x) = 0
per ogni x ∈ H,
che implica v = uL (perché?). Infine, l’uguaglianza LH ∗ = uL segue dalla (6.31), essendo L = LuL nelle notazioni dell’Esempio 5.4. Diciamo che uL è l’elemento di Riesz associato ad L rispetto al prodotto interno (·, ·) in H. Possiamo introdurre in H ∗ il prodotto interno definito dalla relazione (L1 , L2 )H ∗ = (uL1 , uL2 ) . In tal modo H ∗ risulta uno spazio di Hilbert. L’operatore J : H ∗ → H dato da L −→ uL
6.5 Operatori lineari. Spazio duale
367
si chiama operatore di Riesz o anche isometria canonica tra H ∗ ed H in quanto è lineare, biunivoca e conserva le norme: LH ∗ = uL . In ultima analisi, il Teorema di Rappresentazione permette l’identificazione di uno spazio di Hilbert col suo duale. Esempio 5.6. L2 (Ω) si può identificare con il suo duale. Tutti i funzionali lineari e continui su L2 (Ω) sono dunque della forma f g, Lg : f −→ Ω
con g ∈ L2 (Ω). Warning. Vi sono situazioni in cui l’identificazione di cui sopra richiede cautela. Un tipico caso che incontreremo nel Paragrafo 6.8.1, al quale rimandiamo per le dimostrazioni, si presenta considerando una coppia di spazi di Hilbert V, H tali che V → H, con V denso in H. In questa situazione, identificando H e H ∗ , si può immergere H in V ∗ associando ad ogni u ∈ H l’elemento di V ∗ definito da v −→ (u, v)H per ogni v ∈ V. (6.34) Si prova allora che
V →H →V∗
(6.35)
con H denso in V ∗ . A questo punto l’identificazione di V e V ∗ è proibita poiché la (6.35) diventerebbe assurda! Infatti, in quel caso, ogni elemento w ∈ V identificherebbe l’elemento di V ∗ definito dalla relazione v −→ (w, v)V
per ogni v ∈ V.
D’altra parte, essendo V → H, w è anche un elemento di H ed allora, dalla (6.34) dovremmo anche avere (w, v)V = (w, v)H
per ogni v ∈ V,
che è una relazione assurda non appena le norme in H e V non siano equivalenti. Nota importante sulla simbologia. Dato uno spazio di Hilbert H abbiamo sempre indicato il prodotto scalare in H con il simbolo (·, ·) oppure, se esiste rischio di confusione, con (·, ·)H . Sia ora L ∈ H ∗ . Abbiamo indicato l’azione di L su un elemento x ∈ H semplicemente con Lx. Quando sia utile o necessario mettere in evidenza la dualità (pairing) tra H ∗ e H useremo la notazione L, x∗ oppure, qualora dovessero sorgere ambiguità, L, xH ∗ ×H .
368
6 Elementi di analisi funzionale
6.5.3 Aggiunto di un operatore limitato La nozione di operatore aggiunto generalizza quella di matrice trasposta di una matrice A di ordine m × n e svolge un ruolo cruciale nel determinare condizioni necessarie e/o sufficienti di compatibilità sui dati per la risolubilità di molti problemi. La matrice trasposta A è caratterizzata dall’identità (Ax, y)Rm = (x, A y)Rn ,
∀x ∈ Rn , ∀y ∈ Rm
ed è precisamente di questa relazione che ci serviremo per definire la nozione di operatore aggiunto. Sia L ∈ L(H1 , H2 ). Se y è un elemento fissato in H2 , la formula Ty : x −→ (Lx,y)H2 definisce un elemento di H1∗ . Infatti, |Ty x| = (Lx,y)H2 ≤ LxH2 yH2 ≤ LL(H1 ,H2 ) yH2 xH1 cosicché Ty H ∗ ≤ LL(H1 ,H2 ) yH2 . 1
Per il Teorema di Riesz, a tale funzionale è associato biunivocamente un elemento di H1 , che dipende da y e che denotiamo con L∗ y, tale che Ty x = (x,L∗ y)H1
∀x ∈ H1 , ∀y ∈ H2 .
L∗ è un operatore da H2 in H1 che si chiama aggiunto di L. Precisamente: Definizione 5.3. L’operatore L∗ : H2 → H1 , definito dall’identità (Lx,y)H2 = (x,L∗ y)H1 ,
∀x ∈ H1 , ∀y ∈ H2
(6.36)
si chiama aggiunto di L. In altri termini, L∗ associa all’elemento y ∈ H2 l’unico elemento L∗ y ∈ H1 tale che la (6.36) sia valida. Naturalmente, la formula ha senso grazie ∗ all’identificazione di H1∗ e H2 con H1 e H2 , rispettivamente. Esempio 5.7. Sia J : H ∗ → H l’operatore di Riesz. Allora J ∗ = J −1 : H → H ∗ . Infatti, per ogni F ∈ H ∗ e v ∈ H, abbiamo: (J F, v)H = F, v∗ = F, J −1 v H ∗ . Esempio 5.8. Sia T : L2 (0, 1) → L2 (0, 1) definito da x u. T u (x) = 0
Usando la disuguaglianza di Schwarz, si ha 2 1 1 x 1 2 dx ≤ |T u| = u (t) dt x 0
0
0
0
x 0
1 1 2 u2 dx ≤ u 2 0
6.5 Operatori lineari. Spazio duale
369
e quindi T u0 ≤ 2−1/2 u0 da cui si vede che T è continuo. Per determinarne l’aggiunto, osserviamo che (T u,v)0 =
1
x
v (x) 0
1
u
= 0
0
u 0
1
v−
dx = integrando per parti 1
v
u (x) 0
x
dx =
0
dove ∗
1
u
0
1
v
x
dx = (u, T ∗ v)0
1
T v (x) =
v. x
Le matrici simmetriche corrispondono agli operatori autoaggiunti. Diciamo che L è autoaggiunto se L∗ = L. Per gli operatori autoaggiunti, deve necessariamente essere H1 = H2 = H e la (6.36) si riduce a (Lx, y) = (x, Ly) . Un esempio di operatore autoaggiunto in uno spazio di Hilbert H è la proiezione PV su un sottospazio chiuso V . Infatti, ricordando il Teorema di Proiezione, possiamo scrivere: (PV x, y) = (PV x, PV y + QV y) = (PV x, PV y) = (PV x + QV x, PV y) = (x, PV y) . Importanti operatori autoaggiunti sono associati ad inversi di operatori differenziali, come vedremo nel Capitolo 8. Le seguenti proprietà sono conseguenze immediate della definizione di aggiunto (per la dimostrazione si veda il Problema 6.10). Microteorema 5.4. Siano L, L1 ∈ L(H1 , H2 ) e L2 ∈ L(H2 , H3 ). Allora: (a) L∗ ∈ L(H2 , H1 ); inoltre L∗∗ = L e L∗ L(H2 ,H1 ) = LL(H1 ,H2 ) , ∗
(b) (L2 L1 ) = L∗1 L∗2 . In particolare, se L è un isomorfismo anche L∗ è un isomorfismo e −1 ∗ −1 = (L∗ ) . L Le relazioni tra nucleo e immagine di L e del suo aggiunto L∗ sono sostanzialmente le stesse del caso finito dimensionale. Abbiamo infatti:
370
6 Elementi di analisi funzionale
Teorema 5.5 Per ogni L ∈ L (H1 , H2 ). ⊥
a) R (L) = N (L∗ ) . ⊥
b) R (L∗ ) = N (L) . Dimostrazione. a) Sia z ∈ R (L). Allora z = Lx per qualche x ∈ H1 e, se y ∈ N (L∗ ), si ha (z,y)H2 = (Lx,y)H2 = (x,L∗ y)H1 = 0. ⊥
⊥
Perciò R (L) ⊆ N (L∗ ) . Essendo N (L∗ ) chiuso (Nota 4.2), segue anche che ⊥
R (L) ⊆ N (L∗ ) . ⊥
D’altra parte, se z ∈ R (L) , per ogni x ∈ H1 si ha 0 = (Lx,z)H2 = (x,L∗ z)H1 per cui deve essere L∗ z = 0. Pertanto R (L) ⊥ N (L∗ ) ⊆ R (L). b) Dalla a) con L = L∗ si ha
⊥
⊆ N (L∗ ), che equivale a
⊥
R (L∗ ) = N (L) . Passando agli ortogonali si ottiene la tesi.
6.6 Problemi variazionali astratti 6.6.1 Forme bilineari. Teorema di Lax-Milgram Nella formulazione variazionale dei problemi al contorno per operatori differenziali, un ruolo importante è svolto dalle forme bilineari. Se V1 , V2 sono spazi pre-Hilbertiani, una forma bilineare in V1 × V2 è una funzione a : V 1 × V2 → R che soddisfa le seguenti proprietà: i) per ogni y ∈ V2 , fissato, la funzione x −→ a(x, y) è lineare su V1 , ii) per ogni x ∈ V1 , fissato, la funzione y −→ a(x, y) è lineare su V2 . Se V1 = V2 diremo semplicemente forma bilineare in V , anziché in V × V . Nota 6.1. Se il campo di scalari è C, si parla di forme sesquilineari, anzichè bilineari, e la ii) è sostituita dalla seguente: iibis ) per ogni x ∈ V1 , fissato, la funzione y −→ a(x, y) è antilineare 7 su V2 . 7
Cioè a (x, αy + βz) = αa (x, y) + βa (x, z) .
6.6 Problemi variazionali astratti
371
Esempi 6.1. Il prodotto interno in uno spazio di Hilbert V è una forma bilineare in V . 6.2. La formula b b b p(x)u v dx + q(x)u v dx + r(x)uv dx, a (u, v) = a
a
a
dove p, q, r sono funzioni limitate, definisce una forma bilineare in C 1 ([a, b]), spazio pre-Hilbertiano rispetto al prodotto interno b b (u,v)1,2 = uv + u v . a
a
6.3. Sia Ω un dominio limitato in R . Le formule (∇u · ∇v + ub (x) · ∇v + a (x) uv) dx a(u,v) = n
Ω
e
∇u · ∇v dx +
a(u,v) =
huv dσ,
Ω
∂Ω
1 (b, a, h limitate) sono forme bilineari " in C " Ω , spazio pre-Hilbertiano rispetto al prodotto interno (u,v)1,2 = Ω uv + Ω ∇u · ∇v. Siano ora V uno spazio di Hilbert, a = a (u, v) una forma bilineare in V e F ∈ V ∗ . Consideriamo il seguente problema, che prende il nome di problema variazionale astratto: ⎧ Trovare u ∈ V ⎨ tale che (6.37) ⎩ a (u, v) = F, v∗ , ∀v ∈ V. Come vedremo molti problemi per equazioni differenziali possono essere formulati in modo da rientrare in questa classe. Il teorema fondamentale è il seguente. Teorema 6.1. (di Lax-Milgram) Sia V uno spazio di Hilbert reale, con prodotto interno (·, ·) e norma ·. Siano a = a (u, v) una forma bilineare in V ed F ∈ V ∗ . Se: i) a è continua, cioè esiste una costante positiva M tale che |a(u, v)| ≤ M x y ,
∀u, v ∈ V,
ii) a è V −coerciva, cioè esiste una costante α > 0 tale che 2
a(v, v) ≥ α v ,
∀v ∈ V,
(6.38)
allora esiste un’unica soluzione u ∈ V del problema (6.37). Inoltre vale la seguente stima di stabilità: u ≤
1 F V ∗ . α
(6.39)
372
6 Elementi di analisi funzionale
Nota 6.2. La disuguaglianza (6.38) che esprime la coercività di a può essere considerata come una versione astratta delle stime dell’energia, che abbiamo già incontrato nei capitoli precedenti. Di solito, essa costituisce il punto più critico nell’applicazione del Teorema 6.1. Torneremo nella Sezione 6.8 sulla risolubilità del problema (6.37) quando a non è V −coerciva. Nota 6.3. La disuguaglianza (6.39) si chiama stima di stabilità per il motivo seguente. Il funzionale F , elemento di V ∗ , codifica i dati del problema (6.37). Poiché per ogni F il teorema assicura l’esistenza di un’unica soluzione u = u (F ), la corrispondenza F −→ u (F ) risulta una funzione da V ∗ a V . Siano ora λ, μ ∈ R, F1 , F2 ∈ V ∗ e u1 , u2 le corrispondenti soluzioni. In base alla bilinearità di a, abbiamo che a(λu1 + μu2 , v) = λa(u1 , v) + μa(u2 , v) = = λ F1 , v∗ + μ F2 , v∗ . Si deduce che la soluzione corrispondente ad una combinazione lineare dei dati è la combinazione lineare delle soluzioni corrispondenti o, in altri termini, la corrispondenza dati-soluzione è lineare. Per il problema (6.37) vale dunque il principio di sovrapposizione. Applicando la (6.39) alla differenza u1 − u2 , le considerazioni precedenti permettono di scrivere u1 − u2 ≤
1 F1 − F2 V ∗ α
che mostra come la corrispondenza dati-soluzione sia una funzione Lipschitziana con costante di Lipschitz pari a α1 . Questa costante riveste un ruolo particolarmente importante, perché controlla la variazione in norma della soluzione in seguito ad una variazione sui dati, misurata attraverso la norma F1 − F2 V ∗ . Naturalmente, il problema è tanto “più stabile” quanto più elevata è la costante α di coercività. Tutte queste proprietà si sintetizzano nell’unico enunciato seguente: l’operatore che associa ad F ∈ V ∗ la soluzione u = u(F ) ∈ V del problema variazionale è un isomorfismo continuo tra V ∗ e V . Dimostrazione del Teorema 6.1. Per maggior chiarezza dividiamo la dimostrazione in vari passi. 1. Riscrittura del problema (6.37). Per ogni u ∈ V , fissato, dalla continuità di a, segue che l’applicazione v → a (u, v) è lineare e continua in V e definisce perciò un elemento di V ∗ . In base al Teorema di Rappresentazione, esiste un unico elemento A [u] ∈ V tale che a (u, v) = (A[u],v) ,
∀v ∈ V.
(6.40)
6.6 Problemi variazionali astratti
373
Analogamente, essendo F ∈ V ∗ , esiste un unico zF ∈ V tale che F, v∗ = (zF ,v)
∀v ∈ V
e inoltre, F V ∗ = zF . Di conseguenza, il problema (6.37) può essere riformulato nel modo seguente: ⎧ ⎨
Trovare u ∈ V tale che (A [u] ,v) = (zF ,v) ,
⎩
∀v ∈ V
che a sua volta equivale a trovare u tale che A [u] = zF .
(6.41)
Vogliamo dimostrare che l’equazione (6.41) ha esattamente una soluzione. A tale scopo mostriamo che A:V →V è un operatore lineare, continuo, iniettivo e suriettivo. 2. Linearità e continuità di A. Usiamo ripetutamente la definizione di A e la bilinearità di a. Per dimostrare la linearità di A, scriviamo, per ogni u1 , u2 , v ∈ V e λ1 , λ2 ∈ R: (A [λ1 u1 + λ2 u2 ] ,v) = a (λ1 u1 + λ2 u2 , v) = λ1 a (u1 , v) + λ2 a (u2 , v) = λ1 (A [u1 ] ,v) + λ2 (A [u2 ] ,v) = (λ1 A [u1 ] + λ2 A [u2 ] ,v) da cui A [λ1 u1 + λ2 u2 ] = λ1 A [u1 ] + λ2 A [u2 ] . Pertanto A è lineare e possiamo scrivere Au invece di A [u]. Per la continuità, osserviamo che: 2
Au = (Au, Au) = a(u, Au) ≤ M u Au da cui Au ≤ M u . 3. A è iniettivo e ha immagine chiusa, cioè: N (A) = {0}
e
R (A) è un sottospazio chiuso di V.
374
6 Elementi di analisi funzionale
Infatti, dalla coercività di a, si ricava 2
α u ≤ a (u, u) = (Au, u) ≤ Au u da cui u ≤
1 Au . α
(6.42)
Se perciò Au = 0, deve essere u = 0 e quindi N (A) = {0}. Per mostrare che R (A) è un sottospazio chiuso di V occorre considerare una successione {ym } ⊂ R (A) tale che ym → y ∈ V per m → +∞ e mostrare che y ∈ R (A). Essendo ym ∈ R (A) , esiste um tale che Aum = ym . Dalla (6.42) si ha uk − um ≤
1 yk − ym α
per cui, essendo {ym } di Cauchy, lo è anche {um }. Poiché V è completo, esiste u ∈ V tale che um → u e la continuità di A implica che ym = Aum → Au. Deve dunque essere Au = y, per cui y ∈ R (A) e R (A) è chiuso. 4. A è suriettivo, cioè R (A) = V . Per assurdo sia R (A) ⊂ V . Essendo R (A) sottospazio chiuso, per il Teorema di Proiezione esiste z = 0, z ∈ ⊥ R (A) . In particolare, ciò implica che 0 = (Az, z) = a (z, z) ≥ α z
2
da cui z = 0. Contraddizione. Deve dunque essere R (A) = V . 5. Esistenza e unicità della soluzione di (6.37). Poiché A è suriettivo e iniettivo, esiste ed è unico u ∈ V tale che Au = zF . Per quanto visto al punto 1, u è anche l’unica soluzione del problema (6.37). 6. Stima di stabilità. Dalla (6.42) con u = u, si trova u ≤
1 1 1 Au = zF = F V ∗ α α α
che conclude la dimostrazione.
Nota 6.4. Una variante del Teorema 4.1. A volte, nella formulazione astratta occorre considerare soluzioni in uno spazio di Hilbert W mentre le funzioni test che entrano nell’equazione variazionale devono essere scelte in un differente spazio di Hilbert V . Esiste una variante (dovuta a J. Nečas) del Teorema di Lax-Milgram utile in questa situazione. Precisamente, la formulazione del problema è la seguente: siano W e V spazi di Hilbert, a = a (u, v) una forma bilineare in W × V e F ∈ V ∗ .
6.6 Problemi variazionali astratti
Consideriamo il seguente problema variazionale astratto: ⎧ Trovare u ∈ W ⎨ tale che ⎩ a (u, v) = F, v∗ , ∀v ∈ V.
375
(6.43)
Teorema 6.2. Assumiamo le seguenti ipotesi sulla forma bilineare a: i) esiste M tale che: |a(u, v)| ≤ M uW vV ,
∀u ∈ W, ∀v ∈ V,
ii) esiste una costante α > 0 tale che sup a(u, v) ≥ α uW ,
∀u ∈ W,
vV =1
iii) sup a(u, v) > 0, u∈W
∀v ∈ V.
Allora il problema (6.43) ha un’unica soluzione u ∈ W . Inoltre vale la seguente stima di stabilità: 1 uW ≤ F V ∗ . (6.44) α La condizione ii) è una coercività asimmetrica, mentre la iii) assicura che, fissato v in V , la forma bilineare assume almeno un valore positivo. La dimostrazione ricalca quella del Teorema di Lax-Milgram (Problema 6.11). 6.6.2 Minimizzazione di funzionali quadratici Se la forma bilineare a è simmetrica, cioè se a (u, v) = a (v, u)
∀u, v ∈ V,
al problema variazionale astratto (6.37) è associato in modo naturale un problema di minimo. Infatti, consideriamo il funzionale quadratico E (v) =
1 a (v, v) − F, v∗ . 2
Il problema (6.37) è allora equivalente a minimizzare il funzionale E, nel senso espresso nel seguente teorema. Teorema 6.3. Sia a simmetrica. Allora u è soluzione del problema (6.37) se e solo se u minimizza E, ovvero E (u) = min E (v) . v∈V
376
6 Elementi di analisi funzionale
Dimostrazione. Per ogni ε ∈ R e ogni v ∈ V si ha E (u + εv) − E (u) 1 = 2 a (u + εv, u + εv) − F, u + εv∗ − 12 a (u, u) − F, u∗ = ε {a (u, v) − F, v∗ } + 12 ε2 a (v, v) .
Se ora u è soluzione del problema (6.37), si ha a (u, v) − F, v∗ = 0 e perciò E (u + εv) − E (u) = 12 ε2 a (v, v) ≥ 0 per cui u minimizza E. Viceversa, se u minimizza E allora E (u + εv) − E (u) ≥ 0, che implica
ε {a (u, v) − F, v∗ } + 12 ε2 a (v, v) ≥ 0.
Questa disuguaglianza forza l’annullamento del termine in ε (perché?) e cioè a (u, v) − F, v∗ = 0,
∀v ∈ V,
ossia u è soluzione del problema (6.37). Ponendo ϕ (ε) = E (u + εv), i calcoli appena fatti mostrano che
(6.45)
ϕ (0) = a (u, v) − F, v∗ . Pertanto, il funzionale lineare v −→ a (u, v) − F, v∗ si interpreta come la derivata di E nel punto u lungo la “direzione” v e scriviamo E (u) v = a (u, v) − F, v∗ . (6.46) Nel Calcolo delle Variazioni, E prende il nome di variazione prima di E e si indica col simbolo δE. L’equazione variazionale E (u) v = a (u, v) − F, v∗ = 0,
∀v ∈ V
(6.47)
si chiama equazione d’Eulero per il funzionale E. Questa equazione può essere considerata una versione astratta del principio dei lavori virtuali, mentre il funzionale E rappresenta in genere un’energia. Nota 6.5. Se a è simmetrica e coerciva, essa definisce in V un prodotto scalare, avendone tutte le proprietà: (·, ·)a = a (u, v) . In tal caso, esistenza ed unicità per il problema (6.37) seguono direttamente dal Teorema di Rappresentazione di Riesz per il funzionale F , in riferimento al prodotto scalare (·, ·)a . Dal Teorema 6.3 segue allora che esiste un unico elemento u che minimizza il funzionale E.
6.6 Problemi variazionali astratti
377
6.6.3 Approssimazione e metodo di Galerkin La soluzione u del problema variazionale astratto (6.37) soddisfa l’equazione a (u, v) = F, v∗
(6.48)
per ogni elemento v dello spazio di Hilbert V . Nelle applicazioni concrete, è importante poter calcolare approssimazioni accurate della soluzione e la dimensione infinita di V è l’ostacolo principale. Spesso, tuttavia, V può essere scritto come unione di sottospazi finito-dimensionali, cosicché l’idea per ottenere soluzioni approssimate è “proiettare” l’equazione (6.48) su quei sottospazi. Questo è il metodo di Galerkin. In linea di principio, aumentando la dimensione del sottospazio dovrebbe migliorare l’approssimazione. Più precisamente, si cerca di costruire una successione {Vk } di sottospazi di V con le seguenti proprietà: a) Ogni Vk è finito dimensionale: dimVk = k; b) Vk ⊂ Vk+1 (in realtà, non strettamente necessario), c) ∪Vk = V. Per eseguire la proiezione, si seleziona una base ψ 1 , ψ 2 , ..., ψ k per Vk . Si cerca poi un’approssimazione della soluzione u nella forma uk =
k
cj ψ j ,
(6.49)
j=1
risolvendo il problema proiettato a (uk , v) = F, v∗ ,
∀v ∈ Vk .
(6.50)
Poiché gli elementi ψ 1 , ψ 2 , ..., ψ k costituiscono una base per Vk , è sufficiente richiedere che a (uk , ψ r ) = F, ψ r ∗ , r = 1, ..., k. (6.51) Sostituendo la (6.49) nella (6.51), troviamo le k equazioni lineari algebriche k
cj a ψ j , ψ r = F, ψ r ∗
r = 1, 2, ..., k
j=1
per coefficienti incogniti c1 , c2 , ..., ck . Introducendo i vettori ⎛ ⎞ ⎛ ⎞ F ψ1 c1 ⎜ F ψ2 ⎟ ⎜ c2 ⎟ ⎟ ⎜ ⎜ ⎟ c =⎜. ⎟, F =⎜. ⎟ ⎝ .. ⎠ ⎝ .. ⎠ ck F ψk e la matrice A = (arj ) di ordine k i cui elementi sono j, r = 1, ..., k, arj = a ψ j , ψ r ,
(6.52)
378
6 Elementi di analisi funzionale
possiamo scrivere il sistema di equazioni (6.52) nella forma compatta Ac = F.
(6.53)
A si chiama matrice di rigidezza o di stiffness e gioca un ruolo decisivo nell’analisi numerica del problema. Se la forma bilineare a è coerciva, la matrice A è definita positiva. Infatti, sia ξ ∈Rk . Sfruttando la bilinearità e la coercività di a abbiamo: Aξ · ξ =
k
arj ξ r ξ j =
r,j=1
=
k
k
a ψj , ψr ξr ξj
r,j=1
a ξj ψj , ξr ψr
⎞ ⎛ k k
ξj ψj , ξr ψr ⎠ = a⎝
r,j=1
≥ α v
i=1
j=1
2
dove v=
k
ξ j ψ j ∈Vk .
j=1
Poiché {ψ 1 , ψ 2 , ..., ψ k } è una base in Vk , si ha che v = 0 se e solo se ξ = 0. Ciò mostra che A è definita positiva ed in particolare invertibile. Per ogni k ≥ 1, esiste dunque un’unica soluzione approssimata uk in Vk del sistema lineare algebrico (6.53). Occorre ora dimostrare che, se k → ∞, uk tende alla vera soluzione u, ossia la convergenza del metodo, e controllare l’errore commesso ad ogni passo nell’approssimazione. A questo proposito risulta importante il seguente lemma che mostra, tra l’altro, il peso delle costanti di continuità (M ) e di coercività (α) della forma bilineare. Questo ha conseguenze rilevanti dal punto di vista numerico. Lemma 6.4. (di Céa). Valgano le ipotesi del Teorema di Lax-Milgram. Supponiamo che uk sia soluzione del problema approssimato (6.51) e che u sia la soluzione del problema originale. Allora u − uk ≤
M inf u − v . α v∈Vk
Dimostrazione. Osserviamo subito che si ha a (uk , v) = F, v∗ ,
∀v ∈ Vk
a (u, v) = F, v∗ ,
∀v ∈ Vk .
e anche Sottraendo membro a membro si ottiene a (u − uk , v) = 0,
∀v ∈ Vk .
(6.54)
6.7 Compattezza
379
In particolare, essendo v − uk ∈ Vk , si ha a (u − uk , v − uk ) = 0,
∀v ∈ Vk
che implica a (u − uk , u − uk ) = a (u − uk , u − v) + a (u − uk , v − uk ) = a (u − uk , u − v) . Allora si può scrivere, usando continuità e coercività di a, 2
α u − uk ≤ a (u − uk , u − uk ) ≤ M u − uk u − v da cui, semplificando, M u − v . (6.55) α Questa disuguaglianza vale per ogni v ∈ Vk con la costante M α indipendente da k. Vale perciò anche se a secondo membro si passa all’estremo inferiore su v ∈ Vk . u − uk ≤
Convergenza del metodo di Galerkin. Poiché abbiamo supposto che ∪Vk = V , esiste una successione {wk } ⊂ Vk tale che wk → u se k → ∞. Dal Lemma 6.4, per ogni k si ha: M M u − uk ≤ inf u − v ≤ u − wk α v∈Vk α da cui u − uk → 0 ossia la convergenza del metodo di Galerkin.
6.7 Compattezza 6.7.1 Compattezza e convergenza debole Nello studio dei problemi al contorno per equazioni a derivate parziali e nella messa a punto di metodi numerici per l’approssimazione della soluzione, ci si scontra spesso con problemi di convergenza. Una situazione tipica è quella in cui si riesce a costruire una successione di candidate approssimanti e si vuole sapere se effettivamente queste convergono in qualche senso opportuno alla soluzione. Spesso, attraverso stime cosiddette dell’energia 8 , si riesce a mostrare che queste successioni sono limitate in qualche spazio di Hilbert. Come si può usare questa informazione? Sebbene non ci possiamo aspettare che queste successioni convergano, potremmo ragionevolmente cercare di estrarre almeno una sottosuccessione convergente. In altri termini stiamo richiedendo alla nostra successione una proprietà di compattezza. Soffermiamoci brevemente su questo importante concetto topologico 9 . 8 9
In genere, si tratta di controllare la norma L2 di una funzione e del suo gradiente. Per le dimostrazioni, si può vedere Rudin, 1964 o Yhosida, 1968.
380
6 Elementi di analisi funzionale
Sia dunque X uno spazio topologico. Dato un insieme E ⊆ X, si dice copertura aperta di E una famiglia di aperti la cui unione contiene E. Definizione 7.1 (Compattezza 1). Diciamo che E ⊆ X è compatto se da ogni copertura aperta di E si può estrarre una sottocopertura finita. Diciamo che E è precompatto o relativamente compatto se la sua chiusura è compatta. Negli spazi metrici e quindi, in particolare negli spazi di Banach e di Hilbert, si può dare una caratterizzazione degli insiemi compatti in termini di successioni convergenti, che risulta molto più operativa della Definizione 7.1. Definizione 7.2 (Compattezza 2). Diciamo che E ⊆ X è sequenzialmente compatto o compatto per successioni se da ogni successione infinita {xk } ⊂ E si può estrarre una sottosuccessione {xks } convergente ad un elemento di E. Vale il seguente importante teorema. Teorema 7.1 (Compattezza 3). Siano X uno spazio metrico ed E ⊆ X. E è compatto se e solo se è sequenzialmente compatto. Vediamo alcune relazioni tra chiusura, limitatezza e compattezza. Gli insiemi compatti in Rn sono tutti e solo gli insiemi chiusi e limitati. Si può dimostrare che ciò succede solamente negli spazi vettoriali a dimensione finita. Precisamente (si veda il Problema 6.11): Teorema 7.2. Sia X uno spazio normato. Se la sfera unitaria {x ∈ X: x ≤ 1} è compatta allora X ha dimensione finita. Anche in dimensione infinita è vero che un sottoinsieme compatto di uno spazio normato è sempre chiuso e limitato (Problema 6.12), ma non è vero il viceversa come mostra il seguente esempio. Esempio 7.1. Sia 2
l =
a = {ak }k≥1 :
∞
, a2k
< ∞, ak ∈ R
k=1
lo spazio di Hilbert delle successioni reali a quadrato sommabile, con (a, b) =
∞
k=1
ak bk
e
2
a =
∞
a2k .
k=1
Sia E = ek k≥1 , dove e1 = {1, 0, 0, ...}, e2 = {0, 1, 0, ...}, ecc. E costituisce una base ortonormale dello spazio l2 ed è un chiuso (poiché non ha > > insieme punti di accumulazione) e limitato (poiché >ej > = 1 per ogni j ≥ 1). > √ > j >e − ek > = 2 se Tuttavia, E non è sequenzialmente compatto. Infatti, j = k e perciò nessuna sottosuccessione estratta da ek k≥1 è convergente. In generale, se E = {ek }k≥1 è una base ortonormale in uno spazio di Hilbert H a dimensione infinita, E è chiuso e limitato ma non compatto.
6.7 Compattezza
381
6.7.2 Criteri di compattezza in C Ω e in L2 (Ω) Riconoscere che un sottoinsieme di uno spazio normato è compatto o precompatto è di solito piuttosto complicato. Una caratterizzazione degli insiemi precompatti nello spazio C Ω , dove Ω è un dominio limitato è dato dal seguente importante teorema10 . n Teorema 7.3 (di Ascoli-Arzelà). Siano Ω ⊂ R un dominio limitato ed E ⊂ C Ω . Allora E è precompatto in C Ω se e solo se valgono le seguenti condizioni: i) E è limitato in C Ω , cioè esiste M > 0 tale che uC (Ω ) ≤ M,
∀u ∈ E,
(6.56)
ii) E è equicontinuo, cioè, per ogni ε > 0 esiste δ = δ (ε) > 0 tale che se x, x + h ∈ Ω e |h| < δ allora |u (x + h) − u (x)| < ε,
∀u ∈ E.
(6.57)
Si noti che la (ii) equivale a richiedere che lim u (· + h) − u (·)C (Ω ) = 0,
h→0
uniformemente rispetto a u ∈ E.
Mentre, di solito, la limitatezza è una condizione relativamente facile da provare, non è così per l’equicontinuità. Un caso particolarmente significativo si verifica se E è costituito da funzioni equihölderiane, ossia seE è limitato nella norma di C 0,α Ω , 0 < α ≤ 1, o a maggior ragione di C 1 Ω , e non solo in quella di C Ω . Precisiamo questa osservazione nel seguente corollario. Corollario 7.4. Siano Ω ⊂ Rn un dominio limitato ed E ⊂ C 0,α Ω , 0 < α ≤ 1. Se esiste M > 0 tale che uC 0,α (Ω ) ≤ M,
∀u ∈ E
(6.58)
allora E è precompatto in C Ω . Dimostrazione. La (6.58) significa che uC (Ω ) + sup
x,y∈Ω
|u (x) − u (y)| ≤ M, α |x − y|
∀u ∈ E.
x=y
Deduciamo, in particolare, uC (Ω ) ≤ M , che è la (6.56), e inoltre α
|u (x + h) − u (x)| ≤ M |h| ,
∀x, x + h ∈ Ω, ∀u ∈ E
che implica (perché?) la (ii) del Teorema 7.3. 10
Ricordiamo che la norma in C Ω è f C (Ω ) = maxΩ |f | .
(6.59)
382
6 Elementi di analisi funzionale
Per gli spazi Lp (Ω), 1 ≤ p < ∞, esiste un analogo del Teorema di Ascoli Arzelà, dovuto a M. Riesz-Fréchet-Kolmogoroff, in cui la norma in C Ω è sostituita da quella in Lp (Ω): Teorema 7.5. Siano Ω ⊂ Rn un dominio limitato ed E ⊂ Lp (Ω), 1 ≤ p < ∞. Allora E è precompatto in Lp (Ω) se e solo se valgono le seguenti condizioni: i) E è limitato in Lp (Ω), cioè esiste M > 0 tale che uLp (Ω) ≤ M,
∀u ∈ E,
ii) E è equicontinuo in norma Lp (Ω), cioè, pensando u estesa a zero fuori da Ω, lim u (· + h) − u (·)Lp (Ω) = 0,
h→0
uniformemente rispetto a u ∈ E.
L’analogo del Corollario 7.4. è il seguente; lo useremo più avanti. Corollario 7.6. Siano Ω un dominio limitato di Rn ed E ⊂ Lp (Ω). Se E è limitato in Lp (Ω) ed esistono α ed L, positivi, tali che, pensando u estesa a zero fuori da Ω, p α |u (x + h) − u (x)| dx ≤ L |h| , ∀h ∈Rn , ∀u ∈ E (6.60) Ω
allora E è precompatto in Lp (Ω). La (6.60) è una condizione di equihölderianità in norma Lp (Ω) degli elementi di E. Vedremo nel capitolo sugli spazi di Sobolev esempi di compatti in L2 (Ω). 6.7.3 Convergenza debole e compattezza Abbiamo visto che la compattezza in uno spazio normato è equivalente alla compattezza per successioni. Nelle applicazioni citate all’inizio della sezione, ciò si traduce in una condizione molto restrittiva per le successioni approssimanti. Fortunatamente, negli spazi normati, ed in particolare in quelli di Hilbert, esiste un’altra nozione di convergenza, molto più flessibile, che, come vedremo, si adatta perfettamente alla formulazione variazionale dei problemi al bordo per equazioni a derivate parziali. Sia H uno spazio di Hilbert con prodotto interno (·, ·) e norma ·. Se F ∈ H ∗ , sappiamo che F, xk ∗ → F, x∗ ogni volta che xk − x → 0. Può darsi però che F, xk ∗ → F, x∗ per ogni elemento F del duale, senza che xk − x → 0. Diremo allora che xk converge debolmente a x. Precisamente:
6.7 Compattezza
383
Definizione 7.1. Una successione {xk } ⊂ H converge debolmente a x ∈ H, e in tal caso scriviamo xk ! x (con la “mezza freccia”), se F, xk ∗ → F, x∗ ,
∀F ∈ H ∗ .
La convergenza in norma è allora detta anche convergenza forte. Dal Teorema di Riesz, segue subito che {xk } ⊂ H converge debolmente a x ∈ H se e solo se (xk , y) → (x, y) ,
∀y ∈ H.
Il limite debole è unico poiché xk ! x e xk ! z implicano (x − z, y) = 0
∀y ∈ H,
da cui x = z. Inoltre, dalla disuguaglianza di Schwarz si ha |(xk − x, y)| ≤ xk − x y e perciò la convergenza forte implica quella debole. Le due nozioni di convergenza forte e debole sono equivalenti in spazi vettoriali a dimensione finita. In generale non sono equivalenti, come mostra il prossimo esempio. Esempio 7.2. Sia H = L2 (0, 2π). La successione {vk }k≥1 = {cos kx}k≥1 è debolmente convergente a zero. Infatti, per ogni f ∈ L2 (0, 2π) , (f, vk )0 =
0
2π
f (x) cos kx dx → 0
per k → ∞ (Teorema di Riemann-Lebesgue sui coefficienti di Fourier di f ). Tuttavia √ vk 0 = π e quindi {vk } non può convergere fortemente a zero. Nota 7.1. Se L ∈ L (H1 , H2 ) e xn ! x in H1 non è detto che Lxk → Lx in H2 . È vero tuttavia che Lxk ! Lx. Infatti, per ogni y ∈ H2 , (L(xn − x), y)H2 = (xn − x, L∗ y)H1 → 0. Dunque, se L è (fortemente) continuo allora è anche debolmente continuo.
384
6 Elementi di analisi funzionale
Warning: Non sempre forte implica debole! Sia E ⊂ H chiuso (fortemente). Possiamo dedurre che E è anche debolmente chiuso? La risposta è no. Infatti, “fortemente chiuso” significa che E contiene i punti limite di tutte le successioni {xk } ⊂ E, convergenti in norma. Supponiamo ora che xk ! x (solo debolmente); poiché la convergenza non è forte non possiamo affermare che x ∈ E. Pertanto, in generale, E non è debolmente chiuso 11 . Per esempio, sia E = {vk } dove vk (x) = cos kx, come nell’esempio 7.2. 2 Allora E è un sottoinsieme fortemente √ chiuso in L (0, 2π) e contenuto nel2 l’insieme v ∈ L (0, 2π) : v = π . Tuttavia vk ! 0 ∈ / E e quindi E non è debolmente chiuso. Abbiamo osservato che la norma in uno spazio di Hilbert è (fortemente) continua. Rispetto alla convergenza debole è solo inferiormente semicontinua, come mostra la proprietà 2 nel seguente teorema. Teorema 7.7. Sia {xk } ⊂ H tale che xk ! x. Allora: 1) {xk } è limitata, 2) x ≤ lim inf k→∞ xk
(semicontinuità inferiore debole).
Omettiamo la dimostrazione di 1). Per la 2) è sufficiente osservare che 2
x = lim (xk , x) = lim inf (xk , x) ≤ x lim inf xk k→∞
k→∞
k→∞
e semplificare per x. L’Esempio 7.2 indica che nella 2) può esserci il segno di minore stretto. Abbiamo affermato che è utile avere a disposizione criteri di compattezza. Nel paragrafo precedente abbiamo visto che, in generale, la limitatezza di un insieme non è sufficiente per avere un insieme precompatto in norma (ossia fortemente). Se però rinunciamo alla convergenza forte e ci accontentiamo di quella debole, allora le cose migliorano. Infatti, vale il seguente teorema, che indica come i limitati in uno spazio di Hilbert siano debolmente compatti per successioni. La dimostrazione è elementare se supponiamo che H sia anche separabile, ossia che esista un insieme numerabile, denso in H. La faremo in questo caso12 . Teorema 7.8. Ogni successione limitata in uno spazio di Hilbert H contiene una sottosuccessione debolmente convergente. Dimostrazione (nel caso H separabile). Poiché H è separabile esiste una successione {zk } densa in H. Sia ora {xj } una successione limitata: xj ≤ M , ∀j ≥ 1. Dividiamo la dimostrazione in tre passi. 1. Usiamo un tipico procedimento “diagonale” per costruire una sottosuc(s) (s) cessione {xs } tale che la successione di numeri reali (xs , zk ) sia convergente 11 12
Si veda il Problema 6.18. Al quale del resto ci si può sempre ricondurre considerando, anzichè H, la chiusura H0 del sottospazio generato dalle combinazioni lineari finite di elementi della successione.
6.7 Compattezza
385
per ogni zk fissato. La successione numerica (xj , z1 ) (1)
è limitata in R e quindi esiste una sottosuccessione {xj } ⊂ {xj } tale che (1)
(xj , z1 ) (1)
è convergente. Per la stessa ragione, da {xj } si può estrarre una sottosuc(2)
cessione {xj } tale che (2)
(xj , z2 ) è convergente. Procedendo induttivamente si costruisce una sottosuccessione (k) {xj } tale che (k)
(xj , zk ) (s)
converge. Consideriamo ora la successione diagonale {xs }, ottenuta selezio(1) (1) (2) (2) nando x1 da {xj }, x2 da {xj } e così via. Abbiamo allora che (x(s) s , zk ) è convergente per ogni k ≥ 1, fissato. (s)
2. Usiamo la densità di {zk } per mostrare che (xs , z) converge per ogni z ∈ H. Infatti, fissati ε > 0 e z ∈ H, possiamo trovare zk tale che z − zk < ε. Scriviamo (m) (s) (m) (s) (m) (x(s) s − xm , z) = (xs − xm , z − zk ) + (xs − xm , zk ).
(6.61)
Se s ed m sono abbastanza grandi, abbiamo (s) (xs − x(m) m , zk ) < ε (s)
poiché (xs , zk ) è convergente. Per il primo termine nella (6.61), dalla disuguaglianza di Schwarz si ha > > > (s) (s) (m) > , z − z ) ≤ − x >x (xs − x(m) k m s m > z − zk ≤ 2M ε. Se quindi s ed m sono abbastanza grandi, abbiamo (s) (xs − x(m) m , z) ≤ (2M + 1)ε, (s)
(m)
per cui la successione (xs −xm , z) è fondamentale in R e perciò convergente.
386
6 Elementi di analisi funzionale
3. Usiamo il Teorema di Riesz per identificare il limite debole della (s) successione {xs }. Definiamo un funzionale lineare T su H ponendo T z = lim (x(s) s , z). s→∞
> > > (s) > Poiché >xs > ≤ M , si ha |T z| ≤ M z ∗
da cui T ∈ H . Dal Teorema di Riesz, esiste allora x∞ ∈ H tale che T z = (x∞ , z) ,
∀z ∈ H.
Si ha perciò, per s → ∞, (x(s) s , z) → (x∞ , z) , ossia che
∀z ∈ H
x(s) s ! x∞ .
Procedendo come nell’ultima parte della dimostrazione precedente si dimostra la seguente proprietà di completezza debole. Teorema 7.9. Ogni successione {xn } debolmente convergente in uno spazio di Hilbert H, converge debolmente ad un elemento x di H. L’enunciato sembra, a prima vista ... tautologico. In realtà, il fatto che le successioni numeriche (xn , z) siano convergenti per ogni z potrebbe, in linea di principio, non implicare l’esistenza di un elemento x ∈ H, che rappresenti tutti i limiti, ossia tale che (xn , z) → (x, z) . Ma negli spazi di Hilbert vale il Teorema di Rappresentazione! Esempio 7.3. Sia H = L2 (Ω), Ω aperto di Rn . Il Teorema 7.9 implica che, se {uk }k≥1 ⊂ L2 (Ω) è una successione limitata, se cioè esiste M > 0 tale che uk 0 ≤ M, per ogni k ≥ 1, allora esiste una sottosucessione {ukm }m≥1 e u ∈ L2 (Ω) tale che u km v → uv, per ogni v ∈ L2 (Ω) , m → +∞. Ω
Ω
6.7.4 Operatori compatti Per definizione, ogni operatore in L (H1 , H2 ) trasforma insiemi limitati in H1 in insiemi limitati in H2 . La sottoclasse degli operatori che trasportano insiemi limitati in insiemi precompatti è particolarmente importante.. Definizione 7.2. Siano H1 e H2 spazi di Hilbert e L ∈ L (H1 , H2 ). L si dice compatto se, per ogni insieme limitato E ⊂ H1 , l’immagine L (E) è precompatta in H2 .
6.7 Compattezza
387
Vi sono condizioni equivalenti, a volte più comode della definizione precedente, per determinare la compattezza di un operatore. Il seguente teorema indica che un operatore è compatto se e solo se “converte convergenza debole in convergenza forte”. Precisamente: Microteorema 7.10. L ∈ L (H1 , H2 ) è compatto se e solo se, per ogni successione {xk } ⊂ H1 , xk ! 0 in H1
Lxk → 0 in H2 .
implica
(6.62)
Dimostrazione. Supponiamo che valga la (6.62). Siano E ⊂ H1 , limitato, e {zk } ⊂ L (E). Allora zk = Lxk con xk ∈ E. Per il Teorema 7.9, esiste in E una sottosuccessione {xks } debolmente convergente a x ∈ H1 . Allora ys = xks − x ! 0 in H1 e, per la (6.62), Lys → 0 in H2 , ossia zks = Lxks → Lx ≡ z in H2 . Essendo {Lxks } ⊂ L (E), concludiamo che L (E) è precompatto per successioni e quindi precompatto in H2 . Viceversa, sia L compatto e xk ! 0 in H1 . In base alla Nota 7.1, Lxk ! 0. Supponiamo che Lxk 0. Allora, esistono ¯ε > 0 e infiniti indici kj tali che > > >Lxk > > ¯ε. Poiché j xkj ! 0, dal Teorema 7.7 xkj è limitata in H1 per cui Lxkj contiene una sottosuccessione (che continuiamo ad indicare con) Lxkj fortemente, e quindi debolmente convergente ad un elemento y ∈ H parte, abbiamo an> >2 . D’altra che Lxkj ! 0 che implica y = 0. Dunque >Lxkj > → 0. Contraddizione. 1 Esempio 7.4. Sia Hper (0, 2π) lo spazio di Hilbert introdotto nell’Esempio 3.4. L’immersione 1 (0, 2π) → L2 (0, 2π) IH 1 →L2 : Hper
è compatta (Problema 6.15). Esempio 7.5. In base al Teorema 7.2, l’operatore identità I : H → H è compatto se e solo se dimH < ∞. Ogni operatore con immagine a dimensione finita è compatto. Esempio 7.6. Sia Q = (0, 1) × (0, 1) e g ∈ C Q . Definiamo 1 T v (x) = g (x, y) v (y) dy. (6.63) 0
Vogliamo dimostrare che T è compatto da L2 (0, 1) in L2 (0, 1). Infatti, per ogni x ∈ (0, 1), abbiamo 1 |T v (x)| ≤ |g (x, y) v (y)| dy ≤ g (x, ·)L2 (0,1) vL2 (0,1) , (6.64) 0
da cui
0
1
2
2
2
|T v (x)| dx ≤ gL2 (Q) vL2 (0,1)
388
6 Elementi di analisi funzionale
che implica T v ∈ L2 (0, 1) e mostra la continuità di T . Per controllare la compattezza, usiamo il Microteorema 7.10. Sia {vk } ⊂ L2 (0, 1), tale che vk ! 0, cioè 1 vk w → 0, per ogni w ∈ L2 (0, 1) . (6.65) 0
Vogliamo provare che T vk → 0 in L2 (0, 1). Essendo debolmente convergente, la successione {vk } è limitata, per cui esiste M tale che vk L2 (0,1) ≤ M per ogni k. Dalla (6.64) si ha |T vk (x)| ≤ M g (x, ·)L2 (0,1) . Inoltre, inserendo w (·) = g (x, ·) nella (6.65) si deduce che T vk (x) =
1
g (x, y) vk (y) dy → 0
0
per ogni x ∈ (0, 1) .
Il Teorema della Convergenza Dominata 13 implica allora che T vk → 0 in L2 (0, 1). Dunque T è compatto. Microteorema 7.11. Sia L : H1 → H2 compatto. Allora: a) l’aggiunto L∗ : H2 → H1 è compatto; b) se G ∈ L (H2 , H3 ) oppure G ∈ L (H0 , H1 ), gli operatori composti G ◦ L oppure L ◦ G sono compatti. Dimostrazione. a) Usiamo il Microteorema 7.10. Sia {xn } ⊂ H2 , xn ! 0 e facciamo vedere che L∗ xn H1 → 0. Abbiamo: 2
L∗ xn H1 = (L∗ xn , L∗ xn )H1 = (xn , LL∗ xn )H2 . Essendo L∗ ∈ L (H2 , H1 ), si ha L∗ xn ! 0 in H1 e allora, per la compattezza di L, LL∗ xn → 0. Poiché xn H2 ≤ M , abbiamo infine 2
L∗ xn H1 = (xn , LL∗ xn )H2 ≤ M LL∗ xn H2 → 0.
b) La lasciamo come esercizio.
6.8 Teorema dell’Alternativa di Fredholm 6.8.1 Alternativa per problemi variazionali astratti Torniamo al problema variazionale astratto a (u, v) = F, v∗ 13
Appendice B.
∀v ∈ V,
(6.66)
6.8 Teorema dell’Alternativa di Fredholm
389
dove F ∈ V ∗ , e supponiamo che il Teorema di Lax-Milgram non possa essere applicato, per esempio a causa della non coercività della forma bilineare a. In questa situazione può succedere che il problema non abbia soluzione, a meno che certe condizioni di compatibilità su F non siano soddisfatte. Un esempio tipico è dato dal problema di Neumann −Δu = f in Ω ∂ν u = g su ∂Ω. Una condizione necessaria e sufficiente di risolubilità è data da f+ g = 0. Ω
(6.67)
∂Ω
Inoltre, se vale la (6.67), esistono infinite soluzioni, che differiscono a due a due per una costante. La condizione (6.67) ha una precisa interpretazione fisica ed un significato matematico profondo, con radici nell’Algebra Lineare! Infatti, i risultati che stiamo per presentare estendono fatti ben noti, riguardanti la risolubilità di sistemi lineari algebrici della forma Ax = b
(6.68)
dove A è una matrice quadrata di ordine n e b ∈R . Vale la seguente dicotomia: o il sistema (6.68) ha un’unica soluzione per ogni b oppure il sistema omogeneo Ax = 0 ha soluzioni non banali. Più precisamente, il sistema (6.68) è risolubile se e solo se il vettore b appartiene allo spazio generato dalle colonne di A, che coincide con il complemento ortogonale del nucleo della matrice trasposta ker(A ). Pertanto, se w1 , ..., ws è una base di ker(A ), il sistema (6.68) è risolubile se e solo se b soddisfa le s condizioni di compatibilità, 0 ≤ s ≤ n, n
b · wj = 0
j = 1, ..., s.
Infine, ker (A) e ker(A ) hanno la stessa dimensione e se v1 , ..., vs è una base di ker (A), la soluzione generale del siatema (6.68) è data da:
s cj v j x=x+ j=1
dove x è una qualunque soluzione di (6.68) e c1 , ..., cs sono costanti arbitrarie. L’estensione di questi risultati al caso infinito-dimensionale richiede cautela. In particolare, per enunciare un analogo teorema di dicotomia per il problema variazionale (6.66), è necessario precisarne l’ambientazione funzionale, per evitare confusioni. Il problema (6.66) coinvolge due spazi di Hilbert: V , dove cerchiamo le soluzioni, e V ∗ dove assegniamo il dato F . Introduciamo un terzo spazio di Hilbert H, intermedio tra V e V ∗ . Usiamo i simboli (·, ·) = (·, ·)H ,
· = ·H
390
6 Elementi di analisi funzionale
per il prodotto interno e per la norma in H, rispettivamente, mentre con ·, ·∗ oppure ·, ·V ∗ ×V indichiamo la dualità tra V ∗ e V . Nei problemi differenziali, di solito H = L2 (Ω), con Ω dominio limitato in n R , mentre V è un suo sottospazio (di Sobolev), i cui elementi sono funzioni dotate di un opportuno numero di derivate e che soddisfano qualche condizione al bordo. In sostanza, abbiamo una terna V , H, V ∗ , e vogliamo che: 1. V → H, cioé V sia immerso con continuità in H. Ciò significa che l’operatore identità IV →H : V → H è continuo, ossia esiste un numero C tale che u ≤ C uV
∀u ∈ V ;
(6.69)
2. V sia denso in H. Vediamo alcune conseguenze delle ipotesi 1 e 2. Usando il Teorema di Riesz, identifichiamo H col suo duale H ∗ . Come conseguenza, possiamo immergere H in V ∗ con continuità. Infatti, osserviamo che, fissato u ∈ H, il funzionale Tu definito da Tu , v∗ = (u, v) ∀v ∈ V, (6.70) è continuo in V . Ciò segue dalla disuguaglianza di Schwarz e dalla (6.69): |(u, v)| ≤ u v ≤ C u vV .
(6.71)
Dunque abbiamo una corrispondenza continua u −→ Tu , da H in V ∗ , con Tu V ∗ ≤ C u . Inoltre, se Tu = 0 allora (u, v) = 0
∀v ∈ V
che forza u = 0, in virtù della densità di V in H. Deduciamo quindi che la corrispondenza u −→ Tu è iniettiva e definisce pertanto l’immersione continua IH→V ∗ . In pratica, possiamo identificare u con un elemento di V ∗ , con la conseguenza che, invece della (6.70), siamo autorizzati a scrivere u, v∗ = (u, v)
∀v ∈ V :
(6.72)
a sinistra della (6.72) u è visto come elemento di V ∗ mentre a destra come elemento di H. Abbiamo già osservato nel Paragrafo 6.5.2 che l’identificazione di H con H ∗ proibisce di identificare V con V ∗ .
6.8 Teorema dell’Alternativa di Fredholm
391
Si può poi dimostrare (esercizio) che V e H sono densi in V ∗ . Abbiamo perciò V →H →V∗ e, sotto le condizioni 1 e 2, chiamiamo (V, H, V ∗ ) terna Hilbertiana. Questa è l’ambientazione giusta. Per enunciare il risultato principale, occorre introdurre le nozioni di coercività debole e di aggiunta di una forma bilineare. Definizione 8.1. Diciamo che la forma bilineare a (u, v) è debolmente (V, H) − coerciva se esistono λ0 ∈ R e α > 0 tali che 2
2
aλ0 (u, v) ≡ a (v, v) + λ0 v ≥ α vV
∀v ∈ V.
La forma bilineare aggiunta di a è definita dalla relazione a∗ (u, v) = a (v, u) , ottenuta scambiando i ruoli di u e v nell’espressione analitica di a. Nelle applicazioni, a∗ è associata al cosiddetto aggiunto formale di un operatore differenziale (si veda il Paragrafo 8.5.1). Evidentemente, a è simmetrica se a = a∗ . Indicheremo con N (a) e N (a∗ ) i nuclei di a e a∗ , rispettivamente, e cioè l’insieme delle soluzioni u e w dei problemi variazionali omogenei: a (u, v) = 0, ∀v ∈ V
e
a∗ (w, v) = 0, ∀v ∈ V.
Sottolineiamo che N (a) e N (a∗ ) sono sottospazi di V . Teorema 8.1 (Alternativa I). Sia (V, H, V ∗ ) una terna Hilbertiana tale che l’immersione di V in H sia compatta. Sia a una forma bilineare in V , continua e (V, H) − debolmente coerciva. Allora vale la seguente dicotomia. a) L’equazione a (u, v) = F, v∗
∀v ∈ V
(6.73)
ha un’unica soluzione u per ogni F ∈ V ∗ ed esiste C tale che uV ≤ C F V ∗
(6.74)
oppure b)
0 < dimN (a) = dimN (a∗ ) = d < ∞
e (6.73) è risolubile se e solo se F, w∗ = 0 per ogni w ∈ N (a∗ ). Nel caso b), se {w1 , w2 , ..., wd } è una base di N (a∗ ), la (6.73) è risolubile se e solo se valgono d condizioni di compatibilità F, wj ∗ = 0,
j = 1, ..., d.
392
6 Elementi di analisi funzionale
In questo caso, la soluzione generale dell’equazione (6.73) ha la forma u=u+
d j=1
cj zj
dove u è una qualunque soluzione di (6.73), {z1 , ..., zd } è una base di N (a) e c1 , ..., cd sono costanti arbitrarie. La dimostrazione del Teorema 8.1 segue da un risultato più generale, noto come Teorema dell’Alternativa di Fredholm, che presentiamo nel prossimo paragrafo. Applicheremo ampiamente il teorema nel Capitolo 8. Qui ci limitiamo ad un esempio preliminare. 1 (0, 2π), H = L2 (0, 2π) e r = r (t) una Esempio 8.1. Siano V = Hper funzione continua e positiva in [0, 2π]. Sappiamo che l’immersione di V in H è compatta (Esempio 7.4). Inoltre, poiché C01 ([0, 2π]) ⊂ V , segue che V è denso in H. La terna Hilbertiana (V, H, V ∗ ) soddisfa dunque le ipotesi del Teorema 8.1. Data f ∈ H, consideriamo il problema variazionale
2π
u v rdt =
2π
∀v ∈ V.
f v dt,
0
0
La forma bilineare a (u, v) =
" 2π 0
(6.75)
u v rdt è continua in V essendo
|a (u, v)| ≤ rmax u 0 v 0 ≤ rmax u1 v1 , ma non è V −coerciva. Infatti a (u, u) = 0 se u è costante. Tuttavia è (V, H) −debolmente coerciva poiché a (u, u) +
2 u0
2π
=
2
2π
(u ) rdt + 0
0
2
u2 dt ≥ min {rmin , 1} u1 .
Infine, abbiamo
0
2π
f v dt ≤ f 0 v0 ≤ f 0 v1
per cui il funzionale
F : v →
2π
f vdt 0
definisce un elemento di V ∗ . Siamo nelle ipotesi del Teorema 8.1. Essendo a simmetrica si ha N (a) = N (a∗ ). Gli elementi di N (a) sono le soluzioni dell’equazione
2π
a (u, v) = 0
u v rdt = 0,
∀v ∈ V.
(6.76)
6.8 Teorema dell’Alternativa di Fredholm
393
Ponendo v = u in (6.76) otteniamo 2π 2 (u ) rdt = 0 0
che forza u (t) ≡ costante, essendo r (t) > 0 in [0, 2π]. Deduciamo che dimN (a) = 1 e che w (t) ≡ 1 genera N (a). Dal Teorema 8.1 traiamo la seguente conclusione: l’equazione (6.75) è risolubile se e solo se 2π f dt = 0. F, 1∗ = 0
Inoltre, in questo caso, la (6.75) ha infinite solutioni della forma u = u + c, dove u è una qualunque soluzione di (6.75). Il problema variazionale ha una semplice interpretazione formale come problema ai limiti. Integrando per parti e ricordando che v (0) = v (2π), la (6.75) diventa 2π [(−ru ) − f ]vdt + v (0) [r (2π) u (2π) − r (0) u (0)] = 0, ∀v ∈ V. 0
(6.77)
Scegliendo v nulla in 0, 2π troviamo 2π [−(ru ) − f ]vdt = 0, 0
che implica
(u r) = −f
∀v ∈ V , v (0) = v (2π) = 0
in (0, 2π) .
La (6.77) si riduce allora a v (0) [r (2π) u (2π) − r (0) u (0)] = 0,
∀v ∈ V
che a sua volta implica r (2π) u (2π) = r (0) u (0) . In conclusione, il problema (6.75) costituisce la formulazione variazionale del seguente problema ai limiti: ⎧ in (0, 2π) ⎪ ⎨ (ru ) = −f u (0) = u (2π) ⎪ ⎩ r (2π) u (2π) = r (0) u (0) . È importante sottolineare che la condizione u (0) = u (2π), che esprime la periodicità dei dati di Dirichlet, è imposta dalla scelta dello spazio V mentre la condizione r (2π) u (2π) = r (0) u (0), ossia la periodicità dei dati di Neuman, è incorporata nell’equazione (6.75).
394
6 Elementi di analisi funzionale
6.8.2 Teorema dell’Alternativa di Fredholm Enunciamo ora il Teorema dell’Alternativa negli spazi di Hilbert. In realtà esso vale anche negli spazi di Banach 14 , definendo opportunamente la nozione di operatore aggiunto. Introduciamo prima un po’ di terminologia. Siano V1 , V2 spazi di Hilbert e Φ ∈ L(V1 , V2 ). Diciamo che Φ è un operatore ⊥ di Fredholm se N (Φ) e R (Φ) hanno dimensione finita. Si chiama indice di Φ il numero intero ⊥
ind (Φ) = dimN (Φ) − dimR (Φ) = dimN (Φ) − dimN (Φ∗ ) . Teorema 8.2 (Alternativa II, di Fredholm). Siano H uno spazio di Hilbert e K : H → H un operatore compatto. Allora Φ=K −I è un operatore di Fredholm con indice zero. Inoltre, Φ∗ = K ∗ − I, R (Φ) = N (Φ∗ )
⊥
(6.78)
e N (Φ) = {0} ⇐⇒ R (Φ) = H.
(6.79)
Nota 8.1. La (6.79) indica che Φ è iniettivo se e solo se è suriettivo. Ovvero, per l’equazione Ku−u = f , l’unicità della soluzione implica l’esistenza di una soluzione, per ogni f ∈ H, e viceversa. Basta allora verificare una sola delle due! Inoltre, poiché Φ ∈ L(H), se Φ è biunivoco anche Φ−1 ∈ L(H) e quindi esiste C tale che15 u ≤ C f . Lo stesso risultato vale per l’aggiunto Φ∗ = K ∗ − I e per la relativa equazione K ∗ w − w = g. ⊥ Nota 8.2. Sia d = dimR (Φ) = dimN (Φ∗ ) > 0. La (6.78) indica che l’equazione Ku − u = f è risolubile se e solo se f ⊥ N (Φ∗ ), cioè se e solo se (f, w) = 0 per ogni y soluzione di K ∗ w − w = 0. Ciò si traduce in d relazioni lineari indipendenti per f . Nota 8.3. Il teorema vale anche nel caso di operatori della forma K − λI con λ = 0. Il caso λ = 0 non si può includere nel teorema. Banalmente, l’operatore K = 0 (che è compatto) ha nuleo coincidente con tutto H e quindi, 14 15
Si veda per esempio, Gilbarg-Trudinger, 2001. Vale infatti il seguente risultato, conseguenza del cosiddetto Teorema della Mappa Aperta (Open Mapping Theorem): Siano X e Y spazi di Banach e L ∈ L (X, Y ). Se L è iniettivo e suriettivo, allora L−1 ∈ L (Y, X).
6.8 Teorema dell’Alternativa di Fredholm
395
se dim H = ∞, il teorema non vale. Ma vi sono casi più significativi. Per esempio, basta prendere l’operatore (con immagine unidimensionale, quindi compatto) dato da Ku = (Lu)u0 dove L ∈ H ∗ e u0 è fissato in H, che supponiamo a dimensione infinita. Il nucleo di K è costituito dagli elementi u ∈ H tali che Ku = (Lu)u0 = 0. Dal Teorema di Riesz, esiste zL ∈ H tale che Lu = (zL , u). Il nucleo N (K) coincide quindi con il sottospazio ortogonale a zL , che ha dimensione infinita. La dimostrazione del Teorema 8.2 si semplifica notevolmente nel caso in cui K sia anche autoaggiunto ed infatti diventa una semplice conseguenza del Teorema 9.1, nella prossima sezione. Dimostrazione (parziale) del Teorema 8.1. La strategia è scrivere l’equazione a (u, v) = F, v∗ (6.80) nella forma (K − IV )u = g dove IV è l’identità in V e K : V → V è compatto. Sia J : V → V ∗ l’immersione di V in V ∗ . Possiamo scrivere J = IV →H ◦ IH→V ∗ , cioè come composizione delle immersioni IV →H e IH→V ∗ . Poiché IV →H è compatto e IH→V ∗ è continuo, deduciamo dal Microteorema 7.11 che J è compatto. Essendo (u, v) = Ju, v, possiamo scrivere la (6.80) nella forma aλ0 (u, v) ≡ a (u, v) + λ0 (u, v) = λ0 Ju + F, v∗ dove λ0 > 0 è scelto in modo che aλ0 (u, v) sia V −coerciva. Fissato u ∈ V , il funzionale lineare v → aλ0 (u, v) è continuo in V , per cui esiste L ∈ L (V, V ∗ ) tale che Lu, v∗ = aλ0 (u, v)
∀u, v ∈ V.
Dunque, l’equazione a (u, v) = F, v∗ è equivalente a Lu, v∗ = λ0 Ju + F, v∗
∀v ∈ V
ossia a Lu = λ0 Ju + F.
(6.81)
Poiché aλ0 è V -coerciva, dal Teorema di Lax-Milgram, l’operatore L è un isomorfismo continuo tra V e V ∗ e quindi possiamo scrivere la (6.81) nella forma λ0 L−1 Ju − u = −L−1 F.
396
6 Elementi di analisi funzionale
Ponendo g = −L−1 F ∈ V e K = λ0 L−1 J, la (6.81) diventa (K − IV )u = g dove K : V → V. Poiché J è compatto e L−1 è continuo, K è compatto. Applicando il Teorema dell’Alternativa e riscrivendo le conclusioni in termini della forma bilineare di partenza, si conclude la dimostrazione 16 .
6.9 Spettro di un operatore compatto autoaggiunto 6.9.1 Risolvente e spettro (reale) di un operatore lineare continuo Siano A è una matrice quadrata di ordine n e λ un numero complesso. Allora, o l’equazione Ax − λx = b ha un’unica soluzione per ogni b oppure esiste un vettore u = 0 tale che Au = λu. In quest’ultimo caso si dice che λ, u costituiscono una coppia autovalore−autovettore. L’insieme degli autovalori si chiama spettro della matrice A; / σ P (A) è quindi ben definita la matrice indichiamolo con σ P (A). Se λ ∈ −1 risolvente (A−λI) . L’insieme ρ (A) = C\σ P (A) si chiama risolvente di A. Se λ ∈ σ P (A) il nucleo N (A−λI) è il sottospazio generato dagli autovettori di A associati a λ e prende il nome di autospazio di A associato a λ. Si noti che σ P (A) = σ P (A ). Un caso particolarmente importante è quello delle matrici simmetriche: tutti gli autovalori λ1 , ...λn sono reali (non necessariamente distinti) ed esiste in Rn una base ortonormale di autovettori u1 , ..., un . L’azione di A si scompone nella somma delle proiezioni sui suoi autospazi secondo la formula 17 (decomposizione spettrale di A): A = λ1 u1 u 1 + λ2 u2 u2 + ... + λn un un .
Vogliamo generalizzare questi concetti nell’ambito degli spazi di Hilbert. Una motivazione è ... il metodo di separazione di variabili, che abbiamo già avuto modo di usare più volte. 16 17
Omettiamo i dettagli, piuttosto lunghi e tecnici. Gli uj sono vettori colonna; uj u j è una matrice n × n, a volte indicata con il simbolo uj ⊗ uj .
6.9 Spettro di un operatore compatto autoaggiunto
397
Col metodo di separazione delle variabili si costruiscono soluzioni di problemi al contorno per sovrapposizione di soluzioni particolari, il cui calcolo esplicito, d’altra parte, si può effettuare solo in presenza di geometrie particolari. Che cosa si può dire in generale? Vediamolo su un esempio nel caso dell’equazione di diffusione. Esempio 9.1. Sia da risolvere in Ω ⎧ ⎨ ut = Δu u (x, y, 0) = g (x, y) ⎩ u (x, y, t) = 0
⊂ R2 , dominio limitato, il problema (x, y) ∈ Ω, t > 0 (x, y) ∈ Ω (x, y) ∈ ∂Ω, t > 0.
Cerchiamo soluzioni della forma u (x, y, t) = v (x, y) w (t) . Sostituendo e riordinando i termini nel solito modo si trova w (t) Δv (x, y) = = −λ, w (t) v (x, y) che conduce ai due problemi w + λw = 0 e
−Δv = λv v=0
t>0 in Ω su ∂Ω.
(6.82)
Un valore λ per cui esiste una soluzione non identicamente nulla v del problema (6.82) si dice autovalore di Dirichlet dell’operatore −Δ in Ω e v è un’autofunzione corrispondente . Il problema originale si può risolvere se: a) esiste una successione di autovalori (reali) λn con autofunzioni corrispondenti un . In corrispondenza ad ogni λn si trova wn (t) = e−λn t ; b) il dato iniziale g può essere “sviluppato” in serie di autofunzioni:
g (x, y) = gn un (x, y) . La soluzione è allora data da u (x, y, t) =
gn e−λn t un (x, y)
dove la serie converge in qualche senso opportuno. La condizione b) richiede che l’insieme delle autofunzioni di −Δ costituisca una base (meglio se ortonormale) per lo spazio dei possibili dati iniziali. Ciò conduce in modo naturale al problema di determinare lo spettro di un
398
6 Elementi di analisi funzionale
operatore lineare in uno spazio di Hilbert, ed in particolare, degli operatori compatti ed autoaggiunti. Spesso, infatti gli “inversi” di operatori differenziali sono operatori di questo tipo, come vedremo nel Capitolo 8. Definiamo risolvente e spettro di un operatore lineare e continuo. Anche se l’ambientazione naturale (e talvolta necessaria) sarebbe in C, ci limitiamo allo spettro reale, sia per semplicità sia perché è il caso che ci interessa qui. Definizioni 9.1. Siano H uno spazio di Hilbert reale, L ∈ L (H) ed I l’identità in H. a) L’insieme risolvente ρ (L) di L è l’insieme dei numeri reali λ tali che L − λI è iniettivo e suriettivo: ρ (L) = {λ ∈ R: L − λI è iniettivo e suriettivo} . b) Lo spettro (reale) di L è σ (L) = R\ρ (L) . −1
Nota 9.1. Se λ ∈ ρ (L), il risolvente Rλ = (L − λI) è limitato18 . Se la dimensione di H è finita lo spettro di un operatore lineare limitato è costituito solo da autovalori. In dimensione infinita lo spettro può essere suddiviso in tre sottoinsiemi. Infatti, se λ ∈ σ (L) possono verificarsi tre fatti. −1 Può succedere che L − λI non sia iniettivo, per cui (L − λI) non esiste. Ciò significa che N (L − λI ) = ∅ ovvero che l’equazione Lx = λx
(6.83)
ha soluzioni non nulle. Diciamo allora che λ è un autovalore di L e che le soluzioni non nulle di (6.83) sono gli autovettori di L corrispondenti a λ. Lo spazio vettoriale generato da questi autovettori si chiama autospazio di λ e coincide con N (L− λI). Definizione 9.2. L’insieme σ P (L) degli autovalori di L si chiama spettro puntuale di L. D’altra parte puo succedere che L−λI sia iniettivo, ma non suriettivo, che la sua immagine R(L − λI ) sia densa in H, ma che (L − λI)−1 sia illimitato. Diciamo allora che λ appartiene a σ C (L), lo spettro continuo di L. Infine, può essere che L − λI sia iniettivo e che la sua immagine R(L − λI) non sia densa in H. Questa condizione definisce lo spettro residuo σ R (L) di L. Esempio 9.2. Siano H = l2 ed L l’operatore lineare da l2 in l2 che associa a x = {x1 , x2 , ...} ∈ l2 l’elemento y = {0, x1 , x2 , ...} (shift operator ). Si ha: (L − λI) x = {−λx1 , x1 − λx2 , x2 − λx3 , ...} . 18
Sempre conseguenza del Teorema della Mappa Aperta (Nota 16, a pié pagina).
6.9 Spettro di un operatore compatto autoaggiunto
399
Se λ = 0, allora λ ∈ ρ (L) e infatti, per ogni z = {z1 , z2 , ...} ∈ l2 , ! z1 z2 z1 −1 (L − λI) z = − , − + 2 , ... . λ λ λ Essendo R(L) costituita dalle successioni con primo elemento nullo, si deduce che R (L) non è densa in l2 e quindi che 0 ∈ σ R (L) = σ (L). 6.9.2 Operatori compatti autoaggiunti Siamo soprattutto interessati allo spettro di un operatore compatto e autoaggiunto. Il seguente teorema è fondamentale. Teorema 9.1. Sia H uno spazio di Hilbert separabile con dimH = ∞ e K ∈ L (H) compatto e autoaggiunto. Allora: a) 0 ∈ σ (K) e σ (K) \ {0} = σ P (K) \ {0}; b) σ P (K) \ {0} è finito oppure è una successione che tende a zero. Inoltre, se λ ∈ σ P (K) \ {0} allora dimN (K − λI ) < ∞; c) H ha una base ortonormale {um } che consiste di autovettori di K. Lo spettro di un operatore compatto ed autoaggiunto contiene dunque λ = 0, che può essere o non essere un autovalore. Gli altri elementi di σ (L), se infiniti, sono autovalori che possono essere ordinati in una successione decrescente |λ1 | ≥ |λ2 | ≥ · · · , con λm → 0, per m → ∞. L’autospazio di un autovalore non nullo ha dimensione finita 19 . Per la dimostrazione, faremo uso dei due seguenti microteoremi. Microteorema 9.2. Sia K ∈ L (H), compatto ed autoaggiunto. Allora KL(H) = sup |(Ku, u)| . u=1
(6.84)
Dimostrazione. Poniamo S (K) = sup |(Ku, u)| . Essendo |(Ku, u)| ≤ u=1
Ku u e ricordando che KL(H) = supu=1 Ku, si ha: S (K) ≤ sup Ku = KL(H) . u=1
D’altra parte si ha, per ogni u ∈ H: Ku = sup |(Ku, v)| . v=1
(6.85)
Essendo K autoaggiunto, possiamo scrivere: (Ku, v) = 19
1 {(K(u + v), u + v) − (K(u − v), u − v)} . 4
Le proprietà a) e b) valgono per K compatto anche non autoaggiunto ed H non necessariamente separabile.
400
6 Elementi di analisi funzionale
Dalla disuguaglianza di Schwarz e dalla legge del parallelogrammo, otteniamo, se u = v = 1: S (K) 2 2 u + v + u − v 4 S (K) 2 2 2 u + 2 v = S (K) . = 4
|(Ku, v)| ≤
Da questa disuguaglianza e dalla (6.85) ricaviamo KL(H) ≤ S (K)
che conclude la dimostrazione.
Microteorema 9.3. Sia K ∈ L (H), compatto ed autoaggiunto. Poniamo m = inf (Ku, u) u=1
M = sup (Ku, u) . u=1
a) Se M > 0 allora esiste z tale che (Kz, z) = M e z = 1. Inoltre, M risulta il massimo autovalore di K e z è un autovettore corrispondente. b) Se m < 0 allora esiste z tale che (Kz, z) = m e z = 1. Inoltre m è il minimo autovalore di K e z è un autovettore corrispondente. Dimostrazione. Sia M > 0. {xn } ⊂ H, tale cioè che xn 7.8 esiste una sottosuccessione, mente convergente ad un certo Scriviamo:
Consideriamo una successione massimizzante = 1 e (Kxn , xn ) → M . In base al Teorema che continuiamo ad indicare con {xn }, debolelemento z ∈ H. Proviamo che M = (Kz, z).
(Kxn , xn ) − (Kz, z) = (Kxn − Kz, xn ) + (Kz, xn − z) . Poiché xn ! z si ha (Kz, xn − z) → 0. Per la compattezza di K abbiamo Kxn → Kz e allora |(Kxn − Kz, xn )| ≤ Kxn − Kz → 0. Pertanto (Kxn , xn ) − (Kz, z) → 0, che implica M = (Kz, z) . Mostriamo ora che z = 1. Infatti, dal Teorema 7.7 abbiamo z ≤ lim inf xn = 1. Se fosse h = z < 1, posto w = z/h avremmo w = 1 e M ≥ (Kw, w) = Contraddizione. Dunque z = 1.
M (Kz, z) = 2 > M. h2 h
6.9 Spettro di un operatore compatto autoaggiunto
401
Basta ora dimostrare che M è un autovalore e che z è un autovettore corrispondente. Da quanto precede, segue che M = (Kz, z) = max
(Ku, u) u
u=0
2
.
Usiamo un procedimento tipico del Calcolo delle Variazioni. Per ogni v ∈ H fissato arbitrariamente e t ∈ (−ε, ε), con ε abbastanza piccolo, si ha z + tv > 0 e perciò in (−ε, ε) è ben definita la funzione t −→ ϕ (t) =
(K (z + tv) , z + tv) z + tv
2
=
t2 (Kv, v) + 2t (Kz, v) + (Kz, z) 2
t2 v + 2t (z, v) + z
2
.
Poiché ϕ (0) = M e ϕ (t) ≤ M in (−ε, ε), ϕ ha un massimo nell’origine e quindi ϕ (0) = 0. Abbiamo: ϕ (t) =
2
2
2 [t (Kv, v) + (Kz, v)] z + tv − 2 (K (z + tv) , z + tv) [t v + (z, v)] z + tv
4
.
Perciò, ricordando che z = 1, l’equazione ϕ (0) = 0 si traduce nella relazione: (Kz, v) − (Kz, z) (z, v) = 0 ossia (Kz − M z, v) = 0. Dall’arbitrarietà di v deduciamo che Kz = M z e perciò M è un autovalore. Il caso m < 0 si tratta in modo simile. Nota 9.2. I Microteoremi 9.2 e 9.3 implicano che, se K è compatto e autoaggiunto e non è l’operatore nullo, allora K ammette sempre un autovalore non nullo dato da m = min u=0
Il rapporto
(Ku,u) u2
(Ku, u) u
2
oppure
M = max u=0
(Ku, u) u
2
.
si chiama quoziente di Rayleigh.
Dimostrazione del Teorema 9.1. La suddividiamo in vari passi. 1. Mostriamo che 0 ∈ σ (K). Supponiamo che 0 ∈ / σ (K). Allora K è biunivoco da H su H e quindi esiste K −1 . Ma allora scrivendo I = K ◦ K −1 , l’operatore identità I risulta compatto come composizione di un limitato e di un compatto20 . Ricordando l’Esempio 7.5, si deduce che dimH < ∞, contro l’ipotesi. Questo prova a). 2. Siano λ e μ autovalori distinti di K. Allora i rispettivi autospazi sono ortogonali. Infatti, siano Ku = λu e Kv = μv. Allora λ (u, v) = (Ku, v) = (u, Kv) = μ (u, v) 20
Microteorema 5.7.
402
6 Elementi di analisi funzionale
che implica (u, v) = 0, essendo λ = μ. 3. Se λ ∈ σ P (K) \ {0}, allora dimN (K − λI ) < ∞. Se la dimensione fosse infinita, esisterebbe una successione ortonormale {wm } contenuta in N (K −λI ) ed avremmo, per m = n: √ Kwm − Kwn = |λ| wm − wn ≥ 2 |λ| > 0. Dunque, {Kwm } non può avere sottosuccessioni convergenti, contro la compattezza di K. 3. Supponiamo che σ P (K) \ {0} sia infinito e mostriamo che è una successione che tende a zero. Infatti, per ogni ε > 0 esiste solo un numero finito di autovalori λ tali che |λ| > ε. Per provarlo, supponiamo che esista una successione {λm } infinita di elementi distinti di σ p (K) \ {0} tali che |λm | > ε. Se {em } è la corrispondente successione di autovettori normalizzati, cioè em = 1, abbiamo che em ! 0 (Problema 6.16). Essendo K compatto, si deduce che Kem = |λm | → 0, contraddizione. Perciò σ P (K) \ {0} è numerabile ed ha 0 come unico punto di accumulazione. Da 2 e 3 segue b). 4. Dimostriamo c). Supponiamo che K non sia l’operatore nullo. Dalla (6.84), (Ku, u) = 0 per qualche u; diciamo (Ku, u) > 0. Dal Microteorema 9.2. deduciamo che M = maxu=1 (Ku, u) è un autovalore e quindi che σ P (K) \ {0} non è vuoto. In tal caso, sia {λ∗n }n≥1 la successione, finita o infinita degli autovalori non nulli e distinti di K. Poniamo H0 = N (K) e, per n ≥ 1, Hn = N (K − λ∗n I). Sappiamo dai punti 2 e 3 che i sottospazi Hn , n ≥ 0, sono a due a due ortogonali e che 0 ≤ dimH0 ≤ ∞
e
0 < dimHn < ∞.
Sia ora V = ⊕n≥0 Hn , la somma diretta degli spazi Hn , n ≥ 0. Dimostriamo che H =V. A tale scopo basta dimostrare che V ⊥ = {0}. Osserviamo che K(V ⊥ ) ⊆ V ⊥ poiché, se u ∈ V ⊥ e v ∈ V si ha (Ku, v) = (u, Kv) = 0. 8 di K a V ⊥ è un operatore compatto ed autoagNe segue che la restrizione K ⊥ giunto. Se ora V = {0}, per i Microteoremi 9.2 e 9.3, V ⊥ dovrebbe contenere 8 che sarebbe automaticamente un autovettore di K. Ma un autovettore di K, ciò è impossibile essendo V ⊥ ortogonale ad ogni autovettore. A questo punto scegliamo in ogni autospazio Hn una base ortonormale, osservando che, essendo H separabile21 , H0 ha una base ortonormale numerabile. 21
È l’unico punto in cui si usa la separabilità di H.
6.9 Spettro di un operatore compatto autoaggiunto
403
L’unione di queste basi forma una base ortonormale numerabile di autovettori per H. Questo prova il punto c). 5. Rimane da dimostrare che σ (K) \ {0} = σ P (K) \ {0}. Occorre provare che, se λ = 0 non è un autovalore, l’equazione Ku − λu = f
(6.86)
ha una e una sola soluzione. Sia {ej } una base ortonormale di autovettori per H e {λj } la successione di tutti gli autovalori, ciascuno ripetuto in accordo alla propria molteplicità. Per ogni u ∈ H si ha u = (u, ej ) ej , dove la somma è estesa a tutti gli indici. Di conseguenza, per la continuità di K, possiamo scrivere: Ku =
(u, ej ) Kej =
λj (u, ej ) ej ,
∀u ∈ H.
Data f ∈ H, determiniamo la soluzione di (6.86). Scriviamo f = ed inseriamo la (6.87) nella (6.86); troviamo
(λj − λ) (u, ej ) ej =
(f, ej ) ej .
(6.87)
(f, ej ) ej
(6.88)
Se ora λ = 0 non è un autovalore, allora λj − λ = 0 per ogni j, e l’unica soluzione della (6.86) è data dalla formula u = (K − λI)−1 f =
(λj − λ)
−1
(f, ej ) ej
(6.89)
purché la serie converga. Infatti, la serie in (6.89) è convergente per ogni f ∈ H poiché, essendo λ = 0, si ha: sup |λj − λ|
−1
<∞
e
2
2
|(f, ej )| = f .
Ciò mostra che K − λI è iniettivo e suriettivo e perciò λ ∈ ρ (K). La dimostrazione del teorema è conclusa. Nota 9.3. Sottolineiamo che la (6.87) esprime la decomposizione spettrale di K, mentre la (6.89) è una formula per il risolvente (K − λI)−1 . Dimostrazione del Teorema dell’Alternativa nel caso K autoaggiunto. La dimostrazione del Teorema 9.1 implica che se λ = 1 non è autovalore di K, l’equazione Φ (u) = Ku − u = f (6.90) ha una ed una sola soluzione data dalla (6.89). Se invece λ = 1 è autovalore di K, allora, dalla (6.88) con λ = 1, si deduce immediatamente che (6.90) è risolubile se e solo se (f, ej ) = 0 per ogni ej ∈ N (Φ). Cio equivale a R (Φ) = ⊥ N (Φ) . Le altre affermazioni sono ovvie, dato che Φ∗ = Φ.
404
6 Elementi di analisi funzionale
6.9.3 Applicazione ai problemi variazionali astratti Applichiamo il Teorema 9.1 ai problemi variazionali astratti. L’impostazione è quella del Teorema 6.3 che prevede una terna Hilbertiana (V, H, V ∗ ), tale che l’immersione di V in H sia compatta. Assumiamo anche che H sia separabile. Sia a una forma bilineare V , continua e (V, H) −debolmente coerciva; in particolare: 2 2 ∀v ∈ V. (6.91) aλ0 (u, v) ≡ a (v, v) + λ0 v ≥ α vV Le nozioni di risolvente e spettro si introducono facilmente. Consideriamo il problema a (u, v) = λ (u, v) + F, v∗ ∀v ∈ V. (6.92) L’insieme risolvente ρ (a) è l’insieme dei numeri reali λ tali che (6.92) ha una e una sola soluzione uF per ogni F ∈ V ∗ e l’applicazione Sa,λ : F −→ u (F ) è un isomorfismo continuo tra V ∗ e V . In particolare, Sa,λ può essere considerato come operatore compatto da H in H, essendo Sa,λ continuo da H in V ed essendo l’immersione di V in H compatta. Poniamo Sλ0 = Saλ0 ,0 . Lo spettro (reale) è σ (a) = R\ρ (a) mentre lo spettro puntuale σ P (a) è il sottoinsieme degli autovalori, ossia dei numeri reali λ tali che il problema omogeneo a (u, v) = λ (u, v) ∀v ∈ V (6.93) ha soluzioni (autovettori ) non nulle. Chiamiamo autospazio associato all’autovalore λ lo spazio generato dai corrispondenti autovettori, che indichiamo con N (a, λ). Il teorema seguente è conseguenza del Teorema dell’Alternativa e del Teorema 9.1 ed è basato sulla seguente relazione tra σ P (aλ0 ) e σ P (Sλ0 ), dove pensiamo Sλ0 ∈ L (H). Osserviamo che σ (aλ0 ) ⊂ (0, +∞) e che 0 ∈ / σ P (Sλ0 ), essendo aλ0 coerciva. Siano ora μ ∈ σ P (Sλ0 ) ed f un corrispondente autovettore, cioè Sλ0 f = μf. (6.94) Allora f ∈ V e μaλ0 (f, v) = aλ0 (Sλ0 f, v) = (f, v) da cui 1 (6.95) aλ0 (f, v) = (f, v) per ogni v ∈ V. μ Quindi λ = 1/μ è un autovalore di aλ0 , con lo stesso autospazio. Poiché le (6.94) e (6.95) sono equivalenti, concludiamo che N (aλ0 ) = N (Sλ0 ) ⊂ V. Inoltre μ > 0, poiché tutti gli autovalori di aλ0 sono positivi.
6.9 Spettro di un operatore compatto autoaggiunto
405
Teorema 9.4. Siano V, H spazi di Hilbert, con H separabile, V denso in H, e tali che l’immersione di V in H sia compatta. Sia a una forma bilineare in V, continua, simmetrica e debolmente coerciva (valga la (6.91)). Allora: (a) σ (a) = σ P (a) ⊂ (−λ0 , +∞). Inoltre, se la successione degli autovalori {λm }m≥1 è infinita allora λm → +∞; (b) se u, v sono autovettori corrispondenti ad autovalori differenti, allora a (u, v) = 0 = (u, v) . Inoltre, H ha una base ortonormale {um }m≥1 di autovettori di a; √ (c) la successione um / λm + λ0 m≥1 costituisce una base ortonormale in V , rispetto al prodotto scalare ((u, v)) = a (u, v) + λ0 (u, v) .
(6.96)
Dimostrazione. Abbiamo osservato che Sλ0 ∈ L (H) è compatto. Inoltre, per la simmetria di a, Sλ0 è autoaggiunto, cioè per ogni f, g ∈ H.
(Sλ0 f, g) = (f, Sλ0 g)
Infatti, siano u = Sλ0 f e w = Sλ0 g. Allora, per ogni v ∈ V , aλ0 (u, v) = (f, v)
e
aλ0 (w, v) = (g, v) .
In particolare, aλ0 (u, w) = (f, w)
e
aλ0 (w, u) = (g, u)
cosicché, essendo aλ0 (u, w) = aλ0 (w, u) e (g, u) = (u, g), possiamo scrivere (Sλ0 f, g) = (u, g) = (f, w) = (f, Sλ0 g) e perciò Sλ0 è autoaggiunto. Poiché 0 ∈ / σ P (Sλ0 ), dal Teorema 9.1 a) e b) segue che σ (Sλ0 ) \ {0} = σ P (Sλ0 ) e che gli autovalori (tutti positivi) costituiscono una successione {μm } con μm ↓ 0. Usando il Teorema dell’Alternativa, il Teorema 9.1 c) e la relazione vista sopra tra σ P (Sλ0 ) e σ P (aλ0 ), (a) e (b) seguono facilmente. Infine se {um }m≥1 è una base ortonormale di autovettori di a in H, allora22 a (um , uk ) = λm (um , uk ) = λm δ mk da cui ((um , uk )) ≡ aλ0 (um , uk ) = (λm + λ0 ) δ mk . 22
δ mk è il simbolo di Kronecker.
406
6 Elementi di analisi funzionale
√ Ciò mostra che um / λm + λ0 è un sistema ortonormale in V . Per provare che è una base, osserviamo che, se v ∈ V e per ogni m ≥ 1
((um , v)) = 0 allora si ha anche
aλ0 (um , v) = (λm + λ0 ) (um , v) = 0
per ogni m ≥ 1
che implica v = 0, essendo {um }m≥1 una base ortonormale di autovettori di a in H. Di conseguenza, il vettore è l’unico elemento in V ortogonale al √ nullo sottospazio generato da um / λm + λ0 , rispetto al prodotto scalare ((·, ·)). Vedremo nel Capitolo 8 che per una forma a bilineare simmetrica e V −coerciva, il primo autovalore λ1 riveste particolare importanza. Vogliamo caratterizzarlo come minimo del quoziente di Rayleigh R (u) =
a (u, u) u
2
.
Microteorema 9.5 (Principio variazionale per il primo autovalore). Siano V e H spazi di Hilbert. Assumiamo che H sia separabile a dimensione infinita ed inoltre che V ⊂ H con immersione compatta. Sia a una forma bilineare in V , continua, simmetrica e V −coerciva. 1) Se λ1 , u1 sono, rispettivamente, il primo autovalore di a ed un autovettore corrispondente, allora λ1 = R (u1 ) =
min R (v) .
v∈V,v=0
(6.97)
2) Viceversa, se R (w) = λ1 =
min R (v)
v∈V,v=0
allora w è un autovettore di a con autovalore λ1 , cioè soddisfa l’equazione a (w, v) = λ1 (w, v)
∀v ∈ V .
Dimostrazione. (1) Sia {λm }m≥1 la successione degli autovalori di a e. In base al Teorema 9.4 esiste una base {um }m≥1 di autovettori corrispondenti, ortonormale in H. Allora, per ogni v ∈ H possiamo scrivere v = j≥1 (v, um ) um e quindi:
2 2 (v, um ) . v = m≥1
√ D’altra parte, dal Teorema 9.4, la successione um / λm m≥1 è una base ortogonale in V rispetto al prodotto scalare ((u, v)) = a (u, v). Pertanto, un elemento v appartiene a V se e solo se
1 2 2 2 a (v, um ) = λm (v, um ) < ∞. vV = m≥1 λm m≥1
Problemi
407
Ne segue che, essendo λm ≥ λ1 per ogni m > 1, a (v, v) ≥ λ1
2
m≥1
(v, um ) = λ1 v
2
e inoltre a (u1 , u1 ) = λ1 . Deduciamo che λ1 ≤ R (v) e che λ1 = R (u1 ), cioè la (6.97). (2) Sia v ∈ V fissato arbitrariamente e poniamo v (t) = w + tv. Se t ∈ (−ε, ε), con ε abbastanza piccolo, si ha w + tv > 0 per cui in (−ε, ε) è ben definita la funzione ψ (t) = R (v (t)). Poiché ψ (0) = λ1 ≤ ψ (t) in (−ε, ε), deve essere ψ (0) = 0. Eseguendo i calcoli e sfruttando la simmetria e la bilinearità di a, si trova a (w, v) − λ1 (w, v) = 0.
Dall’arbitrarietà di v segue la tesi.
Problemi 6.1. Principio di Indeterminazione di Heisenberg. Sia ψ ∈ C 1 (R) tale che " 2 2 x [ψ (x)] → 0 per |x| → ∞ e R [ψ (x)] dx = 1. Mostrare che 1≤4
R
2
x2 |ψ (x)| dx
ψ (x)2 dx.
R
(Se ψ è la funzione d’onda di Schrödinger, il primo fattore a secondo membro è una misura della dispersione della densità di una particella, mentre il secondo è una misura della dispersione del suo momento lineare). 6.2. Dimostrare la completezza di l2 . [Suggerimento. Sia xk di Cauchy in l2 , dove xk = xkm m≥1 . In particolare, k xm − xhm → 0 per h, k → ∞, m fissato, e quindi xhm → xm per ogni m. Definire x = {xm } e mostrare che, dato ε > 0,
M m=1
k xm − xm 2 < ε
per ogni M , se k è sufficientemente grande. Dedurre che xk → x in l2 ]. 6.3. Sia H uno spazio di Hilbert e V un sottospazio chiuso di H. Mostrare che u = PV x se e solo se 1. u ∈ V 2. (x − u, v) = 0, ∀v ∈ V.
408
6 Elementi di analisi funzionale
6.4. Sia f ∈ L2 (−1, 1). Trovare il polinomio di grado ≤ n che meglio approssima f in norma L2 (−1, 1), ossia il polinomio p che minimizza 1 (f − q)2 −1
tra tutti i polinomi q di grado ≤ n. [Risposta. p (x) = a0 L0 (x) + a1 L1 (x) + ... + an Ln (x), dove Ln è l’n−esimo polinomio di Legendre e aj = (n + 1/2) (f, Ln )L2 (−1,1) ]. 6.5. Equazione di Hermite e oscillatore armonico quantistico. Si consideri l’equazione x∈R (6.98) w + 2λ + 1 − x2 w = 0 con la condizione w (x) → 0 as x → ±∞. 2
a) Mostrare che il cambio di variabile z = wex nell’equazione di Hermite per z:
/2
trasforma (6.98)
z − 2xz + 2λz = 0 2
con e−x /2 z (x) → 0 as x → ±∞. b) Si consideri l’equazione d’onda di Schrödinger per l’oscillatore armonico: ψ +
8π 2 m E − 2π 2 mν 2 x2 ψ = 0 2 h
x∈R
dove m è la massa della particella, E è l’energia totale, h è la costante di Plank e ν è la frequenza della vibrazione. Le soluzioni fisicamente ammissibili sono quelle che soddisfano le seguenti condizioni: ψ → 0 per x → ±∞
e
ψL2 (R) = 1.
Dimostrare che esiste una soluzione se e solo se 1 E = hν n + n = 0, 1, 2... 2 e, per ogni n, la corrispondente soluzione è data da ' 2π 2 νm 2 ψ n (x) = kn Hn 2π νm/hx exp − x h # $1/2 4πνm dove kn = e Hn è l’n−esimo polinomio di Hermite. 2 22n (n!) h 6.6. Usando la separazione delle variabili, risolvere il seguente problema di diffusione in tre dimensioni (r, θ, ϕ coordinate sferiche, 0 ≤ θ ≤ 2π, 0 ≤ ϕ ≤ π): Δu = 0 r < 1, 0 < ϕ < π u (1, ϕ) = g (ϕ) 0 ≤ ϕ ≤ π.
Problemi
[Risposta: u (r, ϕ) = Legendre e
∞ n=0
an =
409
an rn Ln (cos ϕ), dove Ln è l’n−esimo polinomio di
2n + 1 2
1
−1
g cos−1 x Ln (x) dx.
A un certo punto, è richiesto il cambio di variabili x = cos ϕ]. 6.7. L’ampiezza u delle piccole vibrazioni di una membrana circolare di raggio a, fissata al bordo, soddisfa l’equazione delle onde bidimensionale utt = Δu, con la condizione u (a, θ, t) = 0. Supponiamo che inizialmente la membrana sia a riposo. Scrivere la soluzione del problema. [Risposta: u (r,θ, t) =
∞
√ Jp (αpj r) {Apj cos pθ + Bpj sin pθ} cos( αpj t)
p,j=0
dove i coefficienti Apj e Bpj sono determinati dallo sviluppo di g (r, θ) in serie di Fourier-Bessel]. 6.8. Nel calcolo differenziale, diciamo che una funzione f : Rn → R è differenziabile in un punto x0 se esiste un funzionale lineare L : Rn → R tale che f (x0 + h) − f (x0 ) = Lh+o (h) as h → 0. Determinare l’elemento di Riesz associato a L, rispetto ai seguenti prodotti interni in Rn : n n a) (x, y) = x · y = j=1 xj yj , b) (x, y)A = Ax · y = i,j=1 aij xi yj , dove A = (aij ) è una matrice simmetrica e definita positiva. 6.9. Dimostrare il Microteorema 5.4. [Suggerimento. Usando direttamente le definizioni di norma e di aggiunto, mostrare prima che L∗ L(H2 ,H1 ) ≤ LL(H1 ,H2 ) e poi che L∗∗ = L. Invertire i ruoli di L e L∗ per ottenere L∗ L(H2 ,H1 ) ≥ LL(H1 ,H2 ) ]. 6.10. Dimostrare il Teorema 6.2. [Suggerimento. Imitare la dimostrazione del Teorema di Lax-Milgram]. 6.11. Dimostrare il Teorema 7.2 nel caso in cui X sia uno spazio di Hilbert. 6.12. Siano X uno spazio di Banach ed E, F ⊂ X. Provare i seguenti fatti: a) se E è compatto, allora è chiuso e limitato; b) sia E ⊂ F con F compatto; se E è chiuso allora E è compatto. 6.13. Proiezione su un convesso chiuso. Siano H uno spazio di Hilbert ed E ⊂ H, chiuso e convesso. Dimostrare che:
410
6 Elementi di analisi funzionale
a) per ogni x ∈ H, esiste un unico elemento PE x ∈ E (la proiezione di x su E) tale che PE x − x = inf v − x ; v∈E
∗
b) x = PE x se e solo se (x∗ − x, v − x∗ ) ≥ 0
per ogni v ∈ E;
(6.99)
c) dare un’interpretazione geometrica della (6.99). [Suggerimento. a) Seguire la dimostrazione del Teorema di Proiezione 4.1. b) Sia 0 ≤ t ≤ 1 e si definisca ϕ (t) = x∗ + t(v − x∗ ) − x
2
v ∈ E.
Mostrare che x∗ = PE x se e solo se ϕ (0) ≥ 0. Controllare che ϕ (0) ≥ 0 è equivalente alla (6.99)]. 6.14. Siano H uno spazio di Hilbert ed E ⊂ H, chiuso e convesso. Dimostrare che E è debolmente chiuso. [Suggerimento. Sia {xk } ⊂ E tale che xk ! x. Usare la (6.99) per dimostrare che PE x = x, per cui x ∈ E]. 1 6.15. Mostrare che l’immersione di Hper (0, 2π) in L2 (0, 2π) è compatta. 1 [Suggerimento. Sia {uk } ⊂ Hper (0, 2π) con
2 2 1 + m2 |? ukm | < M. uk = m∈Z
Dimostrare che, per ogni m fissato, kj esiste una successione u? kj m convergente ad un numero Um per kj → +∞. Mostrare poi che
2 1 + m2 |Um | < M. m∈Z
Porre u (x) =
m∈Z
Um eimx e mostrare infine che ukj → u in L2 (0, 2π)].
6.16. Sia {ek } una base ortonormale in H. Dimostrare che ek ! 0. [Suggerimento. Ricordare che ogni x ∈ H si può scrivere nella forma x=
∞ k=1
(x, ek ) ek
2
e che x = · · · ] . 6.17. Sia L : L2 (R) → L2 (R) definito da Lv (x) = v (−x) . Mostrare che σ (L) = σ P (L) = {1, −1}.
7 Distribuzioni e spazi di Sobolev
7.1 Distribuzioni 7.1.1 Considerazioni preliminari Abbiamo già avuto modo di incontrare la delta di Dirac a proposito della soluzione fondamentale dell’equazione del calore. Un’altra interessante situazione è la seguente, nella quale si vede come la misura di Dirac sia legata a fenomeni di tipo impulsivo. In riferimento alla Figura 7.1, consideriamo una massa m in moto rettilineo lungo l’asse x con velocità costante v =vi. Ad un certo istante t0 avviene un urto elastico con una parete verticale, in seguito al quale la massa si muove con la stessa velocità in senso opposto −vi. Indicate con v1 , v2 le velocità scalari in due istanti t1 < t2 , in base alle leggi della meccanica dovrebbe essere, m(v2 − v1 ) =
t2
F (t) dt t1
dove F denota l’intensità della forza complessiva agente sulla massa. Se t1 < t2 < t0 oppure t0 < t1 < t2 allora v2 = v1 = v oppure v2 = v1 = −v e quindi F = 0: nessuna forza agisce sulla massa prima e dopo l’urto. Ma se
Figura 7.1. Urto elastico al tempo t = t0 Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
412
7 Distribuzioni e spazi di Sobolev
t1 < t0 < t2 , il primo membro è uguale a 2mv = 0 mentre se insistiamo a modellare l’intensità della forza con una funzione F , l’integrale a destra è sempre nullo ed otteniamo una contraddizione. In tal caso, infatti, F è una forza concentrata nell’istante t0 , di intensità 2mv, cioè F (t) = 2mv δ (t − t0 ) . In questo capitolo vedremo come la misura di Dirac si inquadri perfettamente nella teoria delle funzioni generalizzate o distribuzioni di L. Schwartz. L’idea chiave è descrivere un oggetto matematico mediante l’azione che questo esercita su un opportuno spazio di funzioni test ϕ. Nel caso della δ di Dirac nell’origine, tale azione si esprime mediante il seguente funzionale lineare (si veda la Definizione 2.2): ϕ −→ δ, ϕ = ϕ (0) . La δ si identifica dunque con questo funzionale lineare, ed è quest’ultimo che prende il nome di funzione generalizzata o distribuzione. Naturalmente, per un principio di coerenza, tra le funzioni generalizzate devono trovar posto le usuali funzioni dell’Analisi. Questo fatto implica che la scelta dell’insieme di funzioni test non può essere arbitraria. Infatti, consideriamo un dominio Ω ⊆ Rn e sia u ∈ L2 (Ω). Un modo naturale di definire l’azione di u su una funzione test ϕ è associare ad u il funzionale lineare Iu : ϕ −→ (u, ϕ)0 = uϕ dx. Ω
Possiamo identificare u col funzionale Iu ? In altri termini: è possibile risalire ad u dalla conoscenza del valore Iu (ϕ) su tutte le ϕ? Se scegliessimo L2 (Ω) come spazio di funzioni test, questo è vero. Infatti se v ∈ L2 (Ω) è tale che Iu (ϕ) = Iv (ϕ) per ogni ϕ ∈ L2 (Ω), abbiamo 0 = Iu (ϕ) − Iv (ϕ) = (u − v)ϕ dx. (7.1) Ω
Scegliendo ϕ = u − v, si ha
(u − v)2 dx =0
Ω
che forza u = v q.o. in Ω. D’altra parte, però, non possiamo usare tutte le funzioni test in L2 (Ω) perché in generale sono definite solo q.o. ed allora δ, ϕ = ϕ (0) potrebbe non avere senso. La questione è dunque se sia possibile risalire ad u dalla conoscenza del valore Iu (ϕ) quando ϕ varia su un insieme di funzioni regolari. Certamente ciò è impossibile se pensiamo ai valori di Iu (ϕ) in corrispondenza a “poche” funzioni ϕ, per esempio un numero finito. Ma è ragionevole che vi sia una concreta possibilità di individuare univocamente u dai
7.1 Distribuzioni
413
valori di Iu (ϕ), se ϕ varia in un sottoinsieme denso in L2 (Ω). Infatti, sia Iu (ϕ) = Iv (ϕ) per ogni funzione test. Data ψ ∈ L2 (Ω), per via della densità dell’insieme delle funzioni test in L2 (Ω), esiste una successione di funzioni {ϕk } tale che ϕk − ψ0 → 0. Allora1 ,
(u − v)ϕk dx →
0= Ω
(u − v)ψ dx Ω
cosicché la (7.1) vale in realtà per ogni ψ ∈ L2 (Ω) che, come abbiamo visto, implica u − v = 0 q.o. Perciò la distribuzione Iu identifica univocamente u. Dunque, l’insieme delle funzioni test deve essere denso in L2 (Ω) se vogliamo che le funzioni in L2 (Ω) possano essere viste come distribuzioni. Tuttavia, la ragione principale che porta all’introduzione delle distribuzioni di Schwartz non si riduce ad una mera estensione della nozione di funzione ma risiede nella possibilità di allargare significativamente il dominio di applicabilità del calcolo differenziale. L’idea è utilizzare la formula di integrazione per parti per “scaricare” le operazioni di derivazione sulle funzioni test. In realtà, non si tratta di un’idea completamente nuova. L’abbiamo già usata, per esempio, nel Paragrafo 2.3.3, quando abbiamo interpretato la delta di Dirac in x = 0 come derivata della funzione di Heaviside H, (si veda la formula (2.53)). Anche l’allargamento della nozione di soluzione per una legge di conservazione (Paragrafo 4.4.2) o per l’equazione delle onde (Paragrafo 5.4.2) segue più o meno la stessa filosofia. Nella prima parte del capitolo, illustriamo i concetti basilari della Teoria delle Distribuzioni di Schwartz, finalizzati all’introduzione degli spazi di Sobolev. Il riferimento principale è il libro di L. Schwartz, 1966, al quale rimandiamo anche per le dimostrazioni non incluse qui. 7.1.2 Funzioni test e mollificatori Ricordiamo che, data una funzione continua v definita in un dominio Ω ⊆ Rn , per supporto di v si intende la chiusura dell’insieme dei punti in cui v è diversa da zero: supp (v) = Ω ∩ chiusura di {x ∈Rn : v (x) = 0} . Si può definire il supporto, o meglio, il supporto essenziale, anche di una funzione f che sia solo misurabile, non necessariamente continua, in Ω. Sia infatti Z l’unione degli aperti nei quali f = 0 q.o. L’insieme Ω\Z prende il nome di supporto essenziale di f , indicato con lo stesso simbolo supp(v). Diciamo che una funzione ha supporto compatto in Ω se supp(v) è un sottoinsieme compatto di Ω. 1
Osservare che:
(u − v) (ϕ − ψ) dx ≤ u − v ϕ − ψ . k k 0 0 Ω
414
7 Distribuzioni e spazi di Sobolev
Definizione 1.1. Indichiamo con C0∞ (Ω) l’insieme delle funzioni di classe C ∞ (Ω) a supporto compatto in Ω. Le funzioni in C0∞ (Ω) si chiamano funzioni test. Esempio 1.1. La funzione ⎧ 1 ⎨ c exp |x|2 −1 η (x) = ⎩ 0
0 ≤ |x| < 1
(7.2)
|x| ≥ 1
dove c è una costante, appartiene a C0∞ (Rn ). La (7.2) è un esempio tipico di funzione test. Insieme all’operazione di convoluzione tra funzioni permette di generare altre funzioni test. Richiamiamo brevemente la definizione ed alcune proprietà della convoluzione. Date due funzioni u, v definite in Rn , la convoluzione tra u e v è definita dalla formula (u ∗ v) (x) = u (x − y) v (y) dy = u (y) v (x − y) dy. Rn
Rn
Le proprietà di sommabilità di u ∗ v dipendono da quelle di u e v nel modo indicato dal seguente teorema. Teorema 1.1 (di Young). Siano u ∈ Lp (Rn ) e v ∈ Lq (Rn ), p, q ∈ [1, ∞] . Allora, u ∗ v ∈ Lr (Rn ) dove 1r = p1 + 1q − 1 e u ∗ vLr (Rn ) ≤ uLp (Rn ) uLq (Rn ) .
(7.3)
Vediamo come si usa la convoluzione per regolarizzare funzioni “selvagge”. La ricetta è la seguente: si prende la funzione η nella (7.2), che ha le seguenti proprietà: η ≥ 0 e supp(η) = B 1 (0) , dove, ricordiamo, BR (0) = {x ∈Rn : |x| < R}. −1 " " 1 exp in modo che Rn η = 1. Si pone, dx Si sceglie c = 2 Rn |x| −1 per ε > 0, |x| 1 η ε (x) = n η (7.4) ε ε che appartiene a C0∞ (R"n ) (e quindi a tutti gli Lp (Rn )), con supporto coincidente con B ε (0) e Rn η ε = 1. Sia ora f ∈ Lp (Ω). Se si definisce f = 0 fuori da Ω, si ottiene una funzione in Lp (Rn ), che continuiamo a chiamare f , per la quale la convoluzione f ∗ η ε è ben definita in tutto Rn : fε (x) = (f ∗ η ε ) (x) = η ε (x − y) f (y) dy Ω η (z) f (x−εz) dz. = {|z|≤1}
7.1 Distribuzioni
415
Figura 7.2. Supporto della convoluzione con un mollificatore
Anche se f è molto irregolare, fε è sempre di classe C ∞ ; per questo motivo η ε si chiama mollificatore. Inoltre, quando ε → 0, fε approssima f nel senso precisato nel seguente lemma, che ci limitiamo ad enunciare. Lemma 1.2. Sia f ∈ Lp (Ω), 1 ≤ p ≤ ∞; allora fε ha le seguenti proprietà: 1. il supporto di fε è un ε−intorno del supporto di f (Figura 7.2): supp (f ) = {x ∈ Rn : dist (x, supp (f )) ≤ ε} ; 2. fε ∈ C ∞ (Rn ) e se il supporto di f è un compatto K ⊂ Ω, allora fε ∈ C0∞ (Ω) , per ε < dist(K, ∂Ω); 3. se ε → 0, fε → f quasi ovunque in Ω; 4. se f ∈ C (Ω), allora fε → f uniformemente in ogni compatto K ⊂ Ω; 5. se 1 ≤ p < ∞, allora fε Lp (Ω) ≤ f Lp (Ω)
e
fε − f Lp (Ω) → 0 per ε → 0.
Nota 1.1. Sia f ∈ L1loc (Ω), cioè f ∈ L1 (Ω ) per ogni2 Ω ⊂⊂ Ω. La convoluzione fε è ben definita se x si mantiene a distanza > ε dal bordo di Ω, cioè se x appartiene all’insieme Ωε = {x ∈ Ω: dist (x,∂Ω) > ε} . Nota 1.2. Sottolineiamo che la proprietà 5 è falsa in L∞ (Ω): una funzione discontinua e limitata non è approssimabile in norma L∞ (cioè uniformemente! ) da funzioni regolari. Nota 1.3. La convoluzione con un mollificatore si può usare per costruire funzioni in C0∞ (Ω) che assumano sempre valori tra 0 ed 1 e valore 1 in un dato compatto K ⊂ Ω. Vediamo come si fa. Siano K ε ⊂ Ω un ε−intorno di K e f = χK ε la funzione caratteristica di K ε . 2
Ω ⊂⊂ Ω significa che la chiusura di Ω è compatta e contenuta in Ω
416
7 Distribuzioni e spazi di Sobolev
Allora, se ε < 12 dist(K, ∂Ω) si ha fε = χK ε ∗ η ε ∈ C0∞ (Ω). Osserviamo che 0 ≤ fε ≤ 1. Infatti: fε (x) = η ε (x − y) χK ε (y) dy = η ε (x − y) dy Ω K ε ∩Bε (x) η ε (y) dy ≤ 1. ≤ Bε (0)
Inoltre fε ≡ 1 in K. Infatti, se x ∈K, la sfera Bε (x) è contenuta in K ε e quindi η ε (x − y) dy = η ε (y) dy = 1. K ε ∩Bε (x)
Bε (0)
Questo tipo di funzioni si rivelerà utile in seguito, nel Paragrafo 7.6.2. Teorema 1.3. C0∞ (Ω) è denso in Lp (Ω) per ogni 1 ≤ p < ∞. Dimostrazione. Indichiamo con Lpc (Ω) lo spazio delle funzioni p-sommabili a supporto (essenziale) compatto in Ω. Se f ∈ Lpc (Ω) con supporto K ⊂ Ω, compatto, dalla proprietà 1 del Lemma 1.2, il supporto di fε è un ε−intorno di K, che, per ε piccolo, è ancora un sottoinsieme compatto di Ω. Dalle proprietà 2 e 5 si deduce che C0∞ (Ω) è denso in Lpc (Ω), se 1 ≤ p < ∞. D’altra parte Lpc (Ω) è a sua volta denso in Lp (Ω): infatti, prendiamo una successione di compatti {Km } tale che Km ⊂ Km+1 ⊂ Ω
∪ Km = Ω.
e
Se indichiamo con χKm la funzione caratteristica di Km , abbiamo
χKm f
⊂ Lpc (Ω)
e
> > > > >χKm f − f >
Lp
→0
per m → +∞
per il Teorema della Convergenza Dominata 3 .
7.1.3 Le distribuzioni Convinti della bontà dell’insieme C0∞ (Ω), lo dotiamo di una topologia su misura, che illustriamo definendo la convergenza che essa induce. Ricordiamo che il simbolo Dα =
∂ α1 ∂ αn , α1 ... n ∂x1 ∂xα 1
α = (α1 , ..., αn ) ,
indica una generica derivata di ordine |α| = α1 + ... + αn . Definizione 1.2. Siano {ϕk } ⊂ C0∞ (Ω) e ϕ ∈ C0∞ (Ω) . Si dice che ϕk → ϕ in C0∞ (Ω) se: 3
Appendice B.
7.1 Distribuzioni
417
1. esiste un compatto K ⊂ Ω che contiene i supporti di tutte le ϕk ; 2. Dα ϕk → Dα ϕ uniformemente in Ω, ∀α = (α1 , ..., αn ) . Si può mostrare che il limite così definito, se esiste, è unico. È entrato in uso il simbolo D (Ω) per indicare lo spazio C0∞ (Ω) dotato della nozione di convergenza appena descritta. Seguendo la discussione all’inizio del capitolo, spostiamo il nostro interesse sui funzionali lineari su D (Ω). Se L è uno di questi, usiamo il crochet L, ϕ per indicare l’azione di L su una funzione ϕ. Un funzionale lineare L : D (Ω) → R si dice continuo in D (Ω) quando L, ϕk → L, ϕ,
se ϕk → ϕ in D (Ω) .
Notiamo incidentalmente che, data la linearità di L, è sufficiente considerare ϕ = 0. Definizione 1.3. Una distribuzione in Ω è un funzionale lineare e continuo su D (Ω). L’insieme delle distribuzioni si indica con il simbolo D (Ω). Due distribuzioni F e G coincidono quando la loro azione su tutte le funzioni test è la stessa, cioè quando F, ϕ = G, ϕ,
∀ϕ ∈ D (Ω) .
Ad ogni u ∈ L2 (Ω) corrisponde il funzionale Iu la cui azione su ϕ è Iu , ϕ = uϕ dx.
(7.5)
Ω
Se ϕk → ϕ in D (Ω) è facile controllare che Iu , ϕk → Iu , ϕ e quindi Iu è una distribuzione in Ω, che, come abbiamo visto, possiamo identificare (ed indicare) con u. La nozione di distribuzione generalizza dunque quella di funzione (in L2 ) e la dualità ·, · tra D (Ω) e D (Ω) generalizza il prodotto scalare in L2 (Ω). Le stesse considerazioni si possono ripetere se u ∈ L1loc (Ω), in quanto l’integrale (7.5) ha perfettamente senso, essendo ϕ ∈ D (Ω). Quindi L1loc (Ω) ⊂ D (Ω). Se u : Ω → R è una funzione ma u ∈ / L1loc , u non può rappresentare una distribuzione, poiché per qualche ϕ ∈ D (Ω) l’integrale" nella (7.5) non è finito. Per esempio u (x) = 1/x non appartiene a L1loc (R) e Ω uϕ dx non esiste (nel senso di Lebesgue) non appena il supporto di ϕ contiene l’origine. D’altra parte esistono distribuzioni che non possono essere rappresentate da funzioni, come la delta di Dirac nel prossimo esempio.
418
7 Distribuzioni e spazi di Sobolev
Esempio 1.2 (Delta di Dirac). Il funzionale lineare δ : D (Rn ) → R, definito dalla relazione δ, ϕ = ϕ (0) è un elemento di D (Rn ), come facilmente si verifica, che prende il nome di delta di Dirac, nell’origine. Per indicarla si usa anche la notazione (impropria, ma comoda) δ (x). Analogamente il funzionale lineare δ y (ma si usa anche la notazione δ (x − y)) definito da δ y , ϕ = ϕ (y) si chiama delta di Dirac nel punto y. Non può esistere u ∈ L1loc (Rn ) che rappresenti la distribuzione δ. Infatti, se tale u esistesse si avrebbe per ogni ϕ ∈ D (Rn ), uϕ dx. ϕ (0) = Rn
" Ma questa relazione implica (dimostrarlo) che u ≡ 0 in Rn \ {0} e Rn u dx = 1. Contraddizione! In D (Ω) si può inserire facilmente una struttura di spazio vettoriale: se α, β sono scalari, reali o complessi, ϕ ∈ D (Ω) e L1 , L2 ∈ D (Ω), si definisce αL1 + βL2 ∈ D (Ω) mediante la formula αL1 + βL2 , ϕ = αL1 , ϕ + βL2 , ϕ. In D (Ω) introduciamo la seguente nozione di convergenza (debole): {Lk } converge a L in D (Ω) se Lk , ϕ → L, ϕ,
∀ϕ ∈ D (Ω) .
Ancora si può mostrare che il limite così definito, se esiste, è unico. Esempio 1.3. Abbiamo visto nella Sezione 2.8 che, se ΓD (x, t) è la soluzione fondamentale dell’equazione del calore ut − DΔu = 0 e ϕ ∈ D (Rn ), allora lim ΓD (y − x, t) ϕ (x) dx = ϕ (y) . t→0+
Rn
In termini di distribuzioni ciò significa che, per y fissato, ΓD (y−·, t) → δ y
in D (Rn ) , se t → 0+ .
Esempio 1.4. Se 1 ≤ p ≤ ∞, abbiamo le immersioni continue Lp (Ω) → L1loc (Ω) → D (Ω) . Ciò significa che, se uk → u in Lp (Ω) o in L1loc (Ω), allora4 uk → u anche in D (Ω) . 4
Per esempio, se ϕ ∈ D (Ω) , si ha, usando la disuguaglianza di Hőlder: (uk − u)ϕdx ≤ uk − u p L (Ω) ϕLq (Ω) Ω dove q = p/(p − 1). Se dunque uk − uLp (Ω) → 0, anche Ω (uk − u)ϕdx →0, da cui la convergenza in D (Ω) .
7.1 Distribuzioni
419
Per riconoscere o costruire distribuzioni, a volte si rivela comodo il seguente teorema di completezza: Microteorema 1.4. Sia {Fk } ⊂ D (Ω) tale che lim Fk , ϕ
k→∞
(7.6)
esiste finito, per ogni ϕ ∈ D (Ω) . Indichiamo con F (ϕ) il limite (7.6). Allora F ∈ D (Ω) e Fk → F in D (Ω). In particolare, se la serie (numerica)
∞ k=1
Fk , ϕ
∞ è convergente per ogni ϕ ∈ D (Ω), allora F ≡ k=1 Fk definisce una distribuzione in D (Ω). Un esempio importante è il seguente. Esempio 1.5 (Pettine di Dirac). Sia P > 0. Per ogni ϕ ∈ D (R), la serie numerica ∞ ∞
δ (x − kP) , ϕ = ϕ (kP) k=−∞
k=−∞
è convergente, poiché solo un numero finito di addendi è diverso da zero 5 . In base al teorema di completezza, la serie
∞ δ (x − kP) (7.7) combP (x) = k=−∞
definisce una distribuzione in D (R), che si chiama pettine di Dirac. Il nome è dovuto al fatto che essa modella un treno di impulsi equidistanziati, concentrati nei punti kP, k ∈ Z, a volte graficamente visualizzato nella pittoresca Figura 7.3.
Figura 7.3. Un treno di ... impulsi (P = 1)
5
Il supporto di ϕ è contenuto in un intervallo limitato, al quale appartiene solo un numero finito di punti kP.
420
7 Distribuzioni e spazi di Sobolev
• Supporto di una distribuzione. La delta di Dirac è concentrata in un punto. Tecnicamente si dice che il suo supporto coincide con un punto. Il supporto di una distribuzione si può definire in generale, nel modo seguente. Vogliamo caratterizzare il più piccolo insieme chiuso fuori dal quale una distribuzione F si annulla. Non si può procedere come nel caso di una funzione continua, definendo il supporto come la chiusura dell’insieme in cui essa è diversa da zero, poiché le distribuzioni non sono definite su sottoinsiemi di Rn ma sugli elementi di D (Ω). Procediamo per via indiretta: cominciamo col dire che una distribuzione F ∈ D (Ω) si annulla su un aperto A di Rn se F, ϕ = 0 per tutte le ϕ ∈ D (Ω) con supporto contenuto in A. Sia ora A l’unione di tutti gli aperti A sui quali F si annulla. Questo è un insieme aperto. Definiamo supp (F ) = Ω\A. Per esempio, supp(comb) = Z. Nota 1.4. Le distribuzioni sono definite, in generale, sugli elementi di D (Ω). Se però F ∈ D (Ω) con supporto compatto K ⊂ Ω allora si può estendere la definizione di F, v ad ogni v ∈ C ∞ (Ω), non necessariamente con supporto compatto. Infatti, sia ψ ∈ D (Ω), 0 ≤ ψ ≤ 1, tale che ψ ≡ 1 in un intorno di K (ricordare la Nota 1.3). Allora vψ ∈ D (Ω) e possiamo definire F, v = F, vψ . Occorre controllare che F, vϕ non dipende dalla scelta di ψ. Infatti, se ψ 1 ha le stesse proprietà di ψ, allora F, vψ − F, vψ 1 = F, v(ψ − ψ 1 ) = 0 poiché ψ − ψ 1 = 0 in un intorno di K (si veda il Problema 7.4).
7.2 Calcolo differenziale 7.2.1 Derivata nel senso delle distribuzioni Vogliamo estendere alle distribuzioni il calcolo differenziale. Naturalmente dobbiamo abbandonare l’idea di una definizione tradizionale, in quanto, già per funzioni in L1loc (Ω), che possono presentare discontinuità, le derivate nel senso classico non esistono. L’idea è allora di “scaricare” l’operazione di derivata sulle funzioni test, per le quali non ci sono problemi, in quanto differenziabili con continuità infinite volte. Lo strumento chiave è la formula di integrazione per parti, nota in dimensione maggiore di uno come formula di Gauss.
7.2 Calcolo differenziale
421
Cominciamo ad esaminare l’idea su una funzione u ∈ C 1 (Ω). Se ϕ è una funzione test, dalla formula di Gauss abbiamo, indicando con ν = (ν 1 , ..., ν n ) il versore normale esterno a ∂Ω, ϕ∂xi u dx = ϕu ν i dσ − u∂xi ϕ dx Ω ∂Ω Ω =− u∂xi ϕ dx Ω
essendo ϕ = 0 su ∂Ω. L’equazione ϕ ∂xi u dx = − u ∂xi ϕ dx Ω
Ω
corrisponde, in termini di distribuzioni, a scrivere ∂xi u, ϕ = −u, ∂xi ϕ.
(7.8)
La (7.8) mostra che l’azione di ∂xi u sulla funzione test ϕ equivale all’azione di u su −∂xi ϕ. D’altra parte, la (7.8) ha perfettamente senso se sostituiamo u con F ∈ D (Ω) e non è difficile controllare che il funzionale lineare ϕ → − F, ∂xi ϕ è continuo in D (Ω). Questo porta alla seguente fondamentale definizione. Definizione 2.1 Sia F ∈ D (Ω). La derivata ∂xi F è la distribuzione definita dalla formula ∂xi F, ϕ = −F, ∂xi ϕ,
∀ϕ ∈ D (Ω) .
Dalla (7.8) si vede che, se u ∈ C 1 (Ω), le sue derivate nel senso delle distribuzioni coincidono con quelle classiche. Per questo motivo manteniamo lo stesso simbolo nei due casi. La derivata di una distribuzione è sempre definita! Poiché, poi, la derivata di una distribuzione è ancora una distribuzione, segue subito il confortevole fatto che ogni distribuzione è derivabile infinite volte (ovviamente in D (Ω)). Si possono così definire le derivate di ordine superiore di qualunque F ∈ D (Ω). Per esempio, ∂xi xk F = ∂xi (∂xk F ) è definita dalla formula ∂xi xk F, ϕ = u, ∂xi xk ϕ.
(7.9)
Non solo. Poiché ϕ è regolare, allora ∂xi xk ϕ = ∂xk xi ϕ per cui la (7.9) implica ∂xi xk F = ∂xk xi F.
422
7 Distribuzioni e spazi di Sobolev
Come conseguenza, per ogni F ∈ D (Ω) possiamo scambiare l’ordine di derivazione senza alcuna restrizione. Esempio 2.1. Sia u (x) = H (x), la funzione di Heaviside. In D (R), si ha H = δ. Infatti, sia ϕ ∈ D (R) . Per definizione H , ϕ = −H, ϕ . D’altra parte H ∈ L1loc (R), per cui
H, ϕ =
R
H (x) ϕ (x) dx =
∞ 0
ϕ (x) dx = −ϕ (0)
e quindi H , ϕ = ϕ (0) = δ, ϕ da cui H = δ. Procedendo analogamente si dimostra che, se S (x) = sign(x) si ha S = 2δ
in D (R) .
Un altro aspetto dell’idilliaca relazione tra calcolo differenziale e distribuzioni è contenuto nel seguente teorema che esprime la continuità in D (Ω) di ogni derivata Dα . Microteorema 2.1. Se Fk → F in D (Ω) allora Dα Fk → Dα F in D (Ω) , per ogni multi-indice α. Dimostrazione. Fk → F in D (Ω) significa che Fk , ϕ → F, ϕ, ∀ϕ ∈ D (Ω). In particolare si ha Dα Fk , ϕ = (−1)|α| Fk , Dα ϕ −→ (−1)|α| F, D α ϕ = Dα F, ϕ, essendo Dα ϕ ∈ D (Ω). Come conseguenza, se
∞ k=1
∞ k=1
Fk = F in D (Ω), allora
Dα Fk = Dα F
in D (Ω) .
Dunque, la derivazione termine a termine è sempre permessa in D (Ω). Più complessa (perciò la evitiamo) è la dimostrazione del seguente teorema che esprime un fatto ben noto per funzioni di n variabili. Microteorema 2.2. Sia Ω un dominio in Rn . Se F ∈ D (Ω) e ∂xj F = 0 per ogni j = 1, ..., n, allora F è una funzione costante.
7.2 Calcolo differenziale
423
7.2.2 Gradiente, divergenza, rotore, Laplaciano Non c’è alcun problema nel definire distribuzioni a valori in Rn . Prendiamo come spazio di funzioni test D (Ω; Rn ), ossia l’insieme dei vettori ϕ = (ϕ1 , ..., ϕn ) le cui componenti appartengono a D (Ω). Una distribuzione in D (Ω; Rn ) è costituita da una n − upla di elementi di D (Ω). La dualità tra D (Ω; Rn ) e D (Ω; Rn ) è assegnata dalla formula F, ϕ =
n i=1
Fi ,ϕi .
(7.10)
• Gradiente. Data una distribuzione F ∈ D (Ω), Ω ⊂ Rn , il suo gradiente (distribuzionale) è semplicemente definito come il vettore ∇F = (∂x1 F, ∂x2 F, ..., ∂xn F ) che è un elemento di D (Ω; Rn ). Dalla (7.10) si ha, se ϕ = (ϕ1 , ..., ϕn ) ∈ D (Ω; Rn ), ∇F , ϕ =
n i=1
∂xi F, ϕi = −
n i=1
F, ∂xi ϕi = −F, divϕ
da cui: ∇F , ϕ = −F, divϕ.
(7.11)
• Divergenza. Se F ∈ D (Ω; Rn ) si definisce divF =
n i=1
∂xi Fi .
Chiaramente si ha divF ∈ D (Ω). Se ϕ ∈ D (Ω) n n
divF,ϕ = ∂xi Fi ,ϕ = − Fi ,∂xi ϕ = −F,∇ϕ 1=1
1=1
da cui divF,ϕ = −F,∇ϕ. • L’operatore di Laplace Δ = div∇ è definito in D (Ω) da ΔF = Se ϕ ∈ D (Ω), allora
n i=1
∂xi xi F.
ΔF ,ϕ = F ,Δϕ .
Usando le (7.11), (7.12), si ha: ΔF ,ϕ = F ,div∇ϕ = − ∇F ,∇ϕ = div∇F ,ϕ per cui Δ =div∇ anche in D (Ω).
(7.12)
424
7 Distribuzioni e spazi di Sobolev
3 Ω; R è un vettore in • Sia n = 3. Il rotore di un vettore F ∈ D 3 D Ω; R definito dalla formula rot F = (∂x2 F3 − ∂x3 F2 , ∂x3 F1 − ∂x1 F3 , ∂x1 F2 − ∂x2 F1 ) . Se se ϕ = (ϕ1 , ϕ2 , ϕ3 ) ∈ D Ω; R3 , è facile controllare che rot F, ϕ =
3
(rot F)i , ϕi = F,rot ϕ .
i=1
Esempio 2.9 ( importante). Consideriamo la soluzione fondamentale dell’equazione di Laplace in R3 1 1 . 4π |x| Notiamo che u ∈ L1loc R3 e quindi u ∈ D R3 . Vogliamo dimostrare che, in D R3 , −Δu = δ. (7.13) u (x) =
Osserviamo subito che, se Ω ⊂ Rn è una regione che non contiene l’origine, u è armonica in Ω, ovvero Δu = 0
in Ω in senso classico e quindi anche in D R3 . Sia dunque ϕ ∈ D R3 tale che 0 ∈ supp(ϕ). Si ha essendo u ∈ L1loc R3 : Δu,ϕ = u,Δϕ =
1 4π
R3
1 Δϕ (x) dx. |x|
(7.14)
Vorremmo a questo punto integrare per parti, per scaricare l’operatore di Laplace su 1/ |x|. La funzione integranda non è però continua nell’origine per cui dobbiamo procedere con cautela, escludendo dal dominio di integrazione una sferetta Br = Br (0), centrata nell’origine, e scrivendo 1 1 Δϕ (x) dx = lim Δϕ (x) dx (7.15) r→0 R3 |x| BR \Br |x| dove BR = BR (0) è una sfera che contiene il supporto di ϕ. Un’integrazione per parti nella corona sferica CR,r = BR \Br dà6 1 1 1 Δϕ (x) dx = ∂ν ϕ (x) dσ − · ∇ϕ (x) dx ∇ |x| r |x| BR \Br ∂Br CR,r 6
Ricordare che ϕ = 0 e ∇ϕ = 0 su ∂BR .
7.2 Calcolo differenziale
425
x dove ν = − |x| è il versore normale a ∂Br , che punta verso l’esterno della corona. Integrando per parti l’ultimo integrale, si ha:
∇
BR \Br
poiché Δ dunque: BR \Br
1 |x|
1 |x|
1 1 ϕ (x) dσ − ϕ (x) dx Δ |x| |x| ∂Br CR,r 1 = ∂ν ϕ (x) dσ |x| ∂Br
· ∇ϕ (x) dx =
∂ν
= 0 nella corona sferica CR,r . Dai calcoli fatti finora, si ha,
1 Δϕ (x) dx = |x|
1 ∂ν ϕ (x) dσ − r
∂Br
∂ν ∂Br
1 |x|
ϕ (x) dσ. (7.16)
Abbiamo: 1 1 ∂ ϕ (x) dσ ≤ |∂ν ϕ (x)| dσ ≤ 4πr max |∇ϕ| ν r r ∂Br R3 ∂Br e perciò
lim
r→0
∂Br
1 ∂ν ϕ (x) dσ = 0. r
Inoltre, essendo ∂ν
1 |x|
=∇
1 |x|
$ # x x x 1 · − = − 3 · − = 2 |x| |x| |x| |x|
possiamo scrivere
∂ν ∂Br
1 |x|
1 ϕ (x) dσ = 4π 4πr 2
ϕ (x) dσ → 4πϕ (0) . ∂Br
Da (7.16) abbiamo quindi lim
r→0
BR \Br
1 Δϕ (x) dx = −4πϕ (0) |x|
e infine, la (7.14) dà Δu,ϕ = −ϕ (0) = − δ, ϕ da cui −Δu = δ.
426
7 Distribuzioni e spazi di Sobolev
7.3 Moltiplicazione, composizione, divisione 7.3.1 Moltiplicazione. Regola di Leibniz Somma e moltiplicazione per uno scalare sono definite per le distribuzioni in modo ovvio. Occupiamoci della moltiplicazione tra distribuzioni. Le cose non sono così lisce come per la derivazione. Consideriamo, per esempio, il prodotto δ · δ = δ 2 in D (R). Come si può definire? Abbiamo visto che la derivazione risulta essere un’operazione continua in D (Ω) e certamente, per un principio di coerenza, vogliamo mantenere questa continuità nella costruzione delle altre operazioni in D (Ω). Di conseguenza, un’idea per definire δ 2 potrebbe essere la seguente: si prende una successione {uk } di funzioni che approssimano δ in D (R) , si calcola u2k , si definisce δ 2 = lim u2k
in D (R) .
k→∞
Poiché di successioni che approssimano δ in D (R) ce ne sono infinite (Problema 7.1), occorre che la definizione sia indipendente dalla successione approssimante. Vale a dire: per il calcolo di δ 2 dobbiamo essere autorizzati a scegliere una qualunque successione approssimante. Questa è un’illusione, poiché, se uk = kχ[0,1/k] si ha
in D (R)
uk → δ
ma, se ϕ ∈ D (R), usando il teorema del valor medio, si ha R
u2k ϕ = k 2
1/k
0
ϕ = kϕ (xk )
dove xk è un punto opportuno appartenente a [0, 1/k]. Se ϕ (0) = 0, si conclude che u2k ϕ → ∞, k→∞
R
e cioè che la successione u2k non converge in D (R). Il metodo, quindi, non funziona e non sembra che ce ne sia uno ragionevole per definire δ 2 . Si rinuncia pertanto a definire δ 2 come una distribuzione e, a maggior ragione, a definire il prodotto tra due distribuzioni generali. Restringiamo il campo d’azione. Se F ∈ D (Ω) e u ∈ C ∞ (Ω), si definisce il prodotto uF con la formula uF, ϕ = F, uϕ ,
∀ϕ ∈ D (Ω) ,
scaricando cioè il prodotto sulla funzione test. Ciò è possibile in quanto uϕ ∈ D (Ω) e, se ϕk → ϕ in D (Ω), è facile controllare che anche uϕk → uϕ in
7.3 Moltiplicazione, composizione, divisione
427
D (Ω); inoltre, essendo F ∈ D (Ω), uF, ϕk = F, uϕk → F, uϕ = uF, ϕ per cui uF è ben definito come elemento di D (Ω). Questa operazione risulta essere continua in D (Ω) . Esempio 3.1. Sia u ∈ C ∞ (R). Si ha uδ = u (0) δ. Infatti, se ϕ ∈ D (R), uδ, ϕ = δ, uϕ = u (0) ϕ (0) = u (0) δ, ϕ . In particolare, xδ = 0. • Regola di Leibniz: Se F ∈ D (Ω) e u ∈ C ∞ (Ω), vale la formula: ∂xi (uF ) = u ∂xi F + ∂xi u F . Basta controllare che le distribuzioni a primo e secondo membro hanno la stessa azione su una test ϕ ∈ D (Ω); si ha: ∂xi (uF ) , ϕ = − uF, ∂xi ϕ = − F, u∂xi ϕ mentre u ∂xi F + ∂xi u F, ϕ = ∂xi F, uϕ + F, ϕ∂xi u = − F, ∂xi (uϕ) + F, ϕ∂xi u = F, u∂xi ϕ da cui la formula. Esempio 3.2. Da xδ = 0, usando la formula di Leibniz, ricaviamo δ + xδ = 0. 7.3.2 Composizione Anche l’operazione di composizione richiede cautela. Per esempio, se F = δ e ψ (x) = x3 , c’è un modo naturale di definire F ◦ ψ ? Procedendo come prima, considerando la successione uk = kχ[0,1/k] , possiamo calcolare wk = uk ◦ ψ e poi il limite per k → ∞. Abbiamo, se ϕ ∈ D (R),
R
wk ϕ = k
R
χ[0,1/k] x3 ϕ (x) dx = k
k−1/3
0
ϕ (x) dx = k 2/3 ϕ (xk )
428
7 Distribuzioni e spazi di Sobolev
per un opportuno xk ∈ [0, 1/k]. Ancora, se ϕ (0) = 0, concludiamo che il limite è infinito e F ◦ ψ non ha significato. Occorre rinunciare alla composizione fre due distribuzioni generali. Per vedere ciò che si può fare, analizziamo la situazione per le funzioni. Consideriamo una trasformazione ψ : Ω → Ω, biunivoca, con ψ e ψ −1 di classe C ∞ . Sia F : Ω → R una funzione di classe C 1 . Posto w =F ◦ψ abbiamo, se ϕ ∈ D (Ω), usando il cambio di variabili y = ψ (x), w (x) ϕ (x) dx = F (ψ(x)) ϕ (x) dx Ω Ω = F (y) ϕ ψ −1 (y) det Jψ−1 (y) dy Ω
che si legge, in termini di distribuzioni: F ◦ ψ, ϕ = F, ϕ ◦ ψ −1 · det Jψ−1 .
(7.17)
Questa formula ha senso anche se F ∈ D (Ω) e definisce un elemento di D (Ω): Definizione 3.1. Se F ∈ D (Ω) e ψ : Ω → Ω è biunivoca, con ψ e ψ −1 di classe C ∞ , allora la formula (7.17) definisce la composizione F ◦ ψ come elemento di D (Ω). √ Si noti che ψ (x) = x3 è biunivoca, di classe C ∞ (R) ma ψ −1 (y) = 3 y che non è differenziabile in y = 0. Ci permetteremo abusi di notazione, scrivendo F (ψ (x)) anzichè F ◦ ψ. Per esempio, la scrittura (comoda e scorretta) δ (ax) indica la distribuzione δ ◦ ψ con ψ (x) = ax (scrittura scomoda e corretta). Esempio 3.3. In D (Rn ), si ha (controllare) δ (ax) =
1 n δ (x) . |a|
Possiamo estendere alle distribuzioni alcune nozioni proprie delle funzioni. Siano λ ∈ R, P ∈ Rn , P = 0. Una distribuzione F ∈ D (Rn ) si dice: • radiale, se F (Ax) = F (x) ,
per ogni matrice ortogonale A;
• omogenea di grado λ, se F (tx) = tλ F (x) ,
∀t > 0;
7.3 Moltiplicazione, composizione, divisione
•
429
pari, dispari, se rispettivamente, F (−x) = F (x) , F (−x) = −F (x) ;
•
periodica di periodo P, se F (x + P) = F (x) .
Per esempio, δ ∈ D (Rn ) è radiale, pari e omogenea di grado λ = −n; combP ∈ D (R) è periodica di periodo P. 7.3.3 Divisione La divisione nell’ambito delle distribuzioni è piuttosto complicata, anche restringendosi al caso F ∈ D (Ω) e u ∈ C ∞ (Ω). Dividere F per u significa trovare G ∈ D (Ω) tale che uG = F . Se u non si annulla mai, non ci sono problemi perché in questo caso u1 ∈ C ∞ (Ω) e ci si riporta al caso del prodotto; la risposta è, semplicemente, 1 G = F. u Se u si annulla la cosa si complica. Ci limiteremo qui a un caso particolare. Sia I ⊆ R un intervallo aperto e u ∈ C ∞ (I). Se z è uno zero di u, diciamo che z ha ordine finito m (z) se u si annulla in z insieme alle sue derivate fino all’ordine m (z) − 1, incluso, mentre la derivata di ordine m (z) non si annulla in z. Per esempio, u (x) = sin x − x ha l’unico zero z = 0, che è del terz’ordine. Microteorema 3.1. Supponiamo che gli zeri (anche infiniti) z1 , z2 , ... di u siano tutti isolati e di ordine m (z1 ), m (z2 ) , .... Allora l’equazione uG = 0 ha infinite soluzioni in D (I), assegnate dalla formula seguente:
m(zj )−1 cj,k δ (k) G= zj j
k=0
(7.18)
dove cj,k sono costanti arbitrarie e δ (k) zj è la derivata di ordine k di δ zj . La (7.18) è una conseguenza della formula seguente: xm δ (k) = 0
in D (I) ,
se 0 ≤ k < m.
Infatti, se ϕ ∈ D (R) e 0 ≤ k < m, @ A @ A k xm δ (k) , ϕ = δ (k) , xm ϕ = (−1) Dk [xm ϕ (x)]|x=0 = 0. Esempio 3.4. Le soluzioni in D (R) dell’equazione (sin x − x)G = 0 sono le distribuzioni della forma G = c1,0 δ + c1,1 δ + c1,2 δ ,
(c1,0 , c1,1 , c1,2 ∈ R).
430
7 Distribuzioni e spazi di Sobolev
7.3.4 Convoluzione Anche la convoluzione tra distribuzioni richiede qualche cautela. Vediamo perché. Se u, w ∈ L1 (Rn ) e ϕ ∈ D (Rn ) possiamo scrivere: u (x − y) w (y) dy,ϕ = u ∗ w, ϕ = Rn = u (x − y) w (y) dy ϕ(x) dx = (Teorema di Fubini) n n R R u (x) w (y) ϕ(x + y)dydx. = Rn
Rn
Ci chiediamo: l’ultima formula ha senso se u e v sono distribuzioni generiche? La risposta è negativa, in quanto, la funzione φ (x, y) = ϕ(x + y) non ha, in generale, supporto compatto 7 in Rn × Rn , anche se ϕ ha supporto compatto in Rn (a meno che ϕ ≡ 0). Occorre limitare ancora una volta il raggio d’azione. Diciamo subito che, con qualche sforzo, si può definire la convoluzione tra due distribuzioni quando almeno una delle due ha supporto compatto. In questa “brochure di sopravvivenza” ci limitiamo a definire la convoluzione tra una distribuzione T , a supporto compatto, ed una funzione u ∈ C ∞ (Rn ). Per x fissato, sia ψ x (y) = x − y cosicché u (x − y) = u ◦ ψ x . Se T ∈ L1 (Rn ), con supporto compatto, allora la definizione usuale di convoluzione è T (y) u (x − y) dy = T, u ◦ ψ x . (7.19) (T ∗ u) (x) = Rn
Poiché u ◦ ψ x ∈ C ∞ (Rn ), ricordando la Nota 7.2, il crochet a destra ha senso anche se T è una distribuzione a supporto compatto. Abbiamo perciò: Definizione 3.2. Siano T ∈ D (Rn ), con supporto compatto, e u ∈ ∞ C (Rn ). Allora la formula (T ∗ u) (x) = T, u ◦ ψ x
(7.20)
definisce una funzione di classe C ∞ (Rn ) che si chiama convoluzione tra T e u. Nei seguenti esempi, le formule sono dimostrate sotto le ipotesi del teorema precedente, ma valgono non appena la convoluzione sia ben definita. Esempio 3.5. (Importante). Sia u ∈ C ∞ (Rn ). Si ha (δ ∗ u) (x) = (u ∗ δ) (x) = δ, u (x − ·) = u (x) 7
Per esempio: se ϕ ∈ D (R) e supp(ϕ) = [a, b], allora suppϕ (x + y) in R2 è la striscia illimitata a ≤ x + y ≤ b.
7.3 Moltiplicazione, composizione, divisione
431
e cioè δ ∗ u = u.
(7.21)
La distribuzione di Dirac opera dunque come elemento unità rispetto al prodotto di convoluzione. La formula (7.21) vale in realtà per ogni distribuzione u, in quanto δ ha supporto compatto. In particolare: δ ∗ δ = δ. • Convoluzione e derivazione. Le operazioni di convoluzione e derivazione commutano tra loro. Precisamente, vale la formula ∂xj (T ∗ u) (z) = ∂xj T ∗ u = T ∗ ∂xj u. Infatti, per esempio
% & & % (∂xj T ∗ u) (z) = ∂xj T, u ◦ ψ z = − T, ∂xj (u ◦ ψ z ) % & = T, ∂xj u ◦ ψ z = T ∗ ∂xj u (z) .
In particolare: se T = H è la funzione di Heaviside e u ∈ D (R),
(H ∗ u) = (H ∗ u) = δ ∗ u = u. Warning. Per la convoluzione tra funzioni valgono la proprietà commutativa e associativa. Per la convoluzione tra distribuzioni vale la proprietà commutativa, ma non l’associativa. Consideriamo infatti il seguente caso: 1, δ , H ∈ D (R); si ha
1 ∗ δ = (1 ∗ δ) = 1 = 0 e quindi D’altra parte, e quindi
1 ∗ δ ∗ H = 0 ∗ H = 0. δ ∗ H = δ ∗ H = δ ∗ δ = δ 1 ∗ (δ ∗ H) = 1 ∗ δ = 1.
Il problema è che due tra le tre distribuzioni considerate hanno supporto non compatto. Se almeno due tra esse avessero supporto compatto allora si può dimostrare che il prodotto è anche associativo. Esempio 3.16. Sia u ∈ C (R), u = 0 fuori dall’intervallo [0, P]. Si ha
+∞ (u ∗ combP ) (x) = u ∗ δ (x − kP) k=−∞
+∞
+∞ u ∗ δ (x − kP) = u (x − kP) . = k=−∞
La funzione
+∞ k=−∞
k=−∞
u (x − kP)
è l’estensione periodica di u su R (è cioè periodica di periodo P e coincide con u in [0, P]).
432
7 Distribuzioni e spazi di Sobolev
7.4 Trasformata di Fourier 7.4.1 Distribuzioni temperate Per definire la trasformata di Fourier di una distribuzione F ∈ D (Rn ), lo spazio giusto di funzioni test non è D(Rn ). Infatti, l’idea è, come al solito, di “scaricare” la trasformata sulla funzione test, ma si presenta il problema che se ϕ ∈ D(Rn ), la sua trasformata di Fourier ϕ < (ξ) = e−ix·ξ ϕ (x) dx Rn
non può appartenere a D(Rn )8 . Occorre perciò allargare lo spazio delle funzioni test ad uno spazio che si comporti bene rispetto alla trasformata. Lo spazio giusto è quello delle funzioni che decrescono all’infinito più rapidamente di qualunque potenza negativa di |x|, che ovviamente contiene D (Rn ). Conviene poi considerare funzioni e distribuzioni a valori complessi. Definizione 4.1. Indichiamo con S (Rn ) lo spazio delle funzioni v ∈ C (Rn ) a decrescenza rapida all’infinito, tali cioè che −m Dα v (x) = o |x| , |x| → ∞, ∞
per ogni m ∈ N e ogni multi-indice α. 2
2
2
Esempio 4.1. Siano v1 (x) = e−|x| e v2 (x) = e−|x| sin(e|x| ). Allora / S (Rn ). v1 ∈ S (Rn ) mentre v2 ∈ Come abbiamo fatto per D(Rn ), dotiamo S (Rn ) di una convergenza su misura. Se β = (β 1 , ..., β n ) è un multiindice si pone β
β
xβ = x1 1 · · · x1 n . Definizione 4.2. Siano {vk } ⊂ S (Rn ) e v ∈ S (Rn ). Si dice che vk → v 8
in S (Rn )
Per esempio, supponiamo che il supporto di ϕ ∈ D (R) sia contenuto nell’intervallo (−a, a) e che ϕ non sia identicamente nulla. Si può scrivere a a ∞ (−ixξ)n ϕ (ξ) = e−ixξ ϕ (x) dx = ϕ (x) dx n=0 n! −a −a a n ∞ (−iξ) = xn ϕ (x) dx. n=0 n! −a Essendo
a −a
xn ϕ (x) dx ≤ 2 max |ϕ| an+1 ,
si vede che ϕ (ξ) è una funzione analitica della variabile ξ in tutto il piano complesso e perciò non può annullarsi su alcun intervallo dell’asse reale, a meno che non sia identicamente nulla. Ma in tal caso si avrebbe anche ϕ ≡ 0.
7.4 Trasformata di Fourier
433
se qualunque siano i multi-indici α, β, xβ Dα vk → xβ Dα v,
uniformemente in Rn .
Nota 4.1. Se il limite esiste è unico. Inoltre, se {vk } ⊂ D (Rn ) e vk → v in D (Rn ) allora si ha anche vk → v
in S (Rn )
poiché, per funzioni a supporto contenuto in un compatto comune, la moltiplicazione per xβ non ha nessuna influenza sulla convergenza. Notiamo invece che se vk → v in S (Rn ) non è detto che vk → v in D (Rn ) (perché?). Le distribuzioni per le quali è definita la trasformata di Fourier sono gli elementi di D (Rn ) che risultano continui anche rispetto alla convergenza in S (Rn ). Definizione 4.3. T ∈ D (Rn ) si dice temperata se T, vk → 0 per ogni {vk } ⊂ D (Rn ) tale che vk → 0 in S (Rn ). L’insieme delle distribuzioni temperate si indica con S (Rn ) . Vogliamo definire l’azione di una distribuzione temperata su tutti gli elementi di S (Rn ), non solo su D (Rn ). A questo scopo, osserviamo che D (Rn ) è denso in S (Rn ). Infatti, data v ∈ S (Rn ), si può sempre trovare una successione di funzioni {vk } ⊂ D (Rn ) tale che vk → v in S (Rn ). Per esempio, sia ρ = ρ (s), s ∈ R+ , di classe C ∞ (R), uguale a 1 nell’intervallo [0, 1] e nulla per s ≥ 2 (Figura 7.4). La funzione ρ (|x| /k) è allora uguale ad 1 nella sfera {|x| < k} ed è nulla fuori dalla sfera {|x| < 2k}. Con un pò di pazienza, è facile convincersi che la successione vk (x) = v (x) ρ (|x| /k)
Figura 7.4. Una funzione regolare e decrescente, uguale a 1 in [0, 1] e nulla per s≥2
434
7 Distribuzioni e spazi di Sobolev
è contenuta in D (Rn ) e converge a v in S (Rn ). Di conseguenza, D (Rn ) è denso in S (Rn ). Se ora v ∈ S (Rn ) e T ∈ S (Rn ) , si definisce T, v = lim T, vk k→∞
dove {vk } ⊂ D (Rn ) , vk → v in S (Rn ). Si può dimostrare che il limite esiste finito ed è indipendente dalla successione approssimante {vk } . Dunque, una distribuzione temperata è un funzionale lineare e continuo in S (Rn ). Esempi 4.2. Le seguenti distribuzioni sono temperate (lasciamo la verifica come esercizio). a. Ogni polinomio. b. Ogni distribuzione a supporto compatto. In particolare, la δ di Dirac e ogni sua derivata di qualunque ordine sono distribuzioni temperate. c. Lp (Rn ) ⊂ S (Rn ) per ogni p, 1 ≤ p ≤ ∞. Abbiamo inoltre: S (Rn ) → Lp (Rn ) → S (Rn ) . Invece: d. ex ∈ / S (R) (perché?). Anche in S (Rn ) abbiamo un teorema di completezza, utile a riconoscere o a costruire distribuzioni temperate. Diciamo che una successione {Tk } ⊂ S (Rn ) converge a T in S (Rn ) se Tk , v → T, v ,
∀v ∈ S (Rn ) .
Teorema 4.1. Sia {Tk } ⊂ S (Rn ) tale che lim Tk , v esiste finito
∀v ∈ S (Rn ) .
k→∞
Allora il limite definisce un elemento T in S (Rn ) e Tk converge a T in S (Rn ) . Esempio 4.9. Il pettine di Dirac comb(x) è una distribuzione temperata. Infatti, se v ∈ S(R), si ha comb (x) , v =
∞ k=−∞
v (k) −m
e la serie è convergente in quanto v (k) → 0 più rapidamente di |k| per ogni intero m > 0. In base al Teorema 4.1, comb(x) ∈ S (R). In generale, ogni distribuzione periodica è temperata. Nota 4.2. Convoluzione. Se T ∈ S (Rn ) e v ∈ S(Rn ) si può definire la convoluzione con la formula (7.20); si ottiene ancora una funzione di classe C ∞ (Rn ), appartenente anche a S (Rn ).
7.4 Trasformata di Fourier
435
7.4.2 Trasformata di Fourier in S (Rn ) Se u ∈ L1 (Rn ) la sua trasformata di Fourier è definita dalla formula u < (ξ) = F [u] (ξ) =
e−ix·ξ u (x) dx. Rn
Ricordiamo che u < ∈ C (R) e (Teorema di Riemann-Lebesgue) u < (ξ) → 0 se |ξ| → +∞. In generale comunque, anche se u ha supporto compatto, non è detto che u < appartenga ad L1 (Rn ). Per esempio, la trasformata della “porta” pa (x) = χ[−a,a] (x) è la funzione p< (ξ) = 2
sin (aξ) ξ
che non appartiene9 a L1 (R). Quando anche u < ∈ L1 (Rn ), si può ricostruire u da u < mediante la trasformazione inversa. Teorema 4.2 (di inversione). Siano u ∈ L1 (Rn ), u < ∈ L1 (Rn ). Allora vale la formula di inversione 1 eix·ξ u <(ξ) dξ = F −1 [< u] (x) . u (x) = n (2π) Rn In particolare il teorema di inversione vale per le funzioni di S(Rn ) in quanto, se u ∈ S(Rn ) allora (esercizio) anche u < ∈ S(Rn ). Si può poi mostrare che uk → u
in S(Rn )
u
in S(Rn )
se e solo
e cioè che F,F −1 : S(Rn ) → S(Rn ) sono operatori continui 10 . 9 10
Appendice B. Facciamo la dimostrazione per F nel caso n = 1. Si ha (si veda più avanti la proprietà F 2 ): ξ m Dr u k − ξ m Dr u L∞ (R) = F [Dm xr (uk − u)]L∞ (R) ≤ wk L1 (R) dove wk = Dm xr (uk − u). Sia ora p (x) = 1 + x2 . Si ha, moltiplicando e dividendo per p (x) : 1 wk L1 (R) ≤ pwk L∞ (R) p 1 L (R)
a cui la tesi poiché pwk L∞ (R) → 0.
436
7 Distribuzioni e spazi di Sobolev
Per definire la trasformata di Fourier in S (Rn ) usiamo la solita tecnica di scaricare tutto sulle funzioni test, che ora sono gli elementi di S(Rn ). Osserviamo preliminarmente che, se u, v ∈ S(Rn ), e−ix·ξ u(x)dx,v = e−ix·ξ u(x)dx v (ξ) dξ < u, v = n Rn Rn R = e−ix·ξ v (ξ) dξ u(x)dx = u, v< Rn
Rn
e quindi vale la seguente identità di Parseval debole: < u, v = u, v< .
(7.22)
Il punto è che l’ultimo crochet ha senso anche se u = T ∈ S (Rn ) e definisce una distribuzione temperata. Lemma 4.3 Sia T ∈ S (Rn ). Il funzionale lineare v → T, v< ,
∀v ∈ S(Rn )
definisce una distribuzione temperata. Dimostrazione. Sia vk → v in D(Rn ) allora si ha anche vk → v in S(Rn ) e, per quanto appena visto, v
k→∞
e quindi v → T, v< definisce una distribuzione. Se vk → 0 in S(Rn ), allora v
∀v ∈ S(Rn ).
Come si vede, secondo tradizione, la trasformata è stata “scaricata” sulla test in S(Rn ). Di conseguenza, continuano a valere le proprietà della trasformata di una funzione. Vediamone alcune. Siano T ∈ S (Rn ) e v ∈ S(Rn ). F1. Traslazione. Se a ∈ Rn , F [T (x − a)] = e−ia·ξ T< e F eia·x T = T< (ξ − a) . Infatti, (v = v (ξ)): F [T (x − a)] , v = T (x − a) , v< = T, v< (x + a) % & = T, F e−ia·ξ v = T<, e−ia·ξ v = e−ia·ξ T<, v.
7.4 Trasformata di Fourier
F2. Trasformata e derivazione. a) F ∂xj T = iξ j T<. Infatti:
e
437
b) F [xj T ] = i∂ξj T<.
@ A & % & % F ∂xj T , v = ∂xj T, v< = − T, ∂ξj v< = T, F [ixj v] = iξ j T<, v.
Per la seconda formula, abbiano: F [xj T ] , v = xj T, v< = T, xj v< @ A = T, −iF[∂ξj v] = −iT<, ∂ξj v = i∂ξj T<, v. F3. Cambio di scala. 1 < F [T (hx)] = nT |h|
ξ h
(h ∈ R,h = 0).
Si ha: F [T (hx)] , v = T (hx) , v< = T,
1 x < nv h |h|
= T, F [v (hξ)] = T<, v (hξ) =
1 < nT |h|
ξ , v. h
In particolare, scegliendo h = −1, si deduce che, se T è pari o dispari, T< è pari o dispari, rispettivamente. F4. Formula di inversione. La trasformazione inversa F −1 è definita in modo perfettamente analogo dalla formula & % & % −1 F [T ] , v = T, F −1 [v] . Vale la formula di inversione F −1 F [T ] = T la cui verifica è immediata. F5. Trasformata di una convoluzione. Se v ∈ S(Rn ) e T ∈ S (Rn ), F [v ∗ T ] = v< · T<. Omettiamo la dimostrazione. Esempio 4.10. In S (Rn ) si ha: < δ = 1,
n < 1 = (2π) δ.
438
7 Distribuzioni e spazi di Sobolev
Infatti, < δ, v = δ, v< = Per la seconda formula: < 1, v = 1, v< = n
Rn
v (x) dx = 1, v .
n
Rn
v< (ξ) dξ = (2π) v (0)
= (2π) δ, v . 7.4.3 Formula di sommazione di Poisson. Trasformata del pettine di Dirac Come applicazione della teoria svolta, dimostriamo due formule, particolarmente importanti in teoria dei segnali. Teorema 4.4 (Formula di sommazione di Poisson). Per ogni v ∈ S (R) vale la formula:
+∞
+∞ v< (k) = 2π v (2πk) . (7.23) k=−∞
k=−∞
Dimostrazione. Consideriamo la funzione
+∞ ϕ (x) = v (x + 2πk) . k=−∞
Essendo v ∈ S (R) la serie converge uniformemente in ogni intervallo compatto di R e perciò definisce una funzione di classe C ∞ (R) e periodica di periodo 2π:
+∞
+∞ ϕ (x + 2π) = v (x + 2π + 2πk) = v (x + 2πk) = ϕ (x) . k=−∞
k=−∞
Calcoliamo l’ennesimo coefficiente di Fourier di ϕ. Si trova: 1 ϕ
2π
2π
+∞ 1 ϕ (t) dt = e−int v (t + 2πk) dt k=−∞ 2π 0 2π e−int v (t + 2πk) dt
−int
e 0
1 +∞ k=−∞ 0 2π 2π(k+1) 1 +∞ 2π
k=−∞
e−int v (t) dt =
2πk
1 2π
e−int v (t) dt =
R
1 v< (n) . 2π
Si può allora scrivere ϕ (x) =
+∞ k=−∞
v (x + 2πk) =
che per x = 0 dà la (7.23).
+∞ n=−∞
ϕ < n einx =
1 +∞ v< (n) einx n=−∞ 2π
7.4 Trasformata di Fourier
439
Corollario 4.5. Il pettine di Dirac è invariante rispetto alla trasformata di Fourier. Precisamente, si ha: F [comb1 ] =
1 comb2π . 2π
Dimostrazione. Se v ∈ S (R) si ha, essendo comb(x) =
comb2π , v =
+∞ k=−∞
+∞
+∞
F [comb1 ] , v = comb1 , v< = mentre
(7.24)
k=−∞
k=−∞
δ (x − k),
v< (k)
v (2πk) .
Dalla (7.23) si ricava subito la (7.24). 7.4.4 Trasformata di Fourier in L2 (Rn )
Poiché L2 (Rn ) ⊂ S (Rn ), per ogni funzione di L2 (Rn ) è ben definita la trasformata di Fourier. Vale il seguente teorema, che enunciamo per funzioni complesse (la barra sta per coniugato). Teorema 4.4 (Di Plancherel). u ∈ L2 (Rn ) se e solo se u < ∈ L2 (Rn ). 2 n Inoltre, se u, v ∈ L (R ) allora vale la seguente identità di Parseval forte n u < · v< = (2π) u·v. (7.25) Rn
In particolare
Rn
2
2
< uL2 (Rn ) = (2π)n uL2 (Rn ) .
(7.26)
La (7.26) indica un fatto importante: la trasformata di Fourier è un’isometria n in L2 (Rn ) (modulo il fattore (2π) ). Dimostrazione. Poiché S (Rn ) è denso in L2 (Rn ), basta dimostrare la (7.25) per u, v ∈ S (Rn ) . Tutto il resto segue facilmente. Sia w = v<. Abbiamo, dalla (7.22): Rn
u <·w =
Rn
u · w. <
D’altra parte si controlla facilmente che n n e−ix·y v< (y) dy = (2π) F −1 [< v ] (x) = (2π) v (x) w < (x) = Rn
da cui la (7.25). Esempio 4.12. Calcoliamo R
sin x x
2 dx.
440
7 Distribuzioni e spazi di Sobolev
Sappiamo che la trasformata di Fourier di χ[−1,1] è 2 sin ξ/ξ che appartiene a L2 (R). Dalla (7.26) abbiamo 4 R
sin ξ ξ
2
dξ = 2π R
da cui
R
sin x x
2 χ[−1,1] (x)
dx = 4π
2 dx = π.
7.5 Spazi di Sobolev Gli spazi di Sobolev costituiscono uno degli ambienti funzionali adatti al trattamento dei problemi al contorno per operatori differenziali. Noi ci limiteremo agli spazi di Sobolev Hilbertiani che useremo in seguito, sviluppando gli elementi teorici strettamente necessari. 11 7.5.1 Una costruzione astratta Il seguente teorema astratto permette di generare spazi di Sobolev in modo flessibile. Gli ingredienti della costruzione sono: •
lo spazio D (Ω; Rn ), in particolare, per n = 1, D (Ω) ,
• due spazi di Hilbert H e Z, con Z → D (Ω; Rn ) per qualche n ≥ 1. In particolare, vk → v in Z
implica
vk → v in D (Ω; Rn ) ,
(7.27)
• un operatore L lineare e continuo da H in D (Ω; Rn ) (tipicamente un gradiente o una divergenza,...). Con queste ipotesi, abbiamo: Teorema 5.1. Definiamo W = {v ∈ H : Lv ∈ Z} e (u, v)W = (u, v)H + (Lu, Lv)Z . 11
(7.28)
Ometteremo le dimostrazioni più tecniche, che si possono trovare, per esempio nei classici libri Adams, 1975, o Mazja, 1985.
7.5 Spazi di Sobolev
441
Allora W è uno spazio di Hilbert con prodotto interno dato dalla (7.28). L’immersione di W in H è continua e la restrizione di L a W è continua da W in Z. Dimostrazione. È facile verificare che (7.28) ha effettivamente le proprietà di un prodotto interno, con norma indotta 2
2
2
uW = uH + LuZ e quindi W è pre-Hilbertiano. Occorre verificare la completezza. Sia {vk } una successione di Cauchy in W. Dobbiamo mostrare che esiste v ∈ H tale che vk → v in H
Lvk → Lv in Z.
e
Osserviamo che {vk } è di Cauchy in H e {Lvk } è di Cauchy in Z. Esistono quindi v ∈ H e z ∈ Z tali che vk → v
in H
e
Lvk → z
in Z.
Per la continuità di L e per la (7.27), si deduce che Lvk → Lv in D (Ω; Rn )
e
Lvk → z in D (Ω; Rn ) .
Ma il limite di una successione in D (Ω; Rn ), se esiste, è unico, perciò Lv = z. Dunque Lvk → Lv in Z, per cui vk → v in W e W è di Hilbert. La continuità dell’immersione di W in H segue da uH ≤ uW mentre la continuità di L|W : W → Z segue da LuZ ≤ uW . La dimostrazione è completa. Nota 5.1. La norma indotta dal prodotto scalare (7.28) è 2 2 uW = uH + LuZ e si chiama norma del grafico di L. 7.5.2 Lo spazio H 1 (Ω) Sia Ω un dominio in Rn . Nel Teorema 5.1 scegliamo H = L2 (Ω),
Z = L2 (Ω; Rn ) → D (Ω; Rn )
442
7 Distribuzioni e spazi di Sobolev
e L : H → D (Ω; Rn ) dato da
L=∇
dove il gradiente è da considerarsi nel senso delle distribuzioni. Allora W è lo spazio di Sobolev delle funzioni in L2 (Ω) le cui derivate prime , nel senso delle distribuzioni, sono funzioni in L2 (Ω). Per questo spazio si usa il simbolo12 H 1 (Ω). In formule: H 1 (Ω) = v ∈ L2 (Ω) : ∇v ∈ L2 (Ω; Rn ) . In altri termini, se v ∈ H 1 (Ω), ogni derivata parziale ∂xi v non è una qualsiasi distribuzione ma è ancora una funzione vi ∈ L2 (Ω). Questo vuol dire che ∂xi v, ϕ = − (v, ∂xi ϕ)0 = (vi , ϕ)0 ,
∀ϕ ∈ D (Ω)
e, più esplicitamente, che v (x) ∂xi ϕ (x) dx = − vi (x) ϕ (x) dx, Ω
∀ϕ ∈ D (Ω) .
Ω
In molte situazioni concrete, l’integrale di Dirichlet 2 |∇v| Ω
rappresenta un’energia. Le funzioni di H 1 (Ω) sono dunque associate a configurazioni ad energia finita. Da qui l’importanza e l’adeguatezza di questo spazio. Dal Teorema 5.1 e dal fatto che L2 (Ω) è separabile13 , abbiamo: Microteorema 5.2. H 1 (Ω) è uno spazio di Hilbert separabile, immerso con continuità in L2 (Ω). Il gradiente è un operatore continuo da H 1 (Ω) in L2 (Ω; Rn ). Prodotto interno e norma in H 1 (Ω) sono dati, rispettivamente, da uv dx + ∇u · ∇v dx (u, v)H 1 (Ω) = Ω
e 2 uH 1 (Ω) 12 13
=
Ω
2
Ω
2
|∇u| dx.
u dx + Ω
Anche H 1,2 (Ω) o W 1,2 (Ω) sono usati. Infatti, H 1 (Ω) si può identificare con un sottospazio di L2 (Ω) × L2 (Ω) × ... × L2 (Ω) = L2 Ω;Rn+1 che è separabile, considerando i suoi elementi come vettori del tipo u, ux1 , ..., uxn .
7.5 Spazi di Sobolev
443
Se non c’è rischio di confusione, useremo i simboli (u, v)1,2
invece di
(u, v)H 1 (Ω)
e14 u1,2
invece di uH 1 (Ω) . Esempio 5.1. Sia Ω = B1 (0) = x ∈R2 : |x| < 1 e a
u (x) = (− log |x|) ,
x = 0.
Si ha, utilizzando le coordinate polari:
u2 = 2π
1
(− log r)
2a
0
B1 (0)
rdr < ∞
per ogni a ∈ R
e quindi u ∈ L2 (B1 (0)) per ogni a ∈ R. Si ha, poi, −2
uxi = −axi |x| e quindi
(− log |x|)
a−1
, i = 1, 2,
a−1 −1 |∇u| = a (− log |x|) |x| .
Utilizzando ancora le coordinate polari, troviamo: B1 (0)
2
|∇u| = 2πa
2
0
1
|log r|
2a−2 −1
r
dr.
L’integrale è finito solo se 2−2a > 1 ossia se a < 1/2. Non è difficile controllare che le derivate appena calcolate coincidono con le derivate di u nel senso delle distribuzioni e quindi u ∈ H 1 (B1 (0)) solo se a < 1/2. Sottolineiamo che se a > 0, u è illimitata in un intorno dell’origine. Abbiamo affermato che gli spazi di Sobolev sono un ambiente adatto a risolvere equazioni a derivate parziali. Occorre a questo punto fare alcune precisazioni. Quando si scrive f ∈ L2 (Ω), possiamo certamente pensare ad una singola funzione f : Ω → R (o C) a quadrato sommabile secondo Lebesgue. Se però vogliamo sfruttare la struttura di spazio di Hilbert di L2 (Ω), occorre identificare due funzioni quando esse siano uguali a meno di insiemi di misura zero. Adottando questo punto di vista, un singolo elemento di L2 (Ω) è, in realtà, una classe di equivalenza di cui f è un rappresentante che serve ad identificarla. Ciò si porta dietro una sgradevole conseguenza: non ha senso parlare di valore di una funzione di L2 (Ω) in un punto! 14
I numeri 1, 2 nei simboli ·1,2 e (·, ·)1,2 significano “derivate prime in L2 ”.
444
7 Distribuzioni e spazi di Sobolev
Gli stessi discorsi valgono naturalmente anche per le “funzioni” di H 1 (Ω), poiché H 1 (Ω) ⊂ L2 (Ω). Ma se trattiamo un problema di equazioni a derivate parziali, certamente vorremmo poter parlare di valore della soluzione in un punto! Forse ancor più importante è il problema delle tracce sul bordo di un dominio. Per traccia di una funzione sul bordo di un dominio Ω si intende la sua restrizione a ∂Ω. Che significato si può attribuire a una condizione di Dirichlet o peggio, di Neumann, che richiedono di poter valutare la restrizione di una funzione o della sua derivata su ∂Ω, che ha misura nulla? Si potrebbe obiettare che, in fondo, si lavora sempre con un rappresentante e che nel calcolo numerico della soluzione, le operazioni di discretizzazione coinvolgono sempre un numero finito di punti, rendendo invisibile la distinzione tra funzioni continue, in L2 (Ω) o in H 1 (Ω). Che bisogno c’è dunque di affannarsi a dare un significato preciso alla traccia di una funzione in H 1 (Ω)? Una ragione viene proprio dall’Analisi Numerica, in particolare dalla necessità di controllo degli errori di approssimazione e dalle stime di stabilità della corrispondenza dati-soluzione. Chiediamoci ad esempio: se un dato di Dirichlet è noto a meno di un errore dell’ordine di ε in media quadratica (cioè in norma L2 (∂Ω)) si può stimare o controllare in termini di ε l’errore sulla corrispondente soluzione? Se ci si accontenta della norma in L2 (Ω) (o anche della norma L∞ (Ω)) all’interno del dominio, la stima è possibile; se invece, come quasi sempre accade, è richiesta una stima “dell’energia” in tutto il dominio (ossia la norma L2 (Ω; Rn ) del gradiente della soluzione), la norma L2 (∂Ω) del dato al bordo non è sufficiente. Quali informazioni aggiuntive occorrono per ripristinare il controllo? La risposta è contenuta proprio nella caratterizzazione della nozione di traccia della Sezione 7.7, che utilizzeremo ampiamente nel Capitolo 8. Risolveremo il problema della traccia di una funzione in H 1 (Ω) mediante approssimazione con funzioni regolari, per le quali questa nozione è ben definita. Vi sono però due casi in cui il problema viene risolto più semplicemente; vale la pena di segnalarli subito: sono il caso unidimensionale e il caso delle funzioni a traccia nulla. Cominciamo col primo caso.
Caratterizzazione di H 1 (a, b) Come mostrato nell’Esempio 5.1, una funzione in H 1 (Ω) può essere illimitata. Questo non accade in una dimensione. Infatti, il fatto di possedere derivate in L2 (Ω) conferisce agli elementi di H 1 (Ω) ulteriori proprietà di regolarità. Per esempio, gli elementi di H 1 (a, b) sono funzioni continue in [a, b]. In realtà, per esprimerci con precisione avremmo dovuto scrivere: all’interno di ogni classe di equivalenza esiste un rappresentante continuo. Questa locuzione è un pò scomoda per cui, con abuso di linguaggio, diremo semplicemente che una funzione di H 1 (Ω) possiede una certà proprietà, sottointendendo la scelta del rappresentante “giusto”.
7.5 Spazi di Sobolev
445
Microteorema 5.3. Sia u ∈ L2 (a, b) . Allora u ∈ H 1 (a, b) se e solo se u è continua in [a, b] ed esiste w ∈ L2 (a, b) tale che
y
∀x, y ∈ [a, b].
w (s) ds,
u(y) = u(x) +
(7.29)
x
Inoltre u = w (sia nel senso delle distribuzioni che quasi ovunque ). Dimostrazione. Supponiamo che u sia continua in [a, b] e che valga la formula (7.29). Scegliamo x = a. A meno di traslazioni del grafico di u, possiamo ritenere che u (a) = 0, perciò
y
u(y) =
∀y ∈ [a, b].
w (s) ds, a
Sia ora v ∈ D (a, b). Si ha u , v = − u, v = −
b
u (s) v (s) ds = −
a
b
a
s
w (t) dt v (s) ds =
a
(scambiando l’ordine di integrazione)
b
*
=−
b
+
b
v (t) w (t) dt = w, v .
v (s) ds w (t) dt = a
t
a
Perciò u = w in D (a, b) e quindi u ∈ H 1 (a, b). Viceversa, sia u ∈ H 1 (a, b). Poniamo
x
v (x) =
u (s) ds,
x ∈ [a, b].
(7.30)
a
La funzione v è continua in [a, b] e da quanto appena mostrato si ha v = u in D (a, b). Dal Microteorema 2.2 segue che u = v + C, C ∈ R per cui u è continua in [a, b]. Dalla (7.30) si ha poi,
y
u(y) − u (x) = v(y) − v (x) =
u (s) ds
x
che è la (7.29). Infine, dal Teorema di Differenziazione di Lebesgue (Appendice B) si deduce che u = w anche q.o. in (a, b). Essendo u ∈ H 1 (a, b) continua in [a, b], il valore u (x0 ) di u in un punto qualsiasi x0 ∈ [a, b] ha perfettamente senso ed in particolare non vi sono problemi nel definire la traccia di u agli estremi dell’intervallo e cioè i valori u (a) e u (b).
446
7 Distribuzioni e spazi di Sobolev
7.5.3 Lo spazio H01 (Ω) Sia Ω ⊆ Rn . Caratterizziamo le funzioni a traccia nulla su ∂Ω. Definizione 5.1 Indichiamo con H01 (Ω) la chiusura di D (Ω) in H 1 (Ω). Più esplicitamente, u ∈ H01 (Ω) se e solo se esiste una successione {ϕk } ⊂ D (Ω) tale che ϕk → u in H 1 (Ω), cioè tale che ϕk − u0 → 0 e ∇ϕk − ∇u0 → 0 per k → ∞. Poiché le funzioni di D (Ω) hanno traccia nulla su ∂Ω, ogni u ∈ H01 (Ω) “eredita per densità” questa proprietà: le funzioni di H01 (Ω) sono precisamente le funzioni di H 1 (Ω) alle quali attribuiamo traccia nulla su ∂Ω. Evidentemente, H01 (Ω) è un sottospazio di Hilbert di H 1 (Ω). Per gli elementi di H01 (Ω) vale la disuguaglianza seguente dovuta a Poincaré, particolarmente utile nella soluzione di problemi al contorno per equazioni a derivate parziali. Teorema 5.4. Sia Ω ⊂ Rn un dominio limitato. Esiste una costante positiva CP (costante di Poincaré) che dipende solo da n e da Ω, tale che, per ogni u ∈ H01 (Ω), (7.31) u0 ≤ CP ∇u0 . Dimostrazione. Usiamo un metodo tipico per dimostrare disuguaglianze in H01 (Ω). Supponiamo di aver dimostrato la formula (7.31) per ogni v ∈ D (Ω). Per estenderla a u ∈ H01 (Ω), scegliamo una successione {vk } ⊂ D (Ω) che converge a u in H01 (Ω) per k → ∞, e cioè vk − u0 → 0,
∇vk − ∇u0 → 0.
vk 0 → u0 ,
∇vk 0 → ∇u0 .
In particolare Poiché la (7.31) è vera per le vk , si ha vk 0 ≤ CP ∇vk 0 . Passando al limite per k → ∞ si ottiene la (7.31) per u. Basta dunque dimostrare la (7.31) per v ∈ D (Ω). A tale scopo osserviamo che, dal teorema della divergenza, essendo v = 0 su ∂Ω, si ha div v 2 x dx = 0. (7.32) Ω
Poiché
div v 2 x = 2v∇v · x + nv 2
dalla (7.32) deduciamo
v 2 dx = − Ω
2 n
v∇v · x dx. Ω
7.5 Spazi di Sobolev
447
Poiché Ω è limitato, si ha max |x| = M < ∞ e quindi, per la disuguaglianza x∈Ω
di Schwarz,
1/2 1/2 2M 2 2 2 v dx ≤ v∇v · x dx ≤ v dx |∇v| dx . n Ω n Ω Ω Ω 2
Dopo aver semplificato per
" Ω
1/2 v 2 dx otteniamo
v0 ≤ CP ∇v0
con CP = 2M/n.
Il valore CP = 2M/n non costituisce, in generale, la migliore costante possibile nella (7.31). Infatti, quest’ultima è data da λ1 = min ∇v0 : v ∈ H01 (Ω) , v0 = 1 . Come vedremo nel Paragrafo 8.8.3, λ1 coincide col primo autovalore di Dirichlet per l’operatore di Laplace. La (7.31) implica che in H01 (Ω) la norma u1,2 è equivalente a ∇u0 . Infatti, u1,2 =
2
2
u0 + ∇u0
e dalla (7.31), ∇u0 ≤ u1,2 ≤
CP2 + 1 ∇u0 .
Salvo avviso contrario, in H01 (Ω) sceglieremo (u, v)1 = (∇u, ∇v)0
e
u1 = ∇u0
come prodotto interno e norma, rispettivamente. 7.5.4 Duale di H01 (Ω) Nelle applicazioni alle equazioni a derivate parziali, in connessione con l’uso del Teorema di Lax-Milgram, il duale di H01 (Ω) svolge un ruolo rilevante. Infatti merita un simbolo speciale. Definizione 5.2. Si indica con H −1 (Ω) il duale dello spazio H01 (Ω) con la norma F H −1 (Ω) = sup |F v| : v ∈ H01 (Ω), v1 ≤ 1 . É importante osservare che, poiché D (Ω) è denso (per definizione) e immerso con continuità in H01 (Ω), H −1 (Ω) è uno spazio di distribuzioni. Ciò significa due cose: a) se F ∈ H −1 (Ω), la sua restrizione a D (Ω) è una distribuzione;
448
7 Distribuzioni e spazi di Sobolev
b) la restrizione di F a D (Ω) identifica F ovvero: se F, G ∈ H −1 (Ω) e F ϕ = Gϕ per ogni ϕ ∈ D (Ω), allora F = G. Per dimostrare a) è sufficiente osservare che se ϕk → ϕ in D (Ω) allora ϕk → ϕ anche in H01 (Ω) e quindi F ϕk → F ϕ. Perciò F ∈ D (Ω). Per dimostrare b), siano u ∈ H01 (Ω) e ϕk → u in H01 (Ω), con ϕk ∈ D (Ω). Allora, essendo F ϕk = Gϕk , abbiamo F u = lim F ϕk = lim Gϕk = Gu k→+∞
k→+∞
da cui F = G. Le proprietà a) e b) indicano che H −1 (Ω) è in corrispondenza biunivoca con un sottospazio di D (Ω) e in questo senso possiamo scrivere H −1 (Ω) ⊂ D (Ω) . Quali sono le distribuzioni che appartengono a H −1 (Ω)? Il seguente teorema dà una risposta soddisfacente. Teorema 5.5. H −1 (Ω) è l’insieme di distribuzioni della forma F = f0 + div f
(7.33)
dove f0 ∈ L2 (Ω) e f = (f1 , ..., fn ) ∈ L2 (Ω; Rn ). Inoltre F H −1 (Ω) ≤ {CP f0 0 + f 0 } .
(7.34)
Dimostrazione. Sia F ∈ H −1 (Ω). Dal Teorema di Rappresentazione di Riesz, esiste un’unica u ∈ H01 (Ω) tale che (u, v)1 = F v
∀v ∈ H01 (Ω) .
Poiché (u, v)1 = (∇u, ∇v) = − div∇u, v in D (Ω) , segue che la (7.33) vale con f0 = 0 e f = −∇u. Inoltre F H −1 (Ω) = ∇u0 . Viceversa, sia F = f0 + div f , con f0 ∈ L2 (Ω) e f = (f1 , ..., fn ) ∈ L2 (Ω; Rn ). Allora F ∈ D (Ω) e, ponendo F v = F, v, abbiamo: Fv = f0 v dx + f ·∇v dx ∀v ∈ D (Ω) . Ω
Ω
Dalle disuguaglianze di Schwarz e Poincaré, otteniamo |F v| ≤ {CP f0 0 + f 0 } v1 e quindi F è continuo in D (Ω) nella norma di H01 .
(7.35)
7.5 Spazi di Sobolev
449
Rimane da dimostrare che F ha un’unica estensione continua a tutto H01 (Ω). Siano u ∈ H01 (Ω) e {vk } ⊂ D (Ω) tali che vk − u1 → 0. Allora ponendo v = vk − vh nella (7.35) ricaviamo: |F vk − F vh | ≤ {CP f0 0 + f 0 } vk − vh 1 . Pertanto {F vk } è una successione di Cauchy in R e perciò converge a un limite che è indipendente dalla successione che approssima u (controllare) e che possiamo indicare con F u. Infine, poiché |F u| = lim |F vk | k→∞
e
u1 = lim vk 1 , k→∞
dalla (7.35) segue che |F u| ≤ {CP f0 0 + f 0 } u1 ossia che F ∈ H −1 (Ω) e che vale la (7.35). 1 Nota 5.2. Gli elementi del duale di H0 (Ω) sono dunque rappresentati da somme di una funzione in L2 (Ω) e di derivate prime (nel senso delle distribuzioni) di funzioni in L2 (Ω). La notazione H −1 (Ω) sta proprio a ricordare che l’operatore di divergenza “consuma” una derivata. In particolare, L2 (Ω) → H −1 (Ω). Esempio 5.2. Se n = 1, la δ di Dirac in zero appartiene a H −1 (−a, a); ricordiamo infatti che δ = H , dove H è la funzione di Heaviside, e H ∈ L2 (−a, a). Se però n ≥ 2 e 0 ∈ Ω, δ ∈ / H −1 (Ω). Per esempio, supponiamo n = 2 −1 e Ω = B1 (0). Se fosse δ ∈ H (Ω), dovrebbero esistere f0 ∈ L2 (Ω) e f ∈ L2 (Ω; Rn ) tali che δ = f0 + div f . Allora, per ogni ϕ ∈ D (Ω), si avrebbe
ϕ (0) = δ, ϕ = f0 + div f , ϕ =
[f0 ϕ − f · ∇ϕ] dx. Ω
Ne segue che, per le disuguaglianze di Schwarz e Poincaré, dovrebbe essere |ϕ (0)| ≤ {CP f0 0 + f 0 } ϕ1 e questa disuguaglianza si estenderebbe per densità a tutto H01 (Ω). Ma ciò è impossibile, in quanto in H01 (Ω) esistono funzioni illimitate in un intorno dell’origine, come abbiamo visto nell’Esempio 5.1. Esempio 5.3. Sia Ω un dominio limitato e regolare in Rn e sia u = χΩ la sua funzione caratteristica. Poiché χΩ ∈ L2 (Rn ), la distribuzione F = ∇χΩ appartiene a H −1 (Rn ; Rn ). Il supporto di F coincide con ∂Ω e la sua azione su una funzione test ϕ ∈ D (Rn ; Rn ) è descritta dalla formula seguente: χΩ div ϕ dx = − ϕ · ν dσ. ∇χΩ , ϕ = − Rn
∂Ω
450
7 Distribuzioni e spazi di Sobolev
Si può riguardare F come una “delta distribuita uniformemente sul bordo di Ω”. ∗
Nota 5.3. È importante evitare confusioni tra H −1 (Ω) e H 1 (Ω) , il duale di H 1 (Ω). Poiché, in generale, D (Ω) non è denso in H 1 (Ω), lo spazio ∗ H 1 (Ω) non è uno spazio di distribuzioni. Infatti, sebbene la restrizione a ∗ D (Ω) di ogni T ∈ H 1 (Ω) sia una distribuzione, tale restrizione non identifica T . Come semplice esempio, prendiamo f ∈ L2 (Ω; Rn ) tale che |f | ≥ c > 0 q.o. e div f = 0. Definiamo f · ∇ϕ dx. Tϕ = Ω ∗
Poiché |T ϕ| ≤ f 0 ∇ϕ0 , deduciamo che T ∈ H 1 (Ω) . Tuttavia, la restrizione di T a D (Ω) è il funzionale zero, poiché in D (Ω) abbiamo: f · ∇ϕ dx = − div f · ϕ dx = − div f ,ϕ = 0 ∀ϕ ∈ D (Ω) . T, ϕ = Ω
Ω
7.5.5 Gli spazi H m (Ω), m > 1 Se facciamo intervenire derivate di ordine superiore, otteniamo nuovi spazi di Sobolev. Sia N il numero di multiindici α = (α1 , ..., αn ) tali che |α| = n i=1 αi ≤ m. Nel Teorema 5.1 scegliamo H = L2 (Ω), Z = L2 (Ω; RN ) → D Ω; RN e L : L2 (Ω) → D Ω; RN definito da Lv = {Dα v}|α|≤m . Allora W identifica lo spazio di Sobolev H m (Ω), che consiste delle funzioni in L2 (Ω), le cui derivate nel senso delle distribuzioni fino all’ordine m incluso sono funzioni in L2 (Ω). In formule: H m (Ω) = v ∈ L2 (Ω) : Dα v ∈ L2 (Ω), ∀α : |α| ≤ m . Dal Teorema 5.1, deduciamo subito il seguente risultato. Microteorema 5.6. H m (Ω) è uno spazio di Hilbert separabile, immerso con continuità in L2 (Ω). Gli operatori di derivazione Dα , |α| ≤ m, sono continui da H m (Ω) in L2 (Ω). Prodotto interno e norma in H m sono dati, rispettivamente, da
(u, v)H m (Ω) = (u, v)m,2 = Dα uDα v dx |α|≤m
e 2
2
uH m (Ω) = um,2 =
Ω
|α|≤m
2
|Dα u| dx. Ω
7.5 Spazi di Sobolev
451
Se u ∈ H m (Ω), ogni derivata di ordine k di u appartiene a H m−k (Ω); in altri termini, se |α| = k ≤ m, Dα u ∈ H m−k (Ω) e H m (Ω) → H m−k (Ω), per ogni k ≥ 1. −a Esempio 5.4. Sia Ω = B1 (0) ⊂ R3 e consideriamo u (x) = |x| . Dal Problema 7.11 si ha che u ∈ H 1 (B1 (0)) se a < 1/2. Calcoliamo le derivate seconde di u: −a−4
uxi xj = a (a + 2) xi xj |x| Si ha
ux
i xj
−a−2
− aδ ij |x|
.
≤ |a (a + 2)| |x|−a−2
per cui uxi xj ∈ L2 (B1 (0)) se 2a + 4 < 3, ossia a < − 12 . Per questi valori di a, dunque, u ∈ H 2 (B1 (0)). 7.5.6 Regole di calcolo Le principali regole di calcolo differenziale per funzioni in H m (Ω) ricalcano quelle classiche, anche se alcune dimostrazioni non sono elementari. Prodotto. Siano u ∈ H 1 (Ω) e v ∈ D (Ω) . Allora uv ∈ H 1 (Ω) e ∇ (uv) = u∇v + v∇u. La formula continua a valere nel caso u, v ∈ H 1 (Ω). In tal caso, però, uv ∈ L1 (Ω)
e
∇ (uv) ∈ L1 (Ω; Rn ) .
Composizione I. Siano u ∈ H 1 (Ω) e g : Ω → Ω biunivoca e Lipschitziana. Allora la funzione composta u ◦ g : Ω → R appartiene a H 1 (Ω ) e ∂xi [u ◦ g] (x) =
n
∂xk u (g (x)) ∂xi gk (x)
k=1
quasi ovunque e nel senso delle distribuzioni. In particolare, il cambio di variabili y = g (x) trasforma H 1 (Ω) in H 1 (Ω ). Composizione II. Siano u ∈ H 1 (Ω) e f : R→R, Lipschitziana. Allora la funzione composta f ◦u:Ω →R appartiene ad H 1 (Ω) e ∂xi [f ◦ u] = (f ◦ u)∂xi u
in D (Ω) .
(7.36)
452
7 Distribuzioni e spazi di Sobolev
Oltre che nel senso delle distribuzioni, la formula (7.36) vale anche puntualmente q.o. in Ω. In particolare, scegliendo rispettivamente f (t) = |t| ,
f (t) = max {t, 0}
e
f (t) = − min {t, 0} ,
segue che le funzioni |u| ,
u+ = max {u, 0}
e
u− = − min {u, 0}
appartengono tutte ad H 1 (Ω). Per queste funzioni, la (7.36) dà: ∇u se u > 0 0 se u ≥ 0 ∇u+ = , ∇u− = 0 se u ≤ 0 −∇u se u < 0 e ∇(|u|) = ∇u+ +∇u− , ∇u = ∇u+ −∇u− . Come conseguenza, se u ∈ H 1 (Ω) è costante in un insieme K ⊆ Ω, allora ∇u = 0 q.o. in K. 7.5.7 Trasformata di Fourier e spazi di Sobolev Gli spazi H m (Rn ), m ≥ 1, possono essere definiti in termini di trasformata di Fourier. Infatti, per il Teorema 4.4 u ∈ L2 (Rn ) e
u < ∈ L2 (Rn )
se e solo se
2
uL2 (Rn ) = (2π)
−n
2
< uL2 (Rn ) .
Segue subito che, per qualunque multi-indice α con |α| ≤ m, Dα u ∈ L2 (Rn ) e
se e solo se
2
Dα uL2 (Rn ) = (2π)
−n
ξα u < ∈ L2 (Rn ) 2
ξ α u <L2 (Rn ) .
Se poi notiamo che, per un’opportuna costante C = C (n, m), si ha 2
|ξα | ≤ |ξ|
2|α|
2
≤ C(1 + |ξ| )m
si deduce immediatamente il sequente microteorema. Microteorema 5.7. Sia u ∈ L2 (Rn ) . Allora: 2
< ∈ L2 (Rn ) , i) u ∈ H m (Rn ) se e solo se (1 + |ξ| )m/2 u ii) le norme > > > > 2 uH m (Rn ) e <> >(1 + |ξ| )m/2 u sono equivalenti.
L2 (Rn )
7.6 Approssimazioni con funzioni regolari ed estensioni
453
Il Microteorema 5.7 porta in modo naturale alla definizione mediante trasformata di Fourier degli spazi di Sobolev di ordine reale. Infatti, se u ∈ L2 (Rn ), l’appartenenza di u allo spazio H m (Rn ) è equivalente al fatto m che, moltiplicando per |ξ| la trasformata di Fourier di u, si ottiene una fun2 n zione in L (R ). D’altra parte non c’è ragione di limitare l’esponente m agli interi ed allora si perviene alla seguente definizione. Definizione 5.3. Sia s ∈ R, 0 < s < ∞. Si indica con H s (Rn ) lo spazio 2 < ∈ L2 (Rn ). delle funzioni u tali che (1 + |ξ| )s/2 u Possiamo considerare gli elementi di H s (Rn ) come funzioni in L2 (Rn ) tali che le loro “derivate di ordine s” appartengono ad L2 (Rn ). Microteorema 5.8. H s (Rn ) è uno spazio di Hilbert rispetto al prodotto interno 2 (1 + |ξ| )s u < v< dξ, (u, v)H s (Rn ) = Rn−1
con norma
s
uH s (Rn ) = (1 + |ξ| ) u <L2 (Rn ) . Lo spazio H 1/2 (Rn ) delle funzioni che hanno “derivate di ordine 1/2” in L2 (Rn ) avrà un ruolo importante nella Sezione 7.
7.6 Approssimazioni con funzioni regolari ed estensioni 7.6.1 Approssimazioni locali Le funzioni di H 1 (Ω) possono essere piuttosto irregolari. Tuttavia, usando la convoluzione con un mollificatore, ogni u ∈ H 1 (Ω) può essere approssimata localmente da funzioni regolari, nel senso che l’approssimazione vale in ogni compatto contenuto in Ω. definito in (7.4) e sia Ωε Riprendiamo il mollificatore η ε = ε1n η |x| ε l’insieme dei punti x a distanza maggiore di ε dal bordo di Ω, cioè Ωε = {x ∈Ω: dist (x,∂Ω) > ε} . Abbiamo: Teorema 6.1. Sia u ∈ H 1 (Ω) e poniamo, per ε > 0, piccolo, uε = η ε ∗ u. Allora 1. uε ∈ C ∞ (Ωε ) , 2. se ε → 0, uε → u in H 1 (Ω ) per ogni Ω ⊂⊂ Ω. Dimostrazione. La 1 è già stata considerata nel Lemma 1.2. Per la 2, osserviamo innanzitutto che, per le proprietà della convoluzione, si ha ∂xi uε = η ε ∗ ∂xi u per ogni i = 1, 2, ..., n. La tesi segue ora dalla 5 del Lemma 1.2.
(7.37)
454
7 Distribuzioni e spazi di Sobolev
7.6.2 Estensioni e approssimazioni globali Il Teorema 6.1 permette di approssimare una funzione di H 1 (Ω) con funzioni regolari, se ci manteniamo ad una distanza positiva da ∂Ω. Ci chiediamo se l’approssimazione sia possibile in tutto Ω, possibilmente nella sua chiusura Ω. Ciò risulterebbe molto comodo in vista del trattamento di problemi al contorno per equazioni a derivate parziali. Definizione 6.1. Indichiamo con D Ω l’insieme delle restrizioni a Ω delle funzioni di D (Rn ). In altri termini, ϕ ∈ D Ω se esiste ψ ∈ D (Rn ) tale che ϕ = ψ in Ω. Ovviamente D Ω ⊂ C ∞ Ω . Ci chiediamo: (7.38) D Ω è denso in H 1 (Ω)? Il caso Ω = Rn è speciale poiché in questo caso D (Ω) coincide con D Ω . Abbiamo: Teorema 6.2. D (Rn ) è denso in H 1 (Rn ). In particolare H 1 (Rn ) = 1 H0 (Rn ). Dimostrazione. Osserviamo prima che Hc1 (Rn ), il sottospazio delle funzioni a supporto (essenziale) compatto in Rn , è denso in H 1 (Rn ). Infatti, sia u ∈ H 1 (Rn ) e sia v ∈ D (Rn ), tale che 0 ≤ v ≤ 1 in Rn e v ≡ 1 se |x| ≤ 1. Definiamo x us (x) = v u (x) . s Allora us ∈ Hc1 (Rn ) e x x 1 ∇us (x) = v ∇u (x) + u (x) ∇v . s s s Usando il Teorema della Convergenza Dominata, non è difficile mostrare che 15 , per s → ∞, us → u in H 1 (Rn ). D’altra parte, D (Rn ) è denso in Hc1 (Rn ). Infatti, se u ∈ Hc1 (Rn ), si ha uε = u ∗ η ε ∈ D (Rn ) e uε → u in H 1 (Rn ). In generale (7.38) ha risposta negativa, come mostra il seguente esempio. Esempio 6.1. Sia Ω = {(ρ, θ) : 0 < ρ < 1, 0 < θ < 2π} . Il dominio Ω è costituito dal cerchio unitario aperto, privato del raggio {(ρ, θ) : 0 < ρ < 1, θ = 0} . 15
Osservare che |us | ≤ |u| e |∇us | ≤ |∇u| + M |u| dove M = max |∇v| .
7.6 Approssimazioni con funzioni regolari ed estensioni
455
La chiusura Ω coincide col cerchio chiuso B 1 . Sia u (ρ, θ) = ρ1/2 cos(θ/2). Allora u ∈ L2 (Ω), poiché u è limitata. Inoltre16 , 2
|∇u| = u2ρ +
1 2 1 u = ρ2 θ 4ρ
in Ω,
e quindi u ∈ H 1 (Ω). Tuttavia, u (ρ, 0+) = ρ1/2 mentre u (ρ, 2π−) = −ρ1/2 . Quindi u ha una discontinuità a salto attraverso θ = 0 per cui u ∈ / H 1 (B1 ) e nessuna successione di funzioni regolari in Ω può convergere a u in H 1 (Ω). La difficoltà nell’Esempio 6.1 risiede nel fatto che Ω si trova in entrambi i lati di una parte della sua frontiera (il raggio 0 < ρ < 1, θ = 0). Quindi, per avere una speranza che (7.38) sia vera occorre evitare domini con tale anomalia. Posta questa condizione su Ω, il Teorema 6.1 suggerisce una strategia per risolvere il problema dell’approssimazione con funzioni di D Ω : data u ∈ H 1 (Ω), si estende la definizione di u a tutto Rn e poi si applica il Teorema 6.1. Il problema che si presenta è: data u ∈ H 1 (Ω), è sempre possibile estendere la definizione di u a tutto Rn , in modo che la nuova funzione appartenga a H 1 (Rn )? Introduciamo la nozione di operatore di estensione. Definizione 6.2. Diciamo che un operatore lineare E : H 1 (Ω) → H 1 (Rn ) è un operatore di estensione se, ∀u ∈ H 1 (Ω): 1. Eu = u in Ω, 2. se Ω è limitato, Eu ha supporto compatto, 3. E è continuo: EuH 1 (Rn ) ≤ c (n, Ω) uH 1 (Ω) . Come costruire E? Si potrebbe pensare di definire Eu = 0 fuori da Ω (si chiama estensione banale). Ciò sicuramente funziona se u ∈ H01 (Ω), ma solo in questo caso. Infatti: u ∈ H01 (Ω) se e solo se la sua estensione banale appartiene a H 1 (Rn ). Per esempio, sia u ∈ H 1 (0, ∞) con u (0) = a = 0. Allora u ∈ / H01 (0, ∞). Sia Eu l’estensione banale di u. In D (R) abbiamo (Eu) = u + aδ che non è una funzione in L2 (R). Occorre dunque usare un altro metodo. Se Ω è un semispazio, cioè Ω = Rn+ = {(x1 , ..., xn ) : xn > 0} un operatore di estensione può essere costruito per riflessione nel modo seguente. 16
Appendice C.
456
7 Distribuzioni e spazi di Sobolev
• Metodo di riflessione. Sia u ∈ H 1 Rn+ . Scriviamo x = (x , xn ), x ∈ Rn−1 . Riflettiamo in modo pari rispetto all’iperpiano xn = 0, ponendo Eu = u ˜ dove u ˜ (x) = u (x , |xn |) . Allora si può dimostrare che, in D (Rn ) u ˜xj (x) =
uxj (x , |xn |)
j
j = n.
uxn (x , |xn |) sign xn
(7.39)
È ora facile controllare che E possiede le proprietà 1,2,3 nella Definizione 6.2. In particolare, 2 2 EuH 1 (Rn ) = 2 uH 1 (Rn ) . +
• Operatore di estensione per domini Lipschitziani. Sia Ω un dominio limitato e Lipschitziano. Per costruire un operatore di estensione faremo uso di due idee generali, utili anche in altri contesti: localizzazione e riduzione ad un semispazio. Localizzazione. Si basa sul seguente lemma. Ricordiamo che, dato un insieme K, per copertura aperta di K si intende una famiglia U di insiemi aperti tale che K ⊂ ∪U ∈U U . Lemma 6.3 (Partizione dell’unità). Sia K ⊂ Rn , compatto, e U1 , ..., UN una copertura aperta di K. Allora esistono N funzioni ψ 1 , ..., ψ N con le seguenti proprietà. 1. Per ogni j = 1, ..., N , ψ j ∈ C0∞ (Uj ) e 0 ≤ ψ j ≤ 1. 2. Per ogni x ∈K,
N j=1
ψ j (x) = 1.
Dimostrazione. Poiché K ⊂ ∪N j=1 Uj e ogni Uj è aperto, possiamo trovare degli aperti Aj ⊂⊂ Uj tali che K ⊂ ∪N j=1 Aj . Siano χAj la funzione caratteristica di Aj ed η ε il mollificatore (7.4). Definiamo ϕj,ε = η ε ∗ χAj . Ricordando la Nota 1.3, possiamo fissare ε così piccolo da avere ϕj,ε ∈ C0∞ (Uj ) e ϕj,ε > 0 su Aj . Le funzioni ϕj,ε ψ j = N s=1 ϕs,ε soddisfano le conditioni 1 e 2.
7.6 Approssimazioni con funzioni regolari ed estensioni
457
Figura 7.5. Un insieme Ω e una copertura aperta della sua chiusura
L’insieme di funzioni ψ 1 , ..., ψ N si chiama partizione dell’unità per K, associata alla copertura U1 , ..., UN . Se ora u : K → R, la procedura di localizzazione consiste nello scrivere
N u= ψj u (7.40) j=1
cioè come una somma di funzioni uj = ψ j u con supporto compatto contenuto in Uj . Riduzione ad un semispazio. Prendiamo una copertura aperta di ∂Ω costituita da N sfere Bj = B (xj ), centrate in xj ∈ ∂Ω e tali che ∂Ω ∩ Bj sia il grafico di una funzione Lipschitziana yn = ϕj (y ) . Questo è possibile, essendo ∂Ω compatto. Sia inoltre A0 ⊂ Ω un aperto contenente Ω\ ∪N j=1 Bj (Figura 7.5). In tal modo A0 , B1 , ..., BN è una copertura aperta di Ω. Sia ψ 0 , ψ 1 , ..., ψ N una partizione dell’unità per Ω, associata a A0 , B1 , ..., BN . Dalla definizione di dominio Lipschitziano (Sezione 1.4), per ogni Bj , 1 ≤ j ≤ N , esiste una trasformazione bi-Lipschitziana z = Φj (x) tale che Φj (Bj ∩ Ω) ≡ Uj ⊂ Rn+ dove Uj è un aperto, e (Figura 7.6) Φj (Bj ∩ ∂Ω) ≡ Γj ⊂ ∂Rn+ = {zn = 0} .
Figura 7.6. La trasformazione bi-Lipschitziana Φj spiana Bj ∩ ∂Ω
458
7 Distribuzioni e spazi di Sobolev
Sia ora u ∈ H 1 (Ω). Poniamo uj = ψ j u. Allora il supporto di wj = uj ◦ Φ−1 j è compatto e contenuto in Uj ∪ Γj , cosicché, estendendo wj a zero in Rn+ \Uj , otteniamo wj ∈ H 1 Rn+ . ˜j , ottenuta col metodo di riflessione, appartiene a La funzione Ewj = w H 1 (Rn ). Ora torniamo alle variabili originali. Definiamo Euj = w ˜ j ◦ Φj ,
1 ≤ j ≤ N.
Allora Euj ha supporto compatto in Bj , Euj = 0 fuori da Bj e Euj = uj in Ω ∩ Bj . Infine, siano u0 = ψ 0 u0 ed Eu0 l’estensione banale di u0 . Poniamo Eu =
N j=0
Euj .
A questo punto non è difficile controllare che E soddisfa le proprietà 1, 2, 3 della Definizione 6.2. Abbiamo dimostrato il seguente risultato. Teorema 6.4. Sia Ω = Rn+ oppure un dominio limitato e Lipschitziano. Allora esiste un operatore di estensione E : H 1 (Ω) → H 1 (Rn ). Dai Teoremi 6.2 e 6.4 segue subito il seguente teorema di approssimazione globale: Teorema 6.5. Se Ω = Rn+ oppure Ω è un dominio limitato e Lipschitziano, allora D Ω è denso in H 1 (Ω). In altri termini, per ogni u ∈ H 1 (Ω), esiste una successione {um } ⊂ D Ω tale che um → u in L2 (Ω)
e
∇um → ∇u in L2 (Ω; Rn ).
7.7 Tracce 7.7.1 Tracce di funzioni in H 1 (Ω) La possibilità di approssimare ogni u ∈ H 1 (Ω) con funzioni in D Ω rappresenta un utilissimo strumento nella gestione degli spazi di Sobolev. Molte proprietà che si vogliono dimostrare in questi spazi, vengono dimostrate per funzioni regolari, dove i calcoli sono agevoli, per poi passare al limite su una successione approssimante. Applichiamo questa idea per introdurre la nozione di restrizione di u su Γ = ∂Ω. Tale restrizione si chiama traccia di u su Γ e sarà un elemento di L2 (Γ ). Anzitutto osserviamo che se Ω = Rn+ allora Γ = Rn−1 e lo spazio L2 (Γ ) è ben definito. Se Ω è un dominio limitato e Lipschitziano si può definire L2 (Γ ) per localizzazione. Più precisamente, sia B1 , ..., BN una copertura aperta di Γ costituita da sfere centrate in punti N su Γ , come nel Paragrafo 7.6.2. Se g : Γ → R, scriviamo g = j=1 ψ j g dove ψ 1 , ..., ψ N è una partizione dell’unità per Γ , associata a B1 , ..., BN . Poiché Γ ∩ Bj è il grafico di una
7.7 Tracce
459
funzione Lipschitziana yn = ϕj (y ), su Γ ∩ Bj c’è una nozione naturale di “elemento d’area”, dato da 2 dσ = 1 + |∇ϕ| dy . Diciamo allora che g ∈ L2 (Γ ) se17 2 gL2 (Γ )
e definiamo
=
N
g dσ = Γ
j=1
2
Γ ∩Bj
ψ j |g| dσ< ∞
N j=1
Γ ∩Bj
(7.41)
ψ j g dσ.
L2 (Γ ) è uno spazio di Hilbert rispetto al prodotto interno
N ψ j gh dσ. (g, h)L2 (Γ ) = j=1
Γ ∩Bj
Torniamo al problema della traccia. Consideriamo solo n > 1 poiché abbiamo già visto che il problema non si pone se n = 1. La strategia consiste nei seguenti due passi. Sia τ 0 : D Ω → L2 (Γ ) l’operatore che associa ad ogni funzione appar tenente a D Ω la sua restrizione v|Γ a Γ : τ 0 v = v|Γ . Ciò ha perfettamente senso trattandosi di funzioni regolari. Primo passo: dimostrare che τ 0 uL2 (Γ ) ≤ c (Ω, n) u1,2 . Ciò significa che τ 0 è continuo da D Ω ⊂ H 1 (Ω) in L2 (Γ ). Secondo passo: estendere τ 0 a tutto H 1 (Ω) usando la densità di D Ω in H 1 (Ω). Un’analogia elementare può essere utile. Consideriamo una funzione f : Q → R, definita dunque solo sui numeri razionali. Vogliamo estendere la definizione di f a tutti i numeri reali. Come si può fare? Sia x irrazionale. Poiché Q è denso in R, possiamo prendere una successione {rk } ⊂ Q tale che rk → x. Calcoliamo ora f (rn ) e definiamo f (x) come limite di f (rn ). Questo corrisponde al secondo passo. Naturalmente occorre controllare che il limite esiste, dimostrando, per esempio, che la successione {f (rn )} è di Cauchy, e che non dipende dalla scelta della successione approssimante {rn }. Ciò è vero se f è uniformemente continua18 su Q, in analogia col primo passo. 17
18
La norma (7.41) dipende dalla scelta dalla copertura aperta e dalla partizione dell’unità. Tuttavia, norme corrispondenti a coperture e partizioni differenti sono tutte equivalenti ed inducono la stessa topologia su L2 (Γ ). Una funzione f è uniformemente continua in un insieme A se, fissato ε > 0, esiste δ dipendente solo da ε tale che |f (x) − f (y)| < ε per ogni x, y ∈ A, |x − y| < δ.
460
7 Distribuzioni e spazi di Sobolev
Teorema 7.1. Sia Ω = Rn+ oppure un dominio limitato e Lipschitziano. Allora esiste un operatore lineare (operatore di traccia) τ 0 : H 1 (Ω) → L2 (Γ ) tale che: 1. τ 0 u = u|Γ se u ∈ D Ω , 2. τ 0 uL2 (Γ ) ≤ c (Ω, n) u1,2 . Dimostrazione. Sia Ω = Rn+ . Dimostriamo la 2 per le funzioni u ∈ D Ω . In questo caso τ 0 u = u(x , 0) e occorre dimostrare che esiste una costante c tale che 2 2 |u(x , 0)| dx ≤ c uH 1 (Rn ) (7.42) ∀u ∈ D Ω . +
Rn−1
Si ha, per ogni xn ∈ (0, 1),
u(x , 0) = u(x , xn ) −
xn
uxn (x , t) dt.
0
2
Ricordando la disuguaglianza elementare (a + b) ≤ 2a2 + 2b2 , otteniamo 2
2
|u(x , 0)| ≤ 2 |u(x , xn )| + 2 2
≤ 2 |u(x , xn )| + 2
1
0 1
0
|uxn (x , t)| dt
2
2
|uxn (x , t)| dt
essendo, per la disuguaglianza di Schwarz, 0
1
2
|uxn (x , t)| dt
≤
0
1
2
|uxn (x , t)| dt.
Integrando rispetto ad x in Rn−1 e rispetto ad xn in (0, 1) si ricava la (7.42) con c = 2. Supponiamo ora che u ∈ H 1 Rn+ . Poiché D Ω è denso in H 1 Rn+ , si può trovare una successione {uk } ⊂ D Ω tale che uk → u in H 1 Rn+ . Dalla linearità di τ 0 e dalla (7.42) otteniamo √ τ 0 uh − τ 0 uk L2 (Rn−1 ) ≤ 2 uh − uk H 1 (Rn ) . +
1
n
in Essendo {u k } di Cauchy in H R+ , si deduce che {τ 0 uk } è di Cauchy L2 Rn−1 e quindi risulta definito un unico elemento u0 ∈ L2 Rn−1 tale che τ 0 uk → u0 in L2 Rn−1 . Questo elemento non dipende dalla successione {uk } approssimante. Infatti, se {vk } ⊂ D Ω è un’altra successione tale che vk → u in H 1 Rn+ , allora vk − uk H 1 (Rn ) → 0. +
7.7 Tracce
461
Da
√ τ 0 vk − τ 0 uk L2 (Rn−1 ) ≤ 2 vk − uk H 1 (Rn ) + n−1 2 . segue che anche τ 0 vk → u0 in L R Se u ∈ H 1 Rn+ , ha dunque senso definire τ 0 u = u0 . L’operatore così definito soddisfa i requisiti 1, 2 del Teorema 7.1. Se Ω è un dominio limitato e Lipschitziano, il teorema si dimostra per localizzazione e riduzione a un semispazio. Omettiamo i dettagli. Definizione 7.1. La funzione τ 0 u si chiama traccia di u su Γ ; per essa si può usare la notazione u|Γ . Come corollario del Teorema 7.1, si può provare una formula di integrazione per parti per le funzioni di H 1 (Ω). Precisamente si ha: Corollario 7.2. Nelle ipotesi del Teorema 6.1, vale la formula ∇u · v dx = − u divv dx + (τ 0 u) (τ 0 v) · ν dσ Ω
Ω
(7.43)
Γ
per ogni u ∈ H 1 (Ω) e v ∈ H 1 (Ω; Rn ), dove ν è la normale esterna a Γ e τ 0 v = (τ 0 v1 , ..., τ 0 vn ) . Dimostrazione. La (7.43) vale se u ∈ D Ω e v ∈ D Ω; Rn . Siano u ∈ H 1 (Ω) e v ∈ H 1 (Ω; Rn ) . Scegliamo due successioni {uk } ⊂ D Ω e {vk } ⊂ D Ω; Rn tali che uk → u in H 1 (Ω) e vk → v in H 1 (Ω; Rn ). Allora: ∇uk · vk dx = − uk div vk dx+ (τ 0 uk ) (τ 0 vk ) · ν dσ. Ω
Ω
Γ
Se si passa al limite per k → ∞, sfruttando la continuità di τ 0 , si ottiene la (7.43) per u e v. 19 Non è sorprendente che il nucleo dell’operatore τ 0 sia precisamente H01 (Ω): τ 0 u = 0 ⇐⇒ u ∈ H01 (Ω) . Con metodo analogo si può definire la traccia di una funzione di H 1 (Ω) solo su una parte Γ0 della sua frontiera, purchè non sia troppo irregolare. Enunciato e dimostrazione sono analoghi. Teorema 7.3. Siano Ω = Rn+ oppure un dominio limitato e Lipschitziano e Γ0 un sottoinsieme aperto di Γ . Allora esiste un operatore lineare di traccia τ Γ0 : H 1 (Ω) → L2 (Γ0 ) tale che: 1. τ Γ0 u = u|Γ0 se u ∈ D Ω , > > 2. >τ Γ0 0 u>L2 (Γ ) ≤ c (Ω, n) u1,2 . 0
19
Tuttavia, solo la dimostrazione dell’implicazione “ ⇐= ” è facile. La dimostrazione dell’altra implicazione “ =⇒ ” è piuttosto tecnica.
462
7 Distribuzioni e spazi di Sobolev
La funzione τ Γ0 u si chiama traccia di u su Γ0 , spesso indicata con u|Γ0 . Il 1 (Ω): nucleo di τ Γ0 è indicato con H0,Γ 0 τ Γ0 u = 0
⇐⇒
1 u ∈ H0,Γ (Ω) . 0
Questo spazio può essere caratterizzato in un altro modo. Sia V0,Γ0 linsieme delle funzioni in D Ω , nulle in un intorno di Γ 0 . Allora: 1 Microteorema 7.4. H0,Γ (Ω) è la chiusura di V0,Γ0 in H 1 (Ω). 0 7.7.2 Tracce di funzioni in H m (Ω) Abbiamo visto che una funzione u ∈ H m (Rn+ ), m ≥ 1, ha traccia su Γ = ∂Rn+ . Se però, per esempio, m = 2, ogni derivata di u appartiene ad H 1 (Rn+ ) ed ha perciò traccia su Γ . In particolare, possiamo definire la traccia su Γ della derivata ∂xn u. Poniamo τ 1 u = (∂xn u)|Γ . In generale, per m ≥ 2, possiamo definire le tracce delle derivate ∂xj n u, per j = 0, 1, ..., m − 1, e porre τ j u = (∂xj n u)|Γ . Risulta così definito un operatore di traccia τ : H m (Rn+ ) → L2 (Γ ; Rm ), dato da τ u = (τ 0 u, ..., τ m−1 u) che, in base al Teorema 7.1, soddisfa le seguenti condizioni: u|Γ ), se u ∈ D Rn+ , 1. τ u = (u|Γ , ∂xn u|Γ , ..., ∂xm−1 n 2. τ uL2 (Γ ;Rn ) ≤ c uH m (Rn ) . +
L’operatore τ associa ad ogni u ∈ H m Rn+ la traccia su Γ delle derivate di u fino all’ordine m − 1 nella direzione xn . Questa direzione corrisponde alla normale interna su Γ = ∂Rn+ . Analogamente, per un dominio limitato Ω di classe C m (ipotesi necessaria per estendere funzioni da H m (Ω) a H m (Rn )) possiamo definire le tracce su Γ delle derivate di u fino all’ordine m − 1 nella direzione normale al dominio che, per coerenza con le scelte dei capitoli precedenti, scegliamo diretta verso l’esterno. In conclusione, abbiamo il teorema seguente, dove ν indica il versore normale esterno ad Ω. Teorema 7.5. Sia Ω = Rn+ oppure un dominio limitato e di classe C m , m ≥ 2. Allora esiste un operatore lineare di traccia τ : H m (Ω) → L2 (Γ ; Rm ) tale che: ∂ m−1 u 1. τ u = (u|Γ , ∂u ∂ν |Γ , ..., ∂ν m−1 |Γ ) se u ∈ D Ω , 2. τ uL2 (Γ ;Rm ) ≤ c (Ω, n) uH m (Ω) .
7.7 Tracce
463
Il nucleo dell’operatore τ è lo spazio H0m (Ω), dato dalla chiusura di D (Ω) in H m (Ω) . Precisamente, τ u = (0, ..., 0)
⇐⇒
u ∈ H0m (Ω) .
Evidentemente, H0m (Ω) è un sottospazio di Hilbert di H m (Ω). Se u ∈ H0m (Ω), u e le sue derivate normali fino all’ordine m − 1 hanno traccia nulla su Γ . Con lo stesso metodo, possiamo definire la traccia delle derivate normali di u, fino all’ordine m − 1, su Γ0 aperto regolare in Γ . 7.7.3 Spazi di tracce L’operatore di traccia τ 0 : H 1 (Ω) → L2 (Γ ) non è suriettivo. In altri termini, vi sono funzioni in L2 (Γ ) che non sono tracce di funzioni in H 1 (Ω). La domanda naturale è quindi: quali funzioni g ∈ L2 (Γ ) sono tracce di funzioni in H 1 (Ω)? La risposta non è elementare: si potrebbe dire che queste funzioni sono quelle che posseggono mezze derivate in L2 (Γ ). È come se nell’operazione di restrizione una funzione di H 1 (Ω) debba rassegnarsi a perdere “metà di ognuna delle sue derivate”. Cominciamo coll’esaminare il caso del semispazio. Teorema 7.6. Sia τ 0 : H 1 (Rn+ ) → L2 Rn−1 l’operatore di traccia. Allora Im τ 0 = H 1/2 Rn−1 . Dimostrazione. Mostriamo che Im τ 0 ⊆ H 1/2 Rn−1 . Sia u ∈ D Rn+ . Scriviamo x = (x , xn ), con x ∈ Rn−1 , e definiamo g (x ) = u (x , 0). Vogliamo dimostrare che 2 2 1 2 2 uH 1 (Rn ) . gH 1/2 (Rn−1 ) = (1 + ξ )1/2 g< ξ dξ ≤ + 2π Rn−1 Estendiamo u a tutto Rn per riflessione pari rispetto all’iperpiano xn = 0 ed esprimiamo g< in termini di u <. In base alla formula di inversione, possiamo scrivere: ixn ξ 1 ix ·ξ n dξ e u < ξ , ξ e u (x , xn ) = n n dξ (2π)n Rn−1 R cosicché g (x ) = u (x , 0) =
1 (2π)n−1
Rn−1
eix ·ξ
1 2π
R
u < ξ , ξ n dξ n dξ .
Questa formula indica che 1 u < ξ , ξ n dξ n g< ξ = 2π R e quindi 2 gH 1/2 (Rn−1 )
=
1 2
(2π)
2 2 1/2 (1 + ξ ) u < ξ , ξ n dξ n dξ . n−1
R
R
464
7 Distribuzioni e spazi di Sobolev
Osserviamo ora i seguenti due fatti. Primo, dalla disuguaglianza di Schwarz, abbiamo: 2 −1/2 2 u < ξ , ξ n dξ n (1 + |ξ| )1/2 u < ξ , ξ n dξ n ≤ (1 + |ξ| ) R
R
≤
R
2 2 (1 + |ξ| ) u < ξ , ξ n dξ n
1/2
2
R
Secondo:20 2 2 (1 + |ξ| )−1 dξ n = (1 + ξ + ξ 2n )−1 dξ n = R
R
(1 + |ξ| )−1 dξ n
1/2 .
π . 2 (1 + ξ )1/2
Di conseguenza, possiamo scrivere: 1 2 2 2 gH 1/2 (Rn−1 ) ≤ (1 + |ξ| ) |< u (ξ)| dξ 4π Rn 1 1 2 2 uH 1 (Rn ) = uH 1 (Rn ) . = + 4π 2π n Essendo D R+ denso in H 1 (Rn+ ), l’ultima disuguaglianza risulta vera per ogni u ∈ H 1 Rn+ e mostra che Im τ 0 ⊆ H 1/2 Rn−1 . Per dimostrare l’inclusione opposta, sia g ∈ H 1/2 (Rn−1 ) e definiamo 1 u (x , xn ) = e−(1+|ξ |)xn g< ξ eix ·ξ dξ , xn ≥ 0. n−1 (2π) Rn−1 Allora u (x , 0) = g (x ) e si può mostrare che u ∈ H 1 Rn+ . Quindi g ∈ Im τ 0 e perciò H 1/2 Rn−1 ⊆ Im τ 0 . Se Ω è un dominio limitato e Lipschitziano è possibile definire H 1/2 (Γ ) per localizzazione e riduzione ad un semispazio come abbiamo fatto per L2 (Γ ). In tal modo si può inserire in H 1/2 (Γ ) un prodotto interno rispetto al quale risulta uno spazio di Hilbert, immerso con continuità in L2 (Γ ). Si dimostra che H 1/2 (Γ ) coincide con Im τ 0 : H 1/2 (Γ ) = u|Γ : u ∈ H 1 (Ω) . (7.44) Cambiando un poco punto di vista, potremmo adottare la (7.44) come definizione di H 1/2 (Γ ) e munirlo della norma (equivalente) gH 1/2 (Γ ) = inf uH 1 (Ω) : u ∈ H 1 (Ω), u|Γ = g . (7.45) Questa norma è la più piccola tra le norme di tutti gli elementi in H 1 (Ω) che hanno la stessa traccia g su Γ e tiene conto del fatto che l’operatore di 20
2 R (a
+ t2 )−1 dt =
1 arctan a
+∞ t π = a −∞ a
(a > 0) .
7.8 Compattezza e immersioni
465
traccia τ 0 non è iniettivo, essendo H01 (Ω) il suo nucleo. In particolare, vale la seguente disuguaglianza di traccia > > >u|Γ > 1/2 ≤ u1,2 , (7.46) H (Γ ) che mostra la continuità dell’operatore τ 0 da H 1 (Ω) su H 1/2 (Γ ) . Procedendo allo stesso modo, se Γ0 è un aperto in Γ , possiamo definire lo spazio H 1/2 (Γ0 ) che coincide con Im τ Γ0 , ovvero: H 1/2 (Γ0 ) = u|Γ0 : u ∈ H 1 (Ω) . Possiamo munire H 1/2 (Γ0 ) con la norma gH 1/2 (Γ0 ) = inf uH 1 (Ω) : u ∈ H 1 (Ω), u|Γ0 = g . In particolare, vale la disuguaglianza di traccia > > >u|Γ > 1/2 ≤ uH 1 (Ω) 0 H (Γ ) 0
(7.47)
che mostra la continuità dell’operatore τ Γ0 da H 1 (Ω) su H 1/2 (Γ0 ). Infine, se Ω = Rn+ oppure un dominio limitato e di classe C m , m ≥ 2, lo spazio di tracce delle funzioni in H m (Ω) è lo spazio di Sobolev di ordine frazionario H m−1/2 (Γ ), che mostra sempre una perdita di “mezza derivata”. Coerentemente, la traccia di una derivata normale subirà una perdita di un’ulteriore ordine di derivazione ed appartiene così allo spazio H m−3/2 (Γ ); l’ultima derivata normale appartiene a H 1/2 (Γ ). Abbiamo quindi τ : H m (Ω) → H m−1/2 (Γ ) , H m−3/2 (Γ ) , ..., H 1/2 (Γ ) ed il nucleo di τ è H0m (Ω).
7.8 Compattezza e immersioni 7.8.1 Teorema di Rellich Poiché u0 ≤ u1,2 abbiamo H 1 (Ω) → L2 (Ω) e cioè ogni successione {uk } convergente in H 1 (Ω) è anche convergente in L2 (Ω). Nessuna condizione è richiesta al dominio Ω. Se assumiamo Ω limitato e Lipschitziano allora l’immersione di H 1 (Ω) in L2 (Ω) è anche compatta. Ciò vuol dire che una successione {uk } limitata in H 1 (Ω) ha la seguente notevole proprietà: Esistono una sottosuccessione ukj ed un elemento u ∈ H 1 (Ω), tali che
466
7 Distribuzioni e spazi di Sobolev
• ukj → u in L2 (Ω) , • ukj ! u in H 1 (Ω)
(cioè ukj converge debolmente21 a u in H 1 (Ω)).
In realtà, solo la prima proprietà è conseguenza della compattezza dell’immersione. La seconda è una proprietà generale degli spazi di Hilbert: ogni sottoinsieme limitato è sequenzialmente debolmente compatto (Teorema 6.7.8). Le conseguenze di queste proprietà sono rilevanti, come si potrà apprezzare più avanti. Teorema 8.1 (di Rellich). Se Ω è limitato e Lipschitziano, l’immersione di H 1 (Ω) in L2 (Ω) è compatta. Dimostrazione. Usiamo il criterio di compattezza espresso nel Teorema 6.7.5. Osserviamo prima che, per ogni v ∈ D (Rn ), possiamo scrivere: 1 1 d v (x+th) dt = ∇v (x+th) · h dt v (x + h) − v (x) = 0 dt 0 da cui |v (x + h) − v (x)| = 2
0
1
2 2 ∇v (x+th) · h dt ≤ |h|
0
Integrando su R troviamo 2 2 |v (x + h) − v (x)| dx ≤ |h|
1
2
|∇v (x+th)| dt.
n
Rn
2
1
dx Rn
0
2
|∇v (x+th)| dt
2
≤ |h| ∇vL2 (Rn )
cosicché
2
Rn
2
2
|v (x + h) − v (x)| dx ≤ |h| ∇vL2 (Rn ) .
(7.48)
Poiché D (Rn ) è denso in H 1 (Rn ), la (7.48) continua a valere per ogni u ∈ H 1 (Rn ). Sia ora S ⊂ H 1 (Ω) limitato, ovvero esiste un numero M tale che: uH 1 (Ω) ≤ M,
∀u ∈ S.
Per il Teorema 6.4, ogni u ∈ S ha un’estensione u 8 ∈ H 1 (Rn ), con supporto 1 contenuto in un aperto Ω ⊃⊃ Ω. Allora u 8 ∈ H0 (Ω ) e inoltre ∇8 uL2 (Ω ) ≤ c (Ω, n) ∇uL2 (Ω) ≤ c (Ω, n) M. Indichiamo con S8 l’insieme di tali estensioni. Allora la (7.48) vale per ogni 8 u 8 ∈ S: 2 2 2 2 |8 u (x + h) − u 8 (x)| dx ≤ |h| ∇8 uL2 (Rn ) ≤ c2 M 2 |h| . Ω
21
Paragrafo 6.7.3.
7.8 Compattezza e immersioni
467
In base al Teorema 6.7.5, S8 è precompatto in L2 (Ω ) e quindi S è precompatto in L2 (Ω). Nota 8.1. Come si vede dalla dimostrazione, la compattezza dell’immersione deriva dall’esistenza di un operatore di estensione (Definizione 6.2) da H 1 (Ω) in H 1 (Rn ); da qui l’esigenza di avere una certa regolarità del dominio. D’altra parte, le funzioni di H01 (Ω) hanno estensione banale in H 1 (Rn ) senza restrizioni sul dominio ed infatti è sufficiente che Ω sia solo limitato per avere immersione compatta H01 (Ω) in L2 (Ω). Conclusione: se Ω è limitato, l’immersione di H01 (Ω) in L2 (Ω) è compatta.
7.8.2 Disuguaglianze di Poincaré Nella teoria generale dei problemi al contorno per equazioni a derivate parziali, risultano di particolare utilità certe disuguaglianze, note come disuguaglianze di Poincaré. Queste affermano che, sotto opportune ipotesi, la norma in H 1 (Ω) è equivalente alla norma del gradiente in L2 (Ω) , ossia che esiste una costante CP , che dipende solo dalla dimensione n e da Ω, tale che u0 ≤ CP ∇u0 .
(7.49)
La (7.49) è precisamente una disuguaglianza di Poincaré. È chiaro che essa non può valere in generale, poiché non è vera già nel caso u = costante = 0. Le ipotesi che garantiscono la validità di (7.49) richiedono, sostanzialmente, che u abbia “abbastanza zeri”. Abbiamo già dimostrato (Teorema 5.4) che la (7.49) vale se u ∈ H01 (Ω) (qui u “si annulla” sull’intero bordo di Ω). Altre condizioni sotto le quali la (7.49) vale sono le seguenti: 1 1. u ∈ H0,Γ (Ω) (qui u “si annulla” su un aperto non vuoto Γ0 ⊂ ∂Ω); 0
2. u ∈ H 1 (Ω) e u = 0 su un insieme S ⊂ Ω con misura |S| = a > 0; 3. u ∈ H 1 (Ω) e
" Ω
u = 0 (u ha media nulla in Ω).
Teorema 8.2. Sia Ω un dominio limitato e Lipschiziano. Supponiamo che u soddisfi una tra le ipotesi 1-3. Allora esiste CP tale che u0 ≤ CP ∇u0 per ogni u che soddisfi una tra le ipotesi 1-3.
(7.50)
468
7 Distribuzioni e spazi di Sobolev
Dimostrazione. Facciamo una dimostrazione astratta, valida sotto una qualunque tra le ipotesi 1-3. Per fissare le idee, useremo l’ipotesi 1. Ragioniamo per assurdo supponendo che (7.50) sia falsa. Ciò significa che per ogni 1 (Ω) tale che intero naturale j ≥ 1, esiste una funzione uj ∈ H0,Γ 0 uj 0 > j ∇uj 0 .
(7.51)
Normalizziamo le uj in L2 (Ω) ponendo wj =
uj . uj 0
Allora, dalla (7.51), wj 0 = 1
e
∇wj 0 <
1 ≤ 1. j
Ne segue che la successione {wj } è limitata in H 1 (Ω) e per il Teorema di Rellich esiste una sottosuccessione, che continuiamo a chiamare {wj }, e w ∈ 1 H0,Γ (Ω) tali che: 0 • wj → w in L2 (Ω) , • ∇wj ! ∇w in L2 (Ω). Per la continuità della norma, w0 = lim wj 0 = 1. j→∞
D’altra parte, poiché la norma è semicontinua inferiormente rispetto alla convergenza debole (Teorema 6.7.7), ∇w0 ≤ lim inf ∇wj 0 = 0 j→∞
per cui ∇w = 0 ed essendo Ω connesso, si deduce che w è costante. Siccome 1 w ∈ H0,Γ (Ω) deve essere w = 0, che contraddice w0 = lim wj 0 = 1. 0 j→∞
La dimostrazione negli altri casi è identica. " 1 1 Nota 8.2. Siano Ω limitato e Lipschitziano e u ∈ H (Ω). Posto |Ω| Ω u = uΩ , si ha che w = u − uΩ ha media nulla e quindi per w vale la (7.50). Si ha dunque: u − uΩ 0 ≤ CP ∇u0 ∀u ∈ H 1 (Ω) . 7.8.3 Disuguaglianze di Sobolev in Rn Dal Microteorema 5.3, sappiamo che le funzioni di H 1 (a, b) sono continue in [a, b] e perciò limitate. Inoltre, vale la disuguaglianza max |v| ≤ C vH 1 (a,b) [a,b]
con la costante C che dipende dalla lunghezza dell’intervallo.
7.8 Compattezza e immersioni
469
D’altra parte, l’Esempio 5.1 implica che una disuguaglianza dello stesso tipo è falsa in dimensione maggiore di uno. Tuttavia, il fatto di possedere gradiente in L2 (Ω) implica una migliore sommabilità, nel senso che, se u ∈ H 1 (Ω) allora u ∈ Lp (Ω) per opportuni p > 2. Non solo, la norma di u in Lp (Ω) può essere controllata dalla norma di u in H 1 (Ω). Per renderci conto di quali p possano andar bene, consideriamo una disuguaglianza del tipo uLp (Rn ) ≤ c ∇uL2 (Rn )
(7.52)
e supponiamo che valga per ogni u ∈ D (Rn ), con la costante c che può dipendere da p, n ma non da u. Facciamo ora un tipico “ragionamento di analisi dimensionale”. La (7.52) deve essere invariante per dilatazioni dello spazio, nel senso seguente. Sia u ∈ D (Rn ) ed operiamo la dilatazione (od omotetia) di rapporto λ > 0, definita da x −→λx. La funzione uλ (x) = u (λx) appartiene ancora a D (Rn ) e quindi la (7.52) deve valere per uλ con la costante c indipendente da λ; cioè: uλ Lp (Rn ) ≤ c ∇uλ L2 (Rn ) .
Ora
p
|uλ | dx =
Rn
mentre
Rn
2
Rn
p
|u (λx)| dx =
|∇uλ | dx =
Rn
1 λn
p
Rn
|∇u (λx)| dx =
λ
|u (y)| dy
1
2
(7.53)
n−2
Rn
2
|∇u (y)| dy.
Inserendo nella (7.53) troviamo: 1 λn/p ossia
1/p
p
Rn
|u| dy
≤ c (n, p)
1 λ(n−2)/2
Rn
2
1/2
|∇u| dy
uLp (Rn ) ≤ cλ1− 2 + p ∇uL2 (Rn ) . n
n
L’indipendenza da λ forza la condizione 1 − che l’esponente corretto è dunque p∗ =
n 2
+
n p
= 0. Se n > 2, troviamo
2n , n−2
che si chiama esponente di Sobolev per H 1 (Rn ). Il risultato esatto è espresso nel seguente teorema di Sobolev, Gagliardo, Nirenberg del quale omettiamo la lunga e tecnica dimostrazione.
470
7 Distribuzioni e spazi di Sobolev ∗
Teorema 8.3. Siano n ≥ 3 e u ∈ H 1 (Rn ). Allora u ∈ Lp (Rn ) con 2n p = n−2 e vale la disuguaglianza ∗
uLp∗ (Rn ) ≤ c ∇uL2 (Rn ) dove c = c (n). Restano esclusi i casi n = 1 ed n = 2. Il caso n = 1 è elementare (Problema 7.15 (b)). Il caso n = 2 è critico. Infatti, ponendo formalmente n = 2, si otterrebbe p = ∞. Data la densità di D (Rn ) in H 1 (Rn ) ciò implicherebbe che, per ogni u ∈ H 1 (Rn ), si avrebbe uL∞ (Rn ) ≤ c ∇uL2 (Rn ) ma sappiamo dall’Esempio 5.1 che vi sono funzioni in H 1 (Rn ) illimitate. Il risultato corretto è il seguente. Microteorema 8.4. a) Sia u ∈ H 1 (R). Allora u ∈ C (R) ∩ L∞ (R) e vale la disuguaglianza uL∞ (R) ≤ uH 1 (R) . b) Sia u ∈ H 1 R2 . Allora u ∈ Lp R2 per 2 ≤ p < ∞ e vale la disuguaglianza uLp (R2 ) ≤ c (p) uH 1 (R2 ) . 7.8.4 Immersione di Sobolev in domini limitati Nel caso di domini limitati con il solito grado di regolarità, i risultati sono molto più articolati. Teorema 8.5. Sia Ω un dominio limitato e Lipschitziano. Allora 1. Se n > 2, H 1 (Ω) → Lp (Ω) per 2 ≤ p ≤ p∗ . Se 2 ≤ p < p∗ , l’immersione è compatta. 2. Se n = 2, H 1 (Ω) → Lp (Ω) per 2 ≤ p < ∞. L’immersione è compatta. Nei casi indicati vale inoltre la disuguaglianza uLp (Ω) ≤ c(n, p, Ω) uH 1 (Ω) . Per esempio, nel caso n = 3, abbiamo p∗ =
2n n−2
= 6, perciò H 1 (Ω) → L6 (Ω) e
uL6 (Ω) ≤ c(Ω) uH 1 (Ω) . Il Teorema 8.5 indica quello che “possiamo spremere” da una funzione di H 1 in termini di ulteriore regolarità. È naturale aspettarsi qualcosa in più per funzioni di H m , con m > 1. Infatti, vale il seguente teorema, dove il simbolo [s] indica la parte intera di s.
7.9 Spazi dipendenti dal tempo
471
Teorema 8.6. Sia Ω un dominio limitato e Lipschitziano. Se m > n/2 allora H m (Ω) → C k,α Ω , dove k = m− n2 −1 e α = m− n2 −k se n è dispari, altrimenti α è un qualunque numero in (0, 1). L’immersione è compatta e vale inoltre la disuguaglianza uC k,α (Ω ) ≤ c(n, m, α, Ω) uH m (Ω) . Vediamo alcuni esempi. In dimensione n = 2, occorrono almeno due derivate in L2 per avere continuità: H 2 (Ω) → C 0,α Ω , 0 < α < 1. Infatti, n è pari e per m = 2, si ha k = m − n2 − 1 = 0. Analogamente H 3 (Ω) → C 1,a Ω , 0 < α < 1, essendo k = m −
n 2
− 1 = 3 − 1 − 1 = 1.
In dimensione n = 3, si ha H 2 (Ω) → C 0,1/2 Ω
e
H 3 (Ω) → C 1,1/2 Ω
essendo nel caso k = m − n2 − 1 = 2 − 32 − 1 = 0 mentre, nel secondo, n primo k = m − 2 − 1 = 3 − 32 − 1 = 1. In entrambi i casi α = m − n2 − k = 12 . Nota 9.1. Se u ∈ H m (Ω) per ogni m ≥ 1, allora u ∈ C ∞ Ω .
7.9 Spazi dipendenti dal tempo 7.9.1 Funzioni a valori in spazi di Hilbert Problemi per equazioni non stazionarie (di tipo parabolico o iperbolico) vengono ambientati in spazi dipendenti dal tempo. Data una funzione u = u(x,t), dipendente dallo spazio e dal tempo, è a volte conveniente adottare un punto di vista leggermente diverso, separando i ruoli di spazio e tempo. Supponiamo che t vari in un intervallo temporale [0, T ] e che per ogni t, o per lo meno, per quasi ogni t ∈ [0, T ], la funzione u (·, t) appartenga ad uno spazio di Hilbert V (per esempio L2 (Ω) o H 1 (Ω)). Possiamo allora pensare u come funzione della sola variabile t a valori in V : u : [0, T ] → V. Quando adottiamo questa convenzione, scriviamo u (t) e u˙ (t) invece di u (x, t) e ut (x,t).
472
7 Distribuzioni e spazi di Sobolev
Possiamo estendere a questo tipo di funzioni le nozioni di misurabilità e di integrale senza eccessivo sforzo, seguendo la procedura indicata in Appendice B. Per prima cosa introduciamo l’insieme delle funzioni s : [0, T ] → V che assumono solo un numero finito di valori diversi. Queste funzioni di dicono semplici e sono della forma s (t) =
N j=1
(0 ≤ t ≤ T )
χEj (t) uj
(7.54)
dove u1 , ..., uN ∈ V e E1 , ..., EN sono sottoinsiemi di [0, T ], misurabili secondo Lebesgue, a due a due disgiunti. Una funzione f : [0, T ] → V si dice misurabile se esiste una successione sk : [0, T ] → V di funzioni semplici tale che, per k → ∞, sk (t) − f (t)V → 0,
q.o. in [0, T ] .
Non è difficile dimostrare che, se f è misurabile e v ∈ V , la funzione (reale) t −→ (f (t) , u)V è misurabile secondo Lebesgue in [0, T ]. La nozione di integrale è definita prima per funzioni semplici. Se s è data dalla (7.54), definiamo
T
s (t) dt = 0
N
|Ej | uj .
j=1
Abbiamo poi: Definizione 9.1. Diciamo che f : [0, T ] → V è sommabile in [0, T ] se esiste una successione sk : [0, T ] → V di funzioni semplici tale che
T
0
sk (t) − f (t)V → 0
per k → ∞.
(7.55)
Se f è sommabile in [0, T ], definiamo
T
T
f (t) dt = lim 0
k→∞
0
sk (t) dt
per k → ∞.
Poiché (controllare) > > T > > T > > [sh (t) − sk (t)] dt> ≤ sh (t) − sk (t)V dt > > > 0 0 V T ≤ sh (t) − f (t)V dt 0
T
+ 0
sk (t) − f (t)V dt,
(7.56)
7.9 Spazi dipendenti dal tempo
473
dalla (7.55) segue che la successione di numeri reali , T
sk (t) dt
0
è di Cauchy, cosicché il limite (7.56) è ben definito e non dipende dalla scelta della successione approssimante {sk }. Vale il seguente importante teorema. Teorema 9.1 (di Bochner). Una funzione misurabile f : [0, T ] → V è sommabile in [0, T ] se e solo se la funzione reale t −→ f (t)V è sommabile in [0, T ]. Inoltre > > T > T > > > f (t) dt> ≤ f (t)V dt (7.57) > > 0 > 0 V
e
#
$
T
u,
f (t) dt 0
T
= V
∀u ∈ V.
(u, f (t))V dt,
0
(7.58)
La (7.57) generalizza la ben nota disuguaglianza valida per funzioni reali o complesse. Per il Teorema di Rappresentazione di Riesz, la (7.58) indica che l’azione di un funzionale lineare, appartenente al duale V ∗ , commuta con l’operazione di integrazione. 7.9.2 Spazi di Sobolev dipendenti dal tempo Mediante la definizione di integrale di una funzione a valori in uno spazio di Hilbert V , possiamo introdurre gli spazi C ([0, T ]; V ) e Lp (0, T ; V ), 1 ≤ p ≤ ∞. Il simbolo C ([0, T ]; V ) denota l’insieme delle funzioni continue u : [0, T ] → V . Con la norma uL∞ (0,T ;V ) = max u (t)V < ∞ 0≤t≤T
C ([0, T ]; V ) è uno spazio di Banach. Lo spazio Lp (0, T ; V ) consiste delle funzioni misurabili u : [0, T ] → V tali che: se 1 ≤ p < ∞ # $1/p T
uLp (0,T ;V ) =
0
p
u (t)V dt
<∞
mentre se p = ∞ uL∞ (0,T ;V ) = ess sup u (t)V < ∞. 0≤t≤T
(7.59)
474
7 Distribuzioni e spazi di Sobolev
Con le norme indicate, Lp (0, T ; V ) risulta uno spazio di Banach; per p = 2 la norma (7.59) è indotta dal prodotto interno (u, v)L2 (0,T ;V ) =
T
(u (t) , v (t))V dt
0
rispetto al quale L2 (0, T ; V ) è uno spazio di Hilbert. Per definire gli spazi di Sobolev, abbiamo bisogno di dare una nozione di derivata nel senso delle distribuzioni per funzioni u ∈ L1loc (0, T ; V ). Diciamo che u˙ ∈ L1loc (0, T ; V ) è la derivata nel senso delle distribuzioni (si dice anche derivata debole) di u se
T
ϕ (t) u˙ (t) dt = −
0
T
ϕ˙ (t) u (t) dt
(7.60)
0
per ogni test ϕ ∈ D (0, T ), o equivalentemente, se
T 0
ϕ (t) (u˙ (t) , v)V dt = −
0
T
ϕ˙ (t) (u (t) , v)V dt
∀v ∈ V .
(7.61)
Possiamo allora dare le seguenti definizioni. a) W 1,p (0, T ; V ) indica lo spazio di Sobolev delle funzioni u ∈ Lp (0, T ; V ) tali che u˙ ∈ Lp (0, T ; V ). Tale spazio è di Banach con la norma # uW 1,p (0,T ;V ) =
0
T
p u (t)V
T
dt + 0
$1/p p u˙ (t)V
dt
,
se 1 ≤ p < ∞
e uW 1,∞ (0,T ;V ) = ess sup u (t)V + ess sup u˙ (t)V , 0≤t≤T
0≤t≤T
se p = ∞.
b) Nel caso p = 2 si può scrivere H 1 (0, T ; V ) anzichè W 1,2 (0, T ; V ). Questo spazio è di Hilbert col prodotto scalare T (u, v)H 1 (0,T ;V ) = {(u (t) , v (t))V + (u˙ (t) , v˙ (t))V } dt. 0
Abbiamo visto che, nel caso unidimensionale, le funzioni di H 1 (a, b) sono continue in [a, b] e vale per esse il teorema fondamentale del calcolo integrale. In un certo senso, gli spazi appena introdotti sono “unidimensionali” rispetto a t, per cui non è sorprendente il seguente teorema. Teorema 9.2. Sia u ∈ H 1 (0, T ; V ). Allora u ∈ C ([0, T ]; V ) e uL∞ (0,T ;V ) ≤ C (T ) uH 1 (0,T ;V ) . Inoltre, vale il teorema fondamentale del calcolo:
7.9 Spazi dipendenti dal tempo
u (t) = u (s) +
475
t
u˙ (r) dr
0 ≤ s ≤ t ≤ T.
s
Nella formulazione debole dei problemi iniziali-al bordo per equazioni di evoluzione nel Capitolo 9, occorre considerare funzioni u ∈ L2 (0, T ; V ) la cui derivata u˙ appartiene a L2 (0, T ; V ∗ ). Quest’ultima è definita ancora dalla formula (7.60), da intendersi come uguaglianza tra elementi di V ∗ o anche dalla formula T T ϕ (t) u˙ (t) , v∗ dt = − ϕ˙ (t) u (t) , v∗ dt ∀v ∈ V (7.62) 0
0
dove, ricordiamo, ·, ·∗ = ·, ·V ∗ ×V . Il seguente risultato è fondamentale 22 . Teorema 9.3. Sia (V, H, V ∗ ) una terna Hilbertiana, con H separabile. Siano u, v ∈ L2 (0, T ; V ), con u, ˙ v˙ ∈ L2 (0, T ; V ∗ ) . Allora: a) u ∈ C ([0, T ] ; H) e uL∞ (0,T ;H) ≤ C (T ) uL2 (0,T ;V ) + u ˙ L2 (0,T ;V ∗ ) ; (7.63) b) vale la seguente formula di integrazione per parti: t {u˙ (r) , v (r)∗ + v˙ (r) , u (r)∗ } dr = (u (t) , v (t))H − (u (s) , v (s))H s
(7.64) per ogni s, t ∈ [0, T ]. Nota 9.1. Dalla (7.64) e dal Teorema di Differenziazione di Lebesgue deduciamo che d (u (t) , v (t))H = u˙ (t) , v (t)∗ + v˙ (t) , u (t)∗ dt
q.o. in [0, T ].
Ponendo u = v, si ottiene 1 d 2 u (t)H = u˙ (t) , v (t)∗ 2 dt
q.o. in [0, T ] .
(7.65)
Concludiamo il capitolo con un risultato utile nelle applicazioni alle equazioni di evoluzione: la convergenza debole in L2 (0, T ; V ) “mantiene la limitatezza”. Microteorema 9.4. Sia {uk } ⊂ L2 (0, T ; V ), debolmente convergente a u. Supponiamo che esista C, indipendente da k, tale che uk L∞ (0,T ;V ) ≤ C. Allora anche uL∞ (0,T ;V ) ≤ C. 22
Per la dimostrazione, si veda Dautray-Lions, volume 5, capitolo XVIII, 1985.
476
7 Distribuzioni e spazi di Sobolev
Problemi 7.1. Approssimazione della δ. a) Siano Br la sfera di raggio r centrata nell’origine e χBr la sua funzione caratteristica. Mostrare che lim
r→0
1 χ =δ |Br | Br
in D (Rn ) .
b) Sia η ε il mollificatore definito nella (7.4). Mostrare che lim η ε = δ
ε→0
in D (Rn ) .
∞ 7.2. Sia {xk } ⊂ R, xk → +∞. Mostrare che la serie k=1 ck δ (x − xk ) converge in D (R) qualunque sia la successione numerica {ck } ⊂ R. 7.3. Dimostrare che la serie
∞ k=1
ck sin kx
converge in D (R) se la successione numerica {ck } è a crescita lenta, se cioè esiste p ∈ R tale che ck = O (k p ) per k → ∞. 7.4. Dimostrare che se F ∈ D (Rn ), v ∈ D(Rn ) e v si annulla in un aperto contenente il supporto di F , allora F, v = 0. È vero che F, v = 0 se v si annulla solo sul supporto di F ? 7.5. Mostrare, in base al Microteorema di completezza 1.4, che la relazione ϕ (x) dx, ∀ϕ ∈ D (R) , (7.66) T, ϕ = lim r→0 {|x|>r} x definisce una distribuzione T ∈ D (R). distribuzione si indica col Questa simbolo v.p. x1 . Controllare poi che x · v.p. x1 = 1. [Suggerimento. Mostrare che il limite nella (7.66) esiste finito per ogni ϕ ∈ D (R). L’ultimo integrale si chiama valor principale secondo Cauchy, da cui il simbolo v.p. x1 ]. 7.6. Siano u (x) = |x| e S (x) = sign(x). Controllare che u = S in D (R). 7.7. Sia u (x) = ln |x|. Dimostrare che u = v.p. x1 in D (R). [Suggerimento. Scrivere
u , ϕ = −u, ϕ = − e integrare per parti].
R
ln |x| ϕ (x) dx = − lim
ε→0
{|x|>ε}
ln |x| ϕ (x) dx
Problemi
477
1 7.8. Mostrare che, se u (x1 , x2 ) = − 4π ln(x21 + x22 ) allora −Δu = δ in D R2 .
7.9. Verificare che la soluzione dell’equazione xT = 1 in D (R) è data da T = v.p.
1 + cδ x
(c ∈ R) .
(7.67)
7.10. Trasformata di x. Dimostrare la formula x < = 2πi δ . [Suggerimento. Scrivere x < = F [x · 1] ed usare la proprietà 2 b) della trasformata di Fourier e l’Esempio 4.10]. 7.11. Siano u (x) =sign(x) e H = H (x) la funzione di Heaviside. Dimostrare le seguenti formule: u < (ξ) =
2 1 p.v. , i ξ
< (ξ) = πδ + 1 p.v. 1 . H i ξ
[Suggerimento. a) Provare che u = 2δ. Trasformando questa equazione si ottiene ξ< u (ξ) = −2i. Risolvere questa equazione usando la (7.67) e ricordare che u < è dispari mentre δ è pari. b) Scrivere H (x) = 12 + 12 sign(x) e usare a)]. −a
7.12. Siano Ω = B1 (0) ⊂ Rn , n > 2, e u (x) = |x| per quali valori di a, u ∈ H 2 (Ω).
, x = 0. Determinare
7.13. Nel Teorema 5.1 scegliamo H = L2 (Ω; Rn ),
Z = L2 (Ω) → D (Ω)
e L : H → D (Ω) dato L = div. Identificare lo spazio di Sobolev W che ne risulta. 7.14. Siano X e Z spazi di Banach e Z → D (Ω; Rn ) (e.g. Lp (Ω) o L (Ω; Rn )). Sia L : X → D (Ω; Rn ) un operatore lineare e continuo (e.g. un gradiente o una divergenza). Definiamo p
W = {v ∈ X : Lv ∈ Z} con norma
2
2
2
uW = uX + LuZ .
478
7 Distribuzioni e spazi di Sobolev
Dimostrare che W è uno spazio di Banach, immerso con continuità in X. [Suggerimento. Imitare la dimostrazione del Teorema 5.1]. 7.15. Lo spazio di Sobolev W 1,p (Ω). Sia Ω ⊆ Rn . Per p ≥ 1, definiamo W 1,p (Ω) = {v ∈ Lp (Ω) : ∇v ∈ Lp (Ω; Rn )} . Usando il risultato del Probema 7.13, dimostrare che W 1,p (Ω) è uno spazio di Banach. 7.16. Sia u ∈ H s (R). (a) Mostrare che, se s > 1/2, allora u ∈ C (R) e u (x) → 0 per x → ±∞. (b) Dedurre che, se s = 1, si ha u ∈ C (R)∩L∞ (R) e uL∞ (R) ≤ uH 1 (R) . [Suggerimento. (a) Mostrare che u < ∈ L1 (R)]. 7.17. Sia
1 H0,a (a, b) = u ∈ H 1 (a, b) : u (a) = 0 .
1 (a, b)? Vale la disuguaglianza di Poincaré in H0,a
7.18. Disuguaglianza di Poincaré in domini illimitati. Sia n > 1 e Ω = (x , xn ) : x ∈ Rn−1 , 0 < xn < d . Dimostrare che la disuguaglianza di Poincaré vale in H01 (Ω). 7.19. Sia Ω un dominio limitato e Lipschitziano in Rn . Poniamo Γ = ∂Ω. a) Mostrare che (u, v)1,∂ = u|Γ v|Γ dσ + ∇u · ∇v dx Γ
Ω
1
è un prodotto interno in H (Ω) . b) Mostrare che la norma u1,∂ =
∂Ω
u2|Γ
2
|∇u| dx
dσ +
1/2 (7.68)
Ω
è equivalente a u1,2 . [Suggerimento. b) Sia u|Γ = g. Per il Teorema di Proiezione 6.2, è possibile scrivere in un unico modo u = u0 + g˜, con u0 ∈ H01 (Ω), g˜ ∈ H 1 (Ω) e (u0 , g˜)1,2 = 0. Usando (7.45), mostrare che gH 1/2 (Γ ) = ˜ g 1,2 ].
8 Formulazione variazionale di problemi ellittici
8.1 Equazioni ellittiche L’equazione di Poisson Δu = f è il prototipo delle equazioni ellittiche, già classificate nel caso bidimensionale nella Sezione 5.5. Questo tipo di equazioni si presenta nella modellazione di una vasta classe di fenomeni, spesso in condizioni di equilibrio. Tipicamente, in modelli di diffusione, trasporto e reazione come quelli considerati nel Capitolo 2, le condizioni di stazionarietà, che possono corrispondere a situazioni a regime dove non c’è più dipendenza dal tempo, conducono ad equazioni ellittiche. Esse intervengono inoltre nella teoria dei potenziali elettrostatici ed elettromagnetici, nonchè nella determinazione dei modi di vibrazione di strutture elastiche (per esempio attraverso il metodo di separazione delle variabili per l’equazione delle onde). Precisiamo che cosa si intende per equazione ellittica in dimensione n. Siano Ω un dominio di Rn , A = A (x) = (aij (x)) una matrice quadrata di ordine n, b = b (x) e c = c (x) campi vettoriali in Rn , a = a(x) ed f = f (x) funzioni reali. Un’equazione della forma −
n
n n
∂xi aij (x) uxj + ∂xi (bi (x)u)+ ci (x)uxi +a (x) u = f (x) (8.1)
i,j=1
i=1
i=1
oppure −
n
aij (x) uxi xj +
i,j=1
n
ci (x) uxi + a (x) u = f (x)
(8.2)
i=1
si dice ellittica in Ω se A è definita positiva in Ω, se cioè vale la seguente condizione di ellitticità :
n i,j=1
aij (x) ξ i ξ j > 0,
∀x ∈Ω, ∀ξ ∈Rn , ξ = 0.
Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
480
8 Formulazione variazionale di problemi ellittici
Si dice che la (8.1) è in forma di divergenza, poiché si può scrivere nel seguente modo: −div(A∇u) + div(bu) + c · ∇u + -./0 au = ./ 0 ./ 0 dif f usione
trasporto
reazione
f -./0
(8.3)
sorgente esterna
che mette in evidenza la particolare struttura del primo termine. Generalmente quest’ultimo modella fenomeni di diffusione in mezzi non omogenei e/o non isotropi, per i quali, per esempio, vale una legge costitutiva per la funzione di flusso q del tipo Fourier o Fick: q = −A∇u dove u rappresenta la temperatura o la concentrazione di una sostanza (o altro ancora). Il termine −div(A∇u) è quindi associato al fenomeno di diffusione termica o molecolare. La matrice A si chiama matrice di diffusione; la dipendenza di A da x indica che la diffusione avviene in modo non isotropo. Usando la disuguaglianza della conduzione del calore −q · ∇u ≥ 0, che traduce il ben noto fatto che il calore fluisce sempre in verso opposto al gradiente di temperatura, si ottiene A∇u · ∇u ≥ 0 che chiarisce origine e significato fisico della condizione di ellitticità. Gli esempi esaminati nel Capitolo 2 ci guidano al significato degli altri termini nella (8.3). In particolare, div(bu) modella convezione o trasporto e corrisponde ad una funzione di flusso data da q = bu. Il vettore b ha le dimensioni di una velocità. Si pensi, per esempio, al caso del fumo emesso da un impianto industriale che diffonde trasportato dal vento. In questo caso b è la velocità del vento. Si noti che, se divb = 0, allora div(bu) si riduce a b · ∇u che è della stessa forma del terzo termine c · ∇u. Anche quest’ultimo è dunque un termine di trasporto, ma come vedremo, è bene inserire entrambi i termini. Il termine au, che chiamiamo termine di reazione può avere diversi significati. Per esempio, se u è la concentrazione di una sostanza, a può rappresentare un tasso di decomposizione (a > 0) o di crescita (a < 0). Infine, f rappresenta l’azione di un agente esogeno, distribuita in Ω (per esempio proporzionale al calore sottratto o fornito nell’unità di tempo). La (8.2) si dice in forma di non divergenza. Se gli elementi aij di A sono differenziabili, n la (8.2) si può scrivere in forma di divergenza aggiungendo e togliendo i=1 (∂xi aij ) uxj . Viceversa, se nella (8.2) gli elementi aij di A e le
8.2 Tipi di soluzione
481
componenti bj di b sono tutte differenziabili, si può calcolare la divergenza di A∇u e bu e ricondursi la alla forma di non divergenza −
n
aij uxi xj +
i,j=1
dove ˜bk =
n
n
˜bk ux + a ˜u = f k
k=1
∂xi aik + bk + ck
e
a ˜ = divb + a.
i=1
Quando però si trattano casi in cui le proprietà fisiche in gioco sono distribuite in modo irregolare, per esempio discontinuo, tutti o alcuni degli elementi aij e bj risultano non differenziabili ed occorre mantenere la forma di divergenza. In questi casi, tuttavia, occorre dare un significato all’equazione! Anche la forma di non divergenza è associata a fenomeni di diffusione attraverso la considerazione di processi stocastici che generalizzano il moto Browniano e che sono detti processi di diffusione. In casi non troppo complicati si può procedere con varianti della passeggiata aleatoria del Capitolo 2. Per esempio, considerando una passeggiata aleatoria in hZ2 , simmetrica lungo ciascun asse, separatamente, e passando al limite in modo opportuno per h e τ (il passo temporale) tendenti a zero, si ottiene un’equazione del tipo ut = D1 (x, y) uxx + D2 (x, y) uyy con matrice di diffusione A (x, y) =
D1 (x, y) 0 0 D2 (x, y)
dove D1 (x, y) > 0, D2 (x, y) > 0. Nel caso stazionario, si trova un’equazione ellittica in forma di non divergenza. Nella prossima sezione, esaminiamo brevemente alcune nozioni di soluzione proponibili per questo genere di equazioni servendoci come modello dell’equazione di Poisson −Δu + au = f . Successivamente svilupperemo i fondamenti della teoria per le equazioni ellittiche in forma di divergenza, riformulando i più comuni problemi (di Dirichlet, Neumann, Robin e misti) nel quadro funzionale astratto della Sezione 6.6.
8.2 Tipi di soluzione Siano dati: un dominio limitato Ω ⊂ Rn e due funzioni a, f : Ω → R. Si vuole determinare una funzione u che soddisfi −Δu + a (x) u = f (x)
in Ω
(8.4)
482
8 Formulazione variazionale di problemi ellittici
e inoltre condizioni su ∂Ω
(8.5)
che possono assumere le forme usuali. Che cosa vuol dire risolvere il problema (8.4)? La risposta è ovvia da un lato, molto meno da un altro. La parte ovvia è l’obiettivo finale: si vuole mostrare esistenza, unicità, stabilità della soluzione; sulla base di questi risultati, si vuole poi calcolare la soluzione, mediante i metodi dell’Analisi Numerica. Meno ovvio è il significato di soluzione. Infatti, ogni problema, ed in particolare quello di Poisson, si può formulare in vari modi e ad ognuno di questi è associata una nozione di soluzione. È importante, allora, selezionare quella “più efficiente” per il problema in esame, dove per efficienza si potrebbe intendere il miglior compromesso tra facilità di formulazione e di risolubilità teorica, sufficiente generalità, adattabilità ai metodi numerici. Analizziamo brevemente varie nozioni disponibili di soluzione per il problema di Poisson. •
Soluzioni classiche. Hanno due derivate continue; l’equazione differenziale e le condizioni al bordo sono intese nel senso classico (puntuale) dell’Analisi. • Soluzioni forti. Sono funzioni nello spazio di Sobolev H 2 (Ω); hanno quindi due derivate in L2 (Ω), nel senso delle distribuzioni. L’equazione differenziale vale quasi ovunque (cioè puntualmente, a meno di insiemi di misura nulla secondo Lebesgue) e le condizioni al bordo sono soddisfatte nel senso delle tracce. • Soluzioni distribuzionali. Sono funzioni in L1loc (Ω) e l’equazione vale nel senso delle distribuzioni: {−uΔϕ + auϕ} dx = f ϕ dx, ∀ϕ ∈ D (Ω) . Ω
Ω
Le condizioni al bordo potrebbero essere interpretate in un opportuno senso debole. • Soluzioni deboli o variazionali. Sono funzioni nello spazio di Sobolev H 1 (Ω). Il problema è riformulato nel quadro funzionale astratto della Sezione 6.6. In molti casi, la nuova formulazione rappresenta una versione del principio dei lavori virtuali. Naturalmente c’è qualcosa che collega tutte queste nozioni ed è un principio di coerenza che si può formulare così: se tutti i dati del problema (dominio, coefficienti, dati al bordo, forzante esterna) e la soluzione sono regolari, tutte le nozioni di soluzione devono risultare equivalenti. Le nozioni non-classiche costituiscono dunque un “allargamento” della nozione di soluzione, rispetto a quella classica. Una questione che si pone naturalmente e che ha importanti riflessi sul controllo dell’errore nei metodi numerici è stabilire il grado di regolarità ottimale della soluzione. Più precisamente, ci si chiede:
8.3 Formulazioni variazionali per l’equazione di Poisson
483
sia u soluzione non classica del problema di Poisson : quanto si trasferisce la regolarità dei dati a, f e del dominio Ω sulla soluzione? Una risposta esauriente richiede tecniche abbastanza complicate, per cui ci limiteremo solo ad enunciare alcuni risultati significativi per l’Analisi Numerica. La teoria per soluzioni classiche e forti, che richiede strumenti matematici piuttosto avanzati, è ben consolidata ed il lettore può trovarla nei libri specialistici indicati in bibliografia. Dal punto di vista numerico, il metodo delle differenze finite è aderente alla forma differenziale del problema e dunque possiamo dire che esso miri ad approssimare soluzioni classiche. La teoria distribuzionale è stata ampiamente trattata, è molto generale, ma non è la più indicata per il trattamento dei problemi al contorno. Proprio il senso in cui sono assunti i dati al bordo del dominio rappresenta uno dei punti delicati quando si voglia “allargare” il concetto di soluzione. Per i nostri scopi, la nozione più conveniente di soluzione è l’ultima: infatti, porta ad una formulazione molto flessibile con un elevato grado di generalità e con una teoria basata, sostanzialmente, su due teoremi di Analisi Funzionale (Teoremi di Lax-Milgram e dell’Alternativa di Fredholm ). Inoltre, l’analogia (e spesso la coincidenza) col principio dei lavori virtuali indica aderenza all’interpretazione fisica. Infine, la formulazione debole è quella naturale per implementare le varie versioni del metodo di Galerkin (con elementi finiti, metodi spettrali, ecc.), di cui si fa ampio uso nella moderna teoria dell’approssimazione per le equazioni a derivate parziali. Occupiamoci dunque della formulazione debole, partendo, per meglio motivare definizioni e scelte, proprio dal caso dell’equazione di Poisson.
8.3 Formulazioni variazionali per l’equazione di Poisson Esaminiamo formulazione debole e soluzione dei problemi di Dirichlet e Neumann per l’equazione di Poisson. In generale, per la formulazione debole uno dei punti chiave è incorporare le condizioni al bordo nella formulazione stessa. I passi tipici sono i seguenti: 1. Scegliere uno spazio di funzioni test, regolari ed adattate alla condizione al bordo. Moltiplicare l’equazione differenziale per una funzione test arbitraria ed integrare l’equazione così ottenuta su Ω. 2. Assumere che dati e soluzione siano regolari e “scaricare” un ordine di derivazione dal termine di diffusione alla funzione test mediante integrazione per parti, usando le condizioni al bordo. 3. Ambientare l’equazione integrale ottenuta in un opportuno spazio di Hilbert, che, in generale, coincide con uno spazio di Sobolev, chiusura topologica dello spazio di funzioni test di partenza (nella norma di Sobolev). Si ricava così la formulazione variazionale.
484
8 Formulazione variazionale di problemi ellittici
4. Controllare che la scelta dello spazio di funzioni test e la conseguente formulazione variazionale ottenuta siano quelle corrette. In base al principio di coerenza, basta assumere che dati e soluzione siano regolari, rifare i calcoli in senso inverso e ricavare la formulazione originale. 5. Per risolvere il problema, formulare il problema come problema variazionale astratto (Sezione 6.6) e usare il Teorema di Lax-Milgram (o anche il Teorema di Rappresentazione di Riesz, se la forma bilineare è simmetrica). 8.3.1 Condizioni di Dirichlet Sia Ω ⊂ Rn un dominio limitato. Vogliamo scrivere una formulazione variazionale del problema −Δu + a (x) u = f (x) in Ω (8.6) u=0 su ∂Ω e risolverlo. Procediamo formalmente, seguendo i passi 1-5 descritti sopra. 1. Scegliamo C0∞ (Ω) come classe di funzioni test. Le funzioni in questa classe sono regolari ed hanno supporto compatto in Ω. In particolare, quindi, sono nulle su ∂Ω. Moltiplichiamo l’equazione differenziale per v ∈ C0∞ (Ω) ed integriamo su Ω: {−Δu v + auv} dx = f v dx. Ω
Ω
Si noti che questa equazione vale per ogni v ∈ C0∞ (Ω), essendo v arbitraria. 2. Integriamo per parti il primo termine; essendo v = 0 su ∂Ω, si ottiene {∇u · ∇v + auv} dx = f v dx, ∀v ∈ C0∞ (Ω) . Ω
Ω
3. Osserviamo che il problema (8.6) si è trasformato in un’equazione integrale valida su uno spazio di funzioni test infinito-dimensionale, nel quale intervengono solo derivate del prim’ordine. È allora naturale cercare la soluzione u nello spazio di Sobolev H01 (Ω), chiusura di C0∞ (Ω) in H 1 (Ω), ed allargare la classe delle funzioni test ad H01 (Ω). Di conseguenza, a ∈ L∞ (Ω) ed f ∈ L2 (Ω) appaiono ipotesi ragionevoli. La formulazione variazionale è dunque la seguente: Determinare u ∈ H01 (Ω) tale che {∇u · ∇v + auv} dx = f v dx, ∀v ∈ H01 (Ω) . (8.7) Ω
Ω
1 4. Sia u ∈ H0 (Ω) una soluzione di (8.7) che sia regolare, diciamo di classe C Ω . Allora u = 0 su ∂Ω e si può invertire l’integrazione per parti per tornare a {−Δu + au − f } v dx = 0. 2
Ω
8.3 Formulazioni variazionali per l’equazione di Poisson
485
Se a ed f sono continue in Ω, L’arbitrarietà di v, implica allora che −Δu+ au −f = 0 in Ω. Per soluzioni regolari, le due formulazioni (8.6) e (8.7) sono dunque equivalenti. 5. Sia V = H01 (Ω) . Introduciamo la forma bilineare B (u, v) = {∇u · ∇v + auv} dx Ω
e il funzionale lineare L definito da
f v dx.
Lv = Ω
Il problema è allora equivalente a determinare una funzione u ∈ V tale che B (u, v) = Lv,
∀v ∈ V.
Ricordiamo che, essendo1 u0 ≤ CP ∇u0 , si può scegliere u1 = ∇u0 e (u, v)1 = (∇u, ∇v) come norma e prodotto scalare in V , rispettivamente. Esistenza, unicità e dipendenza continua della soluzione seguono dal Teorema di Lax-Milgram, sotto l’ulteriore ipotesi di non negatività di a. Teorema 3.1. Assumiamo che f ∈ L2 (Ω) e che a ∈ L∞ (Ω), a ≥ 0 q.o. in Ω. Allora il problema (8.7) ha una sola soluzione u ∈ H01 (Ω). Inoltre u1 ≤ CP f 0 . Dimostrazione. Usiamo il Teorema di Lax-Milgram. Si ha, dalle disuguaglianze di Schwarz e di Poincaré: |B (u, v)| ≤ ∇u0 ∇v0 + aL∞ (Ω) u0 v0 ≤ (1 + CP2 aL∞ (Ω) ) ∇u0 ∇v0 per cui B è continua in H01 (Ω). La coercività segue da 2 2 |∇u| + au2 dx ≥ ∇u0 B (u, u) = Ω
essendo a ≥ 0. Ancora dalle disuguaglianze di Schwarz e di Poincaré si ha |Lv| = f v dx ≤ f 0 v0 Ω
≤ CP f 0 ∇v0 1
Disuguaglianza di Poincaré, Teorema 7.2.3.
486
8 Formulazione variazionale di problemi ellittici
per cui L ∈ H −1 (Ω) e LH −1 (Ω) ≤ CP f 0 . La tesi segue ora dal Teorema di Lax-Milgram. Nota 3.1. Per fissare le idee, supponiamo che a = 0 e che u rappresenti la posizione di equilibrio di una membrana elastica. La (8.7) corrisponde al principio dei lavori virtuali. Infatti, B (u, v) rappresenta il lavoro effettuato dalle forze elastiche interne in seguito ad uno spostamento virtuale v, mentre Lv esprime quello delle forze esterne. L’equazione in forma debole equivale all’uguaglianza di questi due lavori. Inoltre, data la simmetria della forma bilineare B, la soluzione del problema di Dirichlet minimizza in H01 (Ω) il funzionale di Dirichlet (Paragrafo 6.6.2) 1 2 E (u) = |∇u| dx − f u dx 2 - Ω ./ 0 - Ω ./ 0 Energia elastica interna
Energia potenziale esogena
che ha il significato di energia potenziale totale. L’equazione in forma debole coincide allora con l’equazione di Eulero del funzionale E. Ancora in accordo col principio dei lavori virtuali, la posizione di equilibrio u, soluzione dell’equazione in forma debole, è quella che minimizza l’energia potenziale tra tutte le posizioni ammissibili. Osservazioni analoghe valgono per gli altri tipi di condizioni al bordo. Nota 3.2. Poiché la forma bilineare B è simmetrica e coerciva in H01 (Ω), la relazione (u, v)B = B (u, v) definisce un prodotto scalare in questo spazio (Nota 6.6.5). Essendo L ∈ H −1 (Ω), il Teorema 3.1 segue allora direttamente dal Teorema di Rappresentazione di Riesz. Considereremo condizioni di Dirichlet non omogenee nel Paragrafo 8.4.5. 8.3.2 Condizioni di Neumann Siano Ω ⊂ Rn un dominio limitato e Lipschitziano. Vogliamo scrivere una formulazione variazionale del problema −Δu + au = f in Ω (8.8) ∂ν u = g su ∂Ω dove ν indica il versore normale esterno a ∂Ω. Come per il problema di Dirichlet, procediamo formalmente seguendo i passi 1-5. 1. Non c’è un modo naturale di scegliere lo spazio di funzioni test in modo da incorporare il dato di Neumann, per cui scegliamo C ∞ Ω come classe di funzioni test. Moltiplichiamo l’equazione differenziale per v ∈ C ∞ Ω ed integriamo su Ω; deduciamo l’equazione {−Δu v + auv} dx = f v dx, ∀v ∈ C ∞ Ω . Ω
Ω
8.3 Formulazioni variazionali per l’equazione di Poisson
487
2. Integriamo per parti il primo termine, usando la condizione di Neumann; si ottiene {∇u · ∇v dx + auv} dx = f v dx + gv dσ ∀v ∈ C ∞ Ω . Ω
Ω
∂Ω
3. Anche il problema (8.8) si è trasformato in un’equazione integrale valida su uno spazio di funzioni test infinito-dimensionale, nel quale intervengonoso- lo derivate del prim’ordine. Ricordiamo ora che, per il Teorema 7.10, C ∞ Ω è denso in H 1 (Ω), che perciò appare come lo spazio di Sobolev adatto al problema di Neumann. Pertanto, cerchiamo la soluzione in H 1 (Ω) e allarghiamo lo spazio di funzioni test a H 1 (Ω). La formulazione variazionale è dunque la seguente: Determinare u ∈ H 1 (Ω) tale che: {∇u · ∇v + auv} dx = f v dx + gv dσ, ∀v ∈ H 1 (Ω) . (8.9) Ω
Ω
∂Ω
Si noti come, diversamente dal problema di Dirichlet, la condizione al bordo è nascosta nell’equazione. Si dice che la condizione di Neumann è una condizione naturale (cioè non forzata). L’ultimo integrale fa intervenire la traccia di v su ∂Ω, ben definita in quanto Ω è un dominio Lipschitziano. Ricordiamo (Teorema 7.7.1) che in tal caso vale la disuguaglianza “di traccia” vL2 (∂Ω) ≤ C (n, Ω) v1,2 .
(8.10)
Di conseguenza, richieste ragionevoli sui dati sono a ∈ L∞ (Ω), f ∈ L2 (Ω) e g ∈ L2 (∂Ω). 4. Sia ora u ∈ C 2 Ω una soluzione di (8.9). Se a, f e g sono continue in Ω e ∂Ω, rispettivamente, e il bordo di Ω è regolare, si può facilmente tornare indietro con l’integrazione per parti per arrivare all’equazione {−Δu + au − f } v dx + {∂ν u − g } v dσ = 0 Ω
∂Ω
valida per ogni v ∈ C ∞ Ω . Scegliendo in particolare v ∈ C0∞ (Ω), l’integrale sul bordo è nullo e, data l’arbitrarietà di v, si recupera l’equazione differenziale −Δu + au − f = 0
in Ω.
Scegliendo v non nulla al bordo, abbiamo ora {∂ν u − g } vdσ = 0 ∂Ω
e l’arbitrarietà di v implica che deve essere ∂ν u = g su ∂Ω, recuperando anche la condizione di Neumann. Per soluzioni regolari, le due formulazioni (8.8) e (8.9) sono dunque equivalenti.
488
8 Formulazione variazionale di problemi ellittici
5. Sia V = H 1 (Ω). Introduciamo la forma bilineare {∇u · ∇v + auv} dx B (u, v) = Ω
e il funzionale lineare L definito da f v dx + Lv = Ω
gv dσ.
∂Ω
Il problema è allora equivalente a determinare una funzione u ∈ V tale che ∀v ∈ V.
B (u, v) = Lv,
La buona posizione del problema segue dal Teorema di Lax-Milgram, sotto l’ulteriore ipotesi che a ≥ a0 > 0 q.o. in Ω. Precisamente, abbiamo: Teorema 3.2. Sia Ω ⊂ Rn un dominio limitato e lipschitziano. Siano inoltre f ∈ L2 (Ω), g ∈ L2 (∂Ω) e a ∈ L∞ (Ω). Se a (x) ≥ a0 > 0
q.o. in Ω,
(8.11)
il problema di Neumann ha un’unica soluzione u ∈ H 1 (Ω). Inoltre 1 u1,2 ≤ f 0 + C gL2 (∂Ω) . min {1, a0 } Dimostrazione. Controlliamo le ipotesi del Teorema di Lax-Milgram. Si ha, usando la disuguaglianza di Schwarz, |B (u, v)| ≤ ∇u0 ∇v0 + aL∞ (Ω) u0 v0 ≤ max 1, aL∞ (Ω) u1,2 v1,2 per cui B è continua in H 1 (Ω). La coercività di B segue dalla (8.11): 2 2 |∇u| dx + au2 dx ≥ min {1, a0 } u1,2 . B (u, u) = Ω
Ω
Infine, usando la (8.10):
|Lv| ≤ f v dx + Ω
∂Ω
gv dσ
≤ f 0 v0 + gL2 (∂Ω) vL2 (∂Ω) ≤ f 0 + C gL2 (∂Ω) v1,2 . Il funzionale L è dunque continuo in H 1 (Ω) con LH 1 (Ω)∗ ≤ f L2 (Ω) + C gL2 (∂Ω) . La tesi segue dal Teorema di Lax-Milgram.
8.3 Formulazioni variazionali per l’equazione di Poisson
489
Nota 3.3. Senza la condizione a (x) ≥ a0 > 0 q.o. in Ω, non c’è, in generale, esistenza nè unicità della soluzione. Supponiamo, per esempio a ≡ 0; allora, aggiungendo ad una soluzione una qualunque costante, si ottiene ancora una soluzione dello stesso problema. L’unicità si ripristina richiedendo, per esempio, che u abbia integrale nullo in Ω: u (x) dx = 0. Ω
L’esistenza di una soluzione richiede la seguente condizione di compatibilità sui dati f e g: f dx + g dσ = 0 (8.12) Ω
∂Ω
come si ottiene semplicemente sostituendo v = 1 nell’equazione ∇u · ∇v dx = f v dx + gv dσ Ω
Ω
∂Ω
che deve essere valida per ogni v ∈ H 1 (Ω); si noti che, essendo Ω limitato, la funzione v = 1 appartiene a H 1 (Ω). Se non vale la (8.12) non esiste alcuna soluzione. Viceversa, vedremo più avanti2 che, se questa condizione è verificata, una soluzione esiste. La (8.12) non è in realtà misteriosa. Consideriamo il caso della membrana con bordo libero di "scorrere lungo una guida verticale. In questo caso g = 0 e la (8.12) si riduce a Ω f dx = 0. Questa condizione esprime l’ovvio fatto, che, in condizioni di equilibrio, la risultante del carico sulla membrana deve annullarsi. 8.3.3 Autovalori e autofunzioni dell’operatore di Laplace Nel capitolo sugli elementi di Analisi Funzionale abbiamo visto come l’efficacia del metodo di separazione delle variabili per un dato problema sia legata all’esistenza di una base di autofunzioni associate a quel problema. I risultati astratti del Paragrafo 6.9.3 sullo spettro di una forma bilineare forniscono gli strumenti necessari per analizzare le proprietà spettrali degli operatori uniformemente ellittici ed in particolare dell’operatore di Laplace. Occorre sottolineare che lo spettro di un operatore differenziale deve essere sempre associato a specifiche condizioni al bordo e cioè al tipo di problema che si vuole considerare. Possiamo, per esempio, considerare le autofunzioni di Dirichlet per l’operatore di Laplace in un dominio Ω limitato, ossia le soluzioni non banali del problema −Δu = λu in Ω (8.13) u=0 su ∂Ω. 2
Teorema 4.4.
490
8 Formulazione variazionale di problemi ellittici
Una soluzione debole di (8.13) è una funzione u ∈ H01 (Ω) tale che ∀v ∈ H01 (Ω) .
a (u, v) ≡ (∇u, ∇v)0 = λ (u, v)0
Essendo Ω limitato, la forma bilineare a è H01 (Ω) −coerciva ed inoltre l’immersione di H01 (Ω) in L2 (Ω) è compatta. Dal Teorema 6.9.4 abbiamo: Teorema 3.3. Sia Ω un dominio limitato. Allora a) esiste in L2 (Ω) una base ortonormale {uk }k≥1 di autofunzioni di Dirichlet per l’operatore di Laplace; b) i corrispondenti autovalori {λk }k≥1 sono tutti positivi e possono essere ordinati in una successione crescente 0 < λ 1 ≤ λ2 ≤ · · · ≤ λ k ≤ · · · , con λk → +∞. Ogni autospazio ha dimensione finita; √ c) la successione uk / λk k≥1 costituisce una base ortonormale in H01 (Ω) rispetto al prodotto scalare (u, v)1 = (∇u, ∇v)0 . Dal Microteorema 6.9.5, deduciamo poi il seguente principio variazionale per il primo autovalore di Dirichlet λ1 : (8.14) λ1 = R (u1 ) = min R (v) : v ∈ H01 (Ω) , v = 0 dove R (v) è il quoziente di Rayleigh: " R (v) =
2
Ω "
|∇v| . v2 Ω
(8.15)
Inoltre: Microteorema 3.5. Sia Ω un dominio di classe C ∞ . Allora λ1 è semplice, ossia il corrispondente autospazio ha dimensione 1 e ogni autofunzione w1 corrispondente a λ1 ha segno costante in Ω. Dimostrazione. Mostriamo prima che w1 ha segno costante. Posto z = |w1 | si ha che R (z) = R (w1 ) e quindi, dal Microteorema 6.9.5 deduciamo che z è soluzione dell’equazione (∇z, ∇v)0 = λ1 (z, v)0
∀v ∈ H01 (Ω) .
Poiché Ω è di classe C ∞ , allora (si veda il Teorema 6.4) z ∈ C ∞ Ω per cui soddisfa l’equazione −Δz = λ1 z in Ω (8.16) in senso classico e si annulla su ∂Ω. Essendo z ≥ 0 e λ1 > 0, dalla (8.16) segue che z è superarmonica in Ω e per il principio di massimo (si veda la (3.121)), concludiamo che z = |w1 | > 0 in Ω. Pertanto w1 non si annulla in Ω ed essendo continua ha segno costante.
8.3 Formulazioni variazionali per l’equazione di Poisson
491
Come conseguenza, l’autospazio di λ1 ha dimensione 1, generato per esempio dall’autovettore normalizzato u1 . Se così non fosse, dovrebbe esistere un’altra autofunzione w1 ortogonale in L2 (Ω) a u1 . Ma ciò è impossibile, avendo w1 e u1 segno costante in Ω. Anche gli altri autovalori hanno una caratterizzazione variazionale. Per esempio, indicando con V1 l’autospazio corrispondente a λ1 , si ha (si veda il Problema 8.18): (8.17) λ2 = min R (v) : v = 0, v ∈ H01 (Ω) ∩ V1⊥ . Teoremi analoghi al 3.3 valgono per gli altri tipi di problemi e per operatori più generali (si veda il Problema 8.19). Per esempio, le autofunzioni di Neumann per l’operatore di Laplace in Ω sono le soluzioni non banali del problema −Δu = μu in Ω (8.18) ∂ν u = 0 su ∂Ω. Una soluzione debole di (8.18) è una funzione u ∈ H 1 (Ω) tale che a (u, v) ≡ (∇u, ∇v)0 = μ (u, v)0
∀v ∈ H 1 (Ω) .
Se Ω è limitato e Lipschitziano, l’immersione di H 1 (Ω) in L2 (Ω) è compatta. Inoltre, la forma bilineare a è debolmente H 1 (Ω) −coerciva, infatti 2
a (u, u) + (u, u)0 = u1,2 e quindi, dal Teorema 9.4 abbiamo: Teorema 3.4. Sia Ω un dominio limitato e Lipschitziano. Allora a) Esiste in L2 (Ω) una base ortonormale {wk }k≥1 di autofunzioni di Neumann per l’operatore di Laplace. b) I corrispondenti autovalori {μk }k≥1 possono essere ordinati in una successione non decrescente 0 = μ1 ≤ μ2 ≤ · · · ≤ μk ≤ · · · , con μk → +∞. Ogni autospazio ha dimensione finita. √ c) La successione {wk / μk + 1}k≥1 costituisce una base ortonormale in H 1 (Ω) rispetto al prodotto scalare (u, v)1,2 = (∇u, ∇v)0 + (u, v)0 .
8.3.4 Un risultato di stabilità asintotica I risultati precedenti possono essere usati per dimostrare che, sotto ipotesi ragionevoli, per t → ∞, una soluzione dell’equazione di diffusione tende in
492
8 Formulazione variazionale di problemi ellittici
media quadratica alla soluzione del problema stazionario corrispondente. Co- me situazione modello consideriamo la seguente. Sia u ∈ C 2,1 Ω × [0, +∞) la soluzione del problema ⎧ ⎪ ⎨ ut − Δu = f (x) x ∈ Ω, t > 0 u (x,0) = U (x) x∈Ω ⎪ ⎩ u (σ,t) = 0 σ ∈ ∂Ω, t > 0 dove Ω è limitato e Lipschitziano. Indichiamo con u∞ = u∞ (x) la soluzione del problema stazionario −Δu∞ = f in Ω u∞ = 0
su ∂Ω.
Microteorema 3.5. Nelle ipotesi indicate sopra, si ha, per t ≥ 0, u (·, t) − u∞ 0 ≤ e−λ1 t {CP f 0 + u0 0 } ,
(8.19)
dove λ1 è il primo autovalore di Dirichlet per l’operatore di Laplace in Ω. Dimostrazione. Poniamo g (x) = U (x) − u∞ (x). La funzione w (x,t) = u (x,t) − u∞ (x) è soluzione del problema ⎧ x ∈ Ω, t > 0 ⎪ ⎨ wt − Δw = 0 w (x,0) = g (x) x ∈ Ω (8.20) ⎪ ⎩ w (σ,t) = 0 σ ∈ ∂Ω, t > 0. Usiamo il metodo di separazione di variabili per trovare la soluzione del problema (8.20). Cercando soluzioni del tipo w (x,t) = v (x) z (t) si trova: Δv (x) z (t) = = −λ z (t) v (x) con λ costante. Risolviamo il problema agli autovalori −Δv = λv in Ω v=0 su ∂Ω. Dal Teorema 3.2, esiste in L2 (Ω) una base ortonormale {uk }k≥1 costituita da autovettori, corrispondenti ad una successione nondecrescente di autovalori {λk }k≥1 , con λ1 > 0 e λk → +∞. Si può allora scrivere g (x) =
∞ 1
gk uk (x)
e
2
g0 =
∞ k=1
dove gk = (uk , g). Di conseguenza si trova z (t) = e−λk t e poi
∞ e−λk t gk uk (x) . w (x,t) = 1
gk2
8.4 Equazioni generali in forma di divergenza
Pertanto
2
2
u (·, t) − u∞ 0 = w (·, t)0 =
∞ k=1
493
e−2λk t gk2
e poiché λk > λ1 per ogni k, si ha
∞ 2 2 e−2λ1 t gk2 = e−2λ1 t g0 . u (·, t) − u∞ 0 ≤ k=1
Dal Teorema 3.1 si ha, in particolare, u∞ 0 ≤ CP f 0 , e quindi g0 ≤ U 0 + u∞ 0 ≤ u0 0 + CP f 0 . da cui la (8.19). Il Microteorema 3.5 implica che lo stato stazionario u∞ è asintoticamente stabile in norma L2 (Ω) per t → +∞. La velocità di convergenza allo stato stazionario è molto rapida, infatti esponenziale, ed è determinata dal primo autovalore di Dirichlet del Laplaciano in Ω.
8.4 Equazioni generali in forma di divergenza In questa sezione consideriamo operatori ellittici con termini generali di diffusione e trasporto. Sia Ω ⊂ Rn un dominio limitato e poniamo Lu = −div (A (x) ∇u − b (x) u) + c (x) · ∇u + a (x) u
(8.21)
dove A =(aij )i,j=1,...,n , b = (b1 , ..., bn ), c = (c1 , ..., cn ) e a è una funzione reale. D’ora in poi assumeremo le seguenti ipotesi. 1. L’operatore differenziale L è uniformemente ellittico: esistono due numeri positivi α ed M tali che tale che:
n 2 aij (x) ξ i ξ j ≥ α |ξ| e |aij (x)| ≤ M, ∀ξ ∈Rn , q.o. in Ω. i,j=1
(8.22) La costante α prende il nome di costante di ellitticità di L. 2. I coefficienti bj , cj , a sono limitati per ogni i, j = 1, ..., n: |bj (x)| ≤ b∞ ,
|cj (x)| ≤ c∞ ,
|a (x)| ≤ a∞ ,
q.o. in Ω.
(8.23)
Vogliamo estendere la teoria della sezione precedente per questo tipo di operatori. In questa sezione indichiamo prima qualche condizione sufficiente per la buona posizione dei soliti problemi al bordo, basati sull’uso del Teorema di Lax-Milgram. D’altra parte, queste condizioni appaiono talvolta troppo restrittive. Quando non sono soddisfatte ed il Teorema di Lax-Milgram non è utilizzabile, informazioni sulla risolubilità dei vari problemi al contorno si possono ottenere
494
8 Formulazione variazionale di problemi ellittici
dal Teorema dell’Alternativa 6.8. Sottolineiamo che il grado di generalità raggiunto permette di trattare il caso di coefficienti discontinui, anche nel termine di diffusione e in quello convettivo. La condizione di uniforme ellitticità (8.22) è necessaria per l’applicazione dei teoremi di Lax-Milgram e dell’Alternativa. Se si ha solo A (x) ξ · ξ ≥ 0 entriamo nel campo delle equazioni ellittiche degeneri per le quali la teoria è molto più complessa3 . Le nostre ipotesi sono comunque verificate nella maggior parte delle applicazioni concrete. Nella presentazione seguiremo lo schema delle sezioni precedenti, partendo con il problema di Dirichlet. 8.4.1 Problema di Dirichlet Occupiamoci del problema
Lu = f + div f u=0
in Ω su ∂Ω
(8.24)
dove f ∈ L2 (Ω) e f ∈L2 (Ω; Rn ). Il secondo membro dell’equazione richiede qualche parola di commento. Nel Capitolo 7 abbiamo indicato il duale di H01 (Ω) con il simbolo H −1 (Ω). Sappiamo (Teorema 7.5.5) che ogni elemento F ∈ H −1 (Ω) si può identificare con una distribuzione in D (Ω) della forma F = f + div f e inoltre F H −1 (Ω) ≤ CP f 0 + f 0 .
(8.25)
A secondo membro dell’equazione differenziale (8.24) si trova quindi un generico elemento del duale di H01 (Ω). Per arrivare alla formulazione debole seguiamo il metodo illustrato nella sezione precedente. Moltiplichiamo entrambi i membri dell’equazione per una funzione v ∈ C0∞ (Ω) ed integriamo su Ω: {−div(A∇u − bu) v} dx + {c · ∇u + au} v dx = {f + div f } v dx. Ω
Ω
Ω
Procedendo formalmente, integriamo per parti il primo termine e quello contenente div f . Essendo v = 0 su ∂Ω, troviamo: {−div(A∇u − bu) v} dx = {A∇u · ∇v − bu · ∇v} dx Ω 3
Ω
Rimandiamo al classico Ole˘ınik- Radkevič, Second Order Equations With Nonnegative Characteristic Form, A.M.S, Providence, Rhode Island, 1973.
8.4 Equazioni generali in forma di divergenza
e
495
v div f dx = − Ω
f ·∇v dx. Ω
L’equazione che si ottiene è quindi la seguente: {A∇u · ∇v − bu · ∇v + cv · ∇u + auv} dx = {f v − f · ∇v } dx Ω
Ω
C0∞
(Ω). per ogni v ∈ Allarghiamo lo spazio delle funzioni test a H01 (Ω) e introduciamo la forma bilineare {A∇u · ∇v − bu · ∇v + cv · ∇u + auv} dx B (u, v) = Ω
e il funzionale lineare
{f v − f · ∇v } dx.
Fv = Ω
La formulazione variazionale del problema (8.24) è dunque la seguente: determinare u ∈ H01 (Ω) tale che B (u, v) = F v,
∀v ∈ H01 (Ω) .
(8.26)
Non è difficile controllare (lo lasciamo come esercizio) che se i coefficienti dell’equazione e la soluzione sono regolari le due formulazioni (8.24) e (8.26) sono equivalenti. Il seguente teorema indica alcune ipotesi sotto le quali il problema è ben posto. Teorema 4.1. Assumiamo che valgano le ipotesi (8.23), (8.22) e che f ∈ L2 (Ω), f ∈ L2 (Ω; Rn ). Allora, se b e c sono funzioni Lipschitziane e 1 div (b − c) + a ≥ 0, q.o. in Ω 2
(8.27)
allora il problema (8.26) ha un’unica soluzione. Inoltre vale la seguente stima di stabilità: 1 u1 ≤ {CP f 0 + f 0 } . (8.28) α Dimostrazione. Applichiamo il Teorema di Lax-Milgram con V = H01 (Ω). Sotto le ipotesi (8.23) e (8.22) la forma bilineare è continua. Infatti, dalla disuguaglianza di Schwarz si ha:
n A∇u · ∇v dx ≤ aij uxi vxj dx i,j=1 Ω Ω n ≤ |aij | |∇u| |∇v| dx i,j=1 Ω ≤ n2 M |∇u| |∇v| dx ≤ n2 M ∇u0 ∇v0 . Ω
496
8 Formulazione variazionale di problemi ellittici
Inoltre, usando anche la disuguaglianza di Poincaré, √ [−ub · ∇v + vc·∇u] dx ≤ nCP (b∞ + c∞ ) ∇u ∇v 0 0 Ω
e
auv dx ≤ a∞ Ω
Ω
|u| |v| dx ≤ a∞ CP2 ∇u0 ∇v0 .
Raggruppando tutte le disuguaglianze si ha √ |B (u, v)| ≤ n2 M + nCP (b∞ + c∞ ) + a∞ CP2 ∇u0 ∇v0 per cui B è continua. Analizziamo la coercività di B. Abbiamo: B (u, u) = A∇u · ∇u − (b − c)u · ∇u + au2 dx. Ω
Poiché u = 0 su ∂Ω, integrando per parti otteniamo 1 1 (b − c)u · ∇u dx = (b − c) · ∇u2 dx = − div(b − c) · u2 dx. 2 2 Ω Ω Ω Da (8.22) e (8.27) segue che 1 2 2 B (u, u) ≥ α |∇u| dx+ div(b − c)+a u2 dx ≥ α ∇u0 Ω Ω 2 e quindi B è V −coerciva. Poiché sappiamo già che F ∈ H −1 (Ω), il Teorema di Lax-Milgram garantisce esistenza, unicità e stabilità per il problema (8.26). In particolare, dalla (8.25), u1 ≤
1 {CP f 0 + f 0 } . α
Nota 4.1. Se la matrice A è simmetrica e b = c = 0, la soluzione u minimizza in H01 (Ω) il funzionale “energia” 1 A∇u · ∇u + au2 − 2f u dx. E (u) = 2 Ω Con le ovvie modifiche dovute alla presenza della matrice A, si possono ripetere gli stessi discorsi della Nota 3.1. L’equazione in forma debole coincide allora con l’equazione di Eulero del funzionale E. Consideriamo ora il caso di condizioni di Dirichlet non omogenee, cioè il problema Lu = f + div f in Ω (8.29) u=g su ∂Ω.
8.4 Equazioni generali in forma di divergenza
497
Se g ∈ H 1/2 (∂Ω), spazio delle tracce su ∂Ω delle funzioni di H 1 (Ω), ci si riconduce subito al caso omogeneo ponendo w = u − g˜ dove g˜ è un rilevamento di g in H 1 (Ω). In questo caso, richiediamo che il dominio sia Lipschitziano, per assicurare l’esistenza di g˜. La funzione w appartiene a H01 (Ω) e soddisfa l’equazione Lw = f + div (f + A∇˜ g − b˜ g ) − c · ∇˜ g − a˜ g che è dello stesso tipo di quella precedente, essendo, per le ipotesi su b, c e a, f + c · ∇˜ g + a˜ g ∈ L2 (Ω)
and
f + A∇˜ g − b˜ g ∈ L2 (Ω; Rn ) .
In base al Teorema di Lax-Milgram, esiste un’unica soluzione del problema omogeneo ed inoltre g − a˜ g 0 + f + A∇˜ g − b˜ g 0 } ∇w0 ≤ CP {f − c · ∇˜ ≤ C (α, n, M, a∞ , b∞ , c∞ ) {f 0 + f 0 + ˜ g 1,2 },
(8.30)
stima valida qualunque sia il rilevamento g˜ di g. Poiché 1
u1,2 ≤ w1,2 + ˜ g 1,2 ≤ (1 + CP ) 2 ∇w0 + ˜ g 1,2 e
(8.31)
g 1,2 : g˜ ∈ H 1 (Ω), g˜|∂Ω = g , gH 1/2 (∂Ω) = inf ˜
passando all’estremo inferiore su g˜ nelle (8.30) e (8.31), si ricava che esiste un’unica soluzione u ∈ H 1 (Ω) del problema (8.29) ed inoltre: u1,2 ≤ C (α, n, M, a∞ , b∞ , c∞ ) f 0 + f 0 + gH 1/2 (∂Ω) . Esempio 4.1. La Figura 8.1 mostra la soluzione del seguente problema di Dirichlet nel semicerchio B1+ (0, 0) ⊂ R2 : ⎧ ρ < 1, 0 < θ < π ⎨ −Δu − ρuθ = 0 u (ρ, 1) = sin(θ/2) 0≤θ≤π (8.32) ⎩ u (ρ, 0) = 0, u (ρ, π) = −ρ ρ≤1 dove (ρ, θ) sono coordinate polari. Si osservi che in coordinate cartesiane si ha −ρuθ = yux − xuy per cui questo termine rappresenta un termine di trasporto del tipo b · ∇u con b = (y, −x). Poiché divb = 0, c = 0 e a = 0, il Teorema 4.1 assicura la buona posizione del problema.
498
8 Formulazione variazionale di problemi ellittici
Figura 8.1. Soluzione del problema nell’Esempio 4.1
Alternativa per il problema di Dirichlet Vedremo più avanti che il problema (8.24) è ben posto sotto la condizione −divb + a ≥ 0, che non coinvolge il coefficiente c. In particolare, questa condizione è verificata se a (x) ≥ 0 e b (x) = 0 q.o. in Ω. In generale comunque, si può dire che la forma bilineare è solo debolmente coerciva, esiste cioè λ0 ∈ R tale che ˜ (u, v) ≡ B (u, v) + λ0 (u, v) = B (u, v) + λ0 uv dx B 0 Ω
è coerciva. Infatti, usando la disuguaglianza elementare |ab| ≤ εa2 + ∀ε > 0, possiamo scrivere √ (b − c)u · ∇u dx ≤ n (b∞ + c∞ ) |u · ∇u| dx Ω
1 2 4ε b ,
Ω
2
n (b∞ + c∞ ) 2 2 u0 ≤ ε ∇u0 + 4ε e quindi ˜ (u, u) ≥ B
# 2 α ∇u0
2 +λ0 u0
−
2 ε ∇u0
−
2
n (b∞ + c∞ ) + a∞ 4ε
$ 2
u0 .
(8.33) 2 Se scegliamo, per esempio, ε = α/2 e λ0 = a∞ + n (b∞ + c∞ ) /4ε, otteniamo ˜ (u, u) ≥ α ∇u2 B 0 2 ˜ Introduciamo ora la terna Hilbertiana che mostra la coercività di B. V = H01 (Ω) , H = L2 (Ω) , V ∗ = H −1 (Ω)
8.4 Equazioni generali in forma di divergenza
499
e ricordiamo che, essendo Ω limitato, l’immersione di V in H è compatta. Per applicare il Teorema dell’Alternativa al problema variazionale (8.26) occorre introdurre la forma bilineare aggiunta di B, data da B ∗ (u, v) = (A ∇u + cu) · ∇v − bv · ∇u + auv dx = B (v, u) , Ω
associata all’aggiunto formale L∗ di L definito dalla formula L∗ u = −div A ∇u + cu − b · ∇u + cu. Ora possiamo applicare il Teorema 6.8.1 al problema (8.26). Concludiamo che: a) i sottospazi NB ed NB ∗ delle soluzioni dei due problemi omogenei B (u, v) = 0,
∀v ∈ H01 (Ω)
B ∗ (w, v) = 0,
e
∀v ∈ H01 (Ω)
hanno la stessa dimensione d, 0 ≤ d < ∞; b) il problema B (u, v) = F v,
∀v ∈ H01 (Ω)
ha soluzione se e solo se F w = 0 per ogni w ∈ NB ∗ . Traduciamo le conclusioni in termini meno astratti. Teorema 4.2. Sia Ω un dominio limitato, f ∈ L2 (Ω) e f ∈ L2 (Ω; Rn ). Supponiamo che valgano le ipotesi (8.23) e (8.22). Allora: a) o L è un isomorfismo continuo tra H01 (Ω) e H −1 (Ω) e quindi il problema (8.24) ha un’unica soluzione debole ed esiste C = C (α, n, M, a∞ , b∞ , c∞ ) tale che ∇u0 ≤ C {f 0 + f 0 } ; b) oppure i problemi omogeneo e omogeneo aggiunto, rispettivamente, Lu = 0 in Ω L∗ w = 0 in Ω (8.34) u=0 su ∂Ω, w=0 su ∂Ω hanno (ciascuno) d soluzioni linearmente indipendenti con 0 < d < ∞; c) Il problema (8.24) ha soluzione se e solo se {f w − f · ∇w} dx = 0 (8.35) Ω
per ogni soluzione w del problema omogeneo aggiunto. Il Teorema 4.2 indica che, se si dimostra l’unicità della soluzione del problema (8.24), automaticamente si ha esistenza e dipendenza continua dai dati (stabilità). Per dimostrare l’unicità si possono usare principi di massimo come quello che considereremo nel Paragrafo 8.4.5. Le (8.35) costituiscono un insieme di d condizioni di compatibilità che i dati devono soddisfare, affinché il problema sia risolubile.
500
8 Formulazione variazionale di problemi ellittici
8.4.2 Problema di Neumann Il problema di Neumann per un operatore in forma di divergenza si formula assegnando sulla frontiera del dominio il flusso associato al termine di diffusione. Il flusso è composto da due termini: A∇u · ν, dovuto al termine di diffusione −divA∇u, e −bu · ν, dovuto al termine convettivo div(bu), dove ν è la normale esterna su ∂Ω . Poniamo
n
n aij uxj ν i + u bj ν j ∂νL u = (A∇u − bu) · ν = i,j=1
j=1
che prende il nome di derivata conormale di u. Dovendo esistere un versore normale almeno in quasi tutti i punti di ∂Ω, occorre richiedere una certa regolarità a Ω, per esempio che Ω sia Lipschitziano. Il problema di Neumann per l’operatore L è dunque il seguente: Lu = f in Ω (8.36) L ∂ν u = g su ∂Ω con f ∈ L2 (Ω) e g ∈ L2 (∂Ω). La formulazione variazionale del problema (8.36) si ottiene con la solita tecnica. Moltiplicando l’equazione differenziale Lu = f per una funzione test v ∈ H 1 (Ω) ed integrando per parti, si ha, formalmente, {(A∇u − bu) · ∇v + (c · ∇u)v + auv} dx = f v dx + gv dσ Ω
Ω
∂Ω
essendo (A∇u − bu) · ν = g su ∂Ω. Introducendo la forma bilineare B (u, v) = {(A∇u − bu) · ∇v + (c · ∇u)v + auv} dx
(8.37)
Ω
e il funzionale lineare
f v dx +
Fv = Ω
gv dσ ∂Ω
siamo condotti alla seguente formulazione variazionale, che, come si controlla facilmente, equivale alla formulazione (8.36) nel caso in cui tutti i dati siano regolari: Determinare u ∈ H 1 (Ω) tale che B (u, v) = F v,
∀v ∈ H 1 (Ω) .
(8.38)
Un insieme di condizioni che assicurano la buona posizione del problema sono indicate nel seguente teorema. Teorema 4.3. Sia Ω limitato e Lipschitziano. Assumiamo che valgano le ipotesi (8.23), (8.22) e che f ∈ L2 (Ω), g ∈ L2 (∂Ω). Se a (x) ≥ a0 > 0 q.o.in Ωe α0 ≡ min {α − n(b∞ + c∞ )/2, a0 − n(b∞ + c∞ )/2} > 0,
(8.39)
8.4 Equazioni generali in forma di divergenza
501
allora il problema (8.38) ha un’unica soluzione. Inoltre, vale la seguente stima di stabilità: 1 u1,2 ≤ f 0 + C (n, Ω) gL2 (∂Ω) . (8.40) α0 Dimostrazione. Controlliamo che la forma bilineare B ed il funzionale lineare F soddisfino le ipotesi del Teorema di Lax-Milgram. Continuità di B. Procedendo come per il problema di Dirichlet si trova √ |B (u, v)| ≤ M + n(b∞ + c∞ ) + a∞ u1,2 v1,2 . per cui B è continua in H 1 (Ω). Coercività di B. Si ha: 2 |∇u| dx − [(b − c) · ∇u] u dx + au2 dx. B (u, u) ≥ α Ω
Ω
Ω
Dalla disuguaglianza di Schwarz, √ [(b − c) · ∇u] u dx ≤ n(b∞ + c∞ ) ∇u u 0 0 Ω √ n(b∞ + c∞ ) 2 u1,2 . ≤ 2 Quindi, se vale (8.39), si ottiene 2
B (u, u) ≥ α0 u1,2 per cui B è coerciva. Infine, per la disuguaglianza di Schwarz e quella di traccia (8.10), abbiamo: |F v| ≤ |f v| dx+ |gv| dσ ≤ f 0 v0 + gL2 (∂Ω) vL2 (∂Ω) ∂Ω Ω ≤ f L2 (Ω) + C (n, Ω) gL2 (∂Ω) v1,2 ∗
e quindi F ∈ H 1 (Ω) , con F H 1 (Ω)∗ ≤ f 0 + C (n, Ω) gL2 (∂Ω) .
Alternativa per il problema di Neumann La forma bilineare B è coerciva anche sotto le condizioni (b − c) · ν ≤ 0 q.o. su ∂Ω
e
1 div(b − c) + a0 ≥ c0 > 0 q.o in Ω, 2
come si può dimostrare imitando la dimostrazione del Teorema 4.1. In generale, B è solo debolmente coerciva. Infatti, scegliendo nella (8.33), per esempio, 2 ε = α/2 e λ0 = a∞ + n (b∞ + c∞ ) /4ε +α/2, troviamo ˜ (u, u) ≡ B (u, u) + λ0 u2 ≥ α u2 B 0 1,2 2
502
8 Formulazione variazionale di problemi ellittici
˜ è coerciva. Introduciamo ora la terna Hilbertiana e quindi B V = H 1 (Ω) , H = L2 (Ω) , V ∗ = H 1 (Ω)
∗
e ricordiamo che, essendo Ω limitato e Lipschitziano, l’immersione di V in H è compatta. Applicando il Teorema 6.8.1, otteniamo il seguente risultato. Teorema 4.4. Siano Ω un dominio limitato e Lipschitziano, f ∈ L2 (Ω) e g ∈ L2 (∂Ω). Supponiamo che valgano le ipotesi (8.23) e (8.22). Vale la seguente dicotomia: a) o il problema (8.36) ha un’unica soluzione debole u ∈ H 1 (Ω) ed esiste C = C (α, n, M, a∞ , b∞ , c∞ ) tale che u1,2 ≤ C f 0 + gL2 (∂Ω) , b) oppure i problemi omogeneo e omogeneo aggiunto, rispettivamente,
Lu = 0 (A∇u − bu) · ν = 0
in Ω su ∂Ω,
L∗ w = 0
(A ∇w + cw) · ν = 0
in Ω su ∂Ω
hanno (ciascuno) d soluzioni linearmente indipendenti, con 0 < d < ∞. c) Il problema (8.36) ha soluzione se e solo se Fw =
f w dx +
Ω
gw dσ = 0
(8.41)
∂Ω
per ogni soluzione w del problema omogeneo aggiunto. Nota 4.3. Se b = c = 0 e a = 0, allora le soluzioni w del problema omogeneo aggiunto sono le funzioni costanti. Infatti, in questo caso, w è soluzione di B ∗ (u, v) =
A ∇w · ∇v dx = 0
∀v ∈ H 1 (Ω) .
Ω
Inserendo v = w si trova, per l’ellitticità uniforme 2 A ∇w · ∇w dx ≥ α ∇w0 0= Ω
e quindi w è costante. Pertanto si ha d = 1 e la condizione necessaria e sufficiente di risolubilità è f dx + g dσ = 0 Ω
come abbiamo più volte affermato.
∂Ω
8.4 Equazioni generali in forma di divergenza
503
8.4.3 Problema di Robin La formulazione variazionale del problema di Robin Lu = f in Ω ∂νL u + hu = g su ∂Ω
(8.42)
si ricava da quella per il problema di Neumann. Basta osservare che su ∂Ω si ha ∂νL u = A∇u · ν − bu = −hu + g e si perviene subito al problema variazionale seguente: Determinare u ∈ H 1 (Ω) tale che, ∀v ∈ H 1 (Ω), {(A∇u − bu) · ∇v + (c · ∇u)v + auv} dx + huv dσ Ω
f v dx +
=
∂Ω
Ω
gv dσ. ∂Ω
Poniamo BRob (u, v) ≡ B (u, v) +
huv dσ. ∂Ω
Come per il problema di Neumann, siano Ω limitato e Lipschitziano, f ∈ L2 (Ω) e g ∈ L2 (∂Ω). Di diverso rispetto ai casi precedenti c’è solo l’ultimo termine. Assumiamo che h ∈ L∞ (∂Ω). Controlliamo le ipotesi del Teorema di Lax-Milgram (ormai mitico). Dalle disuguaglianze di Schwarz e di traccia si ha: huv dσ ≤ hL∞ (Ω) uL2 (∂Ω) vL2 (∂Ω) ∂Ω
2
≤ C hL∞ (Ω) u1,2 v1,2 e quindi BRob è continua. Procedendo come per il problema di Neumann, se vale la (8.39), si ottiene 2 hu2 dσ. BRob (u, u) ≥ α0 u1,2 + ∂Ω
Se quindi h (x) ≥ 0 q.o. su ∂Ω, BRob è anche coerciva. In tal caso abbiamo esistenza ed unicità di una soluzione debole del problema (8.42) e vale la stima di stabilità (8.40). In generale, la forma bilineare è solo debolmente coerciva B. Si può usare ancora il Teorema dell’Alternativa 6.8.1 e formulare (lasciamo l’onere al lettore) un teorema perfettamente analogo al Teorema 4.3. 8.4.4 Problema misto Come per l’equazione di Poisson, sia Ω ⊂ Rn un dominio limitato, Lipschitziano e sia ΓD ⊂ ∂Ω non vuoto e aperto in ∂Ω. Poniamo poi ΓN = ∂Ω\ΓD .
504
8 Formulazione variazionale di problemi ellittici
Assumiamo infine che a ∈ L∞ (Ω), f ∈ L2 (Ω), problema misto ⎧ ⎨ Lu = f u=0 ⎩ (A∇u − bu) · ν = g
g ∈ L2 (ΓN ) e consideriamo il in Ω su ΓD su ΓN .
Lo spazio di Sobolev naturale nel quale ambientare la formulazione debole è lo 1 spazio H0,Γ (Ω) delle funzioni in H 1 (Ω) a traccia nulla su ΓD , con la norma D uH 1
0,ΓD (Ω)
= ∇u0 .
Ricordiamo infatti che in questo spazio vale la disuguaglianza di Poincaré, la cui costante indichiamo sempre con CP e che vale una disuguaglianza di traccia del tipo 8 ∇v . vL2 (ΓN ) ≤ C 0 Introducendo il funzionale lineare f v dx + Fv = Ω
gv dσ
ΓN
si perviene alla seguente formulazione variazionale: 1 Determinare u ∈ H0,Γ (Ω) tale che, D
B (u, v) = F v,
1 (Ω) . ∀v ∈ H0,Γ D
(8.43)
Con metodi ormai usuali, si può dimostrare il seguente risultato. Teorema 4.5. Supponiamo che valgano le (8.23) e (8.22) e che f ∈ L2 (Ω), g ∈ L2 (ΓN ). Se b e c sono Lipschitziani e (b − c) · ν ≤ 0 su ΓN ,
1 div (b − c) + a ≥ 0, 2
q.o. in Ω,
1 allora, il problema (8.43) ha un’unica soluzione u ∈ H0,Γ (Ω). Inoltre, vale D la seguente stima di stabilità:
u1 ≤
1 CP f 0 + C gL2 (ΓN ) . α
Nota 5.4. Se u = g0 su ΓD , se cioè i dati di Dirichlet non sono omogenei, si può pensare ad un rilevamento g80 ∈ H 1 (Ω) di g0 in Ω e porre w = u − g80 . 1 (Ω) e il problema per w è Allora w ∈ H0,Γ D B (w, v) = B (8 g0 , v) +
f v dx+
Ω
gv dσ ΓN
1 ∀v ∈ H0,Γ (Ω) . D
In generale, la forma bilineare è solo debolmente coerciva. Si può usare ancora il Teorema dell’Alternativa e formulare (lo lasciamo fare al lettore) un teorema
8.5 Principi di massimo
505
perfettamente analogo al Teorema 4.3. Osserviamo solo che la condizione di compatibilità sui dati ha la forma Fw = f w dx + g w dσ = 0 Ω
ΓN
per ogni w soluzione del problema omogeneo aggiunto ⎧ ∗ in Ω ⎨L w = 0 w = 0 su ΓD ⎩ su ΓN . A ∇w + cw · ν = 0 Un’osservazione finale. Abbiamo visto come i Teoremi di Lax-Milgram e dell’Alternativa permettano di unificare il trattamento di un’ampia classe di problemi al contorno per equazioni ellittiche. Abbiamo sempre lavorato in domini limitati, perché questa è la situazione alla quale ci si riduce quando si voglia risolvere numericamente il problema. La teoria si può comunque estendere al caso di domini illimitati, richiedendo condizioni all’infinito sulla soluzione, per esempio che u (x) → 0 se |x| → ∞. Nella formulazione debole, tale condizione è di fatto incorporata nella richiesta che u ∈ H 1 (Ω). Naturalmente, il metodo variazionale indicato dai teoremi citati non è onnipotente, in quanto dipende dalle ipotesi di continuità e coercività o coercività debole della forma bilineare e dalla richiesta che il secondo membro appartenga al duale dello spazio di Hilbert che si considera di volta in volta. Per esempio, in dimensione n > 1, con il metodo variazionale non si può risolvere (per lo meno direttamente) il problema −Δu = δ
in Rn
poiché δ ∈ / H −1 (Rn ). La soluzione, che si chiama soluzione fondamentale dell’operatore di Laplace, è 1 ln |x| n = 2 − 2π u (x) = 1 1 (n−2)ω n |x|n−2 n ≥ 3 dove ω n è la misura della superficie sferica {x ∈Rn : |x| = 1}, come si può verificare con un calcolo diretto 4 .
8.5 Principi di massimo Abbiamo già incontrato una versione del principio di massimo a proposito dell’equazione di Laplace. Questo principio ha un’estensione naturale nel caso di 4
I casi n = 2, 3 sono trattati nella Sezione 7.2.
506
8 Formulazione variazionale di problemi ellittici
operatori in forma di divergenza. Data l’ambientazione negli spazi di Sobolev, l’affermazione che una funzione è positiva (negativa) sul bordo di un dominio Ω è da intendersi nel senso delle tracce. È utile tuttavia fare qualche osservazione a riguardo. Ricordiamo che se u ∈ H 1 (Ω) allora anche la sua parte positiva u+ = max {u, 0} e la sua parte negativa u− = max {−u, 0} appartengono a H 1 (Ω). Allora u ≤ 0 (risp. ≥ 0) su ∂Ω significa che u+ ∈ H01 (Ω) (risp. u− ∈ H01 (Ω)). Le altre disuguaglianze seguono in modo naturale. Per esempio, u ≤ v su ∂Ω se u − v ≤ 0 su ∂Ω. Si può poi definire sup u = inf {k : u ≤ k su ∂Ω} , ∂Ω
inf u = sup {k : u ≥ k su ∂Ω} ∂Ω
che coincidono con i soliti estremo superiore e inferiore nel caso di funzioni continue su ∂Ω. Supponiamo ora che u ∈ H 1 (Ω) soddisfi la disuguaglianza Lu = −div(A∇u − bu) + c · ∇u + au ≤ 0 in senso debole, e cioè che, ∀v ∈ H01 (Ω) , v ≥ 0 q.o. in Ω {(A∇u − bu)∇v + cv · ∇u + auv} dx ≤ 0.
(8.44)
Ω
Definizione 5.1. Se vale la (8.44) diciamo che u è sottosoluzione di L; u è soprasoluzione se −u è sottosoluzione, se cioè vale la disuguaglianza opposta per ogni v ∈ H01 (Ω) , v ≥ 0 q.o. in Ω. Abbiamo: Teorema 5.1 (Principio di massimo debole). Supponiamo che valgano (8.23) e (8.22). Inoltre, sia b Lipschitziana e divb − a ≤ 0 q.o. in Ω. Allora, se u è sottosoluzione (soprasoluzione) di L in Ω si ha: + − sup u ≤ sup u inf u ≥ inf (−u ) . Ω
∂Ω
Ω
∂Ω
(8.45)
(8.46)
In particolare, se u ≤ 0 (≥ 0) su ∂Ω allora u ≤ 0 (≥ 0) q.o. in Ω. Dimostrazione. La facciamo solo nel caso b = c = 0. Sia u sottosoluzione; abbiamo: A∇u · ∇v dx ≤ − auv dx, ∀v ∈ H01 (Ω) , v ≥ 0 q.o. in Ω. Ω
Ω +
Sia l = sup∂Ω u < +∞ (altrimenti non c’è nulla da dimostrare). Scegliamo come funzione test v = max {u − l, 0}, che è nonnegativa e appartiene a H01 (Ω). Osserviamo che nell’insieme {u > l}, dove v > 0, si ha ∇u = ∇v e quindi, usando l’ellitticità e a ≥ 0, si trova 2 2 |∇v| dx = α |∇u| dx ≤ − au (u − l) dx ≤ 0 α {u>l}
{u>l}
{u>l}
8.5 Principi di massimo
507
Figura 8.2. La soluzione di −u + u = 0 in (0, 1), u (0) = u (1) = −1
per cui deve essere o |{u > l}| = 0 oppure ∇v = 0 q.o. In entrambi i casi, essendo v ∈ H01 (Ω), si deduce v = 0 q.o. ossia u ≤ l q.o. Il caso soprasoluzione si tratta in modo simile. + Nota 5.1. Nella (8.46) non è possibile sostituire sup∂Ω u con sup∂Ω u oppure inf ∂Ω (−u− ) con inf ∂Ω u. Un semplice controesempio in dimensione uno è mostrato in Figura 8.2. La soluzione di u − u = 0 in (0, 1), con u (0) = u (1) = −1 ha un massimo negativo, che è maggiore di −1. Immediata conseguenza del principio di massimo debole è l’unicità (e quindi anche l’esistenza, in base al Teorema 4.2) per il problema di Dirichlet: Corollario 5.2. Siano Ω ⊂ Rn un dominio limitato e Lipschitziano, f ∈ L2 (Ω) , f ∈ L2 (Ω; Rn ) e g ∈ H 1/2 (∂Ω) . Se vale la (8.45), il problema Lu = f + div f u=g
in Ω su ∂Ω
ha un’unica soluzione u ∈ H 1 (Ω) e
∇u0 ≤ C (n, α, M, b∞ , c∞ , a∞ ) f 0 + f 0 + gH 1/2 (∂Ω) .
Un principio di massimo analogo vale nel caso di condizioni di Robin, per esempio se h > 0. Per il problema misto, abbiamo il seguente teorema, la cui dimostrazione ricalca quella del Teorema 5.1. Teorema 5.3. Siano ΓD ⊂ ∂Ω, aperto in ∂Ω, e u ∈ H 1 (Ω) tale che, 1 ∀v ∈ H0,Γ (Ω), v ≥ 0, D {(A∇u − bu)∇v + cv · ∇u + auv} dx ≤ 0 (≥ 0). Ω
Se b è Lipschitziano e b · ν ≤ 0 q.o. su ΓN , divb + a ≥ 0 q.o. in Ω
508
8 Formulazione variazionale di problemi ellittici
allora sup u ≤ sup u+ Ω
ΓD
inf u ≥ inf (−u− ) . Ω
ΓD
In particolare, se u ≤ 0 (≥ 0) su ΓD allora u ≤ 0 (≥ 0) q.o. in Ω.
8.6 Questioni di regolarità Nel caso dei problemi di Dirichlet e di Neumann, abbiamo controllato che se una soluzione debole è regolare, per esempio se ha due derivate continue, allora dalla formulazione variazionale si può risalire a quella classica cosicché anche la soluzione è in realtà classica. Un problema importante e, in generale, molto complesso, è stabilire il grado di regolarità ottimale di una soluzione debole, a partire da quello dei dati del problema che sono: il dominio Ω, i dati al bordo, i coefficienti dell’operatore L ed il termine forzante (di solito a secondo membro dell’equazione). Tale grado di regolarità influisce, tra l’altro, sulla rapidità di convergenza dei metodi numerici. Per avere un’idea di ciò che possiamo aspettarci, consideriamo, per esempio, il problema di Dirichlet omogeneo Lu = F in Ω u=0 su ∂Ω dove F è un elemento di H −1 (Ω), Ω limitato. Con le ipotesi fatte, in base al Teorema di Lax-Milgram, si può dire che la soluzione u ∈ H01 (Ω) e non molto di più. Dalle disuguaglianze di Sobolev, infatti, segue che u ∈ Lp (Ω) 2n con p = n−2 , se n ≥ 3, o in ogni Lp (Ω), 2 ≤ p < ∞, se n = 2, ma il guadagno ottenuto non altera di molto la regolarità di u. Rovesciando la situazione, si può dire che, partendo da una funzione in H01 (Ω) e applicando ad essa un operatore del secondo ordine, “si consumano due derivate”: la perdita di una derivata porta da H01 (Ω) ad L2 (Ω) ed un ulteriore consumo di una derivata porta ad H −1 (Ω): è come se l’apice −1 segnalasse il “debito” di una derivata. Consideriamo però il caso particolare in cui u ∈ H 1 (Rn ) è soluzione del problema −Δu + u = f in Rn e chiediamoci: se f ∈ L2 (Rn ) qual è la regolarità ottimale di u? Seguendo il ragionamento un po’ pittoresco appena fatto dovremmo osservare quanto segue: è vero che si parte ancora da u ∈ H 1 (Rn ), ma applicando l’operatore del secondo ordine −Δ + I dove I indica l’operatore identità, si approda ad f ∈ L2 (Rn ), senza più derivate ma anche senza debiti!, per cui si sarebbe tentati di concludere che si è
8.6 Questioni di regolarità
509
partiti in realtà da una funzione in H 2 (Rn ). Questo è proprio ciò che capita e lo vediamo utilizzando la trasformata di Fourier. Notiamo, infatti, che entrambi i membri dell’equazione sono distribuzioni temperate, essendo funzioni di L2 (Rn ) e perciò possiamo calcolare la loro trasformata di Fourier. Essendo ∂= < (ξ) , xi u (ξ) = iξ i u
∂ < (ξ) xi xj u (ξ) = −ξ i ξ j u
? (ξ) = |ξ| u < (ξ) e l’equazione trasformata è si ha −Δu 2
(1 + |ξ| )< u (ξ) = f<(ξ) 2
da cui u < (ξ) =
f<(ξ)
2.
(8.47)
1 + |ξ|
Dalla (8.47) ricaviamo subito l’informazione che volevamo e cioè che ogni derivata seconda di u appartiene a L2 (Rn ). Ciò segue dai seguenti fatti: •
il teorema di Plancherel: 2
2
n
< v L2 (Rn ) = (2π) vL2 (Rn ) , • la disuguaglianza elementare 2 2 ξ i ξ j < 1 + |ξ| , ∀i, j = 1, ..., n, • il semplice calcolo Rn
2 (x) dx = i xj
ux
2
ξ 2i ξ 2j |< u (ξ)| dξ =
2 ξ 2i ξ 2j f<(ξ)
dξ 2 (1 + |ξ| )2 1 (2π) < 2 2 < |f (x)| dx. f (ξ) dξ = 4 Rn 4 n R Rn
Rn n
Si deduce dunque che u ∈ H 2 (Rn ) con un guadagno (significativo) di una derivata rispetto alla regolarità di partenza. Si noti inoltre che abbiamo anche ottenuto la disuguaglianza n/2 > > >ux x > 2 n ≤ (2π) f L2 (Rn ) . i j L (R ) 2
Possiamo spingerci oltre. Se f ∈ H 1 (Rn ), cioè f possiede derivate prime in L2 (Rn ), con un calcolo perfettamente analogo si deduce che u ∈ H 3 (Rn ). Alternativamente, si può derivare l’equazione ed osservare che, per ogni j = 1, ..., n, la derivata uxj soddisfa l’equazione −Δuxj + uxj = fxj
in Rn
510
8 Formulazione variazionale di problemi ellittici
che ha secondo membro in L2 (Rn ), ed applicare quanto appena visto a uxj . Iterando il ragionamento, concludiamo che, per ogni m ≥ 0, se f ∈ H m (Rn )
allora
u ∈ H m+2 (Rn ) .
Utilizzando il Teorema di Immersione di Sobolev possiamo allora dedurre che, se m è sufficientemente grande, u è una soluzione classica. k,α Infatti, in base se u ∈ H m+2 (Rn ), allora u ∈ Cloc (Rn ) n al Teorema 7.8.6, n con k = m − 2 e con α = m − 2 − k se n è dispari oppure ∀α ∈ (0, 1) se 2 (Rn ). n è pari. Pertanto, non appena m > 2 + n2 si ha che u è almeno in Cloc Come immediata conseguenza abbiamo il notevole risultato che se f ∈ C ∞ (Rn )
allora
u ∈ C ∞ (Rn ).
Superando difficoltà tecniche di una certa rilevanza, il risultato precedente può essere esteso al caso di un operatore uniformemente ellittico in forma di divergenza ed alle soluzioni dei problemi di Dirichlet, Neumann, Robin. La regolarità per un problema misto richiede condizioni ulteriori di compatibilità dei dati sul confine tra ΓD e ΓN , sulle quali non insistiamo. Ci sono due tipi di risultati di regolarità. Il primo riguarda la regolarità interna, ossia la regolarità della soluzione in sottoinsiemi compatti di un dominio Ω. L’altro riguarda la regolarità globale e cioè la regolarità della soluzione fino al bordo di Ω. Le dimostrazioni sono molto tecniche (si veda Evans, 1998) per cui ci limitiamo ai soli enunciati. In tutti i teoremi di questa sezione assumiamo che u sia soluzione variazionale di Lu = f in Ω con Ω ⊂ Rn , limitato. Manteniamo le ipotesi (8.23) e (8.22). Regolarità interna Cominciamo con un risultato di regolarità interna H 2 . Si noti che nessuna condizione su ∂Ω è richiesta. Teorema 6.1. (Regolarità interna H 2 ). Assumiamo che f ∈ L2 (Ω) e che i 2 coefficienti aij e bj , i, j = 1, ..., n, siano Lipschitziani in Ω. Allora u ∈ Hloc (Ω) e se Ω ⊂⊂ Ω, uH 2 (Ω ) ≤ C2 {f 0 + u0 } . (8.48) Dunque u è una soluzione forte (Sezione 2) in Ω. La costante C2 nella (8.48) dipende dai parametri n, α, b∞ , c∞ , a∞ , M ed inoltre dalla distanza di Ω da ∂Ω e dalle costanti di Lipschitz di aij e bj , i, j = 1, ..., n. Nota 6.1. La presenza della norma u0 a destra della (8.48) è necessaria5 , poiché, in generale, la forma bilineare B associata a L è solo debolmente coerciva. 5
Per esempio, u (x) = sin x è soluzionedell’equazione u + u = 0. Ovviamente non possiamo controllare una qualunque norma di u col solo secondo membro!
8.6 Questioni di regolarità
511
Se aumentiamo la regolarità dei coefficienti e di f la regolarità di u aumenta corrispondentemente: m Teorema 6.1. (Regolarità interna H m ). Siano f ∈ L2 (Ω) ∩ Hloc (Ω), m+1 m (Ω) e cj , a ∈ C (Ω), m ≥ 1, i, j = 1, ..., n. aij , bj ∈ C m+2 (Ω) e se Ω ⊂⊂ Ω ⊂⊂ Ω, Allora u ∈ Hloc (8.49) uH m+2 (Ω ) ≤ Cm f H m (Ω ) + u0 . Come conseguenza, se aij , bj , cj , a, f ∈ C ∞ (Ω) , allora u ∈ C ∞ (Ω). La costante Cm nella (8.49) dipende, oltre che dai soliti parametri, anche dalla distanza di Ω da Ω e dalle norme di aij ,bj , in C m+1 (Ω ) e di cj ,a, in C m (Ω ) i, j = 1, ..., n. Regolarità globale Ci occupiamo ora della regolarità di una soluzione (non necessariamente unica!) dei problemi considerati nelle sezioni precedenti. Esaminiamo prima la regolarità H 2 (Ω). Se u ∈ H 2 (Ω), la sua traccia su ∂Ω appartiene a H 3/2 (∂Ω) per cui il dato di Dirichlet gD deve essere assegnato in questo spazio. Analogamente, la traccia della derivata normale di u appartiene a H 1/2 (∂Ω) e quindi un dato gN di Neumann o Robin deve essere assegnato in questo spazio. Inoltre, il dominio deve essere sufficientemente regolare, diciamo C 2 , per poter definire le tracce di u e ∂ν u. Riassumendo, assumiamo che u sia una soluzione di Lu = f in Ω, con una delle seguenti condizioni al bordo: u = gD ∈ H 3/2 (∂Ω) oppure ∂νL + hu = gN ∈ H 1/2 (∂Ω) , con 0 ≤ h (σ) ≤ h0
su ∂Ω.
Abbiamo: Teorema 6.3. Sia Ω limitato e di classe C 2 . Assumiamo che i coefficienti aij , bj , i, j = 1, ..., n, siano Lipschitziani in Ω e che f ∈ L2 (Ω). Allora u ∈ H 2 (Ω) e valgono le disuguaglianze (Dirichlet), uH 2 (Ω) ≤ C 2 u0 + f 0 + gD H 3/2 (∂Ω) 82 u + f + gN 1/2 uH 2 (Ω) ≤ C 0 0 H (∂Ω)
(Neumann/Robin).
82 dipendono da Ω, h0 , dai parametri n, α, b∞ , c∞ , a∞ , M e Le costanti C 2 e C dalle costanti di Lipschitz di aij e bj , i, j = 1, ..., n.
512
8 Formulazione variazionale di problemi ellittici
Un aumento della regolarità dei dati si riflette in un aumento corrispondente della regolarità della soluzione variazionale. Teorema 6.4. Siano Ω di classe C m+2 e f ∈ H m (Ω). Se: 1. aij , bj ∈ C m+1 Ω , cj , a ∈ C m Ω , i, j = 1, ..., n 2. gD ∈ H m+3/2 (∂Ω), gN ∈ H m+1/2 (∂Ω) e h ∈ C m+1 (∂Ω) allora u ∈ H m+2 (Ω) e inoltre uH m+2 (Ω) ≤ C m u0 + f H m (Ω) + gH m+3/2 (∂Ω)
(Dirichlet),
8m u + f m uH m+2 (Ω) ≤ C + g m+1/2 0 H (Ω) H (∂Ω) (Neumann/Robin). In particolare, se Ω è di classe C ∞ , f ∈ C ∞ Ω , tutti i coefficienti apparten gono a C ∞ Ω , h ∈ C ∞ (∂Ω) e tutti i dati al bordo appartengono a C ∞ (∂Ω), allora anche u ∈ C ∞ Ω . 8m dipendono oltre che dai soliti parametri, anche dalle Le costanti C m e C m+1 norme di aij ,bj in C Ω e di cj ,a, in C m Ω , i, j = 1, ..., n. Vale la pena di sottolineare un caso particolarmente importante. Se Ω è di classe C 2 e f ∈ L2 (Ω), la soluzione del problema di Dirichlet omogeneo
−Δu = f u=0
in Ω su ∂Ω
appartiene ad H 2 (Ω) ∩ H01 (Ω) ed esiste Cb = Cb (n, Ω) tale che uH 2 (Ω) ≤ Cb f 0 = Cb Δu0 .
(8.50)
Poiché si ha anche Δu0 ≤ uH 2 (Ω) deduciamo la seguente importante conclusione: Corollario 6.5. Se Ω è di classe C 2 e u ∈ H 2 (Ω) ∩ H01 (Ω) allora Δu0 ≤ uH 2 (Ω) ≤ Cb Δu0 . In altri termini, Δu0 e uH 2 (Ω) sono norme equivalenti in H 2 (Ω) ∩ H01 (Ω). Vedremo nella prossima sezione un’applicazione del Corollario 6.5 ad un problema di equilibrio di una piastra.
8.6 Questioni di regolarità
513
Domini con angoli I precedenti risultati valgono in domini con bordo “liscio”, ma, come abbiamo già osservato, in molti casi concreti occorre considerare domini Lipschitziani. La teoria generale diventa un po’ troppo elaborata, per cui ci limitiamo a presentare due casi particolarmente significativi. Esempio 6.1. Consideriamo il settore circolare piano, definito in coordinate polari da: Sα = {(r, θ) : 0 < r < 1, − α/2 < θ < α/2} La funzione
(0 < α < 2π).
π θ α è armonica in Sα , in quanto parte reale della funzione π
u (r, θ) = r α cos
π
f (z) = z α , olomorfa in Sα . Inoltre, u si annulla sui lati del settore: u (r, −α/2) = u (r, α/2) = 0,
0≤r≤1
(8.51)
e
π θ, 0 ≤ θ ≤ α. (8.52) α Focalizziamo l’attenzione nell’intorno dell’origine. Il caso α = π è banale, in quanto il settore Sα è un semicerchio e u (r, θ) = Re z = x1 ∈ C ∞ S α . Supponiamo d’ora in poi α = π. Poiché u (1, θ) = cos
2
|∇u| = u2r + si ha
2
π π2 1 2 uθ = 2 r2( α −1) 2 r α
|∇u| dx1 dx2 = Sα
π2 α
1
r2 α −1 dr = π
0
π 2
1
e quindi u ∈ H (Sα ) ed è l’unica soluzione debole di Δu = 0 in Sα con le condizioni (8.51), (8.52). Non è poi difficile verificare che, per ogni i, j = 1, 2, ux x ∼ r απ −2 r∼0 i j e quindi
ux
i xj
Sα
2 dxdy ∼
1
r2 α −3 dr. π
0
π − 3 > −1 ossia α < π. La L’ultimo integrale è convergente solo per 2 α 2 conclusione è che u ∈ H (Sα ) solo se α < π, cioè se il settore è convesso. Se α > π, u ∈ / H 2 (Sα ) (Figura 8.3).
514
8 Formulazione variazionale di problemi ellittici
1
0.8
0.6
0.4
0.2
0 1 1
0.5 0.5
0 0 -0.5
-0.5 -1
-1
Figura 8.3. Il caso α =
3 π nell’Esempio 6.1 2
Morale: in un intorno di angoli non convessi ci aspettiamo una bassa regolarità della soluzione (meno di H 2 ). Esempio 6.2. Il secondo esempio è un problema misto. La funzione 1
u (r, θ) = r 2 sin
θ 2
è soluzione debole nel semicerchio Sπ = {(r, θ) : 0 < r < 1, del problema misto
2
Infatti, |∇u| =
⎧ Δu = 0 ⎪ ⎪ ⎨ u (1, θ) = sin θ2 ⎪ u (r, 0) = 0 ⎪ ⎩ ux2 (r, π) = 0
1 4r ,
cosicché
0 < θ < π}
in Sπ 0<θ<π 0 < r < 1.
2
|∇u| dx1 dx2 = Sπ
π 8
1
e quindi u ∈ H (Sπ ); inoltre, 1 1 θ ux2 = ur sin θ + uθ cos θ = √ cos r 2 2 r e quindi ux2 (r, π) = 0 se θ = π. Tuttavia, lungo la semiretta θ = π/2, per esempio, si ha uxi xj ∼ r− 32 r∼0 per cui
Sα
pertanto u ∈ / H 2 (Sπ ) .
uxi xj 2 dxdy ∼
0
1
r−2 dr = ∞.
8.7 Alcune applicazioni della teoria
515
Figura 8.4. La soluzione dell’ Esempio 6.2
Si vede quindi che la soluzione ha un basso grado di regolarità vicino all’origine, nonostante in un suo intorno il bordo sia liscio. Non è un caso che l’origine separi le regioni di Dirichlet e Neumann (Figura 8.4). Morale: in generale, in un problema misto, ci si aspetta un basso grado di regolarità della soluzione (meno di H 2 ) vicino al confine tra le regioni di Dirichlet e di Neumann.
8.7 Alcune applicazioni della teoria 8.7.1 Uno schema iterativo per equazioni semilineari Il principio di massimo può essere a volte usato per risolvere problemi nonlineari. Siano Ω ⊂ Rn un dominio limitato e Lipschitziano, g ∈ H 1 (Ω) ed f ∈ C 1 (R), Consideriamo il seguente problema di Dirichlet per l’equazione di Poisson semilineare: −Δu = f (u) in Ω (8.53) u=g su ∂Ω. Una soluzione debole di (8.53) è una funzione u ∈ H 1 (Ω) tale che u = g su ∂Ω e ∇u · ∇v dx = f (u) v dx ∀v ∈ H01 (Ω) . (8.54) Ω
Ω
Dobbiamo introdurre anche i concetti di sotto e soprasoluzione. Diciamo che u∗ ∈ H 1 (Ω) è sottosoluzione debole del problema (8.53) se u∗ ≤ g su ∂Ω e ∇u∗ · ∇v dx ≤ f (u∗ ) v dx ∀v ∈ H01 (Ω) , v ≥ 0 in Ω. Ω
Ω ∗
1
Analogamente, u ∈ H (Ω) è soprasoluzione debole del problema (8.53) se u∗ ≥ g su ∂Ω e ∇u∗ · ∇v dx ≥ f (u∗ ) v dx ∀v ∈ H01 (Ω) , v ≥ 0 in Ω. Ω
Ω
516
8 Formulazione variazionale di problemi ellittici
Vogliamo dimostrare il seguente risultato. Teorema 7.1. Supponiamo che esistano una sottosoluzione debole u∗ ed una soprasoluzione debole u∗ del problema (8.53) tali che: a ≤ u∗ ≤ u∗ ≤ b
q.o. in Ω,
(a, b ∈ R).
(8.55)
Allora esiste una soluzione u del problema (8.53) tale che u∗ ≤ u ≤ u∗
q.o. in Ω.
Inoltre, se Ω, g ed f sono di classe C ∞ allora u ∈ C ∞ Ω . Dimostrazione. Sia M = max[a,b] |f |. Allora la funzione F (s) = f (s) + M s è nondecrescente in [a, b]. Scriviamo l’equazione di Poisson nella forma seguente: −Δu + M u = F (u) . L’idea è di sfruttare la teoria lineare per definire ricorsivamente una successione di funzioni {uk }k≥1 che converga ad una soluzione. Sia u1 la soluzione del problema −Δu1 + M u1 = F (u∗ ) in Ω su ∂Ω. u1 = g Data uk , sia uk+1 la soluzione di −Δuk+1 + M uk+1 = F (uk ) uk = g
in Ω su ∂Ω.
(8.56)
Faciamo vedere che {uk } è una sucessione non decrescente, intrappolata tra u∗ e u∗ ; precisamente: u∗ ≤ uk ≤ uk+1 ≤ u∗
q.o. in Ω, ∀k ≥ 1.
(8.57)
Controlliamo prima che u∗ ≤ u1 in Ω. Poniamo h1 = u∗ − u1 . Essendo u∗ ≤ g su ∂Ω si ha h1 ≤ 0 su ∂Ω e inoltre (∇h1 · ∇v + M h1 v)dx ≤ 0, ∀v ∈ H01 (Ω) , v ≥ 0 in Ω. Ω
Dal principio di massimo debole deduciamo h1 ≤ 0 q.o. in Ω. Analogamente, si dimostra che u1 ≤ u∗ q.o. in Ω. Procediamo ora induttivamente. Assumendo che q.o. in Ω (8.58) u∗ ≤ uk−1 ≤ uk ≤ u∗ vogliamo dimostrare che u∗ ≤ uk ≤ uk+1 ≤ u∗ q.o. in Ω. Sia wk = uk − uk+1 . Abbiamo wk = 0 su ∂Ω e (∇wk · ∇v + M wk v) dx = [F (uk−1 ) − F (uk )]v dx ∀v ∈ H01 (Ω) . Ω
Ω
8.7 Alcune applicazioni della teoria
517
Poiché F è nondecrescente in [a, b], deduciamo da (8.58) che F (uk−1 ) − F (uk ) ≤ 0 q.o. in Ω per cui (∇wk · ∇v + M wk v) dx ≤ 0 ∀v ∈ H01 (Ω) , v ≥ 0 in Ω. Ω
Dal principio di massimo debole deduciamo che u∗ ≤ uk ≤ uk+1 q.o. in Ω. Analogamente si dimostra che uk+1 ≤ u∗ . Pertanto la (8.57) è provata e uk converge q.o. in Ω a una funzione limitata u, per k → +∞. Poiché a ≤ uk ≤ b e quindi F (a) ≤ F (uk ) ≤ F (b), dal Teorema della Convergenza Dominata abbiamo che uk → u anche in L2 (Ω) e F (uk ) v dx → F (u) v dx per k → ∞, Ω
Ω
per ogni v ∈ H01 (Ω). D’altra parte, dalle stime di stabilità per il problema di Dirichlet (8.56), abbiamo: uk 1,2 ≤ C (n, M, Ω) F (uk−1 )0 + gH 1/2 (∂Ω) ≤ C1 (n, M, Ω) max {|F (b)| , |F (b)|} + gH 1/2 (∂Ω) . Dunque {uk } è limitata in H 1 (Ω) ed esiste perciò una sottosuccessione ukj che converge debolmente in H 1 (Ω) ad un elemento che deve coincidere con u, essendo ukj → u in L2 (Ω). Di conseguenza, possiamo passare al limite nell’equazione (∇ukj +1 · ∇v + M ukj +1 v) dx = F (ukj )v dx ∀v ∈ H01 (Ω) Ω
Ω
e ottenere (8.54). Per la regolarità, osserviamo che F (u) ∈ L∞ (Ω) e quindi, dal Teorema 6.3, u ∈ H 2 (Ω). Allora F (u) ∈ H 2 (Ω) che implica u ∈ H 4 (Ω) (Teorema 6.4). Procedendo in questo modo (si chiama bootstapping ) si arriva a u ∈ C ∞ Ω . Il Teorema 7.1 riconduce la risolubilità del problema (8.53) alla ricerca di una sottosoluzione u∗ e di una soprasoluzione u∗ con la proprietà (8.55); u∗ e u∗ prendono il nome di barriera inferiore e superiore, rispettivamente. In generale non si può asserire che la soluzione sia unica. Vediamo un esempio di non unicità. Esempio 7.1. Consideriamo il seguente problema per l’equazione di Fischer stazionaria: −Δu = ru (1 − u) in Ω u=0 su ∂Ω
518
8 Formulazione variazionale di problemi ellittici
dove r > 0. Chiaramente u∗ ≡ 0 è una soluzione. Assumiamo che il dominio Ω sia di classe C ∞ e che il primo autovalore di Dirichlet per l’operatore di Laplace sia λ1 < r (vero se il dominio è sufficientemente grande). Possiamo allora dimostrare che esiste una soluzione positiva in Ω. In base al Teorema 7.1 è sufficiente esibire una barriera inferiore positiva in Ω ed una barriera superiore, limitate. Si vede subito che u∗ ≡ 1 è una barriera superiore. Dobbiamo trovare una barriera inferiore, positiva. Sia w1 la prima autofunzione correspondente a λ1 . Dal Microteorema 3.5, sappiamo che w1 > 0 in Ω e dal Teorema 6.4, che w1 ∈ C ∞ Ω . Poniamo u∗ = σw1 e mostriamo che se σ è positivo e sufficientemente piccolo allora u∗ è una barriera inferiore. Infatti, poiché −Δw1 = λ1 w1 , abbiamo: −Δu∗ − ru∗ (1 − u∗ ) = σw1 [λ1 − r + rσw1 ] .
(8.59)
Se m = maxΩ¯ w1 e σ < (r − λ1 )/rm, allora il membro a destra nella (8.59) è negativo e quindi u∗ è una barriera inferiore, positiva. Dal Teorema 7.1. deduciamo l’esistenza di una soluzione u ∈ C ∞ Ω tale che w1 ≤ u ≤ 1. L’unicità della soluzione del problema (8.53) è garantita, per esempio, se f è non decrescente: f (s) ≤ 0, s ∈ R. Infatti, in tal caso, se u1 e u2 sono soluzioni di (8.53), abbiamo w = u1 − u2 ∈ H01 (Ω) e possiamo scrivere −Δw = f (u1 ) − f (u2 ) = c (x) w dove c (x) = f (¯ u (x)), con u ¯ opportuno tra u1 e u2 . Poiché c ≤ 0, dal Teorema 5.1 ricaviamo w ≡ 0 ovvero u1 = u2 . 8.7.2 Equilibrio di una piastra Consideriamo il problema di determinare la configurazione di equilibrio di una piastra metallica piana sotto un carico verticale q = (0, 0, q). Assumiamo che la piastra sia costituita da materiale isotropo e che soddisfi la legge di Hooke dell’elasticità lineare.6 Inoltre lo spessore della piastra è ritenuto trascurabile rispetto alle altre dimensioni, per cui il problema è 6
Legge di Hooke: σ ij (u) = 2μεij (u) + λδ ij div u dove (σ ij ) è il tensore degli sforzi e εij (u) = è il tensore di deformazione.
1 2
(i, j = 1, 2, 3)
∂uj ∂ui + ∂xj ∂xi
8.7 Alcune applicazioni della teoria
519
essenzialmente bidimensionale. Se Ω ⊂ R2 rappresenta la sezione trasversale della piastra, lo spostamento verticale della piastra può essere descritto da una funzione u = u (x, y). Si può dimostrare che u è soluzione dell’equazione del quart’ordine q ≡f in Ω, ΔΔu = Δ2 u = D dove D codifica le proprietà elastiche del materiale. L’operatore Δ2 si chiama operatore biarmonico o bi-laplaciano ed è un operatore ellittico.7 Le soluzioni di Δ2 u = 0 si chiamano funzioni biarmoniche. In due dimensioni l’espressione esplicita di Δ2 è data da Δ2 =
∂4 ∂4 ∂4 + 2 + . ∂x4 ∂x2 ∂y 2 ∂y 4
Se la piastra è fissata rigidamente al bordo (clamped plate), allora u e la sua derivata normale sono nulle su ∂Ω. Siamo così condotti al problema 2 Δ u=f in Ω u = ∂ν u = 0 su ∂Ω. Vogliamo arrivare ad una formulazione variazionale del problema. Per ottenerla, moltiplichiamo l’equazione biarmonica per una funzione test v ∈ C0∞ (Ω) e integriamo su Ω: Δ2 u v dx = f v dx. (8.61) Ω
Ω
Integrando due volte per parti, ed usando le condizioni v = ∂ν v = 0 su ∂Ω, abbiamo: Δ2 u v dx = div (∇Δu) v dx = ∂ν (Δu) v dσ− ∇Δu · ∇v dx Ω Ω Ω ∂Ω Δu ∂ν v dσ+ ΔuΔv dx = ΔuΔv dx. =− ∂Ω
La (8.61) diventa:
Ω
Ω
ΔuΔv dx = Ω
7
f v dx.
(8.62)
Ω
È possibile dare la definizione di ellitticità per un operatore di ordine superiore al secondo (si veda Renardy-Rogers, 2004). Per esempio, consideriamo l’operatore L = α |α|=m aα D , m ≥ 2 lineare a coefficienti costanti di ordine m, dove α = (α1 , ..., αn ) è un multi-indice. Associamo ad L il suo simbolo, dato da aα (iξ)α . SL (ξ) = |α|=m
Allora L è un operatore ellittico se SL (ξ) = 0 per ogni ξ ∈Rn , ξ = 0. Ne segue che un operatore ellittico deve avere ordine pari. Il simbolo di L = Δ2 in 2 dimensioni è −ξ 41 − 2ξ 21 ξ 22 − ξ 42 , che è negativo se (ξ 1 , ξ 2 ) = (0, 0). Quindi Δ2 è ellittico. Notiamo infine che, se m = 2, ritroviamo l’usuale nozione di ellitticità.
520
8 Formulazione variazionale di problemi ellittici
Allarghiamo lo spazio di funzioni test prendendo la chiusura di C0∞ (Ω) in H 2 (Ω), che è precisamente lo spazio H02 (Ω) delle funzioni con traccia nulla e con derivata normale nulla. Poiché H02 (Ω) ⊂ H01 (Ω) ∩ H 2 (Ω), se Ω è di classe C 2 , in base al Corollario 6.5 possiamo scegliere in questo spazio la norma uH 2 (Ω) = Δu0 e il prodotto interno (u, v)H 2 (Ω) = (Δu, Δv)0 . 0 0 Siamo così condotti alla seguente formulazione debole: Determinare u ∈ H02 (Ω) tale che ΔuΔv dx = f v dx, ∀v ∈ H02 (Ω) . (8.63) Ω
Ω
Vale il seguente risultato. Microteorema 7.2. Siano Ω limitato, di classe C 2 e f ∈ L2 (Ω). Esiste un’unica soluzione u ∈ H02 (Ω) di (8.63). Inoltre vale la stima di stabilità Δu0 ≤ C (n, Ω) f 0 . Dimostrazione. La forma bilineare
Δu · Δv dx
B (u, v) = Ω
coincide con il prodotto interno in H02 (Ω). Posto f v dx, Lv = Ω
abbiamo |L (v)| =
Ω
|f v| dx ≤ f 0 v0 ≤ Cb f 0 Δv0
∗
per cui L ∈ H02 (Ω) . La tesi segue allora direttamente dal Teorema di Rappresentazione di Riesz. Nota 7.1. Nelle ipotesi indicate, la soluzione debole dell’equazione biarmonica appartiene a H02 (Ω). In realtà, ponendo w = Δu, abbiamo che Δw = f 2 con f ∈ L2 (Ω) per cui, ancora dal Corollario 6.5, abbiamo w ∈ Hloc (Ω) che 4 implica a sua volta, u ∈ Hloc (Ω), fatto del resto non troppo sorprendente. 8.7.3 Il sistema di Stokes Equazioni di Navier-Stokes e numero di Reynolds Abbiamo accennato nella sottosezione 3.4.3 che le equazioni di Navier-Stokes ∂u 1 1 +(u · ∇)u = νΔu − ∇p + f ∂t ρ ρ
(8.64)
div u = 0
(8.65)
8.7 Alcune applicazioni della teoria
521
traducono, rispettivamente, equazione del momento lineare e condizione di incomprimibilità per il moto di un fluido viscoso, omogeneo e incomprimibile: ricordiamo che u rappresenta la velocità del fluido, p è la pressione, ρ è la densità (costante), f è una forza per unità di volume e ν = μ/ρ (viscosità cinematica 8 ) è il rapporto tra viscosità (costante) e densità del fluido. Sottolineiamo che la pressione p compare solo attraverso il suo gradiente ed è perciò definita a meno di una costante additiva. All’equazione di Navier-Stokes vanno aggiunte una condizione iniziale u (0) = g oltre a condizioni al bordo nel dominio Ω ⊂ Rn (n = 2, 3) occupato dal fluido, che consideriamo limitato, come condizioni di periodicità o di Dirichlet o altro ancora. Tipicamente, l’osservazione di fluidi reali rivela che le componenti tangenziali e normali della loro velocità su una parete rigida sono uguali a quelli della parete stessa. Se la parete è ferma, si ha dunque u = 0. La condizione sulla componente tangenziale della velocità è nota come condizione di aderenza (no slip condition). Volendo mettere in luce il ruolo del termine convettivo (u·∇)u, adimensionalizzaziamo il problema basandoci sulle seguenti quantità primarie: la densità ρ (massa×lunghezza−3 ), la viscosità cinematica9 ν (lunghezza2 ×tempo−1 ), 1/n una lunghezza L legata al dominio Ω, per esempio il diametro, oppure |Ω| , e una velocità U , per esempio U = gL∞ . Riscaliamo ora le variabili del problema nel modo seguente x x −→ , L
t −→
νt , L2
u →
u , U
p →
pL , ρνU
f →
L2 f. νU
Dopo calcoli elementari, la (8.65) rimane invariata, mentre la (8.64) assume la seguente forma adimensionale (utilizzando gli stessi simboli per le variabili riscalate): ∂u +R(u · ∇)u = Δu − ∇p + f (8.66) ∂t dove compare l’unico parametro R=
UL ν
detto numero di Reynolds . R rappresenta una misura del rapporto tra la “scala delle velocità imposte” e quella delle “velocità viscose” determinata da L e dal tempo di diffusione L2 /ν. Basso numero di Reynolds significa alta 8 9
Si veda la Sezione A.3. Tipici valori di ν sono, alla pressione di un’atmosfera e a 20 gradi centigradi, 10−2 cm2 /sec per l’acqua e 15 × 10−2 cm2 /sec per l’aria.
522
8 Formulazione variazionale di problemi ellittici
viscosità o moto debolmente influenzato dai dati iniziali, corrispondente ad una dinamica vincolata. Alto numero di Reynolds significa bassa viscosità oppure moto fortemente influenzato dai dati iniziali. Il fatto che R sia il coefficiente del termine non lineare convettivo indica che per R → 0 l’equazione si linearizza nell’equazione di diffusione per il campo di velocità. Il moto corrispondente è “super viscoso”, nel senso che l’inerzia non gioca alcun ruolo. All’altro estremo l’inerzia diventa dominante. Il numero di Reynolds può dunque essere interpretato come una misura del rapporto tra inerzia e viscosità. Equazioni di Stokes Le equazioni di Stokes sono la versione stazionaria delle equazioni di NavierStokes, nella forma adimensionale (8.66) e linearizzata per R → 0 (ossia a basso numero di Reynolds). Abbiamo cioè il problema: ⎧ −Δu = f − ∇p in Ω ⎪ ⎨ div u = 0 in Ω (8.67) ⎪ ⎩u = 0 su ∂Ω dove Ω è un dominio limitato di Rn (n = 2 o 3). Vogliamo analizzare la buona posizione del problema riformulandolo convenientemente in senso debole. A questo scopo procediamo formalmente con la tecnica usuale, supponendo che tutto sia regolare. Moltiplichiamo entrambi i membri dell’equazione differenziale per una funzione test v ∈ C0∞ (Ω; Rn ), integriamo su Ω ed integriamo per parti il primo termine. Usando la notazione 3
∂ui ∂vi ∇u : ∇v = ∂x j ∂xj i,j=1
si ottiene: ∇u : ∇v dx = f · v dx+ p div v dx, Ω
Ω
∀v ∈ C0∞ (Ω; Rn ) . (8.68)
Ω
Moltiplichiamo poi l’equazione div u = 0 per q ∈ L2 (Ω) e integriamo su Ω; si ha: q div u dx = 0, ∀q ∈ L2 (Ω) . (8.69) Ω
Viceversa, se u = 0 su ∂Ω e soddisfa la (8.68), si torna indietro con l’integrazione per parti e si trova: (−Δu − f + ∇p)v dx = 0, ∀v ∈ C0∞ (Ω; Rn ) Ω
che implica −Δu − f + ∇p = 0
in Ω.
8.7 Alcune applicazioni della teoria
523
La (8.69) implica poi che div u = 0
in Ω.
Abbiamo così controllato che, per funzioni regolari nulle al bordo di Ω, il sistema (8.67) è equivalente alle equazioni (8.68) e (8.69). Queste ultime suggeriscono l’ambientazione funzionale naturale per la formulazione variazionale del problema. Incorporiamo la condizione nulla di Dirichlet scegliendo per u lo spazio H01 (Ω; Rn ) e osserviamo che, per densità, la (8.68) è vera per ogni v ∈ H01 (Ω; Rn ). Normalizziamo la pressione introducendo lo spazio di Hilbert 10 ! 2 Q = q ∈ L (Ω) : q=0 Ω
e richiedendo che p appartenga a Q. Sia, infine, f ∈ L2 (Ω; Rn ). Definizione 7.1. Si chiama soluzione variazionale o debole del problema (8.67) una coppia (u, p) tale che: ⎧ v ∈ H01 (Ω; Rn ) , p ∈ Q ⎪ ⎪ ⎨" " " ∇u : ∇v dx = Ω f · v dx + Ω p div v dx ∀v ∈ H01 (Ω; Rn ) Ω ⎪" ⎪ ⎩ q div u dx = 0 ∀q ∈ Q. Ω (8.70) Vogliamo dimostrare esistenza, unicità e stabilità della soluzione debole. Un uso diretto del lemma di Lax-Milgram (o del Teorema di Rappresentazione di Riesz) è problematico, data la presenza della pressione incognita p a secondo membro. Per superare questa difficoltà si può scegliere inizialmente, come spazio di funzioni test, invece di H01 (Ω; Rn ), il suo sottospazio di Hilbert Vdiv dei vettori a divergenza nulla, con la norma (vale la disuguaglianza di Poincaré) 2 2 |∇u| dx. uVdiv = Ω
La seconda delle (8.70) diventa allora ∇u : ∇v dx = f · v dx Ω
∀v ∈ Vdiv
Ω
in cui la pressione non compare. La forma bilineare a (u, v) = ∇u : ∇v dx Ω 10
Altre normalizzazioni sono possibili e a volte più convenienti.
(8.71)
524
8 Formulazione variazionale di problemi ellittici
è limitata (per la disuguaglianza di Schwarz) e coerciva in Vdiv ; inoltre f ∈ (Vdiv )∗ . Il Teorema di Lax-Milgram produce un’unica soluzione u ∈ Vdiv , che dunque incorpora anche la condizione div u = 0. Inoltre: ∇u0 ≤ f 0 . Naturalmente la nostra soluzione è incompleta, in quanto occorre recuperare la pressione. D’altra parte, la (8.71) equivale ad asserire che il vettore g = Δu + f considerato come elemento di H −1 (Ω; Rn ), soddisfa l’equazione ∀v ∈ Vdiv
g, vH −1 ×H 1 = 0, 0
ossia g si annulla su Vdiv . Ora, gli elementi di H −1 (Ω; Rn ) che si annullano su Vdiv hanno una forma speciale, come indicato nel seguente teorema. Teorema 7.3. Sia Ω un dominio limitato e Lipschitziano. Un funzionale g, lineare e continuo su H01 (Ω; Rn ), soddisfa la condizione g, vH −1 ×H 1 = 0,
∀v ∈ Vdiv
0
(8.72)
se e solo se esiste p ∈ L2 (Ω) tale che −∇p = g ossia
g, vH −1 ×H −1 = −∇p, vH −1 ×H −1 = 0
0
p div v dx,
∀v ∈ H01 (Ω; Rn ) .
Ω
La funzione p è unica a meno di una costante additiva. La dimostrazione è piuttosto complessa. Ci limitiamo alla seguente osservazione che indica la plausibilità del risultato. Mettiamoci in dimensione 1 3 Ω; R e che Ω sia un dominio semplicemente n = 3; assumiamo che g ∈ C connesso. Se V ∈ D Ω; R3 , essendo div rot V = 0 possiamo scrivere la (8.72) per v = rotV. Applicando la formula 8 di Gauss, in Appendice C, abbiamo 0= g · rot V dx = rot g · V dx − (g × V) · ν dx Ω Ω ∂Ω rot g · V dx = Ω
che, data l’arbitrarietà di V, implica rot g = 0.
8.8 Un problema di controllo ottimo
525
Poiché Ω è un dominio semplicemente connesso esiste un potenziale scalare p di g, tale cioè che −∇p = g. Grazie alla caratterizzazione del Teorema 7.3, posiamo affermare che esiste un’unica p ∈ Q tale che g = Δu + f = −∇p. La coppia (u, p) così trovata è soluzione del problema originale. Vale dunque il seguente Teorema 7.4. Se Ω è un dominio limitato e Lipschitziano e f ∈ L2 (Ω; Rn ), il problema (8.67) ha un’unica soluzione debole (u, p) con u ∈ H01 (Ω; Rn ) e p ∈ Q. Nota 7.1. La pressione come moltiplicatore. Data la simmetria della forma bilineare a, la soluzione u minimizza il funzionale energia 1 2 E (v) = |∇v| − 2f · v dx 2 Ω in Vdiv . Equivalentemente, u minimizza il funzionale in tutto H01 (Ω; Rn ) con il vincolo div u = 0. Se introduciamo un moltiplicatore p ∈ Q e il funzionale lagrangiano ! 1 2 |∇v| − f · v − q div v dx, L (v) = 2 Ω il sistema (8.70) costituisce la condizione necessaria di ottimalità (equazione di Eulero-Lagrange). La pressione q appare dunque come moltiplicatore associato al vincolo di solenoidalità.
8.8 Un problema di controllo ottimo I problemi di controllo ottimo sono sempre più importanti nella tecnologia moderna. Vogliamo applicare la teoria variazionale che abbiamo sviluppato finora a un semplice problema di controllo di una temperatura. 8.8.1 Struttura del problema Supponiamo che la temperatura u di un corpo omogeneo, che occupa un dominio limitato e regolare Ω ⊂ R3 , soddisfi le seguenti condizioni stazionarie: Lu ≡ −Δu + div (bu) = z in Ω (8.73) u=0 su ∂Ω dove b ∈ C 1 Ω; R3 è assegnato, con div b ≥ 0 in Ω. In (8.73) distinguiamo due tipi di variabili: la variabile di controllo z, che prendiamo in H = L2 (Ω), e la variabile di stato u.
526
8 Formulazione variazionale di problemi ellittici
Coerentemente, le (8.73) si chiamano equazioni di stato. Dato un controllo z, dal Corollario 5.2 il problema (8.73) ha un’unica soluzione variazionale u [z] ∈ V = H01 (Ω) dove il simbolo u [z] sottolinea la dipendenza di u dal controllo z. Dunque, ponendo (∇u · ∇v − ub · ∇v) dx, a (u, v) = Ω
u [z] soddisfa l’equazione di stato in forma debole a (u [z] , v) = (z, v)0
∀v ∈ V
(8.74)
e u [z]1 ≤ z0 .
(8.75) 2
H01
Dai risultati di regolarità (Teorema 6.3) segue che u ∈ H (Ω) ∩ (Ω) e quindi u soddisfa l’equazione di stato puntualmente q.o. in Ω (soluzione forte). Il problema è scegliere il termine di sorgente z in modo da minimizzare la “distanza” di u da uno stato di riferimento ud , assegnato (target state). Naturalmente vi sono diversi modi di misurare la distanza tra u e ud . Se siamo interessati ad una distanza che coinvolga solo i valori di u e ud in un sottoinsieme aperto Ω0 ⊆ Ω, una scelta ragionevole può essere 1 β 2 (u − ud ) dx + z 2 dx (8.76) J (u, z) = 2 Ω0 2 Ω dove β > 0. J (u, z) prende il nome di funzionale costo (performance index). Il secondo termine in (8.76) si chiama termine di penalizzazione ; il suo ruolo è duplice: da una parte serve ad evitare l’uso di controlli “troppo grossi” nella minimizzazione J, dall’altra assicura la coercività di J, come vedremo più avanti. Riassumendo, possiamo scrivere il nostro problema di controllo nel modo seguente: Determinare (u∗ , z ∗ ) ∈ V × H, tali che ⎧ J (u∗ , z ∗ ) = min J (u, z) ⎪ ⎪ ⎪ (u,z)∈V ×H ⎨ (8.77) sotto le condizioni ⎪ ⎪ ⎪ ⎩ Lu = z in Ω, u = 0 su ∂Ω. Se (u∗ , z ∗ ) è una coppia minimizzante, u∗ e z ∗ si chiamano stato ottimo e controllo ottimo, rispettivamente. Quando il controllo z è definito su un aperto Ω0 ⊆ Ω, si dice che il controllo è distribuito. Può essere che z sia definito solo su ∂Ω ed allora si tratta di un controllo alla frontiera.
8.8 Un problema di controllo ottimo
527
Analogamente, quando nel funzionale costo (8.76) intervengono i valori di u in Ω0 ⊆ Ω, diciamo che l’osservazione di u è distribuita. D’altra parte, in alcuni casi si può osservare u o ∂ν u solo su Γ ⊆ ∂Ω. Questi casi corrispondono ad osservazioni alla frontiera e il funzionale costo assume conseguentemente una forma appropriata. Alcuni esempi si trovano nei Problemi 8.19-8.21. Le principali questioni da affrontare in un problema di controllo sono le seguenti: • stabilire esistenza e/o unicità della coppia ottima (u∗ , z ∗ ); • derivare condizioni necessarie e/o sufficienti di ottimalità; • costruire algoritmi per l’approssimazione numerica di (u∗ , z ∗ ). 8.8.2 Esistenza e unicità della coppia ottima Dato z ∈ H, possiamo sostituire nell’espressione di J l’unica soluzione u = u [z] di (8.74) ottenendo il funzionale 1 β 2 J˜ (z) = J (u [z] , z) = (u [z] − ud ) dx + z 2 dx, 2 Ω0 2 Ω dipendente solo da z. Pertanto, il problema di minimo (8.77) si riduce a trovare un controllo ottimo z ∗ ∈ H tale che J˜ (z ∗ ) = min J˜ (z) . z∈H
(8.78)
Noto z ∗ , lo stato ottimo è dato da u∗ = u [z ∗ ]. La strategia per provare l’esistenza e l’unicità del controllo ottimo si basa sulla relazione tra minimizzazione di funzionali quadratici a problemi variazionali astratti per forme bilineari simmetriche, espressa nel Teorema 6.6.3. Il punto chiave è scrivere J˜ (z) nel modo seguente: 1 J˜ (z) = b (z, z) − F z + q 2
(8.79)
dove q è un numero reale, (irrilevante nell’ottimizzazione) e: • b (z, w) è una forma bilineare in H, simmetrica, continua e H−coerciva; • F è un funzionale lineare e continuo in H. ˜ Allora, in base al Teorema 6.6.3, esiste un unico minimizzante z ∗ ∈ H di J. Inoltre, z ∗ minimizza J˜ se e solo se z ∗ è soluzione dell’equazione di Eulero (si veda (6.47)) J˜ (z ∗ ) w = b (z ∗ , w) − F w = 0 ∀w ∈ H. (8.80) Queste considerazioni portano al seguente risultato: Teorema 8.1. Esiste un unico controllo ottimo z ∗ ∈ H. Inoltre z ∗ è ottimo se e solo se z ∗ soddisfa la seguente equazione di Eulero, dove u∗ = u [z ∗ ]: J˜ (z ∗ ) w = (u∗ − ud ) u [w] dx + β z ∗ w dx = 0 ∀w ∈ H. (8.81) Ω0
Ω
528
8 Formulazione variazionale di problemi ellittici
Dimostrazione. Seguendo la strategia indicata sopra, scriviamo J˜ (z) nella forma (8.79). Prima notiamo che la funzione z → u [z] è lineare. Infatti, se α1 , α2 ∈ R, allora u [α1 z1 + α2 z2 ] è la soluzione di Lu [α1 z1 + α2 z2 ] = α1 z1 + α2 z2 u1 . Essendo L lineare, L (α1 u [z1 ] + α2 u [z2 ]) = α1 Lu [z1 ] + α2 Lu [z2 ] = α1 z1 + α2 z2 e quindi, per unicità, u [α1 z1 + α2 z2 ] = α1 u [z1 ] + α2 u [z2 ]. Di conseguenza, u [z] u [w] dx + β zw dx b (z, w) = Ω0
(8.82)
Ω
è una forma bilineare e Fw =
u [w] ud dx
(8.83)
Ω0
è un funzionale lineare in H. Inoltre, b simmetrica (ovvio), continua e H−coerciva. Infatti, usando la (8.75) e le disuguaglianze di Schwarz e Poincaré ed essendo Ω0 ⊆ Ω abbiamo |b (z, w)| ≤ u [z]L2 (Ω0 ) u [w]L2 (Ω0 ) + β z0 w0 ≤ (CP2 + β) z0 w0 per cui b è continua. La H−coercività di b segue da 2 2 b (z, z) = u [z] dx + β z 2 dx ≥ β z0 . Ω0
Ω
Infine, dalla (8.75), usando la disuguaglianza di Poincaré, |F w| ≤ ud L2 (Ω0 ) u [w]L2 (Ω0 ) ≤ CP ud 0 w0 , per cui F è continuo"in H. Se ora poniamo q = Ω0 u2d dx, è facile controllare che 1 J˜ (z) = b (z, z) − F z + q. 2 Applicando il Teorema 6.3 deduciamo esistenza ed unicità del controllo ottimo z ∗ . L’equazione di Eulero (8.80) si traduce nella (8.81) dopo calcoli elementari. 8.8.3 Moltiplicatori di Lagrange e condizioni di ottimalità L’equazione di Eulero (8.81) dà una caratterizzazione del controllo ottimo z ∗ poco adatta al suo calcolo.
8.8 Un problema di controllo ottimo
529
Per ottenere condizioni più maneggevoli, cambiamo punto di vista, considerando l’equazione di stato Lu [z] = −Δu+ div(bu) = z, con u ∈ V , come un vincolo per u e z. L’idea è allora imitare il procedimento che si usa per l’ottimizzazione vincolata per funzioni di più variabili, introducendo un moltiplicatore (adjoint state) p, da scegliersi opportunamente, e scrivere J˜ (z) nella forma lagrangiana seguente: 1 β 2 (u [z] − ud ) dx + z 2 dx + p [z − Lu [z]] dx. (8.84) 2 Ω0 2 Ω Ω Infatti abbiamo aggiunto ... zero. Poiché z −→ u [z] è una funzione lineare, ˜ = Lz p (z − Lu [z]) dx Ω
è un funzionale lineare in H e quindi il Teorema 8.1 dà l’equazione di Eulero: ∗ ∗ ∗ ˜ (u − ud ) u [w] dx + (p + βz )w dx − p Lu [w] dx = 0 J (z ) w = Ω0
Ω
Ω
(8.85) per ogni w ∈ H. Integriamo due volte per parti l’ultimo termine, ricordando che u [w] = 0 su ∂Ω. Troviamo: pLu [w] dx = p (−∂ν u [w] + (b · ν)u [w]) dσ Ω ∂Ω (−Δp − b · ∇p) u [w] dx + Ω =− p ∂ν u [w] dσ + L∗ p u [w] dx, ∂Ω
Ω
∗
dove L = −Δ − b · ∇ è l’aggiunto formale di L. La (8.85) diventa: ∗ ∗ ∗ ˜ J (z ) w = p∂ν u [w] dσ (u − ud ) χΩ0 − L p u [w] dx + Ω ∂Ω + (p + βz ∗ )wdx = 0. Ω
A questo punto scegliamo il moltiplicatore in modo da annullare i primi due termini. Basta prendere p = p∗ ∈ V , soluzione del seguente problema aggiunto: L∗ p = (u∗ − ud ) χΩ0 in Ω (8.86) p=0 su ∂Ω. Usando (8.86), la (8.85) si riduce a (p∗ + βz ∗ )w dx = 0 J˜ (z ∗ ) w = Ω
equivalente a p∗ + βz ∗ = 0 q.o in Ω.
∀w ∈ H,
(8.87)
530
8 Formulazione variazionale di problemi ellittici
Riassumendo, abbiamo dimostrato il seguente risultato: Teorema 8.2. Il controllo z ∗ ed il corrispondente stato u∗ = u (z ∗ ) sono ottimi se e solo se esiste un moltiplicatore p∗ tale che z ∗ , u∗ e p∗ soddisfano le seguenti condizioni di ottimalità: ⎧ ∗ ∗ ∗ ∗ in Ω, u∗ = 0 su ∂Ω ⎪ ⎨ Lu = −Δu + div (bu ) = z ∗ ∗ ∗ ∗ ∗ L p = −Δp − b · ∇p = (u − ud )χΩ0 in Ω, p∗ = 0 su ∂Ω ⎪ ⎩ ∗ p + βz ∗ = 0 in Ω. Possiamo generare le equazioni di stato ed aggiunta in forma debole, introducendo il Lagrangiano L = L (u, z, p), dato da L (u, z, p) = J (u, z) − a (u, p) + (z, p)0 . Osserviamo che L è lineare in p, e quindi11 , per ogni v ∈ V , Lp (u∗ , z ∗ , p∗ ) v = −a (u∗ , v) + (z ∗ , v)0 = 0 che corrisponde all’equazione di stato. Inoltre, per ogni ϕ ∈ V , Lu (u∗ , z ∗ , p∗ ) ϕ = Ju (u∗ , z ∗ ) ϕ − a(ϕ, p∗ ) = (u∗ − ud , ϕ)L2 (Ω0 ) − a∗ (p∗ , ϕ) = 0 che corrisponde all’equazione aggiunta, mentre, per ogni w ∈ H, Lz (u∗ , z ∗ , p∗ ) w = β (w, z ∗ )0 + (w, p∗ )0 = 0 che costituisce l’equazione di Eulero. Nota 8.1. È interessante esaminare il comportamento di J˜ (z ∗ ) per β → 0. Nel nostro caso è possibile mostrare che J˜ (z ∗ ) → 0 se β → 0. 8.8.4 Un algoritmo iterativo Dall’equazione di Eulero (8.87) e dal Teorema di Rappresentazione di Riesz deduciamo che p∗ + βz ∗ è l’elemento di Riesz associato a J˜ (z ∗ ) , che in questo caso prende il nome di gradiente di J˜ in z ∗ e si indica col simbolo ∇J˜ (z ∗ ). Dunque, abbiamo: ∇J˜ (z ∗ ) = p∗ + βz ∗ . 11
Lp , Lz e Lu indicano le derivate del funzionale quadratico L rispetto a p, z, u, rispettivamente.
8.8 Un problema di controllo ottimo
531
Come nel caso dell’ottimizzazione in dimensione finita, −∇J˜ (z ∗ ) rappresenta la direzione di massima discesa per J (steepest descent ). Ciò è alla base di numerose procedure per costruire iterativamente una successione {zk }k≥0 di controlli, convergente al controllo ottimo. Come esempio, indichiamo come si possa costruire una di queste successioni approssimanti. Si sceglie un controllo iniziale z0 . Se zk è noto (k ≥ 0), si calcola zk+1 col seguente schema. 1. Si risolve l’equazione di stato a (uk , v) = (zk , v)0 , ∀v ∈ V. 2. Noto uk , si risolve l’equazione aggiunta a∗ (pk , ϕ) = (uk − ud , ϕ)L2 (Ω0 )
∀ϕ ∈ V.
3. Si pone zk+1 = zk − τ k ∇J˜ (zk )
(8.88)
e si seleziona il parametro di rilassamento τ k per assicurare che J˜ (zk+1 ) < J˜ (zk ) .
(8.89)
Chiaramente, la (8.89) implica la convergenza della successione di numeri reali {J (zk )}, sebbene in generale non a zero. Riguardo la scelta del parametro di rilassamento, ci sono diverse possibilità. Per esempio, se β 1, sappiamo che il valore ottimo di J˜ (z ∗ ) è vicino a zero (Nota 8.1) ed allora possiamo scegliere −2 τ k = J˜ (zk ) ∇J˜ (zk ) . Con questa scelta, la (8.88) corrisponde al metodo di Newton: ∇J˜ (zk ) ˜ zk+1 = zk − 2 J (zk ) . ˜ J (z ) ∇ k Anche τ k = τ , costante, può funzionare, come nell’esempio seguente dove τ = 10. Esempio 8.1. Sia Ω = (0, 4) × (0, 4) ⊂ R2 e Ω0 = (2.5, 3.5) × (2.5, 3.5). Consideriamo il problema (8.77), con ud = χΩ0 , β = 10−4 e sistema di stato −Δu + 3.5ux + 1.5uy = z, in Ω e u = 0 su ∂Ω. In base al Teorema 8.1, esiste un unico controllo ottimo z ∗ . Il sistema aggiunto è −Δp − 3.5px − 1.5py = (u − 1) χΩ0 , in Ω e p = 0 on ∂Ω.
532
8 Formulazione variazionale di problemi ellittici
Figura 8.5. Stato ottimo u∗ nell’Esempio 8.1
Figura 8.6. Controllo ottimo z ∗ nell’Esempio 8.1
Le Figure 8.5 e 8.6 mostrano stato e controllo ottimo, rispettivamente, con le loro isocline.12 Si noti l’avvallamento al centro di Ω0 nel grafico z ∗ , in cui z ∗ assume un minimo negativo. Ciò è dovuto al fatto che, senza controllo, la soluzione dell’equazione di stato tenderebbe a valori maggiori di uno in Ω0 per cui il controllo deve bilanciare questo effetto.
Problemi 8.1. Scrivere la formulazione variazionale del problema cos x u − sin x u − xu = 1 0 < x < π/4 u (0) = −u (0) , u (π/4) = 0. Discutere esistenza ed unicità e scrivere una stima di stabilità. 12
Ringrazio Luca Dedè, del laboratorio Mox, Dipartimento di Matematica del Politecnico di Milano, che ha elaborato le immagini.
Problemi
533
8.2. Equazione di Legendre. Sia 1/2 X = v ∈ L2 (−1, 1) : 1 − x2 v ∈ L2 (−1, 1) con prodotto interno (u, v)X =
1
uv + 1 − x2 u v dx.
−1
a) Controllare ch (u, v)X è effettivamente un prodotto interno e che X è uno spazio di Hilbert. b) Data f ∈ L2 (−1, 1), studiare il problema variazionale (u, v)V =
1
f v dx −1
∀v ∈ X.
(8.90)
c) Determinare a quale problema è associata la formulazione variazionale (8.90). [a) Suggerimento. Usare il Teorema 7.4, con V = L2 (−1, 1)
Z = L2w (−1, 1) ,
e
1/2 . Controllare che Z → D (−1, 1) . w (x) = 1 − x2 b) Suggerimento. Usare il Teorema di Lax-Milgram. c) Risposta: Il problema è:
− (1 − x2 )u + u = f (1 − x2 )u (x) → 0
−1<x<1 per x → ±1.
L’equazione è di Legendre, con condizioni naturali di Neumann agli estremi]. 8.3. Siano 1 V = Hper (0, 2π) = u ∈ H 1 (0, 2π) : u (0) = u (2π) e F il funzionale lineare F : v −→
2π
tv (t) dt. 0
Controllare che F ∈ V ∗ e determinare esplicitamente l’elemento di Riesz associato a F , ossia l’elemento u ∈ V tale che (u, v)1,2 = F v, ∀v ∈ V . 8.4. Sia Ω = (0, 1) × (0, 1) ⊂ R2 . Dimostrare che il funzionale 1 2 E (v) = |∇v| − 2xv dxdy 2 Ω
534
8 Formulazione variazionale di problemi ellittici
ha un’unica minimizzante u ∈ H01 (Ω). Scrivere l’equazione di Eulero e trovare una formula esplicita per u. 8.5. Condizioni di trasmissione (I). Considerare il problema (p (x) u ) = f in (a, b) u (a) = u (b) = 0
(8.91)
dove f ∈ L2 (a, b), p (x) = p1 > 0 in (a, c) e p (x) = p2 > 0 in (c, b). Mostrare che il problema (8.91) ha un’unica soluzione in H 1 (a, b), soddisfacente le seguenti condizioni: ⎧ in (a, c) ⎨ p1 u = f p2 u = f in (c, b) ⎩ p1 u (c−) = p2 u (c+) . Si osservi il salto delle derivate u nel punto x = c (Figura 8.7).
Figura 8.7. La soluzione del problema di trasmissione (p (x) u ) = −1, u (0) = u (3) = 0, con p (x) = 3 in (0, 1) e p (x) = 1/2 in (1, 3)
8.6. Consideriamo il sottospazio di H 1 (Ω) ! 1 u dσ = 0 . V = u ∈ H (Ω) : ∂Ω
a) Mostrare che V è uno spazio di Hilbert rispetto al prodotto interno (u, v)1 = (∇u, ∇v)0 e determinare a quale tipo di problema è associata la seguente formulazione variazionale: determinare u ∈ V tale che {∇u · ∇v + uv} dx = f v dx, ∀v ∈ V. Ω
Ω
b) Provare che se f ∈ L2 (Ω) esiste un’unica soluzione.
Problemi
535
[Risposta. a) −Δu + u = f , ∂ν u = costante. b) Applicare il Teorema di Lax-Milgram]. 8.7. Siano Ω ⊂ Rn e g ∈ H 1/2 (∂Ω). Definiamo Hg1 (Ω) = v ∈ H 1 (Ω) : v = g su ∂Ω . Dimostrare il seguente risultato, noto come Principio di Dirichlet: Sia u ∈ Hg1 (Ω) armonica in Ω. Allora, posto
2
|∇v| dx
D (v) =
(integrale di Dirichlet)
Ω
si ha D (u) =
min
v∈Hg1 (Ω)
D (v) .
[Suggerimento. In H 1 (Ω) usare il prodotto interno (u, v)1,∂ = uv dσ + ∇u · ∇v dx ∂Ω
Ω
e la norma (si veda il Problema 7.24): v1,∂ =
v 2 dσ +
∂Ω
2
1/2
|∇v| dx
.
(8.92)
Ω 2
Allora, minimizzare D (v) su Hg1 (Ω) equivale a minimizzare v1,∂ . Se v ∈ Hg1 (Ω) e u ∈ Hg1 (Ω) è armonica in Ω, scrivere u = v + w, con w ∈ H01 (Ω). 2 2 Mostrare che (u, w)1,∂ = 0 e concludere che u1,∂ ≤ v1,∂ ]. 8.8. Considerare il seguente problema di Neumann: ⎧ in Ω ⎨ −Δu1 + u1 − u2 = f1 −Δu2 + u1 + u2 = f1 in Ω ⎩ ∂ν u1 = ∂ν u2 = 0 su ∂Ω. Dare una formulazione variazionale e dimostrare un teorema di buona posizione. [Suggerimento. La formulazione variazionale è: {∇u1 · ∇v1 + ∇u2 · ∇v2 + u1 v1 − u2 v1 + u1 v2 + u2 v2 } Ω = (f1 v1 + f2 v2 ) Ω
per ogni (v1 , v2 ) ∈ H 1 (Ω) × H 1 (Ω)].
536
8 Formulazione variazionale di problemi ellittici
8.9. Condizioni di trasmissione (II). Siano Ω1 e Ω domini Lipschitziani in Rn tali che Ω1 ⊂⊂ Ω. Sia Ω2 = Ω\Ω 1 . In Ω1 e Ω2 consideriamo le seguenti forme bilineari Ak (x) ∇u · ∇v dx (k = 1, 2) ak (u, v) = Ωk
con Ak uniformemente ellittiche. Assumiamo che gli elementi di Ak siano continui in Ω k , ma che la matrice 1 A (x) in Ω 1 A (x) = A2 (x) in Ω2 possa avere una discontinuità a salto attraverso Γ = ∂Ω1 . Sia u ∈ H01 (Ω) la soluzione debole dell’equazione a (u, v) = a1 (u, v) + a2 (u, v) = (f, v)0
∀v ∈ H01 (Ω) ,
dove f ∈ L2 (Ω). a) Di quale problema al bordo u è soluzione debole? b) Quali condizioni su Γ esprimono la connessione tra u1 e u2 ? [Riposta: b) u1|Γ = u2|Γ e A1 ∇u1 ·ν = A2 ∇u2 ·ν, dove ν è la normale interna per Ω1 ]. 8.10. Consideriamo il problema di Neumann −Δu + c · ∇u = f in Ω su ∂Ω ∂ν u = 0 con Ω regolare, c ∈C 1 Ω e f ∈ L2 (Ω). Sia V = H 1 (Ω) e B (u, v) = {∇u · ∇v + (c · ∇u)v} dx.
(8.93)
Ω
Trovare l’errore nel seguente ragionamento. Se divc = 0, possiamo scrivere 1 (c · ∇u) u dx = c · ∇(u2 ) dx = u2 c · ν dσ. 2 Ω Ω ∂Ω Se dunque c · ν ≥ c0 > 0, abbiamo: 2
B(u, u) ≥ ∇u20 + c0 u2L2 (∂Ω) ≥ C u1,2 cosicché B è V −coerciva ed il problema (8.93) ha un’unica soluzione! 8.11. Sia Ω = (0, π) × (0, π). Studiare la risolubilità del problema di Dirichlet Δu + 2u = f in Q u=0 su ∂Q. Esaminare, in particolare, i casi f (x, y) = 1 e f (x, y) = x − π/2.
Problemi
537
8.12. Sia B1+ = (x, y) ∈ R2 : x2 + y 2 < 1, y > 0 . Esaminare la risolubilità del problema di Robin −Δu = f in B1+ ∂ν u + yu = 0 su ∂B1+ . 8.13. Sia Ω = (0, 1) × (0, 1) ⊂ R2 . Discutere, al variare del parametro reale a, la risolubilità del problema misto ⎧ ⎨ Δu + au = 1 in Ω u=0 su ∂Ω\ {y = 0} ⎩ su {y = 0} . ∂ν u = x 8.14. Sia "Ω ⊂ R3 dominio limitato e Lipschitziano f ∈ L2 (Ω) e a, b ∈ L (Ω), con Ω b (x) dx = 0. Consideriamo il seguente problema (non locale) di Neumann: " −Δu + a (x) Ω b (z) u (z) dz = f (x) in Ω (8.94) ∂ν u = 0 su ∂Ω. ∞
a) Dare una formulazione debole del problema. b) Analizzarne la risolubilità. 8.15. Dare una formulazione variazionale del seguente problema: 2 in Ω Δ u=f su ∂Ω Δu + ρ∂ν u = 0 dove ρ è una costante positiva. Controllare che la giusta ambientazione funzionale è H 2 (Ω) ∩ H01 (Ω), cioè lo spazio delle funzioni in H 2 (Ω) a traccia nulla su ∂Ω. Enunciare e dimostrare un risultato di buona posizione del problema variazionale. [Suggerimento. La formulazione variazionale è Δu · Δv dx+ ρ∂ν u · ∂ν v dσ = f v dx, ∀v ∈ H 2 (Ω) ∩ H01 (Ω) . Ω
∂Ω
Ω
Per la buona posizione, controllare che vale la disuguaglianza ∂ν vL2 (∂Ω) ≤ Δv0 , ∀v ∈ H 2 (Ω) ∩ H01 (Ω)]. 8.16. Sia λ1 il primo autovalore di Dirichlet per il Laplaciano e V1 l’autospazio corrispondente. a) Mostrare che il secondo autovalore di Dirichlet λ2 soddisfa il seguente principio variazionale, dove R (v) è il quoziente di Rayleigh (8.15): λ2 = min R (v) : v = 0, v ∈ H01 (Ω) ∩ V1⊥ , . b) Quale principio variazionale soddisfano gli altri autovalori di Dirichlet?
538
8 Formulazione variazionale di problemi ellittici
8.17. Sia Ω ⊂ Rn un dominio limitato e regolare e a ∈ C ∞ Ω , a ≥ 0 in Ω. Considerare il seguente problema agli autovalori: −Δu + a (x) u = λu in Ω u=0 su ∂Ω. a) Verificare che esiste una base di autofunzioni ortonormale in L2 (Ω), in corrispondenza ad una successione crescente di autovalori {λk }k≥1 con λk → +∞. Rispetto a quale prodotto scalare, questa base, opportunamente normalizzata, è ortonormale anche in H01 (Ω)? b) Mostrare che l’autovalore principale λ1 = λ1 (Ω, a) è positivo. Quale quoziente di Rayleigh minimizza λ1 ? c) Dedurre le seguenti proprietà di monotonia e di stabilità del primo autovalore: 1. se a1 ≤ a2 in Ω allora λ1 (Ω, a1 ) ≤ λ1 (Ω, a2 ) 2. |λ1 (Ω, a1 ) − λ1 (Ω, a2 )| ≤ a1 − a2 L∞ (Ω) 3. se Ω1 ⊂ Ω2 allora λ1 (Ω1 , a) ≥ λ1 (Ω2 , a) . 8.18. Sia Lu = −div(A (x) ∇u) + a (x) u, con A simmetrica e a limitata, non necessariamente ≥ 0. Nel caso in cui Ω e tutti i coefficienti siano regolari, enunciare e dimostrare gli analoghi dei Teoremi 3.3, 3.4 e 3.5. 8.19. Osservazione e controllo distribuiti, condizioni di Neumann. Siano Ω ⊂ Rn un dominio limitato e regolare e Ω0 un sottoinsieme aperto (non vuoto) di Ω. Poniamo V = H 1 (Ω), H = L2 (Ω) e consideriamo il seguente problema di controllo. Minimizzare il funzionale costo 1 β 2 (u − ud ) dx + z 2 dx J (u, z) = 2 Ω0 2 Ω al variare di (u, z) ∈ H 1 (Ω) × L2 (Ω), con sistema di stato Lu = −Δu + a0 u = z in Ω ∂ν u = g
(8.96)
su ∂Ω
dove a0 è una costante positiva, g ∈ L2 (∂Ω) e z ∈ L2 (Ω). a) Mostrare che esiste un’unica coppia minimizzante. b) Scrivere le condizioni di ottimalità: problema aggiunto ed equazione di Eulero. [a) Suggerimento. Imitare la dimostrazione del Teorema 8.1, osservando che se u [z] è la soluzione di (8.96) la funzione z −→ u [z] − u [0] è lineare. Scrivere poi 2 J˜ (z) = 12 (u [z] − u [0] + u[0] − ud ) dx + β2 z 2 dx Ω0
e modificare coerentemente la forma bilineare (8.82).
Ω
Problemi
539
b) Risposta. Il problema aggiunto è (qui L = L∗ ) −Δp + a0 p = (u − zd )χΩ0 in Ω su ∂Ω ∂ν p = 0 dove χΩ0 è la funzione caratteristica di Ω0 . L’equazione di Eulero è: p+βz = 0 in L2 (Ω)]. 8.20. Osservazione distribuita e controllo del flusso alla frontiera. Sia Ω ⊂ Rn un dominio limitato e regolare. Consideriamo il seguente problema di controllo. Minimizzare il funzionale costo 1 β 2 J (u, z) = (u − ud ) dx + z 2 dx 2 Ω 2 ∂Ω al variare di (u, z) ∈ H 1 (Ω) × L2 (∂Ω), con sistema di stato in Ω −Δu + a0 u = f ∂ν u = z su ∂Ω dove a0 è una costante positiva, f ∈ L2 (Ω) e z ∈ L2 (∂Ω). a) Mostrare che esiste un’unica coppia minimizzante. b) Scrivere le condizioni di ottimalità: problema aggiunto ed equazione di Eulero. [a) Suggerimento. Vedere il Problema 8.20a. b) Risposta. Il problema aggiunto è −Δp + a0 p = u − zd in Ω ∂ν p = 0 su ∂Ω. L’equazione di Eulero è: p + βz = 0 in L2 (∂Ω)]. 8.21. Osservazione alla frontiera e controllo distribuito, condizioni di Dirichlet. Sia Ω ⊂ Rn un dominio limitato e regolare. Consideriamo il seguente problema di controllo. Minimizzare il funzionale costo 1 β 2 (∂ν u − ud ) dσ + z 2 dx J (u, z) = 2 ∂Ω 2 Ω al variare di (u, z) ∈ H01 (Ω) × L2 (Ω), con sistema di stato −Δu + c · ∇u = f + z, in Ω u=0 su ∂Ω dove c è un vettore costante e f ∈ L2 (Ω). a) Mostrare che, per i risultati di regolarità ellittica, J (u, z) è ben definito e che esiste un’unica coppia minimizzante.
540
8 Formulazione variazionale di problemi ellittici
b) Scrivere le condizioni di ottimalità: problema aggiunto ed equazione di Eulero. [a) Suggerimento. Imitare la dimostrazione del Teorema 8.1, cambiando opportunamente la forma bilineare (8.82). b) Risposta. Il problema aggiunto è: ∗ E p = −Δu − div(cu) + cu = 0 in Ω ∂ν A p = ∂ν u − ud su ∂Ω. L’equazione di Eulero è: p + βz = 0 in L2 (Ω)].
9 Formulazione debole per problemi di evoluzione
9.1 Equazioni paraboliche Nel Capitolo 2 abbiamo considerato l’equazione del calore ed alcune sue generalizzazioni, come nel modello di diffusione e reazione (Sezione 2.7) o nel modello di Black-Scholes (Sezione 2.9). Questi tipi di equazioni rientrano nella classe delle equazioni paraboliche, che abbiamo già classificato in dimensione spaziale 1 nel Paragrafo 5.5.1. Sia Ω ⊂ Rn un dominio limitato e consideriamo il cilindro spaziotemporale QT = Ω × (0, T ), T > 0. Siano A = A (x,t) una matrice quadrata di ordine n, b = b(x,t), c = c(x,t) vettori in Rn , a = a(x,t) e f = f (x,t) funzioni reali. Un’equazione in forma di divergenza del tipo ut − div(A∇u − bu) + c · ∇u + au = f
(9.1)
oppure in forma di non divergenza del tipo ut − Tr(AD2 u) + b · ∇u + au = f
Figura 9.1. Cilindro spazio-temporale Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
(9.2)
542
9 Formulazione debole per problemi di evoluzione
si dice parabolica in QT se (condizione di ellitticità ) ∀(x,t) ∈ QT , ∀ξ ∈ Rn , ξ = 0.
A (x,t) ξ · ξ > 0
Per le equazioni paraboliche si possono ripetere le stesse considerazioni fatte nella Sezioni 8.1 e 8.2 a proposito delle equazioni ellittiche e delle diverse nozioni di soluzione, con le ovvie correzioni dovute alla situazione evolutiva. Per identiche ragioni, svilupperemo la teoria per le equazioni in forma di divergenza. Sia dunque Lu = −div(A∇u − bu) + c · ∇u + au. Assegnata f in QT , vogliamo determinare una soluzione u, dell’equazione parabolica ut + Lu = f in QT che inoltre soddisfi la condizione iniziale (o di Cauchy ) u (x,0) = g (x) in Ω e una delle condizioni di Dirichlet, Neumann, di Robin o miste sulla frontiera laterale ST = ∂Ω × (0, T ]. Il prototipo delle equazioni paraboliche è naturalmente l’equazione del calore. Ci serviamo del problema di Cauchy-Dirichlet per questa equazione per introdurre una possibile formulazione debole. Faremo uso di integrali per funzioni a valori in uno spazio di Hilbert e di spazi di Sobolev dipendenti dal tempo. Una breve introduzione a queste nozioni e ai risultati che ci serviranno si trova nella Sezione 7.10.
9.2 Equazione di diffusione 9.2.1 Problema di Cauchy-Dirichlet Consideriamo il problema ⎧ ⎪ ⎨ ut − αΔu = f u (x,0) = g (x) ⎪ ⎩ u=0
in QT in Ω
(9.3)
su ST
dove α > 0. Vogliamo trovare una formulazione debole. Procediamo formalmente moltiplicando l’equazione di diffusione per una funzione regolare v = v (x), nulla su ∂Ω, e integriamo su Ω. Troviamo ut (x,t) v (x) dx − α Δu (x,t) v (x) dx = f (x,t) v (x) dx. Ω
Ω
Ω
9.2 Equazione di diffusione
543
Integrando per parti il secondo termine, otteniamo ut (x,t) v (x) dx + α ∇u (x,t) · ∇v (x) dx = f (x,t) v (x) dx.
(9.4)
Ω
Ω
Ω
Tutto ciò ricorda quanto abbiamo fatto nel caso ellittico, tranne che per la presenza di ut . Inoltre, qui occorre tener conto in qualche modo della condizione iniziale. Quale può essere un’ambientazione funzionale appropriata? Anzitutto, poiché stiamo considerando equazioni di evoluzione, conviene adottare il punto di vista della Sezione 7.9 e considerare u = u (x, t) come funzione che associa ad ogni t ∈ [0, T ] una funzione di x, vista come elemento di un’opportuno spazio di Hilbert V , ossia come u : [0, T ] → V . Adottando questa convenzione, scriveremo u (t) invece di u (x, t) e u˙ invece di ut . Coerentemente, scriveremo f (t) invece di f (x, t). Con queste notazioni la (9.4) diventa u˙ (t) v dx + α ∇u (t) · ∇v dx = f (t) v dx. (9.5) Ω
Ω
Ω
Cerchiamo ora un’ambientazione funzionale corretta. La condizione omogenea di Dirichlet, cioè u (t) = 0 su ∂Ω per ogni t ∈ [0, T ], suggerisce che lo spazio naturale per u (t) sia V = H01 (Ω), almeno per quasi ogni1 t ∈ [0, T ]. Come al solito, in V usiamo il prodotto interno (w, v)1 = (∇w, ∇v)0 con norma corrispondente ·1 per cui possiamo scrivere il secondo integrale nella (9.5) nella forma (∇u (t) , ∇v)0 . Un’ipotesi naturale su f nel problema di partenza (9.3) è f ∈ L2 (QT ), che ponendo H = L2 (Ω), nelle nuove notazioni si scrive f ∈ L2 (0, T ; H) . Guardando il primo integrale nella (9.5) sembrerebbe appropriato che u˙ (t) ∈ L2 (Ω). Tuttavia ciò non è coerente con la scelta u (t) ∈ V , poiché abbiamo Δu (t) ∈ H −1 (Ω) e, dall’equazione di diffusione, u˙ (t) = αΔu (t) + f (t) .
(9.6)
Quindi deduciamo che V ∗ = H −1 (Ω) è lo spazio naturale per u˙ (t). Di conseguenza, il primo integrale in (9.5) deve essere interpretato come dualità, cioè u˙ (t) , v∗ = u˙ (t) , vV ∗ ×V . Dalla (9.6) si vede che anche l’ipotesi f ∈ L2 (0, T ; V ∗ ) è appropriata. Coerentemente richiediamo che u ∈ L2 (0, T ; V ) e u˙ ∈ L2 (0, T ; V ∗ ). Dal Teorema 7.9.3 sappiamo allora che u ∈ C ([0, T ] ; H) 1
Cioè tranne che per un sottoinsieme di misura di Lebesgue nulla in [0, T ].
544
9 Formulazione debole per problemi di evoluzione
cosicché la condizione iniziale u (0) = g ha senso se g ∈ H e significa che u (t) − gH → 0, se t → 0+ . Consideriamo ora la terna Hilbertiana (V, H, V ∗ ) e introduciamo la forma bilineare a (w, v) = α(∇w, ∇v)0 . Le considerazioni fatte conducono alla seguente formulazione debole del problema (9.3): Determinare una funzione u ∈ L2 (0, T ; V ) tale che u˙ ∈ L2 (0, T ; V ∗ ) e 1. per ogni v ∈ V , u˙ (t) , v∗ +a (u (t) , v) = (f (t) , v)
q.o. in [0, T ] ;
(9.7)
2. u (0) = g. Nota 2.1, La (9.7) si può intendere equivalentemente nel senso delle distribuzioni in D (0, T ) dando alla dualità u˙ (t) , v∗ un significato più esplicito. Si ha infatti: d u˙ (t) , v∗ = in D (0, T ) . (9.8) (u (t) , v)0 dt Per dimostrare la (9.8), osserviamo prima che, essendo u ∈ L2 (0, T ; V ) e u˙ ∈ L2 (0, T ; V ∗ ), abbiamo, per ogni v ∈ V , T T 2 2 2 (u (t) , v)0 dt ≤ v0 u (t)0 dt < ∞ 0
e
0
T
2
2
u˙ (t) , v∗ dt ≤ v1
0
0
T
2
u˙ (t)V ∗ dt < ∞.
Perciò le funzioni reali t −→ (u (t) , v)0 e t −→ u˙ (t) , v∗ 2
appartengono a L (0, T ). Inoltre, essendo u (t) ∈ V , si ha u (t) , v∗ = (u (t) , v)0 (Paragrafo 6.8.1) e quindi, dalla definizione (7.62) di u, ˙ si può scrivere, per ogni v ∈ V e per ogni ϕ ∈ D (0, T ) : T T T u˙ (t) , v∗ ϕ (t) dt = − u (t) , v∗ ϕ˙ (t) dt = − (u (t) , v)0 ϕ˙ (t) dt 0
0
0
che equivale alla (9.8). Come conseguenza, la (9.7) si può scrivere nella forma d (u (t) , v)0 + a (u (t) ,v) = (f (t) , v)0 (9.9) dt nel senso delle distribuzioni in [0, T ], per ogni v ∈ V . Nota 2.2. Nonè difficile mostrare che, se una soluzione debole è regolare, cioé u ∈ C 2,1 QT , allora è una soluzione classica. Lasciamo la verifica al lettore.
9.2 Equazione di diffusione
545
9.2.2 Il metodo di Faedo-Galerkin (I) Vogliamo dimostrare che il problema (9.3) possiede un’unica soluzione debole e che questa dipende con continuità dai dati, in una norma opportuna. Esistono varianti del Teorema di Lax-Milgram che si adattano perfettamente ad un problema di evoluzione come quello che stiamo esaminando, tuttavia, anche in vista dell’uso di metodi numerici, riteniamo più conveniente usare direttamente il metodo di Galerkin, o meglio, nel caso parabolico, di Faedo-Galerkin. Rivediamo brevemente la strategia alla base del metodo, sempre in riferimento al nostro problema. ∞
1. Si seleziona una successione di funzioni {wk }k=1 che costituisca una base ortonormale in H e una base ortogonale in V. Ciò è possibile in quanto H è uno spazio di Hilbert separabile. Qui, in particolare, si può scegliere come base l’insieme delle autofunzioni di Dirichlet per l’operatore di Laplace (Paragrafo 8.8.3), normalizzate in norma L2 (Ω). In particolare, possiamo scrivere g=
∞
gk wk
k=1
dove gk = (g, wk ) e la serie converge in H. 2. Si costruisce la successione Vm = span {w1 , w2 , ..., wm } costituita dai sottospazi di V generati dalle autofunzioni w1 , w2 , ..., wm . I Vm sono sottospazi a dimensione finita tali che Vm ⊂ Vm+1
e
∪V m = V.
Fissato m, si pone um (t) =
m
k=1
ck (t) wk ,
Gm =
m
gk wk
(9.10)
k=1
e si risolve il seguente problema approssimato finito-dimensionale: Determinare um ∈ H 1 (0, T ; V ) tale che, per ogni s = 1, ..., m, (u˙ m (t) , ws )0 + a (um (t) , ws ) = (f (t) ,ws )0 , q.o. in [0, T ] (9.11) um (0) = Gm .
546
9 Formulazione debole per problemi di evoluzione
Naturalmente, la prima equazione in (9.11) è vera per ogni elemento ws della base scelta in Vm se e solo se risulta vera per ogni funzione test v ∈ Vm . Si noti inoltre, che, essendo u˙ m ∈ L2 (0, T ; V ), si può scrivere (Paragrafo 6.8.1) u˙ m (t) , v∗ = (u˙ m (t) , v)0 . Si dice che um è un’approssimazione di Galerkin della soluzione u. 3. Si dimostra che le successioni {um } and {u˙ m } sono limitate in L2 (0, T ; V ) e L2 (0, T ; V ∗ ), rispettivamente, mediante stime dette dell’energia. Allora, in base al Teorema 6.7.8 di compattezza debole, esiste una sottosuccessione {umk } debolmente convergente in L2 (0, T ; V ) ad un certo elemento u, mentre {u˙ mk } converge debolmente a u˙ in L2 (0, T ; V ∗ ). 4. Si prova che la u costruita nel passo precedente è l’unica soluzione debole del problema (9.3). Si noti che, come conseguenza dell’unicità, tutta la successione di Galerkin converge debolmente alla soluzione. 9.2.3 Soluzione del problema approssimato Vale il seguente lemma. Lemma 2.1. Per ogni m, esiste un’unica soluzione del problema (9.11). In particolare, essendo um ∈ H 1 (0, T ; Vm ), si ha um ∈ C (0, T ; Vm ). Dimostrazione. Osserviamo che, per l’ortonormalità delle w1 , ..., wm in H, m (u˙ m (t) , ws )0 = c˙k (t) wk , ws = c˙s (t) k=1
0
e, per l’ortogonalità delle w1 , ..., wm in Vm , m 2 a ck (t) wk , ws = α (∇ws , ∇ws )0 cs (t) = α ∇ws 0 cs (t) . k=1
Poniamo Fs (t) = (f (t) , ws )0 ,
F (t) = (F1 (t) , ..., Fm (t))
e Cm (t) = (c1 (t) , ..., cm (t)) ,
gm = (g1 , ..., gm ) .
Introduciamo poi la matrice diagonale di ordine m, 2 2 2 W = diag ∇w1 0 , ∇w2 0 , ..., ∇wm 0 . Il problema (9.11) è allora equivalente al seguente sistema di equazioni differenziali ordinarie, lineari a coefficienti costanti e disaccoppiate: ˙ m (t) = −αWCm (t) + Fm (t) , C
q.o. t ∈ [0, T ]
(9.12)
9.2 Equazione di diffusione
547
con la condizione iniziale Cm (0) = gm . 2
Poiché F ∈ L (0, T ; R ), questo sistema ha un’unica soluzione Cm (t) ∈ H 1 (0, T ; Rm ). Essendo m
um (t) =
m k=1
ck (t) wk ,
si deduce um ∈ H 1 (0, T ; Vm ).
2
Nota 2.3. Abbiamo scelto una base {wk } ortonormale in L (Ω) e ortogonale in H01 (Ω) perché in questa base l’operatore di Laplace si diagonalizza, come si vede dal fatto che il sistema approssimante (9.12) è disaccoppiato. Perciò i calcoli sono più agevoli. Il risultato resta comunque valido (e anche i risultati successivi restano validi) con una base numerabile qualunque. Il problema (9.11) diventerebbe Cm (t) = −αM−1 WCm (t) + M−1 Fm (t)
q.o in [0, T ]
dove2 M = (Msk ) , W = (Wsk ) ,
Msk = (ws , wk )0 , Ask = α (∇ws , ∇wK )0 .
Ciò si rivela di particolare importanza nella pratica del calcolo approssimato, dove, in generale, gli elementi della base non hanno proprietà di ortogonalità. 9.2.4 Stime dell’energia Vogliamo dimostrare che dalla successione {um } delle approssimazioni di Galerkin si può estrarre una sottosuccessione convergente ad una soluzione del problema originale. Si tratta di un tipico problema di compattezza in spazi di Hilbert ed in questo caso, diventa decisivo il Teorema 6.7.8: siano H uno spazio di Hilbert e {xm } ⊂ H una successione limitata; allora da {xm } si può estrarre una sottosuccessione {xmk } debolmente convergente a un elemento x ∈ H. Inoltre x ≤ lim inf xmk . k→∞
Questo risultato indica la strada da percorrere: occorre mostrare che opportune norme di Sobolev di um si possono controllare con opportune norme dei dati, con costanti di maggiorazione indipendenti da m. Le maggiorazioni devono essere abbastanza potenti da permettere il passaggio al limite nei tre termini dell’equazione (u˙ m , v)0 + α (∇um ,∇v)0 = (f, v)0 . 2
Essendo w1 , ..., wm una base di Vm , la matrice M è definita positiva, quindi invertibile.
548
9 Formulazione debole per problemi di evoluzione
Nel nostro caso, si riesce a controllare le norme di um negli spazi L∞ (0, T ; V ), L2 (0, T ; V ) e la norma di u˙ m in L2 (0, T ; V ∗ ), e cioé T T 2 2 max um (t)0 , um (t)1 dt e u˙ m (t)∗ dt t∈[0,T ]
0
0
dove ·∗ = ·V ∗ . Useremo ripetutamente il seguente lemma elementare ma molto utile. Lemma 2.2. (di Gronwall). Siano F , Ψ e G funzioni continue in [0, T ] con F non negativa e G non decrescente. Se vale la disuguaglianza integrale t F (s) Ψ (s) ds, per ogni t ∈ [0, T ] , (9.13) Ψ (t) ≤ G (t) + 0
allora
t
Ψ (t) ≤ G (t) e
0
F (s)ds
Dimostrazione. Poniamo
per ogni t ∈ [0, T ] .
,
s
F (r) Ψ (r) dr.
R (s) = 0
Allora si ha, in [0, T ]:
R (s) = F (s) Ψ (s) ≤ F (s)
s
F (r) Ψ (r) dr + G (s) 0
= F (s) R (s) + F (s) G (s) .
"s Se moltiplichiamo entrambi i membri per exp − 0 F (r) dr , si può scrivere la disuguaglianza risultante nella forma seguente: s s d F (r) dr ≤ F (s) G (s) exp − F (r) dr . R (s) exp − ds 0 0 Integrando tra 0 e t si ottiene, essendo R (0) = 0, t t s R (t) ≤ e 0 F (r)dr F (s) G (s) e− 0 F (r)dr ds 0
ovvero
t 0
F (s) Ψ (s) ds ≤
t t
e
s
F (r)dr
F (s) G (s) ds.
0
Essendo G non decrescente ed F ≥ 0, si può scrivere t t t F (s)ds r F (s) Ψ (s) ds ≤ G (t) e F (r) dr = −G (t) 0
0
= G (t) e
0
t 0
F (s)ds
t
d t F (s)ds er dr = dr
− G (t)
che inserita nella (9.13) dà la tesi. Sia ora um la soluzione del problema (9.11).
9.2 Equazione di diffusione
549
Teorema 2.3 (Stima di um ). Per ogni t ∈ [0, T ] vale la seguente stima: 2 um (t)0
t
+ 2α 0
2 um (s)1
ds ≤ e
t
2 g0
t
+ 0
f
2 (s)0
! ds .
(9.14)
Una stima alternativa, che evita l’uso del Lemma 2.2, si trova nel Problema 9.3. Dimostrazione. Moltiplicando l’equazione (9.11) per ck (t) e sommando per k = 1, ..., m, si trova (u˙ m (t) , um (t))0 + a (um (t) , um (t)) = (f (t) ,um (t))0
(9.15)
valida q.o. in (0, T ). Osserviamo ora che (u˙ m (t) , um (t))0 =
1 d 2 um (t)0 , 2 dt
e che
q.o. in (0, T )
2
2
a (um (t) , um (t)) = α ∇um (t)0 = α um (t)1 . Per la disuguaglianza di Schwarz, usando la disuguaglianza elementare 2ab ≤ a2 + b2 , abbiamo 1 1 2 2 f (t)0 + um (t)0 , 2 2
(f (t) ,um (t))0 ≤ f (t)0 um (t)0 ≤ cosicché la (9.15) implica che
d 2 2 2 2 um (t)0 + 2α um (t)1 ≤ f (t)0 + um (t)0 . dt Integriamo ora tra 0 e t, ricordando la (7.65); essendo um (0) = Gm ed osservando che, per l’ortogonalità delle wk in L2 (Ω), si ha 2
2
Gm 0 ≤ g0 , possiamo scrivere: 2
um (t)0 + 2α
0
t
t t 2 2 2 2 um 1 ds ≤ Gm 0 + f 0 ds + um 0 ds 0 0 t t 2 2 2 f 0 ds + um 0 ds. ≤ g0 + 0
0
(9.16) Se poniamo 2
2
Ψ (t) = um (t)0 , G (t) = g0 +
0
t
2
f (s)0 ds,
550
9 Formulazione debole per problemi di evoluzione
abbiamo
Ψ (t) ≤ G (t) +
t
Ψ (s) ds 0
e quindi, dalla disuguaglianza di Gronwall, Ψ (t) ≤ et G (t) ossia ! t 2 2 2 t um (t)0 ≤ e g0 + f (s)0 ds in [0, T ] .
(9.17)
0
Sostituendo (9.17) nel secondo membro della (9.16), dopo calcoli elementari si ottiene ! t t 2 2 2 2 um (s)1 ds ≤ et g0 + f (s)0 ds um (t)0 + 2α 0
0
che è la (9.14). 2 ∗ Vediamo ora come si può controllare la norma di u˙ m in L (0, T ; V ). Teorema 2.4 (Stima di u˙ m ). Per ogni t ∈ [0, T ], t t 2 2 2 u˙ m (s)∗ ds ≤ αet g0 + (αet + 2CP2 ) f (s)0 ds. (9.18) 0
0
Dimostrazione. Sia v ∈ V e scriviamo v =w+z con w ∈ Vm = span{w1 , w2 , ..., wm } e z ∈ Vm⊥ . Poiché w e z sono ortogonali in V , si ha w1 ≤ v1 . Utilizzando w come funzione test nel problema (9.11), si trova (u˙ m (t) , v)0 = (u˙ m (t) , w)0 = −a (um (t) , w) + (f (t) ,w)0 . Essendo |a (um (t) , w)| ≤ α um (t)1 w1 si ottiene, per le disuguaglianze di Schwarz e Poincaré, |(u˙ m (t) , v)0 | ≤ α um (t)1 w1 + f (t)0 w0 ≤ {α um (t)1 + CP f (t)0 } w1 ≤ {α um (t)1 + CP f (t)0 } v1 . Per definizione di norma in V ∗ , si deduce allora che u˙ m (t)∗ ≤ α um (t)1 + CP f (t)0 . Quadrando entrambi i membri e integrando tra 0 e t si ottiene, ricordando la 2 disuguaglianza elementare (a + b) ≤ 2a2 + 2b2 : t t t 2 2 2 2 2 u˙ m (s)∗ ds ≤ 2α um (s)1 ds + 2CP f (s)0 ds. 0
Usando la (9.14) per stimare 2α
0
2
"t
2 um (s)1 0
0
ds si ricava facilmente la (9.18).
9.2 Equazione di diffusione
551
9.2.5 Esistenza, unicità e stabilità I Teoremi 2.3 e 2.4 indicano che la successione {um } è limitata in L∞ (0, T ; V ) e quindi anche in L2 (0, T ; V ), mentre la successione {u˙ m } è limitata in L2 (0, T ; V ∗ ). Utilizziamo ora il Teorema di compattezza debole 6.7.8. Deduciamo che esiste una sottosuccessione di {um }, che per semplicità di notazioni indichiamo ancora con {um }, tale che um ! u
in L2 (0, T ; V )
u˙ m ! u˙
in L2 (0, T ; V ∗ )
e3
per m → ∞. Allora u è l’unica soluzione del problema (9.3). Precisamente: Teorema 2.5. Siano f ∈ L2 (0, T ; H) e g ∈ H. Allora u è l’unica soluzione debole del problema (9.3). Inoltre, per ogni t ∈ [0, T ], ! t t 2 2 2 2 u (t)0 + 2α u (s)V ds ≤ et g0 + f (s)0 ds (9.19) 0
e
0
t
2 u˙ m (s)∗
ds ≤ αe
0
t
2 g0
t
+ (αe +
2CP2 )
t 0
2
f (s)0 ds.
(9.20)
Dimostrazione. Esistenza. Dire che um ! u in L2 (0, T ; V ) per m → ∞, significa che T T (∇um (s) , ∇v (s))0 ds → (∇u (s) , ∇v (s))0 ds 0
0
2
per ogni v ∈ L (0, T ; V ). Analogamente, u˙ m ! u˙ debolmente in L2 (0, T ; V ∗ ) significa che T T T u˙ m (s) , v (s)∗ ds = (u˙ m (s) , v (s))0 ds → u˙ (s) , v (s)∗ ds 0
0
0
2
per ogni v ∈ L (0, T ; V ). Vogliamo usare queste proprietà per passare al limite nel problema (9.11), osservando però che le funzioni test in questo problema devono appartenere a Vm . Fissata v ∈ L2 (0, T ; V ), possiamo scrivere, ricordando che {wk } è una base ortogonale in V ,
∞ bk (s) wk v (s) = k=1
con la serie convergente in V , q.o. in [0, T ]. Poniamo
N bk (s) wk vN (s) = k=1
3
Rigorosamente, u˙ m v in L2 (0, T ; V ∗ ) e poi si dimostra che v = u. ˙
(9.21)
552
9 Formulazione debole per problemi di evoluzione
e teniamo per il momento N fisso. Se ora m ≥ N , si ha vN ∈ L2 (0, T ; Vm ). Moltiplicando l’equazione (9.11) per bk (s) e sommando per k = 1, ..., N si trova: (u˙ m (s) , vN (s))0 + α (∇um (s) , ∇vN (s))0 = (f (s) ,vN (s))0 . Integrando in (0, T ) otteniamo:
T 0
{(u˙ m , vN )0 + α (∇um , ∇vN )0 } ds =
T
(f, vN )0 ds.
0
(9.22)
Grazie alla convergenza debole di um e u˙ m nei rispettivi spazi, possiamo passare al limite m → ∞. Poiché T T T (u˙ m , vN )0 ds = u˙ m , vN ∗ ds → u, ˙ vN ∗ ds, 0
0
0
si ottiene
T 0
{u, ˙ vN ∗ + α (∇u, ∇vN )0 } ds =
T
(f, vN )0 ds.
0
Passiamo ora al limite per N → ∞, osservando che vN → v in L2 (0, T ; V ) e quindi anche debolmente in questo spazio; si trova l’equazione T T {u, ˙ v∗ + α (∇u, ∇v)0 } ds = (f, v)0 ds (9.23) 0
0
valida per ogni v ∈ L2 (0, T ; V ). In particolare la (9.23) è valida per ogni v della forma v (s) = χ(t,t+h) (s) w dove w ∈ V (costante) e χ(t,t+h) è la funzione caratteristica dell’intervallo (t, t + h) ⊂ [0, T ]. Con questa scelta di v la (9.23) diventa: t
t+h
{u˙ (s) , w∗ + α (∇u (s) , ∇w)0 } ds =
t+h
(f (s) , w)0 ds
t
(9.24)
Dividendo per h e passando al limite per h → 0, dal Teorema di Differenziazione di Lebesgue (Appendice B) si ottiene: u˙ (t) , w∗ + α (∇u (t) , ∇w)0 dt = (f (t) , w)0 per ogni w ∈ V , q.o. in [0, T ]. Ciò mostra che u è soluzione debole dell’equazione differenziale; dal Teorema 7.9.3, si ha anche u ∈ C ([0, T ] ;H). Controlliamo ora che u (t) soddisfa la condizione iniziale u (0) = g. Scegliamo v ∈ C 1 ([0, T ] ;V ) con v (T ) = 0 e osserviamo che, integrando per parti, si trova T
0
T
(u˙ m , vN )0 ds = (Gm , vN (0))0 −
0
(um , v˙ N )0 ds
9.2 Equazione di diffusione
553
e allora, dalla (9.22), −
T 0
{(um , v˙ N )0 + α (∇um , ∇vN )0 } ds = − (Gm , vN (0))0 +
0
T
(f, vN )0 ds.
Passando al limite prima per m → ∞ e poi per N → ∞, si ricava T T − {(u, v) ˙ 0 + α (∇u, ∇v)0 } ds = − (g, v (0))0 + (f, v)0 ds. 0
(9.25)
0
D’altra parte (Teorema 7.9.3 b)), possiamo integrare per parti nella (9.23) e scrivere (V (T ) = 0): −
T 0
{(u, v) ˙ 0 + α (∇u, ∇v)0 } ds = (u (0) , v (0))0 +
0
T
(f (t) , v (t))0 ds. (9.26)
Sottraendo (9.25) da (9.26) si ha (u (0) , v (0))0 = (g, v (0))0 e l’arbitrarietà di v (0) forza u (0) = g. Unicità. Siano u1 e u2 soluzioni deboli dello stesso problema di CauchyDirichlet. Allora, la funzione w = u1 − u2 è soluzione in L2 (0, T ; V ) dell’equazione w˙ (t) , v∗ + α (∇w (t) , ∇v)0 = 0 per ogni v ∈ V , q.o. in [0, T ], con dato iniziale w (0) = 0. Scegliamo v = w (t). Allora, w˙ (t) , w (t)∗ + α (∇w (t) , ∇w (t))0 = 0 ossia (Nota 7.9.1) 1 d 2 2 w (t)0 = −α w (t)1 . 2 dt 2
Essendo w (0)0 = 0, integrando su (0, t) si deduce che 2
w (t)0 = −
t 0
2
α w (s)1 ds < 0
che implica w (t) ≡ 0 in [0, T ]. La soluzione debole è dunque unica. Stabilità. Le (9.19), (9.19) si ottengono passando al limite nelle stime (9.14) e (9.18), ricordando la semicontinuità inferiore debole delle norme. Per 2 passare al limite in um (t)0 si può usare il Microteorema 7.9.4.
554
9 Formulazione debole per problemi di evoluzione
Nota 2.4. Come sottoprodotto della dimostrazione abbiamo ottenuto che, se f = 0, la soluzione u soddisfa la relazione d 2 2 u (t)0 = −2α u (t)1 . dt 2
Il fatto che la funzione non negativa ψ (t) = w (t)0 sia decrescente riflette la natura dissipativa dell’equazione del calore. 9.2.6 Problema di Cauchy-Neumann Il metodo di Faedo-Galerkin funziona anche con le altre condizioni al bordo, con poche varianti, ed i risultati sono dello stesso tipo. Cominciamo ad esaminare l’equazione in forma debole: u˙ (t) , v∗ +a (u (t) , v) = (f (t) , v)0 ,
(9.27)
che deve essere valida per ogni v ∈ V e q.o. in [0, T ]. Nel caso del problema di Cauchy-Dirichlet, si ha a (w, v) = α (∇w, ∇v)0 che è un multiplo del prodotto scalare in V = H01 (Ω). Quindi a è continua, ma soprattutto è coerciva in V . Queste sono le proprietà alla base del funzionamento del metodo di Faedo-Galerkin, come accade già nel caso ellittico. In realtà, per le equazioni paraboliche, una volta scelta la terna Hilbertiana (V, H, V ∗ ), con H separabile e V immerso con compattezza in H, è sufficiente che a sia debolmente coerciva e cioè che esistano α > 0, λ ≥ 0 tali che 2
2
a (v, v) + λ vH ≥ α vV
∀v ∈ V.
(9.28)
Infatti, se vale (9.28), poniamo w (t) = e−λt u (t) . Allora
w˙ (t) = e−λt u˙ (t) − λe−λt u (t) = e−λt u˙ (t) − λw (t)
e quindi, se u è soluzione di (9.27), w è soluzione di w˙ (t) , v∗ +a (w (t) , v) + λ (w (t) , v)H = e−λt f (t) , v H che è un’equazione dello stesso tipo, con la forma bilineare coerciva 8 a (w, v) = a (w, v) + λ (w, v)H e termine forzante e−λt f (t). In altri termini, se la forma bilineare non è coerciva ma è debolmente coerciva, un semplice cambio di variabile permette di
9.2 Equazione di diffusione
555
ricondursi ad un’equazione equivalente associata ad una forma V −coerciva (si veda anche il Problema 9.4). Come esempio, consideriamo il seguente problema di Cauchy-Neumann 4 : ⎧ in QT ⎪ ⎨ ut − αΔu = f ∂ν u = 0 su ST (9.29) ⎪ ⎩ u (x,0) = g (x) in Ω dove Ω è un dominio limitato e Lipschitziano, f ∈ L2 (QT ) e g ∈ L2 (Ω). Per la formulazione debole scegliamo H = L2 (Ω) e V = H 1 (Ω) , dove, ricordiamo, prodotto interno e norma sono date da (u, v)1,2 = (∇u, ∇v)0 + (u, v)0 ,
2
2
2
u1,2 = ∇u0 + u0 .
Una formulazione debole del problema di Cauchy-Neumann è la seguente: Determinare u ∈ L2 (0, T ; V ) tale che u˙ ∈ L2 (0, T ; V ∗ ) e 1. per ogni v ∈ V e q.o. in [0, T ], u˙ (t) , v∗ + a (u (t) , v) = (f (t) , v)0 , 2. u (0) = g. La forma bilineare a (u, v) = α (∇u, ∇v)0 è debolmente coerciva: qualunque λ > 0 va bene. Scegliamo λ = α; allora 8 a (w, v) = α {(∇u, ∇v)0 + (u, v)0 } = α (u, v)1,2 . Col cambiamento di variabili w (t) = e−αt u (t) ci riconduciamo alla seguente formulazione equivalente: Determinare w ∈ L2 (0, T ; V ) tale che w˙ ∈ L2 (0, T ; V ∗ ) e 1. per ogni v ∈ V e q.o. in [0, T ], a (w (t) , v) = e−αt f (t) , v 0 , w˙ (t) , v∗ + 8 2. w (0) = g. Con dimostrazione pressochè identica, il metodo usato per il problema di Cauchy-Dirichlet dà esistenza ed unicità della soluzione w. Le stime di stabilità per w e w˙ assumono la forma seguente: ! t t 2 2 2 2 w (s)1,2 ds ≤ et g0 + e−2αs f (s)0 ds w (t)0 + 2α 0
4
Per il caso nonomogeneo si veda il Problema 9.2.
0
556
e
9 Formulazione debole per problemi di evoluzione
t 0
2
2
w˙ (s)V ∗ ds ≤ αet g0 + (αet + 2)
0
t
2
e−2αs f (s)0 ds
per ogni t ∈ [0, T ]. Tornando a u, otteniamo il seguente teorema. Teorema 2.6. Esiste un’unica soluzione u ∈ L2 (0, T ; V ) di (9.27) soddisfacente la condizione iniziale u (0) = g. Inoltre, per ogni t ∈ [0, T ]: ! t t 2 2 2 2 2 ˙ V ∗ ds ≤ C g0 + f 0 ds (9.30) u1,2 + u u (t)0 + 0
0
dove C = C (α, T ). 9.2.7 Regolarità Come nel caso ellittico, la regolarità della soluzione debole aumenta con la regolarità dei dati. Un primo risultato in questo senso è il seguente (ricordiamo che il simbolo ·m,2 indica la norma in H m,2 (Ω)). Teorema 2.7. Siano Ω un dominio di classe C 2 e u la soluzione debole del problema (9.3). Se g ∈ V , allora u ∈ L2 (0, T ; H 2 (Ω)) ∩ L∞ (0, T ; V ) e u˙ ∈ L2 (0, T ; H). Inoltre ! t t t 2 2 2 2 2 u2,2 ds + u ˙ 0 ds ≤ C g1 + f 0 ds (9.31) u (t)1 + 0
0
0
dove C = C (n, α, Ω) . Dimostrazione. Moltiplicando l’equazione (9.11) per c˙k (t) e sommando per k = 1, ..., m, si trova 2
u˙ m (t)0 + α (∇um (t) , ∇u˙ m (t))0 = (f (t) ,u˙ m (t))0
q.o. in [0, T ]. (9.32)
Osserviamo ora che (∇um (t) , ∇u˙ m (t))0 =
1 d 2 ∇um (t)0 , 2 dt
q.o in (0, T )
e che dalla disuguaglianza di Schwarz, (f (t) ,um (t))0 ≤ f (t)0 um (t)0 ≤
1 1 2 2 f (t)0 + u˙ m (t)0 . 2 2
Da questa disuguaglianza e dalla (9.32), deduciamo che α
d 2 2 2 ∇um (t)0 + u˙ m (t)0 ≤ f (t)0 dt
q.o in (0, T ) .
Integrando su (0, t) troviamo t t 2 2 2 2 u˙ m (s)0 ds ≤ f (s)0 ds + gm 1 . α ∇um (t)0 + 0
0
(9.33)
9.2 Equazione di diffusione
557
Passando al limite per m → ∞ deduciamo che la stessa stima vale per u e quindi che u ∈ L∞ (0, T ; V ) e u˙ ∈ L2 (0, T ; H). In particolare, possiamo scrivere la (9.7) nella forma seguente: α (∇u (t) , ∇v)0 = (f (t) − u˙ (t) , v)0
q.o in (0, T )
per ogni v ∈ V . Applichiamo ora i risultati di regolarità per le equazioni ellittiche. Il Teorema 8.6.3 implica che u (t) ∈ H 2 (Ω) e che 2 2 2 2 u (t)2,2 ≤ C (n, α, Ω) g1 + f (t)0 + u˙ (t)0 q.o in (0, T ) . Integrando su (0, t) e usando la (9.33), otteniamo che u ∈ L2 (0, T ; H 2 (Ω)) e che vale la (9.31). Ulteriore regolarità globale richiede condizioni di raccordo tra i dati f e g su ∂Ω per t = 0. Ciò non deve sorprendere in quanto ∂Ω × {t = 0} costituisce sempre un insieme di punti non regolari per ∂p QT . ∞ Esaminiamo infatti il caso in cui Ω sia un dominio di classe C , f ∈ ∞ ∞ QT e g ∈ C Ω . C Poiché u = 0 su ST = ∂Ω × (0, T ), ogni derivata di u rispetto a t è nulla su ST e cioè: u = ∂t u = · · · = ∂tj u = · · · = 0,
∀j ≥ 0, su ST .
(9.34)
Queste relazioni valgono per continuità anche per t = 0. D’altra parte, dall’equazione del calore abbiamo: ∂t u = αΔu + f ,
∂t2 u = αΔ(∂t u) + ∂t f = α2 Δ2 u + αΔf + ∂t f
e in generale (Δ0 = Identità)
j−1 ∂tj u = αj Δj u + αk Δk ∂tj−1−k f , k=0
∀j ≥ 1, in QT .
Per t = 0 si ha Δj u (0) = Δj g e dalle (9.34) ricaviamo le condizioni di raccordo
j−1 g = 0 e α j Δj g + αk Δk ∂tj−1−k f (0) = 0, ∀j ≥ 1, su ∂Ω. (9.35) k=0
Le (9.35) sono dunque necessarie per avere una soluzione u ∈ C ∞ QT . Si può dimostrare che risultano anche sufficienti, come stabilito nel seguente teorema. ∞ Teorema 2.8. Siano Ω un dominio di classe C e u la soluzione debole ∞ ∞ Q eg∈C Ω e valgono le condizioni di del problema (9.3). Se f ∈ C T ∞ raccordo (9.35) allora u ∈ C QT . Omettiamo la dimostrazione, che si ottiene dal seguente risultato: se Ω è regolare, g ∈ H 2m+1 (Ω) e ∂tk f ∈ L2 0, T ; H 2m−2k (Ω) per k = 0, ..., m, (9.36)
558
9 Formulazione debole per problemi di evoluzione
(H 0 (Ω) = L2 (Ω)) e inoltre valgono le condizioni di raccordo (9.35) per j = 1, ..., m, allora u ∈ L2 0, T ; H 2m+2 (Ω) (9.37) e
∂tk u ∈ L2 0, T ; H 2m+2−2k (Ω)
per k = 0, ..., m + 1.
(9.38)
Regolarità interna. Se ci si accontenta della regolarità interna a QT allora non c’è bisogno di condizioni di raccordo né della regolarità di Ω. Per esempio, si può dimostrare che se f ∈ C ∞ (QT ) allora anche la soluzione debole u è in C ∞ (QT ). Per vederlo, prendiamo un qualunque cilindro Q∗ ⊂⊂ QT . In base ai risultati del Paragrafo 7.1.1 (in particolare si ricordi la Nota 7.1.3) possiamo costruire una funzione ϕ ∈ C0∞ (QT ) tale che 0 ≤ ϕ ≤ 1 in QT e ϕ ≡ 1 in Q∗ . Consideriamo la funzione w = ϕu. Poiché wt − αΔw = ϕ (ut − αΔu) + (ϕt − αΔϕ) u + 2∇ϕ · ∇u, w è soluzione debole dell’equazione wt − αΔw = ϕf − (ϕt − Δϕ) u + 2∇ϕ · ∇u ≡ F con dati iniziali w (0) = 0. Osserviamo ora che F ∈ L2 (QT ) per cui, per il Teorema 2.5, w ∈ L2 (0, T ; H 2 (Ω)) e w˙ ∈ L2 (0, T ; H) . Ciò implica a sua volta che F soddisfa le (9.36) con m = 1 e d’altra parte le condizioni di raccordo sono verificate, essendo g = 0 e F (0) = 0 su ∂Ω. Quindi ¨ ∈ L2 0, T ; L2 (Ω) . w ∈ L2 0, T ; H 4 (Ω) , w˙ ∈ L2 0, T ; H 2 (Ω) , w Ma allora F soddisfa la (9.36) con m = 2 e si può continuare guadagnando due derivate spaziali ed una temporale. Ripetendo ogni volta il procedimento (bootstrapping ) si ottiene che, per ogni k ≥ 0 e ogni m ≥ 0. ∂tk w ∈ L2 0, T ; H 2m (Ω) Usiamo ora il seguente risultato di interpolazione (Evans, 1998): sia Ω un dominio regolare. Se v ∈ L2 0, T ; H m+2 (Ω) e v˙ ∈ L2 (0, T ; H m (Ω)) allora v ∈ C [0, T ] ; H m+1 (Ω) . Deduciamo che w ∈ C0∞ (QT ). Essendo w = u su Q∗ abbiamo che u ∈ C ∞ (Q∗ ). Poiché Q∗ è un qualunque cilindro contenuto in QT concludiamo che u ∈ C ∞ (QT ).
9.3 Equazioni generali in forma di divergenza 9.3.1 Formulazione debole dei principali problemi Ci occupiamo ora di operatori del tipo Lu = −div(A∇u − bu) + c · ∇u + au.
9.3 Equazioni generali in forma di divergenza
559
La matrice A (x,t) = (ai,j (x,t))i,j=1,...,n codifica le proprietà di anisotropia del mezzo rispetto alla diffusione. Per esempio (si veda il Paragrafo 2.6.2), sappiamo che una matrice del tipo ⎛ ⎞ α00 ⎝0 ε 0⎠ 0 0ε con α ε > 0, indica elevata propensione del mezzo a diffondere in direzione dell’asse x1 rispetto alle altre direzioni. Come già nel caso stazionario (ellittico) è importante per controllare la stabilità degli algoritmi numerici saper confrontare gli effetti dei termini di trasporto e reazione e di quello di diffusione. Assumeremo le seguenti ipotesi. 1. L’operatore differenziale L è uniformemente ellittico: esistono due numeri positivi α ed M tali che tale che:
n 2 aij (x, t)ξ i ξ j ≥ α |ξ| e |aij (x,t)| ≤ M, ∀ξ ∈ Rn , q.o. in QT . i,j=1
2. I coefficienti bj , cj , a sono limitati per ogni i, j = 1, ..., n: |bj (x,t)| ≤ b∞ ,
|cj (x,t)| ≤ c∞ ,
|a (x, t)| ≤ a∞ ,
q.o. in QT .
Consideriamo problemi del tipo seguente: ⎧ in QT ⎪ ⎨ ut + Lu = f u (x,0) = g (x) in Ω ⎪ ⎩ Bu = 0 su ST
(9.39)
dove Bu corrisponde ad una delle solite condizioni al bordo omogenee. Per esempio, Bu = ∂ν u + hu per la condizione di Robin, con h ≥ 0. Guidati dalle considerazioni svolte nella sezione precedente, procediamo verso la formulazione debole del problema (9.39) introducendo i vari ingredienti. Ambientazione funzionale. L’ambiente funzionale è costituito da una terna Hilbertiana (V, H, V ∗ ), dove H = L2 (Ω) e H01 (Ω) ⊆ V ⊆ H 1 (Ω). La scelta di V dipende dalle condizioni al bordo. Le scelte usuali sono V = H01 (Ω) per la condizione di Dirichlet, V = H 1 (Ω) per i problemi di Neumann e di 1 Robin, V = H0,Γ (Ω) nel caso del problema misto Dirichlet/Neumann o D Dirichlet/Robin. Il dominio Ω si può prendere limitato e Lipschitziano. La forma bilineare. Definiamo B (u, v; t) = {A∇u · ∇v − bu · ∇v + (c · ∇u)v + auv} dx Ω
e, nel caso del problema di Robin, B (u, v; t) = {A∇u · ∇v − bu · ∇v + (c · ∇u) v + auv} dx + Ω
huv dσ ∂Ω
560
9 Formulazione debole per problemi di evoluzione
dove assumiamo h ∈ L∞ (∂Ω), h ≥ 0 su ∂Ω. Sotto le ipotesi indicate, procedendo come nel caso ellittico non è difficile dimostrare che |B (u, v; t)| ≤ C uV vV dove C dipende solo da da n, M, b∞ , c∞ , a∞ (e anche da hL∞ (∂Ω) nel caso della condizione di Robin). Quindi B è continua in V , uniformemente rispetto a t ∈ [0, T ]. Facciamo vedere che B è debolmente coerciva in V . Si ha5 , per ogni ε > 0: √ [(−b + c) · ∇u]u dx ≥ − n(b∞ + c∞ ) ∇u0 u0 Ω √ n(b∞ + c∞ ) 1 2 2 ≥− ε ∇u0 + u0 2 ε
e
2
Ω
au2 dx ≥ −a∞ u0
per cui, essendo h ≥ 0 su ∂Ω nel caso delle condizioni di Robin, √ √ n(b∞ + c∞ )ε n(b∞ + c∞ ) 2 2 + a∞ u0 . ∇u0 − B (u, u; t) ≥ α − 2 2ε (9.40) Distinguiamo tre casi: • se b∞ = c∞ = a∞ = 0 la forma bilineare è V −coerciva se V = H01 (Ω). Se H01 (Ω) ⊆ V ⊆ H 1 (Ω), allora ˜ (u, v; t) = B (u, v; t) + λ (u, v) B 0
(9.41)
è V −coerciva per qualsiasi λ > 0; • se b∞ = c∞ = 0 e a∞ > 0 la forma bilineare (9.41) è V −coerciva per qualsiasi λ > a∞ ; • se b∞ + c∞ > 0, scegliamo nella (9.40) α n(b∞ + c∞ )
ε= √ √
e λ=2
n(b∞ + c∞ ) n(b∞ + c∞ )2 + a∞ = + 2a∞ . 2ε α
Si ha allora che ˜ (u, v; t) ≥ α ∇u2 + λ u2 ≥ min B 0 0 2 2 5
Ricordiamo la disuguaglianza elementare 2ab ≤ εa2 + valida ∀a, b ∈ R, ∀ε > 0.
1 2 b ε
α λ , 2 2
!
2
u1,2
9.3 Equazioni generali in forma di divergenza
561
e quindi B è debolmente V −coerciva. Osserviamo che la costante λ è molto grande se i termini di trasporto e/o reazione prevalgono decisamente su quello di diffusione. I dati g ed f e la soluzione. Assumiamo che g ∈ H e f ∈ L2 (0, T ; V ∗ ). Coerentemente cerchiamo una soluzione u ∈ L2 (0, T ; V ) tale che u˙ ∈ L2 (0, T ; V ∗ ). In tal caso sappiamo anche che u ∈ C ([0, T ] ; H). Formulazione debole. Le considerazioni precedenti portano alla seguente formulazione debole per il problema (9.39), dove, ricordiamo, ·, ·∗ indica la dualità tra V ∗ e V . Dati f ∈ L2 (0, T ; V ∗ ) e g ∈ H, determinare una funzione u ∈ L2 (0, T ; V ) tale che u˙ ∈ L2 (0, T ; V ∗ ) e che: 1. per ogni v ∈ V e q.o. in [0, T ], u˙ (t) , v∗ + a (u (t) ,v; t) = f (t) , v∗ ,
(9.42)
2. u (0) = g. La condizione iniziale 2 significa che u (t) − g0 → 0 per t → 0+ . Inoltre, dalla Nota 2.1, la (9.42) si può scrivere nella forma equivalente d (u (t) , v)0 + a (u (t) ,v; t) = f (t) , v∗ dt da intendersi valida per ogni v ∈ V e nel senso delle distribuzioni in D [0, T ]. 9.3.2 Il metodo di Faedo-Galerkin (II) Vogliamo dimostrare che il problema (9.39) possiede esattamente una soluzione debole, che dipende con continuità dai dati nelle norme appropriate. Il metodo di Faedo-Galerkin funziona anche in questo caso con poche correzioni rispetto al caso dell’equazione di diffusione. Scegliamo una base {wk }k≥1 ortonormale in H, ortogonale in V , e sia Vm = span {w1 , w2 , ..., wm } . Proiettiamo ora l’equazione (9.42) su Vm ; otteniamo: (u˙ m , v)0 + B (um ,v; t) = f, v∗ ∀v ∈ Vm (9.43) m dove um = um (t) = k=1 ck (t) wk e i coefficienti ck sono incogniti. Approssimazioni di Galerkin. Inserendo v = ws , s = 1, ..., m, nella (9.43) si trova il seguente sistema di equazioni differenziali ordinarie: q.o in [0, T ] , Cm (t) = −W (t) Cm (t) + F (t) , (9.44) Cm (0) = gm
562
9 Formulazione debole per problemi di evoluzione
dove Cm (t) = (c1 (t) , ..., cm (t)) e Fs (t) = f (t) , ws ∗ ,
Fm (t) = (F1 (t) , ..., Fm (t)) ,
gs = (g, ws ) ,
gm = (g1 , ..., gm ) .
Gli elementi della matrice W sono dati da Wsk (t) = B (wk , ws ; t) . Poiché F ∈ L2 (0, T ; Rm ) e Wsk ∈ L∞ (0, T ), per ogni m ≥ 1 esiste un’unica soluzione um ∈ H 1 (0, T ; Vm ) del problema (9.44). Le stime dell’energia per um (e la loro dimostrazione), necessarie per passare al limite nella (9.43), sono perfettamente analoghe a quelle indicate nei Teoremi 2.3 e 2.4. Se B è solo debolmente coerciva con costante λ, con il cambiamento di variabile w (t) = e−λt u (t) la (9.42) diventa w˙ (t) , v∗ + (w (t) ,v; t) = e−λ0 t f˜ (t) , v∗ con la forma bilineare V −coerciva ˜ (w, v; t) = B (w, v; t) + λ (w, v) . B 0 Ogni stima di stabilità per w si traduce in una corrispondente stima per u, col fattore moltiplicativo eλt . Precisamente, abbiamo: Stime dell’energia su um e u˙ m . Sia um la soluzione del problema (9.44). Allora, per ogni t ∈ [0, T ]: 2
um (t)0 +
0
t
2
um (s)V ds +
t
0
2
u˙ m (s)V ∗ ds ≤ C
0
t
2
2
!
f (s)V ∗ ds + g0
dove C dipende da n, α, λ, b∞ , c∞ , a∞ e T . Esistenza ed unicità. Per le stime dell’energia, la successione {um } è limitata in L2 (0, T ; V ), mentre {u˙ m } è limitata in L2 (0, T ; V ∗ ). Esiste perciò una sottosuccessione di {um }, che indichiamo ancora con {um }, tale che, per m → ∞, in L2 (0, T ; V ) um ! u e u˙ m ! u˙
in L2 (0, T ; V ∗ ) .
Vale il seguente teorema. Teorema 3.1. Se f ∈ L2 (0, T ; V ∗ ) e g ∈ H, u è l’unica soluzione del problema (9.39). Inoltre, per ogni t ∈ [0, T ] , t ! t t 2 2 2 2 2 u (s)V ds + u˙ m (s)V ∗ ds ≤ C f (s)V ∗ ds + g0 u (t)0 + 0
0
0
9.3 Equazioni generali in forma di divergenza
563
dove C dipende da Ω, n, α, λ, b∞ , c∞ , a∞ e T . Nota. 3.1. Il metodo funziona anche con condizioni al bordo non omogenee. Per esempio, nel caso del problema di Cauchy-Dirichlet, se il dato è la traccia di una funzione ϕ ∈ L2 (0, T ; V ) con ϕ˙ ∈ L2 (0, T ; H), il cambio di variabile w = u − ϕ riporta a condizioni omogenee. Regolarità. Se Ω è un dominio di classe C 2 , la matrice A è simmetrica ed i coefficienti aij , bj , cj , a (anche h nel caso di condizioni Robin) sono regolari e non dipendono da t, allora la soluzione debole u dei problemi di Cauchy-Dirichlet o di Cauchy-Neumann/Robin appartiene a L2 (0, T ; H 2 (Ω))∩L∞ (0, T ; V ) mentre u˙ ∈ L2 (0, T ; H). Vale inoltre una stima analoga alla (9.31). La dimostrazione ricalca quella del Teorema 2.7. Se i coefficienti sono di classe C ∞ allora anche la soluzione è di classe ∞ C (QT ). La regolarità fino al bordo di QT richiede condizioni di raccordo tra i dati analoghe alle (9.35) sulle quali non ci soffermiamo. Esempio 3.1. La Figura 9.2 mostra il grafico della soluzione del problema di Cauchy-Dirichlet: ⎧ ⎪ ⎨ ut − uxx + 2ux = 0.2tx u (x,0) = max (2 − 2x, 0) ⎪ ⎩ u (0, t) = 2 − t/6, u (5, t) = 0
0 < x < 5, t > 0 0<x<5
(9.45)
t > 0.
Si noti l’effetto del termine di deriva 2ux che tende a “trasportare verso destra” il dato iniziale e quello del termine di sorgente 0.2tx che fa crescere la soluzione vicino a x = 5 sempre di più all’avanzare del tempo. La soluzione è regolare nella striscia QT = (0, 5) × (0, ∞), ma non può esserlo fino a t = 0, essendo il dato iniziale solo Lipschitziano.
Figura 9.2. La soluzione del problema nella Nota 3.1
564
9 Formulazione debole per problemi di evoluzione
9.3.3 Principio di massimo debole Anche per soluzioni deboli valgono risultati di confronto e principi di massimo che generalizzano quelli visti nel Capitolo 2. Consideriamo il problema di Cauchy-Dirichlet ⎧ in QT ⎪ ⎨ ut − div (A (x,t) ∇u) + a (x,t) u = f (x,t) u (x,0) = g (x) in Ω (9.46) ⎪ ⎩ u=0 su ST . Se f ∈ L2 0, T ; H −1 (Ω) , g ∈ L2 (Ω) e |a (x,t)| ≤ a∞ q.o. in Ω, in ba 2 se al 3.1 esiste un’unica soluzione debole u ∈ C [0, T ] ; L (Ω) ∩ Teorema 2 1 L 0, T ; H0 (Ω) . Teorema 3.2. Sia u la soluzione debole del problema (9.46). a) Se g ≥ 0 q.o. in Ω e f (t) ≥ 0 in D (Ω), cioè f (t) , ϕ ≥ 0 q.o. in (0, T ), ∀ϕ ∈ D (Ω), ϕ ≥ 0 in Ω, allora per ogni t ∈ [0, T ] si ha u (x, t) ≥ 0 q.o. in Ω. b) Se g ∈ L∞ (Ω) e f = 0 allora u ∈ L∞ (QT ) e uL∞ (QT ) ≤ gL∞ (QT ) . Dimostrazione. Posto
{A∇u · ∇v + auv} dx,
B (u, v; t) = Ω
la funzione u soddisfa l’equazione d (u (t) , v)0 + B (u (t) ,v; t) = f (t) , v∗ dt
(9.47)
in D (0, T ) e per ogni v ∈ H01 (Ω) . a) Sia u− (t) = max {−u (t) , 0} la parte negativa di u (t). Allora −u− (t) ∈ H01 (Ω) e può essere inserita nella (9.47) al posto di v. Poiché B u (t) , −u− (t) ; t > >2 A∇u− · ∇u− − a (x,t) (u− )2 dx ≥ −a∞ >u− (t)>0 = Ω
e per ipotesi − f (t) , u− (t)∗ ≤ 0, dalla (9.47) otteniamo: > > > 1 d > >u− (t)>2 ≤ a∞ >u− (t)>2 . 0 0 2 dt Essendo g = u (0) ≥ 0 q.o. in Ω, si ha u− (0) = 0 e quindi concludiamo che u− (t) = 0 q.o. in Ω, per ogni t ∈ [0, T ]. Ne segue che u (t) = u+ (t) ≥ 0 q.o. in Ω, per ogni t > 0.
9.4 Diffusione e reazione non lineare
565
+
b) Sia m = gL∞ (Ω) e poniamo v (t) = (u (t) − m) . Essendo u = 0 su ST abbiamo v (t) ∈ H01 (Ω) per ogni t ∈ [0, T ] e possiamo inserire v (t) nella (9.47) con f = 0. Troviamo: d (u, (u − m)+ )0 + B u, (u − m)+ ; t = 0 dt da cui
> > > d > >(u (t) − m)+ >2 ≤ a∞ >(u (t) − m)+ >2 . 0 0 dt
Essendo (u (0) − m)+ = (g − m)+ = 0, deduciamo che (u (t) − m)+ = 0 e − cioè u (t) ≤ m q.o. in Ω e per ogni t ∈ [0, T ]. Scegliendo v (t) = (u (t) + m) e procedendo in modo analogo si ottiene u (t) ≥ −m q.o. in Ω e per ogni t ∈ [0, T ].
9.4 Diffusione e reazione non lineare 9.4.1 Metodo delle sopra/sottosoluzioni In questo Paragrafo ci occupiamo di un problema del tipo ⎧ ⎨ ut − Δu = f (u) in QT u=0 su ST ⎩ u (x, 0) = g (x) in Ω
(9.48)
dove QT = Ω × (0, T ) e ST = ∂Ω × (0, T ). Assumiamo che Ω sia un dominio limitato di classe C ∞ , g ∈ C Ω con g = 0 su ∂Ω e f ∈ C ∞ (R). Data la non linearità del problema, l’esistenza e/o l’unicità della soluzione non è in generale scontata (già non lo è per l’equazione ordinaria u˙ = f (u)!) per cui è utile segnalare alcuni risultati in questa direzione. Come nel caso ellittico, useremo il metodo delle sopra/sotto soluzioni, basato in ultima analisi sul principio di massimo. Definizione 4.1. Una funzione u∗ ∈ L2 0, T ; H01 (Ω) è detta soprasoluzione debole del problema (9.48) se u˙ ∗ ∈ L2 0, T ; H −1 (Ω) e: 1. per ogni v ∈ H01 (Ω) , v ≥ 0 q.o. in Ω, u˙ ∗ (t) , v∗ + (∇u∗ (t) , ∇v)0 ≥ (f (u∗ ), v)0
q.o. in [0, T ] ;
(9.49)
2. u∗ ≥ 0 su ST ; 3. u∗ (x, 0) ≥ g (x) q.o. in Ω. Analogamente u∗ ∈ L2 0, T ; H01 (Ω) è detta sottosoluzione debole se u˙ ∗ ∈ L2 0, T ; L2 (Ω) e soddisfa le disuguaglianze opposte nella (9.49) e nelle 2, 3. Ovviamente, u è soluzione debole se e solo se è sia sotto sia soprasoluzione.
566
9 Formulazione debole per problemi di evoluzione
Se vale la (9.49) diremo che u è soluzione debole di ut − Δu ≥ f (u). Dimostriamo subito il seguente risultato di confronto. Lemma 4.2. Se u∗ e u∗ sono, rispettivamente, sopra e sottosoluzione limitate del problema (9.48), allora u ∗ ≤ u∗
q.o in QT .
Dimostrazione. La funzione w = u∗ − u∗ è soluzione debole di wt − Δw ≥ f (u∗ ) − f (u∗ ) = f (v) w dove v è opportuna tra u∗ e u∗ . Essendo u∗ e u∗ limitate in QT , si ha |f (v)| ≤ M e quindi w è soluzione debole di wt − Δw − aw ≥ 0 con a = f (v) limitata. Essendo inoltre w ≥ 0 su ST e w (x, 0) ≥ 0 in Ω, dal principio di massimo debole (Teorema 3.2 a)) si deduce che w ≥ 0. Proviamo il seguente teorema di esistenza. Teorema 4.3. Siano u∗ e u∗ , rispettivamente sopra e sottosoluzione limitate del problema (9.48). Allora esiste un’unica soluzione debole u ∈ C ∞ (QT ) e tale che (9.50) u∗ ≤ u ≤ u∗ q.o. in QT . Dimostrazione. Per ipotesi e per il Lemma 4.2, esistono due numeri a, b tali che a ≤ u∗ ≤ u∗ ≤ b q.o. in QT . Procediamo come nel Teorema 8.7.1. Sia M = max[a,b] |f |. Allora la funzione F (s) = f (s) + M s è nondecrescente in [a, b]. Scriviamo l’equazione di diffusione-reazione nella forma ut − Δu + M u = F (u) e costruiamo una successione per ricorrenza nel seguente modo. Sia u(1) la soluzione del problema lineare ⎧ (1) ⎨ ut − Δu(1) + M u(1) = F (u∗ ) in QT u(1) = 0 su ST ⎩ (1) u (x, 0) = g (x) in Ω. Posto w(1) = u(1) − u∗ si ha w(1) ≥ 0 su ST e w(1) (x, 0) ≥ 0 q.o. in Ω. Inoltre (1) wt − Δw(1) + M w(1) ≥ 0 e quindi per il principio di massimo si ha u(1) ≥ u∗ q.o. in QT . Analogamente si dimostra che u(1) ≤ u∗ q.o. in QT . Per k ≥ 1, noto u(k) , si definisce u(k+1) come la soluzione del problema lineare ⎧ (k+1) − Δu(k+1) + M w(k+1) = F (u(k) ) in QT ⎨ ut (k+1) u =0 su ST ⎩ (k+1) u (x, 0) = g (x) in Ω.
9.4 Diffusione e reazione non lineare
567
Imitando la dimostrazione delTeorema 8.7.1 si prova per induzione che (lasciamo i dettagli al lettore) u∗ ≤ u(1) ≤ u(2) ≤ · · · ≤ u(k) ≤ u(k+1) ≤ · · · ≤ u∗
q.o. in QT .
Essendo monotona crescente e limitata superiormente, la successione u(k) converge q.o. in QT ad una funzione u che soddisfa la (9.50) ed è quindi limitata in QT . Dimostriamo che u è soluzione debole del problema (9.48). Infatti, dal Teorema 3.1 abbiamo, per ogni k ≥ 1, essendo F u(k) ≤ max {|a| , |b|} ,
T 0
> > > (k) >2 >u (s)> ds + 1
T 0
> > > (k) >2 >u˙ (s)>
2
H −1 (Ω)
ds ≤ CT + g0
dove C = C (Ω,M, α, n, a, b). A meno di sottosuccessioni, abbiamodunque che u(k) ! u in L2 0, T ; H01 (Ω) e che u˙ (k) ! u in L2 0, T ; H −1 (Ω) . Possiamo perciò passare al limite per k → +∞ nell’equazione T u˙ (k+1) , v∗ + (∇u(k+1) , ∇v)0 + M (u(k+1) , v)0 dt 0 T (F (u(k) ), v)0 dt = 0
usando il Teorema della convergenza dominata per l’integrale a secondo membro. Si ottiene T T {u, ˙ v∗ + (∇u, ∇v)0 + M (u, v)} dt = (F (u) , v)0 dt (9.51) 0
0
per ogni v ∈ H01 (Ω). Ragionando come nella dimostrazione del Teorema 2.5, si deduce che u è soluzione debole del problema (9.48). L’unicità segue ancora dal Lemma 4.2. Siano u1 e u2 soluzioni verificanti la (9.50). Allora, essendo entrambe sotto e soprasoluzioni deve essere simultaneamente u1 ≥ u2 e u2 ≥ u1 e quindi u1 = u2 . La regolarità interna C ∞ di u si ottiene per bootstrapping, partendo dal fatto che F (u) è limitata in QT . Invitiamo il lettore a completare i dettagli. Esempio 4.1. Equazione di Fisher (I). Il risultato precedente si applica in particolare al problema di Cauchy-Dirichlet per l’equazione di Fisher. ⎧ v ⎪ 0 < y < L, τ > 0 ⎨ vτ = Dvyy + av 1 − M (9.52) v (y, 0) = g (y) 0≤y≤L ⎪ ⎩ v (0, τ ) = v (L, τ ) = 0 τ >0 dove a > 0, g ≥ 0, g (0) = g (L) = 0. Per i significati dei vari parametri, rimandiamo al Paragrafo 2.10.2, dove abbiamo trattato l’esistenza di onde progressive in un habitat illimitato. In termini di dinamica di popolazioni, le condizioni omogenee di Dirichlet significano ambiente esterno ostile.
568
9 Formulazione debole per problemi di evoluzione
Qui conviene adimensionalizzare l’equazione in modo diverso tenendo conto del fatto che l’ambiente, cioè l’intervallo [0, L], è finito. Poiché L è una lunghezza tipica, poniamo y x= . L Il tempo si può riscalare in due modi. Per esempio, ricordando che le dimensioni di a sono tempo−1 e quelle di D sono lunghezza2 × tempo−1 , si può porre Dτ t = aτ oppure t = 2 . L Scegliamo per esempio la seconda. Per riscalare v basta usare M come grandezza tipica e porre 1 L2 t v Lx, . u (x, t) = M D Abbiamo: ut =
1 dτ L2 vτ = vτ , M dt MD
uxx =
1 d2 y L2 vyy 2 = vyy . M dx M
Sostituendo nella (9.52) si ottiene ut = uxx + ru (1 − u) dove r=
0<x<1
aL2 D
con condizione iniziale u (x, 0) = g (Lx) /M ≡ G (x)
0<x<1
e condizioni di Dirichlet omogenee u (0, t) = u (1, t) = 0
t > 0.
Proviamo che se 0 ≤ g ≤ 1, esiste per ogni t > 0 un’unica soluzione u tale che 0 ≤ u ≤ 1. Basta infatti osservare che u∗ ≡ 0 e u∗ ≡ 1 sono rispettivamente sotto e soprasoluzione. Essendo u∗ e u∗ costanti, si può prendere T > 0 arbitrario e quindi la soluzione esiste per ogni t > 0. Ciò che interessa maggiormente nelle applicazioni è il comportamento asintotico per t → +∞ ed allora il parametro r assume un ruolo fondamentale (parametro di biforcazione). Per esempio, una situazione interessante è quella in cui u evolve verso una soluzione di equibrio stazionaria, cioè indipendente dal tempo.
9.4 Diffusione e reazione non lineare
569
9.4.2 Equilibri, linearizzazione e stabilità Motivati dall’Esempio 4.1 occupiamoci degli equilibri e della loro stabilità per il problema di reazione diffusione ⎧ ⎨ ut − Δu = f (u) in Ω × (0, +∞) u=0 su ∂Ω × (0, +∞) (9.53) ⎩ u (x, 0) = g (x) in Ω. Assumiamo sempre che Ω sia limitato e di classe C ∞ , g ∈ C Ω con g = 0 su ∂Ω e f ∈ C ∞ (R). Una soluzione di equilibrio è una funzione ws = ws (x) soluzione debole del problema stazionario −Δws = f (ws ) in Ω (9.54) ws = 0 su ∂Ω. In particolare, una soluzione di equilibrio può essere costante. Vogliamo esaminare la stabilità di ws , ossia sotto quali condizioni, u (x, t) → ws (x) per t → +∞, in qualche senso opportuno. Nel Paragrafo 8.3.4 abbiamo visto un risultato di stabilità asintotica in norma L2 per l’equazione di diffusione. Qui ci limitiamo a considerare soluzioni di equilibrio ∞ ws limitate ed esaminiamo la loro stabilità in norma L . Dal Teorema 7.1 ∞ Ω . sappiamo che ws ∈ C Precisamente, diremo che ws è stabile se, per ogni ε > 0, esiste δ tale che se u è una soluzione limitata del problema (9.53) e g − ws L∞ (Ω) < δ allora u (·, t) − ws (·)L∞ (Ω) < ε
∀t > 0.
Se inoltre lim u (·, t) − ws (·)L∞ (Ω) = 0
t→+∞
allora ws è asintoticamente stabile. Se ws non è stabile si dice instabile. Sia dunque ws soluzione di equilibrio, limitata. Per analizzarne la stabilità usiamo una tecnica di linearizzazione. Poniamo z (x, t) = u (x, t) − ws (x) . La funzione z è soluzione del problema zt = Δz + [f (u) − f (ws )] con z (x, 0) = g (x) − ws (x)
in Ω
(9.55)
570
9 Formulazione debole per problemi di evoluzione
e z=0
su ST .
Usando il teorema del valor medio, possiamo scrivere f (u (x, t)) − f (ws (x)) = f (ws (x)) z (x, t) + R (x, t) dove R (·, t)L∞ (Ω) è infinitesimo di ordine superiore a z (·, t)L∞ (Ω) . Procediamo formalmente linearizzando il problema, cioè trascurando il resto R. La (9.55) diventa zt − Δz = f (ws (x)) z che è lineare in z. Si noti che a (x) ≡ f (ws (x)) ∈ C ∞ Ω e quindi z ∈ C ∞ (QT )∩L∞ (QT ). Se lim z (x, t)L∞ (Ω) = 0 t→+∞
per t → +∞ diciamo che w è linearmente asintoticamente stabile (cioè stabile per il sistema linearizzato). Per controllare quando ciò accade, possiamo usare la separazione di variabili ponendo z (x, t) = U (x) Z (t). Sostituendo, ricaviamo U (x) Z (t) = ΔU (x) Z (t) + a (x) U (x) Z (t) e separando le variabili si arriva a Z (t) ΔU (x) + a (x) U (x) = . U (x) Z (t) Uguagliando entrambi i membri ad una costante −μ, arriviamo in particolare al seguente problema agli autovalori −ΔU (x) − a (x) U (x) = μU (x)
in Ω
(9.56)
con U = 0 su ∂Ω.
(9.57)
Essendo a limitata (oltre che regolare), vale il seguente teorema (Problema 8.19): Teorema 4.4. Sia ws ∈ C ∞ Ω soluzione di equilibrio del problema (9.54). Allora: 1. esiste una successione crescente μ1 < μ2 < μk < · · · < μk+1 < · · · di autovalori reali del problema (9.56), (9.57) tale che μk → +∞. In particolare esiste solo un numero finito di autovalori negativi; 2. le autofunzioni corrispondentiall’autovalore principale μ1 sono multipli di un’unica autofunzione ϕ1 ∈ C ∞ Ω , positiva in Ω.
9.4 Diffusione e reazione non lineare
571
Da questo teorema possiamo dedurre ciò che ci serve. Teorema 4.5. Siano ws soluzione di equilibrio del problema (9.54) e μ1 , ϕ1 come nel Teorema 4.4. a) Sia μ1 > 0. Esistono due numeri positivi ρ ed ω tali che se |g (x) − ws (x)| ≤ ρϕ1 (x)
∀x ∈ Ω
(9.58)
allora per t > 0 si ha |u (x,t) − ws (x)| ≤ ρe−ωt ϕ1 (x)
∀x ∈ Ω.
(9.59)
Come conseguenza, ws è asintoticamente stabile. b) Se μ1 > 0 allora ws è instabile, e precisamente, per ogni numero σ ∈ (0, 1), esistono numeri positivi ρ e ω tali che se g (x) − ws (x) ≥ ρ(1 − σ)ϕ1 (x)
∀x ∈ Ω
allora, per t > 0, u (x,t) − ws (x) ≥ ρ(1 − σe−ωt )ϕ1 (x)
∀x ∈ Ω.
Dimostrazione. (a) Sia v (x, t) = ws (x) + ρe−ωt ϕ1 (x). Scegliamo ρ e ω in modo che v sia una soprasoluzione del problema (9.53). Si ha, essendo −Δϕ1 = (μ1 + f (ws )) ϕ1 : vt − Δv = −Δws + (−ωϕ1 − Δϕ1 )ρe−ωt = f (ws ) + (−ω + μ1 + f (ws )) ρe−ωt ϕ1 . Ora, dal teorema del valor medio, per η = η (x,t) opportuno, 0 < η < ρ, possiamo scrivere f (ws ) = f (v) − f (ws + η) ρe−ωt ϕ1 . Essendo f ∈ C ∞ (R) e μ1 > 0, se −ω + μ1 > 0 e ρ è sufficientemente piccolo, si ha −ω + μ1 + f (ws ) > f (ws + η) per cui, ricordando che ϕ1 > 0, vt − Δv = f (v) + [−ω − μ1 + f (ws ) − f (ws + η)]ρe−ωt ϕ1 ≥ f (v) . Osserviamo ora che dalla (9.58) si ha v (x, 0) = ws (x) + ρϕ1 (x) ≥ g (x) e v = 0 su ST . Ne segue che v è soprasoluzione e quindi u (x,t) ≤ v (x) + ρe−ωt ϕ1 (x)
per t > 0, ∀x ∈ Ω.
Analogamente, si mostra che scegliendo opportunamente ρ e ω, la funzione z (x,t) = ws (x) − ρe−ωt ϕ1 (x) è una sottosoluzione e quindi u (x,t) ≥ v (x) − ρe−ωt ϕ1 (x)
per t > 0, ∀x ∈ Ω.
572
9 Formulazione debole per problemi di evoluzione
La (9.59) è così dimostrata e l’asintotica stabilità di ws segue facilmente. (b) Basta verificare che, se σ ∈ (0, 1), w (x,t) = v (x) + ρ(1 − σe−ωt )ϕ1 (x) è una sottosoluzione per ρ e ω opportunamente scelti. Lasciamo il controllo come esercizio. Esempio 4.2. Equazione di Fisher (II). Applichiamo il Teorema 4.5 al problema (9.53), con 0 ≤ g ≤ 1 in (0, 1). Una soluzione di equilibrio è w1 ≡ 0. Esaminiamone la stabilità. Poiché f (u) = r(1 − 2u), abbiamo f (0) = r ed il problema (9.56), (9.57) si riduce a −U (x) = (μ + r)U (x)
0<x<1
con U (0) = U (1) = 0. Abbiamo già calcolato gli autovalori di questo problema nel Capitolo 2; si ha μ + r = k2 π2
k≥1
e perciò μ1 = −r + π 2 . Dal Teorema 3.4 concludiamo che: Microteorema 4.6. Se r < π 2 la soluzione nulla è asintoticamente stabile. Se r > π 2 la soluzione nulla è instabile. In termini del problema originale (non adimensionale) si ha r = aL2 /D e quindi il Microteorema 4.6 indica che se la diffusione è molto grande o se la lunghezza dell’habitat è piccola la popolazione è destinata ad estinguersi. Sia ora r > π 2 , che corrisponde esattamente al caso λ1 < r nell’Esempio 7.1. Esiste allora un’altra soluzione di equilibrio w2 , positiva in (0, 1). Non essendo w2 costante, gli autovalori del problema stazionario non si calcolano esplicitamente e le cose sono un pò più complicate. Vale comunque il seguente risultato: Microteorema 4.7. Se r > π 2 la soluzione di equilibrio w2 del problema (9.52) è asintoticamente stabile. Dimostrazione. Siano μ1 e ϕ1 come nel Teorema 4.4. Nel nostro caso abbiamo −ϕ1 − rf (w2 ) ϕ1 = μϕ1 in (0, 1) ϕ1 (0) = ϕ1 (1) = 0 con f (s) = rs (1 − s) . Vogliamo mostrare che μ1 > 0. Ricordando che ϕ1 (x) > 0 in (0, 1), moltiplichiamo per ϕ1 l’equazione w2 + rf (w2 ) = 0 e integriamo su (0, 1):
1 0
[w2 + rf (w2 )] ϕ1 dx = 0.
9.5 Equazione delle onde
573
Moltiplichiamo ora per w2 l’equazione ϕ1 + rf (w2 ) ϕ1 = −μϕ1 ed integriamo su (0, 1): 1 1 [ϕ1 + rf (w2 ) ϕ1 ] w2 dx = −μ1 ϕ1 w2 dx. 0
0
Sottraendo membro a membro le due equazioni ottenute, si trova: 1 1 [w2 ϕ1 − w2 ϕ1 ] dx + r [f (w2 ) − f (w2 ) w2 ] ϕ1 dx 0
= μ1
0
1
0
ϕ1 w2 dx.
Integriamo per parti il primo termine; otteniamo: 1 1 1 [w2 ϕ1 − w2 ϕ1 ] dx = [w2 ϕ1 − ws ϕ1 ]0 − [w2 ϕ1 − w2 ϕ1 ] dx = 0. 0
0
Abbiamo pertanto 1 [f (w2 ) − f (w2 ) w2 ] ϕ1 dx = μ1 r 0
0
1
ϕ1 w2 dx.
(9.60)
Ricordiamo ora che r > π 2 , ϕ1 > 0 e w2 > 0 in (0, 1); inoltre f (w2 ) − f (w2 ) w2 = w2 − w22 − (1 − 2w2 ) w2 = w22 > 0
in (0, 1) .
Si deduce da (9.60) che deve essere μ1 > 0. Il Teorema 3.1 implica allora che w2 è asintoticamente stabile. Nota 4.1. In realtà si può mostrare che w2 è l’unica soluzione di equilibrio positiva in (0, 1) e che qualunque sia il dato iniziale g (x) > 0 in (0, 1), u (·, t) → w2 (·)L∞ (0,1) → 0 per t → +∞.
9.5 Equazione delle onde La propagazione di onde in mezzi non omogenei ed anisotropi conduce ad equazioni iperboliche del secondo ordine. Con le stesse notazioni delle sezioni precedenti, un’equazione in forma di divergenza del tipo utt − div(A (x,t) ∇u) + c(x,t) · ∇u + a (x,t) u = f (x,t) o di non-divergenza del tipo utt − tr(A (x,t) D2 u) + c(x,t) · ∇u + a (x,t) u = f (x,t) si dice iperbolica in QT se (condizione di ellitticità )
n aij (x,t) ξ i ξ j > 0, ∀ξ ∈ Rn , ξ = 0, q.o in QT . i,j=1
574
9 Formulazione debole per problemi di evoluzione
Alcuni tipici problemi associati ad un’equazione iperbolica sono quelli già considerati per l’equazione delle onde. Assegnata f nel cilindro spazio-temporale QT , si vuole determinare una soluzione u dell’equazione che inoltre soddisfi le condizioni iniziali (o di Cauchy ) ut (x,0) = h (x)
u (x,0) = g (x) ,
in Ω
e una delle solite condizioni su ST = ∂Ω × (0, T ], di Dirichlet, Neumann, di Robin o miste. Anche se dal punto di vista fenomenologico le equazioni iperboliche presentano sostanziali differenze da quelle paraboliche, per le equazioni in forma di divergenza, è possibile una formulazione debole simile a quella della sezione precedente, che può essere analizzata ancora col metodo di Faedo-Galerkin. In realtà, nel caso di equazioni generali, se i coefficienti aij non sono suffi cientemente regolari (per esempio di classe C 1 QT ) la teoria è un po’ più complicata; per questa ragione ci limitiamo all’equazione delle onde. 9.5.1 Il problema di Cauchy-Dirichlet Consideriamo il problema ⎧ 2 ⎪ ⎨ utt − c Δu = f u=0 ⎪ ⎩ u (x,0) = g (x) , ut (x,0) = h (x)
in QT su ST
(9.61)
in Ω.
Per trovare un’adeguata formulazione debole, consideriamo la terna Hilbertiana V = H01 (Ω), H = L2 (Ω), V ∗ = H −1 (Ω), moltiplichiamo l’equazione delle onde per una funzione v ∈ V e integriamo su Ω. Troviamo: utt (x,t) v (x) dx − c2 Δu (x,t) v (x) dx = f (x,t) v (x) dx. Ω
Ω
Ω
Integrando per parti il secondo termine, otteniamo 2 utt (x,t) v (x) dx + c ∇u (x,t) · ∇v (x) dx = f (x,t) v (x) dx (9.62) Ω
Ω
Ω
che con le notazioni della sezione precedente diventa: u ¨ (t) v dx+α ∇u (t) · ∇v dx = f (t) v dx Ω
Ω
Ω
dove u ¨ è la notazione per utt . Lo spazio naturale per u è L2 (0, T ; V ). Dunque u (t) ∈ V e Δu (t) ∈ V ∗ q.o. in [0, T ]. D’altro canto, dall’equazione delle onde abbiamo utt = c2 Δu + f.
9.5 Equazione delle onde
575
Se f ∈ L2 (0, T ; H) è naturale richiedere u ¨ ∈ L2 (0, T ; V ∗ ). Coerentemen2 te, è ragionevole che u˙ ∈ L (0, T ; H), spazio intermedio tra L2 (0, T ; V ) e L2 (0, T ; V ∗ ). In sintesi cerchiamo una soluzione u tale che u ∈ L2 (0, T ; V ) ,
u˙ ∈ L2 (0, T ; H) ,
u ¨ ∈ L2 (0, T ; V ∗ ) .
(9.63)
Per quanto riguarda i dati iniziali, assumiamo u (0) = g in V , u˙ (0) = h ∈ H. Le considerazioni precedenti portano alla seguente formulazione debole per il problema (9.61): Date f ∈ L2 (0, T ; V ∗ ) e g ∈ V , h ∈ H, determinare u ∈ L2 (0, T ; V ) tale che u˙ ∈ L2 (0, T ; H) ,
u ¨ ∈ L2 (0, T ; V ∗ )
e che 1. per ogni v ∈ V e q.o in (0, T ) , ¨ u (t) , v∗ + c2 (∇u (t) , ∇v)0 = (f (t) , v)0 ;
(9.64)
2. u (0) = g, u˙ (0) = h. Nota 5.1. In base al Teorema 7.11.3 si deduce che u ∈ C ([0, T ] ; H) ,
u˙ ∈ C ([0, T ] ; V ∗ )
per cui la condizione iniziale 2 significa che, se t → 0+ , u (t) − g0 → 0 e u˙ (t) − hV ∗ → 0. Nota 5.2. La (9.64) si può intendere equivalentemente nel senso delle distribuzioni in D (0, T ) ed alla dualità ¨ u (t) , v∗ si può dare un significato più esplicito. Infatti (si veda la Nota 2.1) si ha ¨ u (t) , v∗ =
d2 (u (t) , v)0 dt2
in D (0, T )
(9.65)
e come conseguenza, la (9.64) si può scrivere nella forma d2 (u (t) , v)0 + c2 (∇u (t) , ∇v)0 = (f (t) , v)0 dt2
(9.66)
per ogni v ∈ V e nel senso delle distribuzioni in [0, T ]. Nota 5.3. Non è difficile mostrare che, se una soluzione debole è regolare (con due derivate spaziali e due derivate temporali continue) allora è una soluzione classica.
576
9 Formulazione debole per problemi di evoluzione
9.5.2 Il metodo di Faedo-Galerkin (III) Vogliamo dimostrare che il problema (9.61) possiede esattamente una soluzione debole e che questa dipende con continuità dai dati, in una norma opportuna. Volendo usare il metodo di Faedo-Galerkin, rivediamone brevemente la strategia e mettiamo in evidenza le differenze rispetto al caso parabolico. ∞ 1. Sia {wk }k=1 una base ortonormale in H e ortogonale in V . Possiamo scrivere
∞
∞ ˆ k wk h g= gˆk wk , h= k=1
k=1
ˆ k = (h, wk ) e dove le serie convergono in V e H, dove gˆk = (g, wk )0 , h 0 rispettivamente. 2. Poniamo Vm = span {w1 , w2 , ..., wm } e um (t) =
m k=1
rk (t) wk ,
gm =
m k=1
gˆk wk ,
hm =
m k=1
ˆ k wk . h
Costruiamo la successione di Galerkin risolvendo il seguente problema approssimato finito-dimensionale: determinare um ∈ H 2 (0, T ; V ) tale che, per ogni s = 1, ..., m, (¨ um (t) , ws )0 + c2 (∇um (t) , ∇ws )0 = (f (t) ,ws )0 , 0≤t≤T (9.67) um (0) = gm , u˙ m (0) = hm . Si osservi che la prima equazione in (9.67) è vera per ogni elemento ws della base scelta in Vm se e solo se risulta vera per ogni funzione test v ∈ Vm . Inoltre, essendo um ∈ H 2 (0, T ; V ), si ha u ¨m ∈ L2 (0, T ; V ) e quindi um (t) , v∗ . (¨ um (t) , v)0 = ¨ um } sono limitate in 3. Si dimostra che le successioni {um }, {u˙ m } e {¨ L2 (0, T ; V ) L2 (0, T ; H) e L2 (0, T ; V ∗ ), rispettivamente (stime dell’energia). Allora il Teorema 6.7.8 di compattezza debole implica che esiste una sottosuccessione {umk } debolmente convergente in L2 (0, T ; V ) ad un certo elemento u, mentre {u˙ mk } e {¨ umk } convergono debolmente in L2 (0, T ; H) e L2 (0, T ; V ∗ ) a u˙ e u ¨, rispettivamente. 4. Si dimostra che la funzione u costruita nel punto 3 è l’unica soluzione debole del problema (9.61). 9.5.3 Soluzione del problema approssimato Vale il seguente lemma. Lemma 5.1. Per ogni m ≥ 1, esiste un’unica soluzione del problema (9.67). In particolare, essendo um ∈ H 2 (0, T ; V ), si ha um ∈ C 1 ([0, T ]; V ) .
9.5 Equazione delle onde
577
Dimostrazione. Osserviamo che, per l’ortonormalità delle wk in H, m r¨k (t) wk , ws = r¨k (t) (¨ um (t) , ws )0 = 0
k=1
e, per l’ortogonalità delle wk in V , m 2 c2 rk (t) ∇wk , ∇ws = c2 (∇ws , ∇ws )0 rs (t) = c2 ∇ws 0 rs (t) . 0
k=1
Poniamo Fs (t) = (f (t) , ws ) ,
F (t) = (F1 (t) , ..., Fm (t))
e Rm (t) = (r1 (t) , ..., rm (t)) ,
gm = (g1 , ..., gm ) , hm = (h1 , ..., hm ) .
Se introduciamo poi la matrice diagonale 2 2 2 W = diag ∇w1 0 , ∇w2 0 , ..., ∇wm 0 , il problema (9.67) è equivalente al seguente sistema di m equazioni differenziali ordinarie disaccoppiate, lineari e a coefficienti costanti: ¨ m (t) = −c2 WRm (t) + Fm (t) , R
a.e. t ∈ [0, T ]
(9.68)
con le condizioni iniziali ˙ m (0) = hm . Rm (0) = gm . R Poiché Fs ∈ L2 (0, T ), per ogni s = 1, ..., m, questo sistema ha un’unica soluzione Rm (t) ∈ H 2 (0, T ; Rm ). Essendo um (t) =
m k=1
rk (t) wk ,
si deduce che um ∈ H 2 (0, T ; V ).
9.5.4 Stime dell’energia Vogliamo mostrare che dalla successione {um } delle soluzioni del problema (9.67) si può estrarre una sottosuccessione convergente ad una soluzione del problema originale. Come nel caso parabolico, occorre mostrare che opportune norme di Sobolev di um si possono controllare con opportune norme dei dati, con costanti di maggiorazione indipendenti da m. Inoltre, tali stime devono essere abbastanza potenti da permettere il passaggio al limite nei tre termini dell’equazione (¨ um (t) , v)0 + c2 (∇um (t) ,∇v)0 = (f (t) , v)0 .
578
9 Formulazione debole per problemi di evoluzione
In questo caso si riesce a controllare le norme di um in L∞ (0, T ; V ), di u˙ m in L∞ (0, T ; H) e di u ¨ in L2 (0, T ; V ∗ ), cioè le norme T 2 max um (t)1 , max u˙ m (t)0 e ¨ um (t)∗ dt. t∈[0,T ]
t∈[0,T ]
0
Cominciamo da um e u˙ m . Teorema 5.2 (Stima di um e di u˙ m ). Sia um la soluzione del problema (9.67). Allora, per ogni t ∈ [0, T ] : ! t 2 2 2 2 2 2 t f (s)0 ds . (9.69) u˙ m (t)0 + c um (t)1 ≤ e g1 + h0 + 0
Dimostrazione. Poiché um ∈ H 2 (0, T ; V ), possiamo scegliere v = u˙ m (t) come funzione test nel problema (9.67). Otteniamo (¨ um (t) , u˙ m (t))0 + c2 (∇um (t) , ∇u˙ m (t))0 = (f (t) , u˙ m (t))0
q.o. in (0, T ). (9.70)
Osserviamo ora che, sempre q.o. in (0, T ), (¨ um (t) , u˙ m (t))0 = e che (∇um (t) , ∇u˙ m (t))0 =
1 d 2 u˙ m (t)0 2 dt c2 d 2 ∇um (t)0 . 2 dt
Per la disuguaglianza di Schwarz, (f (t) , u˙ m (t))0 ≤ f (t)0 u˙ m (t)0 ≤
1 1 2 2 f (t)0 + u˙ m (t)0 2 2
cosicché dalla (9.70) deduciamo che d 2 2 2 2 u˙ m (t)0 + c2 um (t)1 ≤ f (t)0 + u˙ m (t)0 . dt Integriamo ora tra 0 e t, ricordando che um (0) = gm , u˙ m (0) = hm ed osservando che, dalle proprietà di ortogonalità delle wk , 2
2
2
gm 1 ≤ g1 ,
2
gm 0 ≤ h0 .
Otteniamo: 2
2
u˙ m (t)0 + c2 um (t)1 t t 2 2 2 2 f (s)0 ds + u˙ m (s)0 ds ≤ gm 1 + hm 0 + 0 0 t t 2 2 2 2 ≤ g1 + h0 + f (s)0 ds + u˙ m (s)0 ds. 0
0
(9.71)
9.5 Equazione delle onde
Poniamo 2
2
Ψ (t) = u˙ m (t)0 + c2 um (t)1 ,
2
2
G (t) = g1 + h0 +
0
t
579
2
f (s)0 ds.
Osserviamo che Ψ e G sono positive e continue in [0, T ] e che G è crescente. Dalla (9.71) si deduce che t Ψ (t) ≤ G (t) + Ψ (s) ds 0
e dal Lemma di Gronwall 2.2 troviamo ! t 2 2 2 2 2 f (s)0 ds u˙ m (t)0 + c2 um (t)1 ≤ et g1 + h0 + 0
per ogni t ∈ [0, T ]. 2 ∗ Vediamo ora come si controlla la norma di u ¨m in L (0, T ; V ). Teorema 5.3 (Stima di u ¨m ). Sia um la soluzione del problema (9.67). Allora, per ogni t ∈ [0, T ], ! t t 2 2 2 2 ¨ um (s)V ∗ ds ≤ C1 g1 + h0 + f (s)0 ds (9.72) 0
0
2 t
2
dove C1 = 2(c e − c + 1). Dimostrazione. Sia v ∈ V e scriviamo v =w+z con w ∈ Vm = span{w1 , w2 , ..., wm } e z ∈ Vm⊥ . Poiché le wk sono ortogonali in V , si ha w1 ≤ v1 . Utilizzando w come funzione test nel problema (9.67), si trova (¨ um (t) , v)0 = (¨ um (t) , w)0 = −c2 (∇um (t) , ∇w)0 + (f (t) ,w)0 . Essendo |(∇um (t) , ∇w)0 | ≤ um (t)1 w1 possiamo scrivere
|(¨ um (t) , v)0 | ≤ c2 um (t)1 + f (t)0 w1 ≤ c2 um (t)1 + f (t)0 v1 .
Per definizione di norma in V ∗ , si ottiene ¨ um (t)V ∗ ≤ c2 um (t)1 + f (t)0 . Quadrando entrambi i membri e integrando tra 0 e t si ottiene t t t 2 2 2 ¨ um (s)V ∗ ds ≤ 2c4 um (s)1 ds + 2 f (s)0 ds 0
0
e dal Teorema 5.2 si ricava facilmente la (9.72).
0
580
9 Formulazione debole per problemi di evoluzione
9.5.5 Esistenza, unicità e stabilità Il Teorema 5.3 indica che la successione di Galerkin {um } è limitata in L∞ (0, T ; V ) e quindi, in particolare in L2 (0, T ; V ), mentre la successione {¨ um } è limitata in L2 (0, T ; V ∗ ). Dal Teorema 6.7.8 deduciamo che esiste una sottosuccessione che per semplicità di notazioni indichiamo ancora con {um }, tale che, per m → ∞, um ! u u˙ m ! u˙ u ¨m ! u ¨
in L2 (0, T ; V ) in L2 (0, T ; H) in L2 (0, T ; V ∗ ) .
Allora u è l’unica soluzione del problema (9.61). Vale infatti il seguente teorema. Teorema 5.4. Siano f ∈ L2 (0, T ; H), g ∈ V , h ∈ H. Allora u è l’unica soluzione debole del problema (9.61). Inoltre, per ogni t ∈ [0, T ], ! t t 2 2 2 2 2 2 u˙ (t)0 + u (t)1 + ¨ u (s)V ∗ ds ≤ C g1 + h0 + f (s)0 ds 0
0
dove C = C (c, T ). Dimostrazione. Esistenza. Sappiamo che T T (∇um (t) , ∇v (t))0 dt → (∇u (t) , ∇v (t))0 dt 0
0
2
per ogni v ∈ L (0, T ; V ), T (u˙ m (t) , w (t))0 dt → 0
0
per ogni w ∈ L2 (0, T ; H), e T (¨ um (t) , v (t))0 = 0
T
0
(u˙ (t) , w (t))0 dt
T
¨ um (t) , v (t)∗ dt →
T 0
¨ u (t) , v (t)∗ dt
per ogni v ∈ L2 (0, T ; V ). Vogliamo usare queste proprietà per passare al limite per m → +∞ nel problema (9.67), tenendo presente che le funzioni test per ogni m devono essere scelte in Vm . Fissiamo v ∈ L2 (0, T ; V ); possiamo scrivere
∞ bk (t) wk v (t) = k=1
dove la serie converge in V , q.o in [0, T ]. Sia vN (t) =
N k=1
bk (t) wk
(9.73)
9.5 Equazione delle onde
581
e per il momento teniamo N fissato. Se m ≥ N , allora vN ∈ L2 (0, T ; Vm ) . Moltiplicando l’equazione (9.67) per bk (t) e sommando per k = 1, ..., N , otteniamo (¨ um (t) , vN (t))0 + c2 (∇um , ∇vN )0 = (f (t) ,vN (t))0 . Un’integrazione su (0, T ) dà T 2 (¨ um , vN )0 + c (∇um , ∇vN )0 dt = 0
T
(f, vN )0 dt.
0
(9.74)
¨m nei rispettivi spazi, possiamo Grazie alla convergenza debole di um e u passare al limite per m → +∞. Poiché (¨ um (t) , vN (t))0 = ¨ um (t) , vN (t)∗ → ¨ u (t) , vN (t)∗ , otteniamo
¨ u, vN ∗ + c2 (∇u, ∇vN )0 dt =
T
0
0
T
(f, vN )0 dt.
Passiamo ora al limite per N → ∞, osservando che vN → v in L2 (0, T ; V ) e, in particolare, anche debolmente in questo spazio. Troviamo T T (f (t) , v (t))0 dt. (9.75) ¨ u (t) , v (t)∗ + c2 (∇u (t) , ∇v (t))0 dt = 0
0
2
Dunque la (9.75) è valida per ogni v ∈ L (0, T ; V ). Procedendo come nella dimostrazione del Teorema 2.5, deduciamo che ¨ u (t) , v∗ + c2 (∇u (t) , ∇v)0 dt = (f (t) , v)0 per ogni v ∈ V e qo. in [0, T ]. Quindi u è soluzione di (9.64) e sappiamo che u ∈ C ([0, T ] ;H), u˙ ∈ C ([0, T ] ;V ∗ ). Per controllare le condizioni iniziali, procediamo come nel Teorema 2.5. Scegliamo v ∈ C 1 ([0, T ]; V ), con v (T ) = v˙ (T ) = 0. Integrando due volte per parti nella (9.75), troviamo T u (t) , v¨ (t)∗ + c2 (∇u (t) , ∇v (t))0 dt (9.76) 0
T
= 0
(f (t) , v (t))0 dt + (u˙ (0) , v˙ (0)) − (u (0) , v (0)) .
D’altra parte, Integrando due volte per parti nella (9.74) e passando al limite prima per m → +∞, poi per N → ∞, deduciamo T u (t) , v¨ (t)∗ + c2 (∇u (t) , ∇v (t))0 dt (9.77) 0
=
0
T
(f (t) , v (t))0 dt + (h, v˙ (0)) − (g, v (0)) .
582
9 Formulazione debole per problemi di evoluzione
Dal confronto delle (9.76) e (9.77), concludiamo che (u˙ (0) , v˙ (0)) − (u (0) , v (0)) = (h, v˙ (0)) − (g, v (0)) per ogni v ∈ C 1 ([0, T ]; V ), con v (T ) = v˙ (T ) = 0. L’arbitrarietà di v˙ (0) e v (0) dà u˙ (0) = h e u (0) = g. Unicità. Assumiamo g = h ≡ 0 e f ≡ 0. Vogliamo mostrare che u ≡ 0. La dimostrazione sarebbe più semplice se potessimo usare u˙ come funzione test nella (9.64), ma u˙ (t) non appartiene a V . Sia dunque s fissato e poniamo6 " s v (t) =
t
se 0 ≤ t ≤ s
u (r) dr
se s ≤ t ≤ T .
0
Abbiamo v (t) ∈ V per ogni t ∈ [0, T ], cosicché possiamo inserirla nella (9.64). Integrando su (0, T ) abbiamo 0
s
¨ u (t) , v (t)∗ + c2 (∇u (t) , ∇v (t))0 dt = 0.
Integrando per parti otteniamo s s s ¨ u (t) , v (t)∗ dt = − (u˙ (t) , v˙ (t))0 dt = (u˙ (t) , u (t))0 dt 0 0 0s 1 d 2 u (t)0 dt = 2 0 dt poiché v (s) = 0 e v˙ (t) = −u (t) se 0 < t < s. D’altra parte,
s 0
(∇u (t) , ∇v (t))0 dt = − =−
s 0
1 2
(∇v˙ (t) , ∇v (t))0 dt
0
s
d 2 ∇v (t)0 dt. dt
Quindi, dalla (9.78),
s
0
ovvero
d 2 2 u (t)0 − c2 ∇v (t)0 dt = 0 dt 2
2
u (s)0 + c2 ∇v (0)0 = 0 per ogni s ∈ [0, T ], che implica u (s) ≡ 0. 6
Seguiamo Evans, 1998.
(9.78)
Problemi
583
Stabilità. Per dimostrare la stima di stabilità, usiamo il Microteorema 7.9.4 (per i primi due termini) e la debole semicontinuità inferiore dalla norma in L2 (0, T ; V ∗ ) per passare al limite per m → ∞ nella (9.69). Problemi 9.1. Si consideri il problema ⎧ ⎪ ⎨ ut − (a (x) ux )x + b (x) ux + c(x)u = f (x, t) u (x,0) = g (x) , ⎪ ⎩ u (0, t) = 0, u (1, t) = k (t) .
0 < x < 1, 0 < t < T 0≤x≤1 0 ≤ t ≤ T.
1) Con un opportuno cambiamento di variabile per u ridursi a condizioni di Dirichlet omogenee. 2) Scrivere una formulazione debole per il problema così ottenuto. 3) Dimostrare la buona posizione del problema, precisando le ipotesi sui coefficienti a, b, c e sui dati f, g. Ricavare una stima di stabilità per la soluzione u del problema originale. 9.2. Si consideri il problema di Cauchy-Neumann (9.29) con condizioni non-omogenee ∂ν u = h, dove h ∈ L2 (ST ). a) Scrivere una formulazione debole del problema e derivare le stime dell’energia per la successione delle approssimazioni di Galerkin. b) Dedurre eesistenza ed unicità della soluzione. 9.3. Nelle ipotesi del Teorema 2.3 ricavare la seguente variante delle stime dell’energia per um e u˙ m t Cp2 t 2 2 2 2 um (t)0 + α um (s)1 ds ≤ g0 + f (s)0 ds α 0 0 e
0
t
2 u˙ (t)∗
dt ≤
2 2α g0
+
4CP2
0
t
2
f (t)0 dt.
[Suggerimento. Procedere come nella dimostrazione del Teorema 2.3 ma, anziché usare il Lemma di Gronwall, usare la disuguaglianza elementare |ab| ≤
ε a2 + b2 2ε 2
∀a, b ∈ R, ∀ε > 0
per dedurre che (f (t) ,um (t))0 ≤ f (t)0 um (t)0 ≤ CP f (t)0 um (t)1 ≤
α CP2 2 2 f (t)0 + um (t)1 . 2 2α
A questo punto il resto non dovrebbe essere difficile].
584
9 Formulazione debole per problemi di evoluzione
9.4. Derivare le stime dell’energia per le approssimazioni di Galerkin um per il problema di Cauchy-Neumann senza usare il cambio di variabile w (t) = e−λt u (t). [Suggerimento. Inserire come al solito um come funzione test. Aggiungere e 2 togliere λ um (t)0 ; usare la debole coercività della forma bilineare B ed il Lemma di Gronwall]. 9.5. Regolarità−H 2 . Enunciare e provare un teorema di regolarità H 2 per la soluzione del problema di Cauchy-Neumann per l’equazione del calore. 9.6. Si consideri il problema ⎧ 2 ⎪ ⎨ utt − c Δu = f u (x,0) = g (x) , ut (x, 0) = h (x) ⎪ ⎩ uν (0, t) = 0.
in Ω × (0, T ) in Ω su ∂Ω × [0, T ] .
Scrivere una formulazione debole del problema e dimostrare gli analoghi dei Teoremi 4.2, 4.3 e 4.4. 9.7. Reazione concentrata. Si consideri il problema ⎧ − 1 < x < 1, 0 < t < T ⎪ ⎨ utt − uxx + u (x, t) δ (x) = 0 u (x,0) = g (x) , ut (x, 0) = h (x) −1≤x≤1 ⎪ ⎩ u (−1, t) = u (1, t) = 0. 0 ≤ t ≤ T. dove δ (x) denota la delta di Dirac nell’origine. Scrivere una formulazione debole del problema, provarne la buona posizione e scrivere le stime di stabilità sotto opportune ipotesi su g e h. [Suggerimento. a) Siano V = H01 (−1, 1) e H = L2 (−1, 1). La formulazione debole è: determinare u ∈ C ([−1, 1] , V ), con u˙ ∈ C ([−1, 1] , H) e u ¨ ∈ C ([−1, 1] , V ∗ ), tale che, per ogni v ∈ V , ¨ u (t) , v∗ + (ux (t) , vx ) + u (0, t) v (0) = 0 e u (t) − gV → 0, u˙ (t) − hH → 0 per t → 0].
q.o. in (0, T )
Appendice A Analisi dimensionale
A.1 Un esempio preliminare L’idea che sta alla base dell’analisi dimensionale è molto semplice: le leggi della Fisica non dipendono dalle unità di misura scelte per misurare le quantità coinvolte. Come conseguenza, le relazioni matematiche che esprimono tali leggi devono possedere proprietà generali di omogeneità o simmetria. L’analisi dimensionale è un metodo per determinare ed analizzare tali relazioni in riferimento ad un dato fenomeno, utilizzando solo una conoscenza qualitativa dei principi sottostanti, senza necessariamente servirsi di modelli matematici concreti come potrebbe essere un’equazione differenziale. Vogliamo dare qui i primi rudimenti di questa tecnica, rimandando ai testi specializzati, e specialmente [Barenblatt, 2002], per gli approfondimenti. Nel Capitolo 2, Paragrafo 2.3.2, abbiamo visto un esempio di utilizzo dell’analisi dimensionale per esaminare la propagazione del calore in una sbarra infinita da una sorgente istantanea localizzata in un punto. Come ipotesi di partenza abbiamo assunto che la temperatura fosse una funzione dello spazio, del tempo, dell’energia e del coefficiente di diffusione. L’obiettivo era arrivare ad una relazione funzionale fra quantità adimensionali. L’esatta forma di questa funzione è stata poi determinata sfruttando il fatto che la temperatura fosse soluzione dell’equazione del calore. In generale, se il modello matematico non è disponibile occorre procedere usando dati sperimentali. Vediamo subito un esempio classico. • Periodo nelle oscillazioni di un pendolo. Il classico esempio di uso dell’analisi dimensionale è la determinazione del periodo delle piccole oscillazioni di un pendolo verticale di lunghezza l. Dall’analisi elementare, sappiamo che l’angolo (in radianti) α = α (t), che il pendolo forma con la verticale, è soluzione dell’equazione differenziale l¨ α (t) = −g sin α (t) dove g indica l’accelerazione di gravità. Se α è piccolo, sin α ∼ α e l’equazione Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
586
Appendice A Analisi dimensionale
differenziale è approssimata da g α ¨ (t) + α (t) = 0 l che ha soluzione generale (A, B ∈ R)
α (t) = A cos ωt + B sin ωt dove ω 2 = g/l. Si trova quindi il periodo 2π P= = 2π ω
l . g
(A.1)
Ora, usando l’analisi dimensionale, è possibile ricavare la dipendenza funzionale (A.1), tranne l’esatto valore della costante moltiplicativa 2π, senza ricorrere ad alcuna equazione differenziale. Il ragionamento è il seguente. Da che cosa dipende il periodo P? Dovrebbe essere ragionevole che dipenda solo da l, g, dalla massa m del pendolo e dall’angolo massimo di oscillazione α0 . Pertanto ipotizziamo una relazione funzionale del tipo P = f (l, g, m, α0 ) (A.2) che sia valida in ogni sistema di unità di misura. Le quantità l, g, m hanno dimensioni (fisiche) indipendenti, in quanto nessuna di essa ha dimensione esprimibile in termini delle altre due. L’angolo α0 è invece adimensionale. Cerchiamo una combinazione delle quantità l, m, g che abbia le stesse dimensioni fisiche di P. In altri termini, cerchiamo a, b, c tali che a
b
c
[P] = [l] [g] [m] . Indichiamo con L, M, T le dimensioni di lunghezza, massa e tempo, rispettivamente. Essendo [P] = T , [l] = L, [g] = LT −2 , [m] = M deve essere T = La+b T −2b M c da cui a + b = 0, −2b = 1 e c = 0. Dunque, a = 1/2, b = −1/2, c = 0 e 1/2 −1/2 [P] = [l] [g] . Questo semplice calcolo indica che la quantità g P Π= l è adimensionale. Dividendo la (A.2) per l1/2 g −1/2 otteniamo g g Π= P= f (l, g, m, α0 ) = F (l, g, m, α0 ) . l l Essendo Π adimensionale, anche F (l, g, m, α0 ) deve esserlo. Ma questo implica che F non può dipendere da l, g, m perché altrimenti ogni cambiamento di unità di misura di queste variabili provocherebbe una variazione
A.2 Dimensioni e leggi fisiche
587
di F (l, g, m, α0 ) mentre lascerebbe Π invariato. Pertanto siamo giunti alla conclusione che deve essere g P = F (α0 ) (A.3) l
ossia che P=
l F (α0 ) . g
Assumiamo ora che le oscillazioni siano piccole, cioè α0 sia piccolo. Dalla (A.3) e dal significato di α0 ricaviamo che F (α0 ) = F (−α0 ) sicché, assumendo che F sia regolare, possiamo scrivere 1 1 F (α0 ) = F (0) + F (0) α20 + F (4) (0) α40 + o α50 . 2 4! Di conseguenza, al prim’ordine F (α0 ) ∼ F (0) e l P ∼ F (0) . g A questo punto, la costante F (0) può essere determinata sperimentalmente. Prima di presentare il metodo dell’analisi dimensionale in generale è meglio soffermarsi un momento sul concetto di dimensione di una data quantità fisica.
A.2 Dimensioni e leggi fisiche Abbiamo parlato continuamente di dimensioni fisiche di una data quantità. Per quanto diremo in seguito, è bene precisare esattamente il concetto di dimensione fisica. Fissiamo una classe di sistemi di unità di misura: per esempio la classe in cui lunghezza, massa e tempo sono le grandezze fondamentali. All’interno di una stessa classe, la scelta delle unità di misura per le grandezze fondamentali definisce un sistema. Per esempio i due sistemi c, g, s (centimetro, grammo, secondo) ed m, kg, s (metro, kilogrammo massa, secondo) appartengono alla stessa classe. Consideriamo per esempio la densità di un corpo materiale ρ. Se l’unità di lunghezza cambia di un fattore L e l’unità di massa cambia di un fattore M , i valori numerici della densità cambiano di un fattore L−3 M . Il fattore è il medesimo all’interno della stessa classe di sistemi e definisce una funzione (L, M, T ) −→ L−3 M che prende il nome di funzione dimensione (o semplicemente dimensione) di ρ. In generale, la dimensione di una quantità fisica è la funzione che determina
588
Appendice A Analisi dimensionale
il fattore con cui cambia il valore numerico di quella quantità, quando si passa da un sistema di unità misura ad un altro, all’interno di una stessa classe. La dimensione di una quantità fisica q si indica col simbolo [q] . Per esempio, abbiamo appena visto che [ρ] = L−3 M. All’interno di una stessa classe, si dicono adimensionali le quantità i cui valori numerici rimangono invariati nel passaggio da un sistema all’altro. Le altre quantità si dicono allora dimensionali. Abbiamo già avuto modo di constatare l’importanza della procedura di adimensionalizzazione di un modello matematico (Paragrafo 2.1.4 e Sezione 4.9) ed infatti essa costituisce uno degli aspetti dell’analisi dimensionale. La funzione dimensione non può avere un’espressione analitica qualsiasi. Infatti, supponiamo che all’interno di una data classe di sistemi, L1 , L2 , ..., LN rappresentino le dimensioni delle grandezze fondamentali. Come conseguenza (non banale) del fatto che nessun sistema all’interno di una classe è privilegiato, la funzione dimensione è sempre un prodotto di potenze delle Lj , j = 1, ..., N . In altri termini, se q è una qualunque grandezza fisica, avremo [q] = La1 1 La2 2 · · · LaN con opportuni esponenti numerici aj . Pertanto è impossibile trovare, per esempio, dimensioni che contengano esponenziali o logaritmi. Fissate le dimensioni delle grandezze fondamentali L1 , L2 , ..., LN , consideriamo k quantità p1 , ..., pk con dimensioni a
a
a
[pj ] = L1 1j L2 2j · · · LNN j
j = 1, ..., k.
Diciamo che p1 , ..., pk hanno dimensioni indipendenti se nessuna delle dimensioni [pj ] è esprimibile come prodotto di potenze delle altre dimensioni. In termini algebrici, ciò significa che i vettori (a1j , a2j ..., aN j )
j = 1, ..., k
generano un sottospazio di RN di dimensione k. Si noti che, in questo contesto, le dimensioni Lj delle grandezze fondamentali corrispondono alla base canonica in RN .
A.3 Il teorema Pi di Buckingham Possiamo ora descrivere in generale il metodo dell’analisi dimensionale. Supponiamo che un dato fenomeno fisico sia caratterizzato da un insieme di quantità scalari q1 , ..., qn e che un’altra quantità q dipenda da quelle attraverso una relazione funzionale del tipo q = f (q1 , q2 , ..., qn ) .
(A.4)
A.3 Il teorema Pi di Buckingham
589
Assumiamo di essere all’interno di una classe di sistemi di unità di misura con grandezze fondamentali di dimensioni L1 , ..., LN e che all’interno di questa classe la relazione (A.4) sia la stessa per tutti i sistemi. Si dice allora che la relazione è completa. Possiamo scrivere [q] = Lb11 Lb22 · · · LbNN e
a
a
a
[qj ] = L1 1j L2 2j · · · LNN j
j = 1, ..., n.
Il nostro obiettivo è trasformare la (A.4) in una relazione funzionale del tipo Π = F (Π1 , ..., Πn−k ) dove le quantità Π, Π1 , ..., Πn−k siano adimensionali. Distinguiamo vari passi. Passo 1. Dividiamo l’insieme delle quantità q1 , ..., qn in due sottoinsiemi {p1 , ..., pk } e {s1 , ..., sn−k } in modo che p1 , ..., pk , dette quantità primarie, abbiano dimensioni indipendenti e che le dimensioni delle s1 , ..., sn−k , dette quantità secondarie, siano esprimibili come prodotti di potenze delle dimensioni delle pj , j = 1, ..., k. Si abbia cioè: [sj ] = [p1 ]
α1j
α2j
[p2 ]
αkj
· · · [pk ]
j = 1, ..., n − k.
(A.5)
Questa selezione può essere sempre fatta ed è possibile che sia k = n (le dimensioni di tutte le quantità sono indipendenti) oppure k = 0 (tutte le quantità sono adimensionali). Naturalmente, k è il massimo numero di quantità indipendenti tra le q1 , ..., qn . Riscriviamo allora la (A.4) nella forma q = f (p1 , ..., pk ; s1 , ..., sn−k ) .
(A.6)
Da questa relazione si deduce che anche la dimensione di q può essere espressa in termini delle dimensioni delle quantità primarie: [q] = [p1 ]
β1
[p2 ]
β2
· · · [pk ]
βk
.
(A.7)
Se così non fosse, la dimensione di q sarebbe indipendente dalle dimensioni di p1 , ..., pk e quindi, con un opportuno cambio di unità di misura, si potrebbe lasciare invariato q e cambiare il valore di f (p1 , ..., pk ; s1 , ..., sn−k ) . α α α Passo 2. Usando le (A.5), definiamo le quantità s˜j = p1 1j p2 2j · · · pk kj ed introduciamo le quantità adimensionali Πj =
sj s˜j
j = 1, ..., n − k.
(A.8)
590
Appendice A Analisi dimensionale β
β
β
Analogamente, usando la (A.7), definiamo q˜ = p1 1 p2 2 · · · pk k ed introduciamo la quantità adimensionale q (A.9) Π= . q˜ Passo 3. Dividiamo la (A.6) per q˜ e scriviamo, utilizzando le (A.8): Π=
1 f (p1 , ..., pk ; s˜1 Π1 , ..., s˜n−k Πn−k ) . q˜
Essendo q˜ ed s˜j esprimibili in termini di p1 , ..., pk , questa relazione può essere riscritta a sua volta nella forma seguente: Π = F (p1 , ..., pk ; Π1 , ..., Πn−k ) .
(A.10)
A questo punto è chiaro che F non può dipendere dalle quantità primarie p1 , ..., pk . Se così non fosse, cambiando sistema di unità di misura, avremmo una variazione nel valore di F (p1 , ..., pk ; Π1 , ..., Πn−k ) mentre Π, essendo adimensionale, rimarrebbe invariato. Deduciamo dunque la relazione Π = F (Π1 , ..., Πn−k )
(A.11)
nella quale tutte le quantità sono adimensionali. Sintetizziamo la conclusione nel seguente risultato. Teorema Pi di Buckingham. Sia q = f (q1 , q2 , ..., qn ) ,
(A.12)
una relazione funzionale, completa all’interno di una classe di sistemi di unità di misura. Sia k, 0 ≤ k ≤ n, il massimo numero tra le quantità q1 , q2 , ..., qn aventi dimensioni indipendenti. Allora la (A.12) può essere riscritta come una relazione funzionale del tipo (A.11), dove le Π, Π1 , ..., Πn−k sono combinazioni adimensionali delle quantità q, q1 , q2 , ..., qn . In termini di quantità primarie e secondarie, la relazione (A.11) si scrive esplicitamente nella seguente forma: # $ s1 sn−k β1 β2 βk , ..., α1(n−k) α2(n−k) . q = p1 p2 · · · pk F α 11 α21 k1 pα · · · pα p1 p2 · · · pk k(n−k) 1 p2 k Nel caso del pendolo abbiamo n = 4 e q1 = l, q2 = g, q3 = m, q4 = α0 , mentre q = P, il periodo d’oscillazione. Inoltre N = k = 3 e la scelta per le grandezze primarie è obbligata: p1 = l, p2 = g, p3 = m. Qui abbiamo solo g P. Π= l Nel caso della propagazione del calore da una sorgente istantanea concentrata nell’origine abbiamo n = 4, q1 = x, q2 = t, q3 = D, q4 = Q, mentre q = u∗ .
A.3 Il teorema Pi di Buckingham
591
Inoltre N = k = 3 e scegliendo t, D e Q come quantità primarie abbiamo trovato √ u Dt x Π= e Π1 = √ . Q Dt La relazione Π = F(Π1 ) non è altro che la (2.39). Discutiamo brevemente altri due esempi che illustrano quale tipo di informazioni si possano ricavare dall’analisi dimensionale. Esempio A1. Energia rilasciata da un’esplosione nucleare. Questo classico esempio è dovuto a Sir G.I. Taylor 1 . In un’esplosione atomica, si verifica un rapido rilascio di energia E all’interno di una regione molto piccola. Un’onda d’urto sferica si sviluppa intorno al punto in cui avviene la detonazione. Vogliamo determinare l’energia rilasciata nella prima fase dell’esplosione. Invece di riferirsi direttamente ad E, conviene scegliere il raggio dell’onda d’urto r come la quantità q nel Teorema Pi. Ora, r dipende da E, dal tempo t, dalla densità iniziale dell’aria ρ e dalla pressione atmosferica. Poiché nei primi istanti dell’esplosione la pressione dietro l’onda d’urto è circa 1000 volte quella atmosferica, l’influenza di quest’ultima può essere trascurata. Possiamo dunque scrivere r = f (E, t, ρ) e quindi n = 3. Usiamo il sistema m, kg, s, indicando come al solito con L, M e T , rispettivamente, le dimensioni di lunghezza, massa e tempo. Abbiamo [E] = M L2 T −2 ,
[ρ] = M L−3 .
[t] = T ,
Si controlla facilmente che le dimensioni di E, t e ρ sono indipendenti, per cui coincidono con le quantità primarie; quindi k = 3 e n − k = 0. Ne segue che la funzione F nella (A.11) non ha argomenti e perciò è una costante C. Ricaviamo ora la dimensione di r in funzione delle dimensioni di E, t e ρ. Dobbiamo cercare β 1 , β 2 e β 3 tali che β1
[r] = [E] ossia tali che:
β2
[t]
β3
[ρ]
L = M β 1 +β 3 L2β 1 −3β 3 T −2β 1 +β 2 .
Si trova β 1 = 1/5, β 2 = 2/5 e β 3 = −1/5 e quindi la quantità Π=
r E 1/5 t2/5 ρ−2/5
è adimensionale. La (A.11) diventa Π = C, ossia r = CE 1/5 t2/5 ρ−2/5 . 1
Taylor, G.I., The formation of a blast by a very intense explosion. II. The athomic axplosion of 1945. Proc. Roy. Soc. A201, 159-174.
592
Appendice A Analisi dimensionale
Notiamo espressamente come questa relazione derivi da un puro ragionamento dimensionale. Mediante esperimenti con piccole esplosioni, Taylor trovò per la costante C un valore molto vicino ad uno. Ne segue che, passando ai logaritmi, possiamo scrivere, con buona approssimazione, 5 1 E log r = log + log t 2 2 ρ che, nelle coordinate logaritmiche x = log t e y = y =x+
5 2
log r diventa la retta:
1 E log . 2 ρ
Misurazioni ottenute da una serie di fotografie di J. Mack durante un test nucleare rivelarono un notevole accordo con la predizione teorica. Taylor riuscì quindi a determinare l’energia dell’esplosione dalla dipendenza sperimentale del raggio in funzione del tempo, che forniva l’intersezione della retta con l’asse y. Incidentalmente, il valore trovato da Taylor per l’energia nel test era E = 19, 2 Kilotoni (1 Kilotone = 4, 186 × 1012 Joule). Successivamente è stato dimostrato con metodi più moderni che E = 21 Kilotoni. Esempio A2. Il Teorema di Pitagora. Dimostriamo il Teorema di Pitagora usando l’analisi dimensionale. L’area A di un triangolo rettangolo T dipende dalla lunghezza dell’ipotenusa c e, per esempio, dall’angolo acuto minore ϕ (in radianti). Possiamo dunque scrivere A = f (c, ϕ) . Poiché ϕ è adimensionale, abbiamo k = 1 e l’analisi dimensionale dà Π= ossia
A F (ϕ) c2
A = c2 F (ϕ) .
(A.13)
Ora, l’altezza divide il triangolo T in due triangoli simili con ipotenusa rispettivamente data dai cateti a e b del triangolo e aventi lo stesso angolo acuto minore ϕ. Se indichiamo le aree di questi due triangoli con A1 e A2 , l’analisi dimensionale dà A1 = a2 F (ϕ) e A2 = b2 F (ϕ) , dove F è la stessa funzione. Essendo A = A1 + A2 otteniamo c2 F (ϕ) = a2 F (ϕ) + b2 F (ϕ) da cui
c2 = a2 + b2 .
Appendice B Misure e integrali
Presentiamo una breve introduzione su misura e integrazione.
B.1 Misura di Lebesgue B.1.1 Un problema di ... conteggio Due persone, che per ragioni di privacy indichiamo con R ed L, devono calcolare il valore totale di un insieme M di monete da un centesimo fino a due euro. R decide di suddividere le monete in mucchi, ciascuno, diciamo, di 10 monete qualsiasi, di calcolare il valore di ciascun mucchio e poi di sommare i valori così ottenuti. L, invece, decide di suddividere le monete in mucchi omogenei, da un centesimo, da due e così via, contenenti cioè monete dello stesso tipo, di calcolare il valore di ogni mucchio e poi di sommarne i valori. In termini più analitici, introduciamo la funzione “valore” V :M →N che associa ad ogni elemento di M (cioè ad ogni moneta) il suo valore in euro. R suddivide il dominio di V in sottoinsiemi disgiunti, somma i valori di V su tali sottoinsiemi e poi somma il tutto. L considera ogni punto p del codominio di V (cioè il valore di ogni singola moneta) corrispondente ad un centesimo, due centesimi e così via. Considera la controimmagine V −1 (p) (i mucchi omogenei di monete ), calcola il valore corrispondente ed infine somma il tutto al variare di p. Questi due modi di procedere corrispondono alla “filosofia” sottostante la definizione dei due integrali di Riemann e di Lebesgue, rispettivamente. Essendo la nostra funzione valore definita su un insieme discreto e a valori interi, in entrambi i casi non vi sono problemi nel sommare i suoi valori e la scelta di uno o dell’altro metodo è determinata da un criterio di efficienza. Di solito, il metodo di L è ritenuto più efficiente. Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
594
Appendice B Misure e integrali
Nel caso di funzioni a valori reali (o complessi) si tratta di “somme sul continuo” ed inevitabilmente occorre un passaggio al limite su somme approssimanti. La “filosofia” di L risulta allora un pò più laboriosa e richiede lo sviluppo di nuovi strumenti. Esaminiamo il caso particolare di una funzione positiva, definita e limitata su un intervallo contenuto in R. Sia f : [a, b] → [inf f, sup f ] . Per definire l’integrale di Riemann, si suddivide l’intervallo [a, b] in sottointervalli I1 , ..., IN (i mucchi di R), in ogni intervallo Ik si sceglie un valore ξ k e si calcola f (ξ k ) l (Ik ) (il valore approssimato del mucchio k − esimo), dove l(Ik ) è la lunghezza di Ik . Si sommano i valori f (ξ k ) l(Ik ) e si definisce b
N f = lim f (ξ k ) l(Ik ) (R) δ→0
a
k=1
dove δ è la massima ampiezza dei sottointervalli della suddivisione. Il limite deve esistere finito ed essere indipendente dalla scelta dei punti ξ k . Questo, forse, è il punto più delicato della definizione di Riemann. Ma passiamo all’integrale secondo Lebesgue. Stavolta si suddivide l’intervallo [inf f, sup f ] in sottointervalli [yk−1 , yk ] (i valori in euro) con inf f = y0 < y1 < ... < yN −1 < yN = sup f. Si considerano le controimmagini Ek = f −1 ([yk−1 , yk ]) (i mucchi omogenei di L) e se ne calcola la ... lunghezza? Ma Ek , in generale, non è un intervallo o un unione di intervalli; potrebbe essere un insieme molto irregolare. Ecco che si presenta la necessità di associare ad insiemi come gli Ek una misura che generalizzi la lunghezza degli intervalli. Occorre quindi introdurre quella che si chiama misura di Lebesgue di un insieme E, che si indica con |E| . Potendo misurare gli Ek (il numero di monete in ogni mucchio), si sceglie un’ordinata qualunque αk ∈ [yk−1 , yk ] e si calcola αk |Ek | (valore approssimato del mucchio k − esimo). Si sommano i valori αk |Ek | e si definisce b
N f = lim αk |Ek | (L) a
δ→0
k=1
dove δ è la massima ampiezza degli intervalli [yk−1 , yk ]. Si può dimostrare che, sotto le nostre ipotesi, il limite esiste ed è indipendente dalla scelta di αk . Possiamo dunque scegliere αk = yk−1 , cioè l’ordinata più bassa nell’intervallo considerato. Questa osservazione è alla base della definizione generale dell’inN tegrale di Lebesgue che presenteremo più avanti: il numero k=1 yk−1 |Ek | non è altro che l’integrale di una funzione che assume un numero finito di valori, y0 < ... < yN −1 , e che approssima per difetto f . L’integrale di f è allora l’estremo superiore di questi numeri. La teoria risultante ha notevolissimi vantaggi rispetto a quella di Riemann. Per esempio, la classe delle funzioni integrabili è molto più ampia: una funzione
B.1 Misura di Lebesgue
595
integrabile secondo Riemann è sempre integrabile anche secondo Lebesgue (e il valore dei due integrali coincide), ma non è vero il viceversa; inoltre non c’è bisogno di distinzione tra insiemi limitati e non, tra funzioni limitate e non. Un aspetto più rilevante è che le operazioni di passaggio al limite e di derivazione sotto il segno di integrale, nonchè di integrazione per serie, sono significativamente semplificate. Inoltre, gli spazi di funzioni sommabili secondo Lebesgue costituiscono gli ambienti funzionali più comunemente usati in un grande numero di questioni teoriche ed applicate. Infine, la costruzione della misura e dell’integrale di Lebesgue può essere notevolmente generalizzata, come accenneremo nel Paragrafo B.1.5. Per le dimostrazioni dei teoremi enunciati in questa Appendice, il lettore interessato può consultare, per esempio, Rudin, 1964 e 1974, Royden, 1988, Pagani e Salsa, vol II, 1991 o Zygmund e Weeden, 1977. B.1.2 Misure e funzioni misurabili Che cosa vuol dire introdurre una misura in un insieme Ω? Una misura è da considerarsi una funzione d’insieme, nel senso che è definita su una particolare classe di sottoinsiemi, detti misurabili, e che deve “comportarsi bene” rispetto alle operazioni insiemistiche fondamentali: unione, intersezione e complementare. Cominciamo introducendo le classi di sottoinsiemi più adatte allo scopo: le σ−algebre. Definizione B.1. Una famiglia F di sottoinsiemi di Ω si chiama σ-algebra se: i) ∅, Ω ∈ F, ii) A ∈ F implica Ω\A ∈ F , iii) se {Ak }k∈N ⊂ F allora anche ∪Ak e ∩Ak appartengono a F. Esempio B.1. Se Ω = Rn , la più piccola σ−algebra B che contiene tutti i sottoinsiemi aperti di Rn si chiama σ−algebra di Borel. I suoi elementi sono detti insiemi di Borel o boreliani e tipicamente si ottengono da unioni e/o intersezioni di un’infinità al più numerabile di aperti. Definizione B.2. Data una σ−algebra F in un insieme Ω, una misura su F è una funzione μ:F →R tale che: i)
μ (A) ≥ 0 per ogni A ∈ F,
ii)
se A1 , A2 , ...sono insiemi a due a due disgiunti in F, allora μ (∪k≥1 Ak ) =
k≥1
μ (Ak )
(σ − additività).
Gli elementi di F si chiamano insiemi F−misurabili.
596
Appendice B Misure e integrali
Il seguente teorema stabilisce l’esistenza in Rn di una σ−algebra M, che contiene B, e di una misura su M, tale che la misura degli insiemi che conosciamo fin dall’infanzia corrisponda a quella abituale: alla lunghezza per gli intervalli contenuti in R, all’area per le figure piane standard, al volume per i ... solidi noti in R3 . Teorema B.1. In Rn esiste una σ−algebra M e una misura |·|n : M → [0, +∞] con le seguenti proprietà: 1. ogni insieme aperto, e quindi ogni insieme chiuso, appartiene a M, 2. se A ∈ M ed A ha misura nulla, ogni sottoinsieme di A appartiene a M e ha misura nulla, 3. se A = {x ∈Rn : aj < xj < bj ; j = 1, ..., n} Bn allora |A| = j=1 (bj − aj ) . Gli elementi di M sono gli insiemi misurabili secondo Lebesgue e |·|n (o semplicemente |·| se non c’è pericolo di confusione) si chiama misura n−dimensionale di Lebesgue. Lavorando in Rn , sarà sottointeso che misurabile significherà misurabile secondo Lebesgue, salvo avviso contrario. Non tutti i sottoinsiemi di Rn sono misurabili. Tuttavia, i sottoinsiemi non misurabili sono piuttosto 1 ... patologici! Gli insiemi di misura nulla sono piuttosto importanti. Eccone alcuni esempi: gli insiemi costituiti da un’infinità numerabile di punti, come l’insieme Q dei numeri razionali; in R2 , rette e archi di curva regolari ; in R3 , rette, piani e loro sottoinsiemi, curve e superfici regolari. Si noti che una segmento di retta ha misura nulla in R2 , ma naturalmente non in R. Sia A ∈ M. Si dice che una proprietà vale quasi ovunque in A o per quasi ogni punto di A (in breve q.o. in A) se è vera in tutti i punti di A tranne che in un sottoinsieme di misura nulla. Per esempio, la successione fk (x) = exp (−n |sin x|) converge a zero q.o. in R; una funzione Lipschitziana è differenziabile q.o. nel suo dominio (Teorema 1.1, di Rademacher). L’integrale di Lebesgue è definito per funzioni misurabili ; la proprietà che le caratterizza è che la controimmagine di ogni insieme chiuso è misurabile. Definizione B.3. Sia A ⊆ Rn misurabile e f : A → R. Si dice che f è misurabile se f −1 (C) è misurabile per ogni insieme chiuso C ⊂ R. Naturalmente, invece degli insiemi chiusi, nella definizione B.3 si potrebbero usare equivalentemente gli aperti. 1
Rudin, 1974 o Pagani e Salsa, 1991.
B.2 Integrale di Lebesgue
597
Sono per esempio misurabili: le funzioni continue; somme e prodotti di funzioni misurabili; la composizione g ◦ f se f è continua e g misurabile; limiti puntuali di successioni di funzioni misurabili. Per una funzione f : A → R, misurabile, possiamo definire il suo estremo superiore essenziale: ess sup f = inf {K : f ≤ K q.o. in A} . Si noti che, se f = χQ , la funzione caratteristica dei razionali, si ha sup f = 1, ma esssup f = 0, essendo |Q| = 0. Ogni funzione misurabile può essere approssimata da funzioni semplici. Una funzione s: A ⊆ Rn → R si dice semplice se assume un numero finito di valori s1 , ..., sN , in corrispondenza a insiemi misurabili A1 , ..., AN , contenuti in A. Introducendo le funzioni caratteristiche χAj , si può scrivere una funzione semplice nella forma
N s= sj χAj . j=1
Vale il seguente Teorema B.2. Sia f : A → R, misurabile. Esiste una successione {sk } di funzioni semplici convergente ad f in ogni punto di A. Se inoltre f ≥ 0, si può scegliere {sk } monotona non decrescente.
B.2 Integrale di Lebesgue Possiamo ora definire l’integrale di Lebesgue di una funzione N misurabile su un insieme A misurabile. Per una funzione semplice s = j=1 sj χAj definiamo s= A
N
sj |Aj |
j=1
con la convenzione che se sj = 0 e |Aj | = +∞, sj |Aj | = 0. Se f ≥ 0 è misurabile, definiamo f = sup s A
A
dove l’estremo superiore è calcolato al variare di s tra tutte le funzioni semplici s tali che s ≤ f in A. In generale, se f è misurabile, scriviamo f = f + − f − , dove f + = max {f, 0} e f − = max {−f, 0} sono le parti positiva e negativa di f , rispettivamente. Definiamo poi f= f+ − f− A
A
A
598
Appendice B Misure e integrali
a condizione che almeno uno dei due integrali a secondo membro sia finito. Se entrambi gli integrali sono finiti, la funzione f si dice integrabile o sommabile in A. Dalla definizione, segue subito che una funzione misurabile f è integrabile se e solo se |f | è integrabile. Tutte le funzioni Riemann integrabili su un insieme A sono anche Legesgue integrabili. Un esempio interessante di funzione non integrabile in (0, +∞) è h (x) = sin x/x. Infatti si può provare che2
+∞
0
|sin x| dx = +∞. x
Osserviamo che, viceversa, l’integrale di Riemann generalizzato di h esiste finito e infatti si può provare che N sin x π lim dx = . N →+∞ 0 x 2 L’insieme delle funzioni integrabili in A si indica con L1 (A). Se identifichiamo due funzioni quando sono uguali q.o. in A, L1 (A) diventa uno spazio di Banach con la norma f L1 (A) = |f | . A
L1loc
Indichiamo con (A) l’insieme delle funzioni localmente sommabili, cioè sommabili in ogni sottoinsieme compatto di A. Alcuni teoremi fondamentali I seguenti teoremi sono tra i più importanti e utili nella teoria dell’integrazione. Teorema B.3 (della convergenza dominata). Sia {fk } una successione di funzioni integrabili in A tali che: i) fk → f q.o. in A, ii) esiste una funzione g ≥ 0, integrabile in A e tale che |fk | ≤ g q.o. in A. Allora f ∈ L1 (A) e fk converge ad f in L1 (A), cioè fk − f L1 (A) → 0 In particolare
lim
k→∞ 2
per k → +∞.
fk = A
f. A
Si può scrivere
+∞ 0
kπ ∞ kπ ∞ ∞ |sin x| |sin x| 1 2 |sin x| dx = dx = dx ≥ = +∞. x x kπ kπ (k−1)π k=1 (k−1)π k=1 k=1
B.2 Integrale di Lebesgue
599
Se fk converge ad f in L1 (A) non è detto che fk converga puntualmente q.o. ad f , tuttavia ciò è vero per almeno una sottosuccessione. Infatti, si ha: Teorema B.4. Sia {fk } una successione di funzioni integrabili in A tali che fk − f L1 (A) → 0 per k → +∞. Allora esiste una sottosuccessione fkj tale che fkj → f q.o. per j → +∞. Una situazione che si incontra spesso in questo libro è la seguente. Sia f ∈ L1 (A) e, per ε > 0, poniamo Aε = {x ∈ A: |f (x)| > ε}. Allora abbiamo f→ f per ε → 0. Aε
A
Questo segue dal Teorema B.3 poiché, per ogni successione εk → 0, abbiamo |fk | = |f | χAε ≤ |f | e fk → f in ogni punto di A. Pertanto k
f= Aεk
A
f χAε →
per ε → 0.
f
k
A
Teorema B.5 (della convergenza monotona). Sia {fk } una successione di funzioni misurabili e non negative in A tali che f1 ≤ f2 ≤ ... ≤ fk ≤ fk+1 ≤ ... .
Allora lim
k→∞
fk =
A
lim fk .
A k→∞
Sia C0 (A) l’insieme delle funzioni continue in A, a supporto compatto. Un fatto molto importante è che ogni funzione sommabile può essere approssimata in norma L1 (A) da una funzione in C0 (A). Teorema B.6 (di densità). Sia f ∈ L1 (A). Allora, per ogni δ > 0, esiste una funzione g ∈ C0 (A) tale che f − gL1 (A) < δ. Il teorema fondamentale del calcolo si estende all’integrale di Lebesgue nella forma seguente. Teorema B.7 (di differenziazione). Sia f : Rn → R, localmente integrabile. Allora, per quasi ogni x ∈Rn , 1 f → f (x) , se r → 0. |Br (x)| Br (x) In particolare, se f ∈ L1 (R), x d f (t) dt = f (x) dx a
q.o. x ∈ R.
600
Appendice B Misure e integrali
Lo scambio dell’ordine di integrazione può essere effettuato sotto la semplice ipotesi di integrabilità. Siano I1 = {x ∈Rn : −∞ ≤ ai < xi < bi ≤ ∞; i = 1, ..., n} e I2 = {y ∈Rm : −∞ ≤ aj < yj < bj ≤ ∞; j = 1, ..., m} . Teorema B.8 (di Fubini). Sia f integrabile su I = I1 ×I2 ⊂ Rn+m . Allora 1. per quasi ogni x ∈I1", f (x, y) è misurabile in I2 come funzione di y; 2. come funzione di x, I2 f (x, y) dy è misurabile in I1 e vale la formula f (x, y) dxdy = dx f (x, y) dy. I
I1
I2
Se f ∈ L1 (BR (p)) vale la seguente formula, che può essere considerata una versione del Teorema di Fubini, in coordinate polari: R f (x) dx = ds f (σ) dσ. (B.1) 0
BR (p)
∂Bs (p)
Ne segue che, per quasi ogni r ∈ (0, R) si ha: d f (x) dx = f (σ) dσ. dr Br (p) ∂Bs (p)
B.3 Integrali rispetto a una misura qualunque L’integrale di Lebesgue è definito per funzioni misurabili ; la proprietà che le caratterizza è che la controimmagine di ogni insieme chiuso è misurabile. La definizione si può estendere ad un contesto molto generale. Sia F una σ−algebra in un insieme Ω. Definizione B.4. Sia A ⊆ Ω un insieme F−misurabile e f : A → R. Si dice che f è F−misurabile se f −1 (C) ∈ F per ogni insieme chiuso C ⊂ R. Sia ora μ : F → R una misura. Con la stessa procedura usata per definire l’integrale di Lebesgue possiamo definire l’integrale rispetto a μ di una funzione f che sia F−misurabile. N Descriviamo brevemente i passi principali. Se f è semplice, cioè f = j=1 sj χAj , poniamo
N f dμ = sj μ(Aj ). j=1
A
Se f ≥ 0 definiamo ! f dμ = sup s dμ : s ≤ f , s semplice . A
A
B.3 Integrali rispetto a una misura qualunque
601
Infine, se f = f + − f − , definiamo f dμ = f + dμ − f − dμ A
A
A
posto che almeno uno degli inegrali a secondo membro sia finito. Misure di notevole importanza sono le misure di probabilità. In questo contesto le funzioni misurabili sono le variabili aleatorie. Una misura di probabilità P su F è una misura nel senso delle Definizione B.2, tale che P (Ω) = 1 e P : F → [0, 1] . La terna (Ω, F, P ) prende il nome di spazio di probabilità. Gli elementi ω di Ω si interpretano come eventi elementari, mente gli insiemi A ∈ F rappresentano gli eventi e P (A) è la probabilità che A si verifichi. Un esempio tipico è la terna Ω = [0, 1] , F = M ∩ [0, 1] , P (A) = |A| che modella la scelta a caso (cioè uniforme) di un punto in [0, 1]. Una variabile aleatoria uni-dimensionale in (Ω, F, P ) è una funzione X:Ω→R F-misurable. Per esempio, il numero k di passi a destra dopo N passi nella passeggiata aleatoria della Sezione 2.4 è una variabile aleatoria. Qui Ω è l’insieme dei cammini di N passi. Se |X| dP < ∞, Ω
l’integrale
E (X) = X =
X dP Ω
è detto valore atteso (expectation) di X, mentre 2 (X − E (X)) dP Var (X) = Ω
è la varianza di X. Per variabili aleatorie n−dimensionali, X : Ω → Rn , lavorando componente per componente, si possono dare definizioni analoghe.
Appendice C Identità e formule
Raggruppiamo alcune formule e identità di uso frequente.
C.1 Gradiente, divergenza, rotore, Laplaciano Siano F un campo vettoriale e f uno scalare, regolari in R3 . Coordinate cartesiane ortogonali 1. gradiente: ∇f =
∂f ∂f ∂f i+ j+ k, ∂x ∂y ∂z
2. divergenza: ∇·F=
∂ ∂ ∂ Fx + Fy + Fz , ∂x ∂y ∂z
3. Laplaciano: Δf = 4. rotore:
∂2f ∂2f ∂2f + 2 + 2, 2 ∂x ∂y ∂z
i j k ∇ × F = ∂x ∂y ∂z . Fx Fy Fz
Coordinate cilindriche x = r cos θ, y = r sin θ, z = z
(r > 0, 0 ≤ θ ≤ 2π)
er = cos θi + sin θj, eθ = − sin θi + cos θj, ez = k. Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
604
Appendice C Identità e formule
1. gradiente: ∂f 1 ∂f ∂f er + eθ + ez , ∂r r ∂θ ∂z 2. divergenza (F = Fr er + Fθ eθ + Fz k): ∇f =
∇·F=
1 ∂ 1 ∂ ∂ (rFr ) + Fθ + Fz , r ∂r r ∂θ ∂z
3. Laplaciano: ∂2f 1 ∂f 1 ∂2f 1 ∂ ∂2f + + 2 2 + 2 = Δf = 2 ∂r r ∂r r ∂θ ∂z r ∂r
∂f r ∂r
+
∂2f 1 ∂2f + 2, 2 2 r ∂θ ∂z
er reθ ez 1 ∇ × F = ∂r ∂θ ∂z . r Fr rFθ Fz
4. rotore:
Coordinate sferiche x = r cos θ sin ψ, y = r sin θ sin ψ, z = r cos ψ (r > 0, 0 ≤ θ ≤ 2π, 0 ≤ ψ ≤ π) er = cos θ sin ψi + sin θ sin ψj + cos ψk eθ = − sin θi + cos θj ez = cos θ cos ψi + sin θ cos ψj − sin ψk. 1. gradiente: ∇f =
∂f 1 ∂f 1 ∂f er + eθ + eψ , ∂r r sin ψ ∂θ r ∂ψ
2. divergenza (F = Fr er + Fθ eθ + Fψ eψ ): ∂ 2 1 1 ∂Fθ ∂Fψ ∇·F= F r + Fr + + + cot ψFψ , ∂r r r sin ψ ∂θ ∂ψ ./ 0 ./ 0 parte radiale
parte sferica
3. Laplaciano: Δf =
! ∂2f ∂f 2 ∂f 1 1 ∂2f ∂2f + + + + cot ψ , 2 2 2 2 ∂ψ ∂ψ 2 -∂r ./ r ∂r0 r - (sin ψ) ∂θ ./ 0 parte radiale
4. rotore:
parte sferica (operatore di Laplace-Beltrami)
er reψ r sin ψeθ 1 ∂r ∂ψ ∂θ . ∇×F= 2 r sin ψ Fr rFψ r sin ψFz
C.2 Identità e formule
605
C.2 Identità e formule C.2.1 Formule di Gauss Siano, in Rn , n ≥ 2: • Ω dominio limitato con frontiera regolare ∂Ω e normale esterna ν, • u, v campi vettoriali regolari fino alla frontiera di Ω, • ϕ, ψ campi scalari regolari fino alla frontiera di Ω, • dσ l’elemento di superficie su ∂Ω. Valgono le seguenti formule: 1. 2. 3. 4. 5. 6. 7. 8.
"
" ∇ · u dx = ∂Ω u · ν dσ (formula della divergenza), " " ∇ϕ dx = ∂Ω ϕν dσ, Ω " " " Δϕ dx = ∂Ω ∇ϕ · ν dσ = ∂Ω ∂ν ϕ dσ, Ω " " " ψ ∇ · F dx = ∂Ω ψF · ν dσ − Ω ∇ψ · F dσ (integrazione per parti), Ω " " " ψΔϕ dx = ∂Ω ψ∂ν ϕ dσ − Ω ∇ϕ · ∇ψ dx (identità di Green I), Ω " " (ψΔϕ − ϕΔψ) dx = ∂Ω (ψ∂ν ϕ −ϕ∂ν ψ) dσ (identità di Green II), Ω " " ∇ × u dx = − ∂Ω u × ν dσ, Ω " " " u · (∇ × v) dx = Ω v · (∇ × u) dx− ∂Ω (u × v) · ν dσ. Ω Ω
C.2.2 Formule di Stokes Consideriamo in R3 : • S una superficie regolare, il cui bordo è una linea regolare C, • ν versore normale a S, t versore tangente a C, tali che C sia orientata positivamente rispetto a S (avanzando in direzione e verso di ν e ruotando nella direzione e verso di t si simula il movimento di una vite destrorsa), • ds l’elemento di lunghezza su C, • dσ l’elemento di superficie su S. Valgono le seguenti formule: 1.
" "
S
∇ × u · ν dσ =
" "C
u · t ds
∇ϕ × ν dσ = − C ϕt ds, " 3. C ϕ∇ψ · t ds = C ψ∇ϕ · t ds.
2.
"S
(formula del rotore),
606
Appendice C Identità e formule
C.2.3 Identità vettoriali 1. 2. 3. 4. 5. 6. 7. 8. 9.
∇ · (∇ × u) = 0, ∇ × ∇ϕ = 0, ∇ · (ϕu) = ϕ ∇ · u + ∇ϕ · u, ∇ × (ϕu) = ϕ ∇ × u + ∇ϕ × u, ∇ × (u × v) = (v·∇) u − (u·∇) v + (∇ · v) u − (∇ · u) v, ∇ · (u × v) = (∇ × u) · v − (∇ × v) · u, ∇ (u · v) = u×(∇ × v) + v× (∇ × u) + (u·∇) v+ (v·∇) u, 2 (u·∇) u = (∇ × u) × u + 12 ∇ |u| , ∇ × ∇ × u = ∇(∇ · u) − Δu (rot rot = grad div− Laplaciano).
Bibliografia
Equazioni a derivate parziali L. C. Evans. Partial Differential Equations. A.M.S., Graduate Studies in Mathematics, 1998. R. Dautray, J. L. Lions. Mathematical Analysis and Numerical Methods for Science and Technology. Vol. 1-5. Springer-Verlag, Berlin Heidelberg, 1985. E. DiBenedetto, Partial Differential Equations. Birkhäuser, Boston, 1995. A. Friedman. Partial Differential Equations of parabolic Type. Prentice-Hall, Englewood Cliffs, 1964. D. Gilbarg, N. Trudinger. Elliptic Partial Differential Equations of Second Order. II ed., Springer-Verlag, Berlin Heidelberg, 1998. F. John. Partial Differential Equations. IV ed., Springer-Verlag, New York, 1982. O. Kellog. Foundations of Potential Theory. Springer-Verlag, New York, 1967. G. M. Lieberman. Second Order Parabolic Partial Differential Equations. World Scientific, Singapore, 1996. J. L. Lions, E. Magenes. Non-homogeneous Boundary Value Problems and Applications. Springer-Verlag, New York, 1972. R. Mc Owen. Partial Differential Equations: Methods and Applications. Prentice-Hall, New Jersey, 1996. M. Protter, H. Weinberger. Maximum Principles in Differential Equations. Prentice-Hall, Englewood Cliffs, 1984. J. Rauch. Partial Differential Equations. Springer-Verlag, Heidelberg, 1992. M. Renardy, R. C. Rogers. An Introduction to Partial Differential Equations. Springer-Verlag, New York, 1993. J. Smoller. Shock Waves and Reaction-Diffusion Equations. Springer-Verlag, New York, 1983. W. Strauss. Partial Differential Equation: An Introduction. Wiley, New York, 1992. D. V. Widder. The Heat Equation. Academic Press, New York, 1975.
Salsa S: Equazioni a derivate parziali, 2a edizione. c Springer-Verlag Italia 2010, Milano
608
Bibliografia
Modelli matematici e matematica applicata A. J. Acheson. Elementary Fluid Dynamics. Clarendon Press, Oxford, 1990. G. I. Barenblatt. Scaling, Self-similarity, and intermediate asymptotics, Cambridge University Press, 2002. J. Billingham, A. C. King. Wave Motion. Cambridge University Press, Cambridge, 2000. R. Courant, D. Hilbert. Methods of Mathematical Phisics. Vol. 1 e 2. Wiley, New York, 1953. R. Dautray, J. L. Lions. Mathematical Analysis and Numerical Methods for Science and Technology. Vol. 1-5. Springer-Verlag, Berlin Heidelberg, 1985. C. C. Lin, L. A. Segel. Mathematics Applied to Deterministic Problems in the Natural Sciences. SIAM Classics in Applied Mathematics, IV ed., 1995. J. D. Murray. Mathematical Biology (Vol I e II). Springer-Verlag, Berlin Heidelberg, 2001. L. A. Segel. Mathematics Applied to Continuum Mechanics. Dover Publications, Inc., New York, 1987. A. B. Tayler. Mathematical Models in Applied Mathematics. Clarendon Press, Oxford, 2001. G. B. Whitham. Linear and Nonlinear Waves. Wiley-Interscience, 1974.
Equazioni stocastiche e Finanza Matematica L. Arnold. Stochastic Differential Equations: Theory and Applications. Wiley, New York, 1974. M. Baxter, A. Rennie. Financial Calculus: An Introduction to Derivative Pricing. Cambridge University Press, Cambridge, 1996. L. C. Evans, An Introduction to Stochastic Differential Equations. Lecture Notes, http://math.berkeley.edu/ ∼ evans/ B. K. Øksendal. Stochastic Differential Equations: An Introduction with Applications. IV ed., Springer-Verlag, Berlin Heidelberg, 1995. P. Wilmott, S. Howison, J. Dewinne. The Mathematics of Financial Derivatives. A Student Introduction. Cambridge University Press, Cambridge, 1996.
Analisi e Analisi Funzionale R. Adams. Sobolev Spaces. Academic Press, New York, 1975. H. Brezis. Analisi Funzionale. Liguori Editore, Napoli, 1986. L. C. Evans and R. F. Gariepy. Measure Theory and Fine properties of Functions. CRC Press, 1992. V. G. Maz’ya. Sobolev Spaces. Springer-Verlag, Berlin Heidelberg, 1985. C. Pagani e S. Salsa. Analisi Matematica. volumi I e II. Zanichelli, Bologna, 1991.
Bibliografia
609
W. Rudin. Real and Complex Analysis (2th ed). McGraw-Hill, New York, 1974. L. Schwartz. Théorie des Distributions. Hermann, Paris, 1966. K. Yoshida. Functional Analysis. Springer-Verlag, Berlin Heidelberg, 1965.
Analisi Numerica R. Dautray, J. L. Lions. Mathematical Analysis and Numerical Methods for Science and Technology. Vol. 4 e 6. Springer-Verlag, Berlin Heidelberg, 1985. A. Quarteroni. Modellistica Numerica per Problemi Differenziali. 4 ed., Springer-Verlag Italia, Milano, 2008. A. Quarteroni, A. Valli. Numerical Approximation of Partial Differential Equations. Springer-Verlag, Berlin Heidelberg, 1994.
Indice analitico
Arbitraggio, 91 Autofunzioni – di Dirichlet, 489 – di Neumann, 491 Autovalori, 357 Barriera – inferiore, 517 – superiore, 517 Barriere – assorbenti, 110 – riflettenti, 110 Breaking time, 198
Cono – di luce, 236 – forward, 305 – retrogrado, 292 Conservazione della massa, 64 Controllo ottimo, 526 Convergenza – debole, 383 – uniforme, 11 Convezione, 65 Convoluzione, 414, 430 Copertura aperta, 456 Crescita logistica, 104
Caratteristiche, 179, 217, 283 – Inflow/outflow, 183 Carta locale, 15 Chiusura, 8, 341 Classe di Tychonov, 85 Coefficiente di diffusione, 56 Coefficienti di Fourier, 12, 356 Compatto – operatore, 386 Condizione – cinematica, 315 – di compatibilità, 120 – di entropia, 206 – di Sommerfeld, 175 Condizioni al bordo – Dirichlet, 24, 35 – Mixed, 36 – Neumann, 24, 35 – Robin, 35
Debolmente coerciva, 391, 404, 498, 501, 554 Densità normale, 45 Derivata – conormale, 500 – nel senso delle distribuzioni, 421 Derivazione per serie, 11 Diffusione, 19 Dilatazioni paraboliche, 21 Dimensione fisica, 587 Distribuzione – lognormale, 91 – temperata, 434 Disuguaglianza – di Poincaré, 467 – di traccia, 465 – di Schwarz, 348 Domini – Lipschitziani, 16
612
Indice analitico
– esterni, 158 Dominio, 8 – di influenza, 305 – regolare, 15 Drift, 88 Ellitticità uniforme, 493, 559 Energia – cinetica, 253 – potenziale, 254 Equazione – a derivate parziali, 2 – backward, 93 – Bessel, 74, 360 – biarmonica, 522 – di Bernoulli, 314 – di Black-Scholes, 93 – di Bukley-Leverett, 229 – di Eulero, 376 – di Fisher, 567 – di Fisher stazionaria, 517 – di Helmoltz, 175 – di Klein-Gordon, 274 – di Navier-Stokes, 148, 520 – di Poisson semilineare, 515 – differenziale stocastica, 89 – diffusione, 19 – eikonale, 236 – ellittica, 276, 479 – iperbolica, 276, 573 – mezzi porosi, 102 – parabolica, 276 – parametrica di Bessel (di ordine p), 360 Equazioni – di Sturm-Liouville, 357 – paraboliche, 541 Esponente coniugato, 11 Estremo – inferiore, 9 – superiore, 9 Expiry date, 87 Final payoff, 93 Forma bilineare – coerciva, 370, 371 – continua, 371 – debolmente coerciva, 391, 554, 560 Forma canonica, 280–282
– sesquilineare, 347 Formula – di Bessel, 13 – di d’Alembert, 262 – di Ito, 89 – di Parseval, 13 – di Poisson, 132 – di Rodrigues, 358, 359 – di scomposizione di Helmholtz, 145 Formulazione debole – equazione delle onde, 575 – per equazioni paraboliche, 561 – problema di Cauchy-Dirichlet, 544 – problema di Cauchy-Neumann, 555 Formulazione variazionale – equazione biarmonica, 520 – problema di Dirichlet, 484 – problema di Neumann, 487, 500 – problema misto, 504 – sistema di Stokes, 523 Funzionale costo, 526 Funzione – a supporto compatto, 10 – armonica, 20, 117 – caratteristica, 10 – continua, 10 – di Bessel, 288, 360 – di Green, 151 – di Neumann, 157 – di transizione, 70 – flusso, 177 – test, 51, 413 – valore, 88 Funzioni – integrabili, 598 – misurabili, 596 – semplici, 597 Gram-Schmidt (procedimento di), 356 Identità – di Green, 17 – di Parseval debole, 436 – di Parseval forte, 439 Immagine, 361 Impulso unitario, 47 Inflow/outflow boundary, 225 Insieme – compatto, 8
Indice analitico – compatto, precompatto, 380 – convesso, 8 – denso, 8 – limitato, 8 Insiemi di Borel, 595 Integrale primo, 224 Integrazione – per parti, 17 – per serie, 11 Lagrange multiplier, 525 Legge – del parallelogramma, 347 – di Darcy, 101 – di Fick, 65 – di Fourier, 23 – di Gauss, 59 Massa critica, 76 Matrice di rigidezza, 378 Media quadratica, 31 Metodo, 26 – della discesa, 308 – della fase stazionaria, 249 – delle caratteristiche, 187 – delle immagini, 152 – di Duhamel, 82 – di Faedo-Galerkin, 561, 576 – di Galerkin, 377 – di linearizzazione, 569 – di riflessione, 456 – di separazione delle variabili, 26, 28, 256, 295, 397 – di viscosità, 209 Misura – armonica, 138 – di Lebesgue, 596 – di probabilità, 601 Moto Browniano, 57 Norma integrale di ordine p, 345 Nucleo, 361 – di Poisson, 155 Numero – di Bond, 317 – di Froude, 317 – di Mach, 299 – di Reynolds, 521 – d’onde, 246
o piccolo, 10 Onda – di rarefazione, 192 – progressiva, 179, 188 – stazionaria, 257 Onde – armoniche, 246 – cilindriche, 288 – di capillarità, 321 – di gravità, 321 – piane, 247, 287 – progressive, 209, 245 – sferiche, 247, 288 Operatore – aggiunto, 368 – autoaggiunto, 369 – di estensione, 455 – di Laplace discreto, 121 – di media, 121 – lineare, 361 – lineare limitato, 362 Opzioni Europee, 87 Oscillatore armonico, 408 Pacchetto d’onde, 248 Parallelogramma caratteristico, 264 Partizione dell’unità, 456 Passeggiata aleatoria con deriva, 61 Polinomi – di Chebyshev, 358 – di Hermite, 359 – di Legendre, 358 Portafoglio auto-finanziante, 91, 99 Potenziale, 117 – di doppio strato, 161 – di strato semplice, 166 – logaritmico, 144 – Newtoniano, 142 Principio – di Hopf, 173 – di Huygens forte, 305, 308 – di massimo, 37, 85, 122 – di massimo forte, 39 – di riflessione di Schwarz, 172 – di sovrapposizione, 20, 78, 372 Probabilità – di fuga, 137 – di transizione, 59
613
614
Indice analitico
Problema – aggiunto, 529 – agli autovalori, 29 – di Cauchy globale, 25, 77 – di controllo, 526 – di Dirichlet esterno, 158 – di Riemann, 207 – esterno di Neumann/Robin, 160 – esterno di Robin, 175 Processo stocastico, 57 Prodotto interno, 346 Proprietà – di Markov, 59, 70 – di media, 125 Punto, 8 – di frontiera, 8 – interno, 8 – limite, 8 Put-call parity, 97 Reazione, 67 Regione di transizione, 211 Relazione di dispersione, 248, 274, 319 Reticolo, 120 Risolvente, 396, 398 Serie di Fourier, 30 – convergenza in media quadratica, 13 – convergenza puntuale, 13 – convergenza uniforme, 14 Serie di Fourier-Bessel, 75, 361 Sigma algebra, 595 Sistema – caratteristico di Stokes, 232 Soluzione, 28 – classica, 482 – debole o variazionale, 482 – di autosimilarità, 44, 102 – di Barenblatt, 102 – distribuzionale, 482 – fondamentale, 46, 50, 142, 303 – forte, 482 – stazionaria, 28 – unit source, 49 Somma diretta, 352 Sotto o sopra soluzioni deboli, 506, 507, 565 Spazio – metrico, 340 – normato, 340
– pre-hilbertiano, 346 – topologico, 340 Spettro – di una matrice, 396 Stabilità, stabilità asintotica – equazione delle onde, 569 Stato ottimo, 526 Stazionaria, 247 Steepest descent, 531 Strike price, 87 Striscia caratteristica, 232 Successione di Cauchy, 341 Superficie integrale, 216 Supporto, 10 – di una distribuzione, 420 – essenziale, 413 Tempo – d’arresto, 60, 135 – di prima uscita, 135 Teorema – della convergenza dominata, 598 – della convergenza monotona, 599 – di Approssimazione di Weierstrass, 80 – di Buckingham, 590 – di differenziazione, 599 – di Fubini, 600 – Pi di Buckingham, 43 Terna Hilbertiana, 391 Test di Weierstrass, 11 Topologia indotta, 9 Traccia, 458 Traffico in un tunnel, 241 Traiettoria Browniana, 57 Trasformata di Fourier, 436, 452 Trasformazione di Hopf-Cole, 214 Valore atteso, 601 Variabile aleatoria, 57 – della convergenza dominata, 601 Varianza, 601 Variazione prima, 376 Velocità – di fase, 246 – di gruppo, 248 – locale dell’onda, 188 Volatilità, 89 Weierstrass test, 31
Collana Unitext - La Matematica per il 3+2 a cura di A. Quarteroni (Editor-in-Chief) P. Biscari C. Ciliberto G. Rinaldi W.J. Runggaldier Volumi pubblicati. A partire dal 2004, i volumi della serie sono contrassegnati da un numero di identificazione. I volumi indicati in grigio si riferiscono a edizioni non più in commercio. A. Bernasconi, B. Codenotti Introduzione alla complessità computazionale 1998, X+260 pp, ISBN 88-470-0020-3 A. Bernasconi, B. Codenotti, G. Resta Metodi matematici in complessità computazionale 1999, X+364 pp, ISBN 88-470-0060-2 E. Salinelli, F. Tomarelli Modelli dinamici discreti 2002, XII+354 pp, ISBN 88-470-0187-0 S. Bosch Algebra 2003, VIII+380 pp, ISBN 88-470-0221-4 S. Graffi, M. Degli Esposti Fisica matematica discreta 2003, X+248 pp, ISBN 88-470-0212-5 S. Margarita, E. Salinelli MultiMath - Matematica Multimediale per l’Università 2004, XX+270 pp, ISBN 88-470-0228-1
A. Quarteroni, R. Sacco, F.Saleri Matematica numerica (2a Ed.) 2000, XIV+448 pp, ISBN 88-470-0077-7 2002, 2004 ristampa riveduta e corretta (1a edizione 1998, ISBN 88-470-0010-6) 13. A. Quarteroni, F. Saleri Introduzione al Calcolo Scientifico (2a Ed.) 2004, X+262 pp, ISBN 88-470-0256-7 (1a edizione 2002, ISBN 88-470-0149-8) 14. S. Salsa Equazioni a derivate parziali - Metodi, modelli e applicazioni 2004, XII+426 pp, ISBN 88-470-0259-1 15. G. Riccardi Calcolo differenziale ed integrale 2004, XII+314 pp, ISBN 88-470-0285-0 16. M. Impedovo Matematica generale con il calcolatore 2005, X+526 pp, ISBN 88-470-0258-3 17. L. Formaggia, F. Saleri, A. Veneziani Applicazioni ed esercizi di modellistica numerica per problemi differenziali 2005, VIII+396 pp, ISBN 88-470-0257-5 18. S. Salsa, G. Verzini Equazioni a derivate parziali -Complementi ed esercizi 2005, VIII+406 pp, ISBN 88-470-0260-5 2007, ristampa con modifiche 19. C. Canuto, A. Tabacco Analisi Matematica I (2a Ed.) 2005, XII+448 pp, ISBN 88-470-0337-7 (1a edizione, 2003, XII+376 pp, ISBN 88-470-0220-6) 20. F. Biagini, M. Campanino Elementi di Probabilità e Statistica 2006, XII+236 pp, ISBN 88-470-0330-X
21. S. Leonesi, C. Toffalori Numeri e Crittografia 2006, VIII+178 pp, ISBN 88-470-0331-8 22. A. Quarteroni, F. Saleri Introduzione al Calcolo Scientifico (3a Ed.) 2006, X+306 pp, ISBN 88-470-0480-2 23. S. Leonesi, C. Toffalori Un invito all’Algebra 2006, XVII+432 pp, ISBN 88-470-0313-X 24. W.M. Baldoni, C. Ciliberto, G.M. Piacentini Cattaneo Aritmetica, Crittografia e Codici 2006, XVI+518 pp, ISBN 88-470-0455-1 25. A. Quarteroni Modellistica numerica per problemi differenziali (3a Ed.) 2006, XIV+452 pp, ISBN 88-470-0493-4 (1a edizione 2000, ISBN 88-470-0108-0) (2a edizione 2003, ISBN 88-470-0203-6) 26. M. Abate, F. Tovena Curve e superfici 2006, XIV+394 pp, ISBN 88-470-0535-3 27. L. Giuzzi Codici correttori 2006, XVI+402 pp, ISBN 88-470-0539-6 28. L. Robbiano Algebra lineare 2007, XVI+210 pp, ISBN 88-470-0446-2 29. E. Rosazza Gianin, C. Sgarra Esercizi di finanza matematica 2007, X+184 pp,ISBN 978-88-470-0610-2 30. A. Machì Gruppi - Una introduzione a idee e metodi della Teoria dei Gruppi 2007, XII+349 pp, ISBN 978-88-470-0622-5
31 Y. Biollay, A. Chaabouni, J. Stubbe Matematica si parte! A cura di A. Quarteroni 2007, XII+196 pp, ISBN 978-88-470-0675-1 32. M. Manetti Topologia 2008, XII+298 pp, ISBN 978-88-470-0756-7 33. A. Pascucci Calcolo stocastico per la finanza 2008, XVI+518 pp, ISBN 978-88-470-0600-3 34. A. Quarteroni, R. Sacco, F. Saleri Matematica numerica (3a Ed.) 2008, XVI+510 pp, ISBN 978-88-470-0782-6 35. P. Cannarsa, T. D’Aprile Introduzione alla teoria della misura e all’analisi funzionale 2008, XII+268 pp, ISBN 978-88-470-0701-7 36. A. Quarteroni, F. Saleri Calcolo scientifico (4a Ed.) 2008, XIV+358 pp, ISBN 978-88-470-0837-3 37. C. Canuto, A. Tabacco Analisi Matematica I (3a Ed.) 2008, XIV+452 pp, ISBN 978-88-470-0871-3 38. S. Gabelli Teoria delle Equazioni e Teoria di Galois 2008, XVI+410 pp, ISBN 978-88-470-0618-8 39. A. Quarteroni Modellistica numerica per problemi differenziali (4a Ed.) 2008, XVI+560 pp, ISBN 978-88-470-0841-0 40. C. Canuto, A. Tabacco Analisi Matematica II 2008, XVI+536 pp, ISBN 978-88-470-0873-1
41. E. Salinelli, F. Tomarelli Modelli Dinamici Discreti 2009, XIV+382 pp, ISBN 978-88-470-1075-8 42. S. Salsa, F.M.G. Vegni, A. Zaretti, P. Zunino Invito alle equazioni a derivate parziali 2009, XIV+440 pp, ISBN 978-88-470-1179-3 43. S. Dulli, S. Furini, E. Peron Data mining 2009, XIV+178 pp, ISBN 978-88-470-1162-5 44. A. Pascucci, W.J. Runggaldier Finanza Matematica 2009, X+264 pp, ISBN 978-88-470-1441-1 45. S. Salsa Equazioni a derivate parziali – Metodi, modelli e applicazioni (2a Ed.) 2010, XVI+614 pp, ISBN 978-88-470-1645-3