Emiliano Ippoliti
Inferenze Ampliative Visualizzazione, analogia e rappresentazioni multiple
Emiliano Ippoliti Infere...
12 downloads
315 Views
1MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Emiliano Ippoliti
Inferenze Ampliative Visualizzazione, analogia e rappresentazioni multiple
Emiliano Ippoliti Inferenze ampliative Visualizzazione, analogia e rappresentazioni multiple © 2008 Emiliano Ippoliti Copertina: progetto grafico Studio Ippoliti ISBN: 978-1-4092-0101-4 Finito di stampare nel mese di Marzo 2008 Stampato e distribuito da: Lulu Press, Inc. 860 Aviation Parkway, Suite 300 Morrisville, North Carolina 27560 U.S.A. http://www.lulu.com Proprietà letteraria riservata. È vietata la riproduzione, anche parziale, con qualsiasi mezzo effettuata, compresa la fotocopia, anche a uso interno o didattico, senza l’esplicita autorizzazione dell’Autore.
Inferenze ampliative
Indice del volume
Introduzione
7
Capitolo 1. Le inferenze ampliative
11
1. 2. 3. 4. 5.
Premessa Definizione Non-monotonicità Probabilità Sensibilità alla rappresentazione
Capitolo 2. Visualizzazione e ampliatività 1. Premessa 2. Rappresentazioni visuali ampliative 2.1. Visualizzazione di polinomi di secondo grado a valori interi 2.2. Una prima congettura 2.3. Visualizzazione di serie intere pari e dispari 2.4. Una seconda congettura 3. Osservazioni conclusive
Capitolo 3. Rappresentazioni multiple e ampliatività 1. Premessa 2. Molteplicità di rappresentazioni 2.1. Rappresentazioni multiple e topologia algebrica 2.2. Rappresentazioni multiple e teoria dei nodi 2.3. Rappresentazioni multiple e teoria delle trecce 3. Rappresentazione e oggetti matematici
5
11 12 13 15 17 21 21 26 31 35 36 40 42 45 45 46 49 51 59 65
Indice del volume
Capitolo 4. Analogia e ampliatività 1. 2. 3. 4. 5. 6.
Premessa Definizione Probabilità e analogia Analogia, rappresentazione e scoperta Analogie multiple La concezione euristica dell’analogia
Capitolo 5. Ampliatività e verità 1. Il problema della verità 2. Plausibilità e ampliatività 2.1. Caratterizzazione della plausibilità 2.2. Caratterizzazione dell’inferenza 3. Ampliatività e conoscenza
Bibliografia
67 67 69 72 76 83 87 99 99 101 102 104 107 117
6
Inferenze ampliative
Introduzione
Questo volume fornisce un’analisi delle inferenze ampliative e un percorso tra i metodi di ampliamento della conoscenza. Esso discute sia le proprietà generali di questa forma di ragionamento (v. Cap. 1) sia tre sue significative articolazioni, con un particolare riferimento alla matematica. Il testo analizza inoltre alcuni aspetti epistemologici sollevati dalla natura di queste inferenze in relazione alla verità (v. Cap. 5). Il volume è il risultato sia di una rielaborazione e di un approfondimento di contributi che sono apparsi in sedi diverse (v. Cap. 2 e Cap. 4), sia di contributi originali (v. Cap. 1 e Cap. 3), i quali sono legati da una comune linea di congiunzione: lo studio dei metodi e dei processi mediante i quali produrre davvero nuova conoscenza. Il testo affronta dunque il problema della scoperta scientifica, ossia della costruzione e del raffinamento di metodi mediante cui porre e risolvere problemi e indagare le proprietà degli oggetti matematici. La tesi sostenuta in questo testo è che la conoscenza matematica avanza, si amplia, mediante una moltiplicazione di punti di vista intorno all’oggetto indagato. Per l’esattezza sostengo che esiste una relazione feconda tra la nozione di rappresentazione e quella di ampliatività, in quanto il processo di continua moltiplicazione dei punti di vista avviene proprio mediante la costruzione e la combinazione di nuove e diverse rappresentazioni. Da un lato 7
Introduzione
la costruzione e la combinazione di molteplici rappresentazioni porta a un ampliamento della nostra conoscenza, dall’altro l’ampliamento della conoscenza produce la possibilità di istituire nuove e molteplici rappresentazioni di un oggetto, e così via all’infinito. Questo continuo movimento è alla base dei più rilevanti conseguimenti della matematica. Sosterrò questa tesi esaminando tre tipi d’inferenza ampliativa – la visualizzazione, l’analogia e la combinazione di rappresentazioni – e facendo ricorso a casi tratti dalla teoria dei numeri e dalla topologia, in particolare dalla teoria delle trecce e dalla teoria dei nodi, i quali sono domini nei quali la moltiplicazione euristica di punti di vista mediante l’uso di diverse rappresentazioni è particolarmente evidente e feconda. Il testo intende dunque offrire un contributo allo sviluppo di una concezione euristica della matematica e della filosofia della scienza. La concezione euristica (v. Cellucci 2002) può essere fatta risalire almeno a Descartes, il quale teorizza espressamente la necessità di una logica della scoperta, ossia di un metodo in grado di favorire la scoperta. Secondo la versione moderna della concezione euristica, il compito della matematica e quello della filosofia della matematica non differiscono affatto, in quanto la loro questione centrale è la scoperta, ossia l’indagine sui modi in cui la conoscenza matematica avanza e mediante i quali la scoperta può essere razionalmente perseguita. La filosofia della matematica deve dunque mirare all’ideazione e al raffinamento dei metodi mediante cui porre e risolvere problemi e mediante cui investiga8
Inferenze ampliative
re gli oggetti matematici. Come tento di mostrare nel corso del volume, la matematica avanza, articola il suo processo di ampliamento della conoscenza, mediante la moltiplicazione e interazione di diverse rappresentazioni di un oggetto o di un problema matematico. La costruzione, moltiplicazione e combinazione di diverse rappresentazioni sono strumenti essenziali per il processo di ampliamento poiché esse permettono di introdurre nel corso del processo inferenziale informazioni e dati che non sono contenuti nelle premesse e che sono in qualche modo esterni all’oggetto e al problema esaminato. Questa caratteristica, definibile come sensibilità alla rappresentazione (sensitivity to representation), è cosi cruciale nella matematica, come argomenterò, in virtù della natura stessa della matematica e dei suoi oggetti. Questo libro pertanto presenta: - una filosofia della matematica nella quale la scoperta è trattata come un processo razionale e analitico (in un certo senso di analitico), logicamente e temporalmente non separabile dalla fase della giustificazione, che procede mediante una continua costruzione di molteplici rappresentazioni di oggetti matematici, che originano una moltiplicazione di punti di vista sull’oggetto che produce nuova conoscenza. - una trattazione dell’inferenza ampliativa e degli oggetti matematici basata su una concezione euristica della matematica (v. Cellucci 2002), che considera le entità matematiche come ipotesi per porre e risolvere problemi. Sebbene questo approccio sia sviluppato in riferimento alla 9
Introduzione
matematica, ritengo che sia applicabile e si adatti anche alla trattazione di altri domini scientifici.
10
Inferenze ampliative
1 Le inferenze ampliative
1. Premessa La nozione di ampliatività e di inferenze ampliative rappresentano una frontiera della ricerca logica. Il loro studio e la loro analisi permettono di indagare e render conto dei processi di reale ampliamento della conoscenza, ossia dei processi che consentono di porre e risolvere problemi mediante l’ideazione e il raffinamento di metodi per costruire e valutare ipotesi e per indagare gli oggetti matematici. Le inferenze ampliative, infatti, servono per scoprire e valutare ipotesi mediante processi che introducono e veicolano informazioni e dati che non sono contenuti nel problema affrontato o nell’oggetto indagato e che servono a moltiplicare i punti di vista e le sue possibili rappresentazioni al fine di generare nuova conoscenza. In questo senso, dunque, queste inferenze si distinguono in modo essenziale dalle inferenze non-ampliative, le quali non introducono nuova informazione e non moltiplicano i punti di vista intorno ad un dato oggetto o problema, e anzi rimangono per definizione chiuse all’interno di un particolare punto di vista. La tesi sostenuta in questo testo è che la conoscenza matematica, e in certo senso la conoscenza in generale, si estende e si amplia mediante un processo di continua moltiplicazione dei punti di vista intorno ad un oggetto. Inoltre sostengo e argomento che 11
Capitolo 1. Le inferenze ampliative
questa moltiplicazione di punti di vista avviene mediante la continua costruzione di nuove rappresentazioni dell’oggetto indagato. Certo non per tutti gli oggetti questo processo di moltiplicazione può essere messo in atto e iterato, e anzi esistono oggetti per i quali si possono costruire ben poche rappresentazioni e per i quali si possono dare ben pochi punti di vista (come i numeri naturali), ma in generale questo processo è responsabile degli avanzamenti più profondi e della crescita della conoscenza della matematica.
2. Definizione Con la nozione di ampliatività e di inferenza ampliativa ci si riferisce a una proprietà essenziale del ragionamento. Una definizione comunemente accettata di questo tipo di inferenza è di istituire un nesso tra il contenuto della conclusione e quello delle premesse per effetto del quale il primo non è incluso nel secondo, almeno non per intero. In altre parole le inferenze sono ampliative quando «il contenuto informativo della conclusione non è interamente contenuto in quello delle premesse» 1 , quando l’informazione della conclusione che non è presente nelle premesse o nei dati da cui è stata inferita, e pertanto esse estendono l’informazione fornita nelle loro premesse. Quindi le inferenze ampliative (p. es. le inferenze induttive o 1
Boniolo-Vidali 1999, 222.
12
Inferenze ampliative
le inferenze analogiche) sono davvero in grado, per via della loro stessa natura, di estendere e generare nuova conoscenza, in quanto introducono qualcosa di esterno durante il processo inferenziale. Esse differiscono dunque dalle inferenze non ampliative (ossia quelle deduttive), le quali non sono in grado di estendere davvero la nostra conoscenza, nel senso che tutto ciò che da esse deriva è contenuto nelle informazioni e nei dati forniti nelle premesse. Inoltre le inferenze ampliative «non costituiscono un insieme chiuso, dato una volta per sempre, bensì sono un insieme aperto che può essere sempre di nuovo ampliato mano a mano che si sviluppa la ricerca» 2 .
Esse hanno un ruolo cruciale nei processi di problem-solving e di scoperta in quanto contribuiscono a modellare lo spazio combinatorio delle ipotesi (ossia lo spazio di ricerca che racchiude le possibili combinazioni tra dati e informazioni che possono dare luogo a ipotesi esplicative), espandendolo e contraendolo ad ogni passo del percorso inferenziale in vista della ricerca di una soluzione del problema dato.
3. Non-monotonicità La non monotonicità 3 è una delle principali caratteristiche delle inferenze ampliative. Tali inferenze, infatti, sono caratterizzate e definite mediante la violazione di una delle condizioni più forti 2 3
Cellucci 2008, 335. v. Antonelli 2004 e Gelfond - Watson 2003.
13
Capitolo 1. Le inferenze ampliative
della logica classica, nota appunto come la monotonicità. La monotonicità asserisce la validità della seguente relazione: se Γ A ϕ e Γ ⊆ Δ, allora Δ A ϕ. Dunque un'inferenza è monotonica quando, nel caso in cui la conclusione ϕ di una inferenza è conseguenza di un insieme di premesse Γ, allora essa è una conseguenza di qualsiasi insieme di premesse Δ che contenga Γ quale suo sottoinsieme. Questa condizione, pertanto, sostiene che una conclusione non può essere invalidata dall’ingresso di nuova informazione: quando si è giunti a una conclusione ϕ per via deduttiva partendo da Γ, questa rimane vera una volta per tutte, indifferentemente dalle proposizioni che possiamo aggiungere all’insieme delle premesse Γ. Da ciò segue che il numero delle proposizioni valide aumenta appunto monotonicamente rispetto all’incremento delle premesse aggiunte a Γ, nel senso che all’aumentare delle premesse aumentano anche le conseguenze che ne possono essere derivate. La violazione della condizione di monotonicità nel corso dei ragionamenti permette invece di trattare situazioni in cui una conclusione può essere rivista alla luce dell’ingresso di nuove premesse o informazioni. Tali conclusioni hanno dunque uno statuto diverso, in quanto non sono verità definite e indubitabili, ma sono proposizioni plausibili 4 . Se le conclusioni possono essere invalidate dall’aggiunta di nuove premesse, allora il numero delle asserzioni valide non solo può non aumentare, ma può anche diminuire (o presentare delle oscillazioni). Quindi nel corso 4
v. p. es. Ippoliti 2007 e Cellucci 2008.
14
Inferenze ampliative
dell’articolazione di inferenze ampliative, l’insieme delle proposizioni accettate non cresce monotonicamente perché «inizialmente la conoscenza di sfondo più un insieme di credenze accettate può implicare una conclusione s. Poco dopo aver appreso che la proposizione r è vera, la conoscenza di sfondo e le credenze accettate combinate con r potrebbero non implicare più s» 5 . In tal caso si può anche arrivare a dover rimuovere s dall’insieme delle proposizioni accettate.
4. Probabilità Le inferenze ampliative sono spesso associate alla probabilità, nel senso che esse, pur non essendo vere, sono considerate probabili. Per esempio la descrizione dell’analogia (v. Cap. 4) come una forma d’inferenza «ampliativa e probabile» 6 è largamente condivisa, in quanto «gli argomenti analogici non devono essere classificati come validi o invalidi, in questi casi tutto ciò che si può richiedere è la probabilità» 7 . Questo tentativo di fornire una giustificazione in termini probabilistici della inferenza ampliativa è problematico e, in ultima analisi, inadeguato. L’inferenza ampliativa si basa infatti su considerazioni di carattere materiale e dipendenti dal dominio, e si sottrae a un pro5
Elio 2002, 4.
6
Weitzenfeld 1984, 1.
7
Copi 1961, 466.
15
Capitolo 1. Le inferenze ampliative
cesso d’analisi e di riduzione alla nozione e teoria della probabilità. Infatti, non a caso, sia la teoria classica della probabilità sia quella moderna hanno fallito nel dare una descrizione soddisfacente e una giustificazione dell’inferenza analogica e quindi, per estensione, esse non sono in grado di offrire una descrizione soddisfacente e una giustificazione dell’inferenza ampliativa. Ciò è dovuto a più di una ragione. In primo luogo l’inferenza ampliativa è un concetto qualitativo, perché è una forma di comparazione, mentre la probabilità è un concetto quantitativo, perché è basata sulla quantificazione e sulla enumerazione. Le ragioni che motivano un’inferenza ampliativa non sono e non possono essere di natura probabilistica: esse può avere una probabilità molto bassa (v. Cap. 4), anche prossima allo zero, eppur essere giustificata e, viceversa, ricevere un valore probabilistico molto alto ed essere ingiustificata. In particolare l’affermazione che la natura del legame tra le premesse e la conclusione di una inferenza ampliativa non può essere spiegata mediante la teoria della probabilità ha almeno due sensi. In primo luogo molte ipotesi formate mediante inferenze ampliative si basano su un numero limitato di osservazioni e si riferiscono a un numero molto elevato di casi (anche infiniti), per cui il rapporto tra casi favorevoli e casi possibili è tale da conferire all’ipotesi un valore probabilistico molto basso o prossimo allo zero. In secondo luogo molte inferenze ampliative, come l’analogia, 16
Inferenze ampliative
si basano su un numero di dissimilarità tra i domini oggetti di transfer che supera quello delle similarità e quindi, di nuovo: il loro rapporto conferisce una probabilità molto bassa alla conclusione ma essa è motivata (ad esempio perché avviene su proprietà rilevanti 8 ). Al contrario, inferenze basate sul conforto di un numero molto alto di similarità tra i domini comparati (e quindi su un’alta probabilità) possono rivelarsi non solo non motivate, ma palesemente scorrette o non-informative. Ma il fatto che la logica e la teoria della probabilità non siano adeguate a rendere conto dell’essenza dell’ampliamento della conoscenza ha un motivo specifico: l’inferenza ampliativa è, infatti, soggetta al paradosso dell’inferenza 9 . Pertanto non è possibile avere un’inferenza che goda contemporaneamente della proprietà della correttezza e dell’ampliatività 10 , ossia che sia tale che le sue premesse conferiscano validità e certezza alla conclusione candidata e al contempo estenda davvero le nostre conoscenze. Il legame istituito tra le premesse e la conclusione di una inferenza ampliativa non è infatti di natura probabilistica, ma è semplicemente plausibile.
5. Sensibilità alla rappresentazione
8 9 10
Cfr. Ippoliti 2006 e Ippoliti 2007, Cap. 5.
Cfr. Cellucci 2002, 167-168. Per una analisi approfondita della relazione tra la nozione di correttezza e
quella di ampliatività di un’inferenza cfr. Cellucci 2002, 165-169.
17
Capitolo 1. Le inferenze ampliative
Un’altra proprietà costitutiva dell’inferenza ampliativa e del processo di ampliamento della conoscenza è la sensibilità alla rappresentazione. Con il termine rappresentazione qui intendiamo un modo di organizzare e codificare l’informazione e i dati necessari a trattare un oggetto o un problema matematico (come la visualizzazione, la formalizzazione, la definizione ma anche la semplice notazione). Con la nozione di sensibilità si intende la dipendenza del processo di ampliamento della conoscenza da certi fattori (o insieme di fattori) che intervengono in tale processo. Con la proprietà della sensibilità alla rappresentazione mi riferisco dunque alla dipendenza che esiste tra i modi di rappresentazione e la trattazione di un problema o un oggetto matematico. Una differenza anche piccola nella rappresentazione scelta può condurre a trattazioni completamente differenti del problema o dell’oggetto indagato. Pertanto due modi di rappresentazione possono generare due diverse ipotesi o soluzioni di uno stesso problema e le proprietà che possono essere ascritte ad un certo oggetto matematico sensibilmente dipendono dalla rappresentazione che ne diamo. Il processo di costruzione di nuove rappresentazioni e la loro combinazione strutturata veicola e introduce informazioni tra loro diverse e le organizza in modi diversi. Questo processo di costruzione di rappresentazioni è fortemente basato sulle inferenze ampliative, come l’analogia, che consente di trasferire risultati, strumenti e metodi a livello sia intra-domini sia inter-domini. Quindi tra ampliatività e sensibilità alla rappresentazione esiste una reciproca dipendenza: le inferen18
Inferenze ampliative
ze ampliative permettono di costruire nuove rappresentazioni e, viceversa, l’insieme delle rappresentazioni cui possiamo avere accesso permettono di strutturare il processo inferenziale ampliativo. Inoltre diversi modi di rappresentazioni dipendono dalla conoscenza esistente, nel senso che le rappresentazioni cui possiamo avere accesso e che possiamo costruire dipendono dal corpo di conoscenza esistente in quel momento. Dunque la scoperta e la soluzione di problemi, a loro volta, dipendono dalla conoscenza esistente e dal contesto in cui hanno luogo. Esse sono quindi storicamente situate, e dipendono strettamente dall’insieme delle conoscenze disponibili ad un certo tempo t e dalla loro relativa strutturazione interna. Al crescere della conoscenza esistente e della sua strutturazione interna, lo spazio combinatorio delle ipotesi viene rimodellato in modo tale che certe rappresentazioni possono essere costruite e trasferite mediante le inferenze ampliative a diversi oggetti. Questo fatto, per inciso, spiega perché alcune scoperte o soluzioni di problemi avvengono in certi contesti e in certi momenti (talvolta alcune scoperte o soluzioni sono ottenute del tutto indipendentemente quasi contemporaneamente), e spiega anche perché alcune ipotesi ritenute plausibili in un certo contesto e ad un certo momento, cessano di esserle in contesti e periodo diversi (e viceversa). Dunque la sensitività alla rappresentazione è una caratteristica così cruciale dell’inferenza ampliativa che la semplice ideazione di una nuova rappresentazione (anche di una semplice notazione) può significare produzione di nuova conoscenza. 19
Inferenze ampliative
2 Visualizzazione e ampliatività
1. Premessa La visualizzazione è tradizionalmente considerata 1 come un efficace mezzo di scoperta, che può avere un carattere sia integrativo sia alternativo a stili di ragionamento formali e deduttivi. Essa può dunque sia accompagnare, sia porsi come alternativa alla formalizzazione e alla deduzione. Tra gli strumenti di ampliamento della conoscenza la visualizzazione occupa un posto di rilievo: essa è infatti sia una forma di inferenza sia un tipo di rappresentazione. La visualizzazione (intendendo in questa sede in via del tutto generale sia la visione, sia il ragionamento basato sulle immagini sia le varie tecniche di visualizzazione) è uno strumento (v. Mancosu 2005) decisivo nei processi di ampliamento della conoscenza. In questa sede sostengo e argomento che essa consente davvero di estendere la conoscenza, e non semplicemente che sia un mezzo che accompagna la via analitico-formale, e sostengo che sia un mezzo euristico e non semplicemente un correlato didattico o esplicativo, che si struttura secondo proprie e irriducibili forme di codificazione e organizzazione dei dati e dell’informazione. 1
v. p. es Hadamar 1945.
21
Capitolo 2. Visualizzazione e ampliatività
La visualizzazione offre un metodo per indagare oggetti e risolvere problemi in quanto permette di costruire nuove rappresentazioni di oggetti (ossia di codificazione e organizzazione dei dati e delle informazioni che lo caratterizzano) e di produrre ipotesi esplicative anche in domini molto astratti della matematica. La visualizzazione, non a caso, non solo trova applicazione e gioca un ruolo euristico decisivo in un numero crescente di domini anche molto astratti come la teoria dei numeri 2 , ma solleva profonde questioni metodologiche, epistemologiche e filosofiche 3 . La visualizzazione ricorre infatti a processi inferenziali propri che possono differire sostanzialmente da quelli che caratterizzano stili di ragionamenti assiomatico-formali: questi processi sono in grado di produrre un’organizzazione dei dati e delle informazioni mediante cui scoprire proprietà di oggetti indagati e formulare congetture feconde. Questi processi non introducono semplicemente nuova informazione, esterna al problema dato o all’oggetto indagato, ma contribuiscono a una nuova interpretazione, dall’interno, dell’oggetto indagato e del problema da risolvere. In qualche modo costruiscono un nuovo oggetto e assemblano un nuovo problema. Come abbiamo già accennato, il processo euristico è sensibile alla rappresentazione scelta, per cui le proprietà individuabili di un oggetto e le ipotesi candidabili per risolvere un problema dipendono dall’insieme di rappresentazioni scelte e dal modo in cui 2 3
v. p. es. Borwein - Jörgenson 2001, Goetgheluck 1993, Zenkin -1990. v. p. es. Giaquinto 1992, 1993, 1994 e 2007, Brown 1997 e 1999, Horgan 1993, Cel-
lucci 2008.
22
Inferenze ampliative
le si combina durante il processo di ampliamento della conoscenza. Nella matematica questa dipendenza è particolarmente marcata, e infatti «la storia della matematica è segnata da molti considerevoli sviluppi basati sulla visualizzazione. Per esempio l’introduzione di Descartes delle coordinate cartesiane è forse il più importante passo in avanti nella matematica del millennio» 4 . In questo caso, infatti, la costruzione di una rappresentazione visuale di oggetti algebrici (ossia l’interpretazione di equazioni come curve in una data dimensione e, viceversa, la costruzione di immagini algebriche per oggetti geometrici), ha infatti permesso a Descartes, e separatamente a Fermat, di produrre cruciali scoperte matematiche e di risolvere problemi di lungo corso mediante una nuova codificazione della conoscenza, che istituisce un legame tra due differenti discipline – come la geometria e l’algebra. Ancora, nella teoria dei numeri è ormai manualistico il caso dei numeri figurati (ossia i numeri triangolari, i numeri quadrati, i numeri pentagonali, etc.), la cui visualizzazione ha giocato un ruolo decisivo nella scoperta di Pitagora di molte proprietà aritmetiche. La tesi qui proposta e sostenuta è che la visualizzazione non rappresenta un modo più diretto e “intuitivo” per accedere ad una conoscenza che sarebbe comunque raggiungibile mediante la via assiomatico-formale, ma piuttosto che essa si configura come un mezzo per ottenere conoscenza che non sarebbe accessibile mediante altri metodi e sistemi di rappresentazione della conoscen4
Borwein – Jörgenson 1997, 898.
23
Capitolo 2. Visualizzazione e ampliatività
za. Ovviamente esistono limiti intrinseci della visualizzazione: il numero dei dati che può essere visualizzato, le poche dimensioni cui si può avere accesso, la natura empirica e sensoriale delle immagini. Essi pongono profondi limiti teorici e pratici all’uso della visualizzazione, i quali possono condurre a errori e inferenze fallaci 5 . Su questa base Giaquinto 6 solleva varie obbiezioni sull’uso della visualizzazione, la quale sembra in grado di portare alla mente solo casi singoli ed esempi particolari, che non sono in grado di raggiungere l’astrattezza e la generalità per produrre nuova, rilevante conoscenza matematica. Giaquinto sostiene pertanto che la visualizzazione può ricoprire un ruolo nella matematica nel senso che permette esprimenti mentali e può far emergere sia schemi (di operazioni o prove analitiche) sia la possibilità di certe relazioni almeno nell’aritmetica e nell’analisi reale elementare. A tal fine analizza due esempi famosi, come il teorema del punto fisso e il teorema del valore intermedio, per mostrare come il pensiero visuale – il visual thinking – sebbene non possa essere considerato un metodo di scoperta, possa comunque essere uno stimolo alla scoperta – la quale può comunque essere raggiunta per via assiomatico-formale. Ma la possibilità che in linea di principio ogni oggetto o problema matematico sia suscettibili di una qualche forma di rappre5
v. p. es. Brown 1997, dove si discutono i limiti della visualizzazione di quattro cerchi
in dimensione n, con n>10. 6
v. Giaquinto 1993 e 1994.
24
Inferenze ampliative
sentazioni visuale non può essere esclusa, poiché con l’avanzare della conoscenza matematica è possibile istituire sempre nuove relazioni e rappresentazioni tra domini fino a quel momento rimasti del tutto o parzialmente separati. Ciò non significa ovviamente che ogni oggetto matematico possiede una specifica rappresentazione visuale, ma piuttosto che è possibile, in un qualche modo che dipende dall’avanzare della conoscenza matematica e dalle molteplici rappresentazioni che se ne possono dare, fornire una espressione visuale e grafica di oggetti e problemi matematici. In fondo, come osserva la Grosholz (v. Grosholz 2007), la stessa formalizzazione può in ultima analisi essere considerata come un particolare tipo di rappresentazione. Nei paragrafi che seguono mostrerò mediante alcuni semplici esempi tratti dalla teoria dei numeri come la visualizzazione svolga un ruolo euristico essenziale, e analizzerò come essa non sia un semplice correlato di un approccio assiomatico-formale alla matematica, ma uno strumento di reale ampliamento della conoscenza. La scelta della teoria dei numeri non è causale, se si pensa che Giaquinto (v. Giaquinto 1993) sostiene che i numeri sembrano essere oggetti puramente astratti, entità che non sono visualizzabili neanche in potenza. In realtà è possibile mostrare come un’opportuna rappresentazione visuale di oggetti numerici sia non solo capace di ampliare la nostra conoscenza permettendo di cogliere proprietà e relazioni nuove, ma di fare ciò superando i limiti di un approccio basato su stili di ragionamento formalisti e 25
Capitolo 2. Visualizzazione e ampliatività
deduttivi.
2. Rappresentazioni visuali ampliative La costruzione di nuove rappresentazioni, in questo caso di carattere visuale, è uno strumento così decisivo nell’ampliamento della conoscenza che anche su oggetti apparentemente semplici e a lungo studiati è possibile gettare nuova luce, arrivando a individuare nuove proprietà. Per esempio il matematico russo A. Zenkin (v. Zenkin 1991) è riuscito a scoprire nuove proprietà dei numeri quadrati 1, 4, 9, 25, ..., f(x) = x2, x∈ ` , facendo ricorso ai cosiddetti pitogrammi, una forma di rappresentazione grafica al computer nota come Cognitive Computer Graphics (CCG) – Computer Grafica Cognitiva. Una possibile estensione dei suoi risultati può essere data in varie forme utilizzando proprio tale forma di rappresentazione (v. p. es. Ippoliti 2002a e 2002b). I pitogrammi non sono altro che un modo nuovo di visualizzare le proprietà di oggetti numerici – una codificazione nuova della conoscenza. Essi permettono di individuare nuove proprietà e, come vedremo, di formulare congetture fornendo un mezzo per ampliare la conoscenza su oggetti numerici attraverso la costruzione di una nuova rappresentazione, che non fa altro che organizzare e codificare i dati e le informazioni in un modo nuovo. Essi visualizzano e dispongono in uno spazio bidimensionale un insieme discreto di dati, creando un oggetto visuale che può esse26
Inferenze ampliative
re studiato interattivamente e in una sorta di ambiente geometrico virtuale. Dunque i pittogrammi creano immagini e rappresentazioni geometriche di oggetti della teoria dei numeri. Per costruire un pittogramma è necessario innanzitutto procedere ad una trasformazione della serie, ossia la sequenza monodimensionale 1, 2, 3, 4, 5,..., n, n∈ ` , nella forma modulare e bidimensionale rappresentata nella Figura 1.
Figura 1. Griglia di un pitogramma
Si definisca il modulo del pitogramma (abbreviato mod) la quantità di celle numeriche in ogni stringa orizzontale. Dunque nell’esempio offerto in Figura 1 abbiamo che mod = 5. A questo punto è possibile scegliere una qualsiasi proprietà dei numeri naturali espressa da un predicato P(n), e visualizzarla su un pitogramma in base alla seguente regola: -
se P(n) è vero, allora il colore della n-sima cella è, diciamo, nera,
altrimenti, 27
Capitolo 2. Visualizzazione e ampliatività
-
se P(n) è falsa, allora il colore è, diciamo, giallo.
Ora, sia P(n) il predicato che esprime la proprietà "essere o non essere il quadrato di un numero naturale", n = x2: allora per mod = 5, otteniamo il pitogramma mostrato in Figura 2:
Figura 2. Costruzione del pitogramma dei numeri quadrati
Innanzitutto è possibile osservare come questa rappresentazione visuale è in grado di mostrare la doppia connessione tra due principali proprietà degli oggetti numerici, quali la proprietà additiva e quella moltiplicativa. La prima è infatti espressa dal colore dei pitogrammi, la seconda dalla posizione, dal momento che tutti i 28
Inferenze ampliative
numeri naturali n, per i quali si ha che n = (k*mod)+j, con j<mod, si trovano nella stessa j-esima colonna del pitogramma. Facendo variare la dimensione del modulo, si ottengono diverse configurazioni e rappresentazioni dello stesso oggetto numerico espresso dal predicato P(n), le quali consentono di individuare proprietà e formulare congetture. Inizialmente si possono ottenere configurazioni disordinate di punti (gialli e neri), ma spesso i pitogrammi possono rivelare strutture che, se adeguatamente interpretate, possono evidenziare modelli e proprietà interessanti. Per adeguatamente interpretate intendo che tali modelli o proprietà non sono dati grezzi, ma piuttosto che essi emergono da analogie e legami tra le configurazioni visualizzate dai pitogrammi e quelle di altre discipline scientifiche. Come osserva Brown (v. Brown 1997), la visualizzazione e l’interpretazione di oggetti matematici richiedono infatti uno “sguardo metaforico”. Proprio facendo ricorso ad una opportuna interpretazione basata sulla visualizzazione CCG, Zenkin ha scoperto una proprietà dei numeri quadrati la quale rivela una trasformazione non nota nella matematica moderna. Infatti, per mod = 16, come è possibile osservare nella Figura 3, la singola ma infinita parabola x2 – visualizzata nella Figura 3 (a), – si trasforma in una famiglia infinita di parabole finite, come mostrato nella Figura 3 (b) e (c). Questo nuovo oggetto geometrico può essere espresso analiticamente, come è facilmente verificabile – nel modo seguente:
29
Capitolo 2. Visualizzazione e ampliatività
Y*(n) = (8n ± k)2 , n∈ ` , k = 0, 1, 2, 3, 4. Come mostrato in Figura 3, ogni parabola della famiglia è costituita da nove punti, che sono quadrati di successivi numeri naturali.
Figura 3. Pitogramma dei numeri quadrati
Per formalizzare ed esprimere analiticamente la famiglia basta associare al pitogramma un sistema locale di coordinate, come mostrato nella Figura 4. Quindi abbiamo che Y*(n) = (8n ± k)2 , n∈ ` , k = 0, 1, 2, 3, 4, e dove ogni punto n esprime una parabola. Infatti il valore di Y*(n) non è un semplice numero, ma è la sequenza dei seguenti nove quadrati di numeri naturali successivi: (8n-4)2, (8n-3)2, (8n-2)2, (8n-1)2, (8n)2, (8n+1)2, (8n+2)2, (8n+3)2, (8n+4)2 con n ∈ ` . Quindi la famiglia infinita di parabole finite viene espressa 30
Inferenze ampliative
dalla seguente sequenza infinita di parabole composta da nove punti: Y*(0), Y*(1), Y*(2), Y*(3), ..., Y*(n).
Figura 4. Sistema locale di coordinate del pitogramma
2.1. Visualizzazione di polinomi di secondo grado a valori interi 7 Un cambio di rappresentazione è dunque in grado di rivelare proprietà che non sono individuabili per via analitica, e il risultato di Zenkin mostra come la stessa struttura geometrica di un oggetto della teoria dei numeri – ossia la parabola, – emerga sia nel piano cartesiano sia nella rappresentazione basata sulla visualizzazione CCG. Inoltre esso mostra una particolare e nuova connessione tra finito e infinito all’interno dell’oggetto indagato. Tale rappresentazione organizza e codifica i dati e le informazioni in modo diverso e ottiene risultati nuovi e diversi. Dunque questo semplice risultato mostra come gli oggetti matematici e i 7
Ringrazio il prof. Zenkin per i suoi suggerimenti e il dott. Rustichelli per la
collaborazione nello sviluppo del software di visualizzazione CCG su Linux.
31
Capitolo 2. Visualizzazione e ampliatività
processi di ampliamento della loro conoscenza siano sensibili alla rappresentazione. Cosa sia un oggetto matematico e come sia possibile estendere la conoscenza che ne abbiamo dipende dall’insieme di rappresentazioni che ne possiamo dare e dai modi in cui possiamo combinarle. Ovviamente è possibile sottoporre altri oggetti matematici alla visualizzazione CCG e ottenere risultati che possono condurre a scoprire nuove proprietà e formulare congetture. In ciò che segue intendo mostrare proprio questo. Per esempio, si prendano in esame i numeri eteromechi 8 e i numeri planici 9 , serie numeriche rispettivamente espresse dalle equazioni n = x2 - x e n = x2 + x. Entrambe le serie sono geometricamente delle parabole e sono casi particolari di polinomi della forma f(x) = ±ax2 ± bx ± c, ossia polinomi di secondo grado. Osserviamo il comportamento di polinomi per soli valori interi (ossia che generano serie numeriche di numeri interi positivi), e quindi che soddisfano la condizione x > b, x2 > c, -ax2 < ± bx ± c, ax2 > ±bx ± c. Quindi x2 + x and x2 – x esprimono la stessa serie numerica e in generale polinomi duali che generano serie numeriche di interi positivi esprimono la stessa serie (p. es. x2 + 4x genera la stessa x2 - 4x, in quanto consideriamo, per il secondo, solo i valori di x > 4). Per costruire il pitogramma di queste due serie numeriche si 8
Sono detti eteromechi i numeri che sono il prodotto di due numeri consecutivi, ossia
n=(x-1)x. 9
Sono detti planici i numeri che sono composti dalla somma di un numero e del suo
quadrato, ossia n=x+x2.
32
Inferenze ampliative
definisca dunque il predicato P(n) = “essere o non essere un numero planico/eteromeco". Facendo variare il valore del modulo otteniamo diverse rappresentazioni di questi oggetti numerici, dalle quali possiamo tentare di scoprirne nuove proprietà. In particolare per mod = 14, come mostrato nella Figura 5, anche questa serie si trasforma in una famiglia infinta di parabole finite, ognuna composta da 8 punti che sono successivi numeri planici (eteromechi), tale che per ogni n∈ ` , k = 0, 1, 2, 3, si ha che Y*(n) = (7n ± k)2 + (7n ± k), o (7n ± k)2 - (7n ± k).
Figura 5. Pitogramma dei numeri planici/eteromechi
Come si può vedere, ancora una volta otteniamo una rappresentazione simile a quella dei numeri quadrati, che esibisce la stessa connessione tra finito e infinito che si presenta nei pitogrammi dei numeri quadrati. 33
Capitolo 2. Visualizzazione e ampliatività
Questo secondo risultato ottenuto sulla base della visualizzazione CCG suggerisce la possibilità di estendere lo studio visuale a serie di numeri naturali che possono essere espresse in generale da parabole, ossia polinomi di secondo grado a valori interi, n = ax2 ± bx ± c. Nella Tabella 1 ho riassunto alcuni risultati ottenuti mediante la visualizzazione di tali polinomi, per i quali esiste sempre un valore del modulo per il quale si verifica la trasformazione esibita dai numeri quadrati e dai numeri planici ed eteromechi. serie P(n)
mod
equazione
y = x2+x
14
Y*(n)=(7n ± k)2+ (7n ± k) , n∈ ` , k = 0,1,2,3 e, per
punti
struttura Famiglia infinita
8
di parabole finite
n≥1, -k= 4 2
y=x -x
14
*
Y (n)=(7n ± k)2- (7n ± k), n∈ ` , k = 0,1,2,3 e, per
Famiglia infinita 8
di parabole finite
9
Famiglia infinita
n≥1, -k= 4. 2
y = x +2x
16
*
Y (n)=(6n± k)2+ 2(6n±k),
di parabole finite
n∈ ` , k = 0,1,2,3 2
Y =x +x+2
10
*
2
Y (n)=(4n ± k) + (4n ± k) +
6
Famiglia infinita di parabole finite
2 , n∈ ` ,k = 0,1,2 e, per n≥1, +k = 3. 2
Y = x +x+1
14
*
Y (n)=(7n ± k)2+ (7n ±k) +
8
Famiglia infinita di parabole finite
1, n∈ ` , k = 0,1,2,3 e, per n≥1, - k = 4. Y = ax
2
16a
*
Y (n)=(a8n - k)2, n∈ ` ,
8a Famiglia infinita di parabole finite
k = 4, 3, 2,1 ,0 ...
...
...
...
Tabella 1
34
...
Inferenze ampliative
2.2. Una prima congettura I risultati riportati nella Tabella 1, ottenuti mediante la visualizzazione CCG, suggeriscono la seguente congettura: data una qualsiasi serie di numeri naturali generata da polinomi della forma n = ax2 ± bx ± c, esiste sempre un valore del modulo tale che esiste una famiglia infinita di parabole finite, ognuna di j ± k punti, che può essere espressa da una equazione della forma a(jn ± k)2 + b(jn ± k) + c , con a, b, c, j, k, n, x∈ ` . Ciò equivale a dire che tale congettura sostiene che sia sempre possibile esprimere una serie numerica n = ax2 ± bx ± c nella forma a(jn ± k)2 + b(jn ± k) + c, e rappresentare la singola, infinita, parabola del piano cartesiano come una famiglia infinita di parabole finite nei pitogrammi. Ossia: (I)
∀P(n), P(n)=(ax2 ± bx ± c), dove a, b, c, x∈ ` , ∃q tale che, per mod=q, esiste una famiglia infinita di finite ax2 ± bx ± c della forma Y*(n) = a(jn ± k)2 + b(jn ± k) + c, dove j ± k è il numero dei punti di ogni singola finita ax2 ± bx ± c.
È interessante osservare fin d’ora che tale trasformazione si veri35
Capitolo 2. Visualizzazione e ampliatività
fica invertendo la relazione tra finite e infinito, e vedremo nei paragrafi successivi come questo fatto giochi un ruolo essenziale nella formulazione di una seconda congettura.
2.3. Visualizzazione di serie intere pari e dispari Si esamini ora visualmente per mezzo dei pitogrammi la serie dei numeri naturali 1, 8, 27, ..., f(x) = x3, x∈ ` , usando dunque il predicato P(n)= "essere o non esser un numero cubico". Per mod = 18, come è possibile osservare nella Figura 6, si ottiene un risultato davvero interessante: come nel caso di x2, infatti, abbiamo una struttura finita iterata infinitamente.
Figura 6. Pitogramma dei numeri cubici
36
Inferenze ampliative
La struttura iterata è, ancora una volta, la stessa che si presenta in forma infinita nel piano cartesiano, ossia una cubica. Questa struttura può essere espressa, nel sistema di coordinate locali, mediante l’equazione Y*(n) = (6n - k)3, n∈ ` , k = 5, 4, 3, 2, 1, 0, dove ogni cubica n ha sei punti, che sono cubi di successivi numeri naturali, (6n-5)3, (6n-4)3, (6n-3)3, (6n-2)3, (6n-1)3, (6n)3. Quindi mediante un cambio di rappresentazione, dalla serie dei numeri cubici 1, 8, 27,..., x3 otteniamo una famiglia infinita di cubiche finite. Pertanto per n=2 e n=3, si possono individuare due simili e interessanti risultati per la serie dei numeri naturali della forma xn , con x, n∈ ` . La visualizzazione CCG di valori successive di n in xn mostra come sia possibile formulare una successiva congettura. Si consideri innanzitutto il caso n=4, visualizzandolo mediante pitogrammi in base al predicato P(n) = "essere o non essere il bi-quadrato di un numero naturale". Nella visualizzazione della serie dei bi-quadrati 1, 16, 81, 256, ... , x4, x∈ ` , per mod=48, (vedi Figura 7A) si ottiene ancora una configurazione simile alla precedente: una famiglia infinita di parabole finite – che presentano ovviamente una concavità più grande di quella della serie dei numeri quadrati, – ognuna composta da 7 punti di successivi bi-quadrati di numeri naturali: (4n - 3)4, (4n - 2)4, (4n - 1)4, (4n)4, (4n + 1)4, (4n + 2)4, (4n + 3)4. Tale famiglia è espressa, nel sistema locale di coordinate del pitogramma, dall’equazione Y*(n) = (4n ± k)4, n∈ ` , k = 0, 1, 2, 3. Procedendo per valori interi di n, per n = 5 e con P(n) = "essere o non essere la quinta potenza di un numero naturale", si ottie37
Capitolo 2. Visualizzazione e ampliatività
ne una rappresentazione simile a quella per n = 3 (vedi Figura 7B). La serie delle quinte potenze dei numeri naturali 1, 32, 243, 1024, ... , x5, x∈ ` , per mod=25, esibisce di nuovo una struttura composta da una famiglia infinita di strutture simili alle cubiche, ognuna composta da 5 punti, che sono successive quinte potenza di numeri naturali, (5n - 4)5, (5n - 3)5, (5n - 2)5, (5n - 1)5, (5n)5, che è espressa in via analitica dall’equazione Y*(n) = (5n - k)5, n∈ ` , k = 4, 3, 2, 1, 0. In particolare la serie in questione si articola secondo il decorso tipico delle funzioni cosiddette dispari: questo insieme di osservazioni effettuate mediante la visualizzazione CCG, riassunti nella Tabella 2, suggerisce la congettura del paragrafo che segue.
Figura 7A. Pitogramma dei numeri bi-quadrati
38
Inferenze ampliative
Figura 7B. Pitogramma delle quinte potenze
serie P(n)
mod
equazione
punti
struttura
Y = X2
16
Y*(n) = (8n ± k)2,
9
Struttura pari: famiglia infinita di parabole finite - Fig. 3
n∈ ` , k = 0,1,2,3,4 Y = X3
18
Y*(n) = (6n - k)3,
6
Struttura dispari: famiglia infinita di cubi finite - Fig. 6
n∈ ` , k = 5,4,3,2,1,0 Y=X
4
48
*
Y (n) = (4n ± k )4,
7
nita di parabole finite Fig. 7a
n∈ ` , k = 3,2,1,0 Y = X5
25
Y*(n) = (5n - k)5,
Struttura pari: famiglia infi-
5
Struttura dispari: famiglia infinita di quinte potenze
n∈ ` , k = 4,3,2,1,0
finite - Fig. 7b
...
...
...
... Tabella 2
39
...
Capitolo 2. Visualizzazione e ampliatività
2.4. Una seconda congettura Le funzioni pari e dispari, ossia le funzioni f(x) = xn, x, n∈ ` , per n > 1 e rispettivamente con n = 2p e n = 2p+1, come noto presentano un preciso e distinto andamento sul piano cartesiano, come mostrato nella Figura 8.
Figura 8. Rappresentazione cartesiana di funzioni pari e dispari
Per n = 2, 3, 4, 5 abbiamo visto che esiste almeno una rappresentazione nel piano CCG che trasforma la singola, infinita struttura cartesiana in una famiglia infinita di strutture finite che hanno lo stesso andamento di quella cartesiana. Sembra quindi del tutto plausibile, ossia compatibile con i dati esistenti, supporre che tale trasformazione si verifichi per ogni serie pari e ogni serie dispari. 40
Inferenze ampliative
Ciò significa che è ipotizzabile che sia sempre possibile rappresentare una singola, infinita, serie pari/dispari di numeri naturali sotto forma di una famiglia infinita di strutture finite rispettivamente pari e dispari, esprimibili analiticamente nella forma Y*(n) = (an ± k)N con N, a , k, n∈ ` , dove a ± k è il numero dei punti della singola struttura finita. Più rigorosamente questa congettura può essere espressa nel modo seguente: (II) ∀P(n) = xn, con x, n∈ ` , ∃q t.c. per mod=q, ∃ famiglia infinita di finite xn della forma Y*(n) = (an ±k)N con N, a, k, n∈ ` , e dove a ± k = numero dei punti delle singole, finite xn, le quali hanno, per n = 2p e n = 2p+1, rispettivamente una struttura pari e dispari. È possibile osservare come le due congetture formulate presentano caratteristiche simili. In primo luogo entrambe hanno una forma esistenziale: esse ipotizzano che esista almeno un valore del modulo per il quale la proprietà è soddisfatta. Ovviamente l’indagine visuale di proprietà di oggetti della teoria dei numeri può assumere una forma universale, per esempio ricercando invarianti che occorrono in ogni pitogramma (la congettura avrà dunque in questo caso la forma “per ogni valore del modulo, esiste una etc. etc.”). Esempi di questo genere di osservazioni e risultati mediante la visualizzazione CCG nel dominio della teoria dei numeri sono date da Zenkin (v. Zenkin 1991). In secondo luogo la loro formulazione dipende, come abbiamo 41
Capitolo 2. Visualizzazione e ampliatività
visto, in modo essenziale dalla visualizzazione, che codificando e organizzando in modo diverso i dati e le informazioni, e introducendo nuova informazione, consente di costruire e rintracciare relazioni in modelli spaziali, permettendo di ampliare la conoscenza intorno a certi oggetti mediante una nuova interpretazione dell’oggetto stesso e moltiplicandone i punti di vista: infatti i pitogrammi forniscono un’immagine geometrica di entità numeriche. Il conseguimento di questa nuova conoscenza sarebbe stata impossibile mediante stili di ragionamento di tipo formalededuttivo.
3. Osservazioni conclusive I semplici risultati e le congetture ottenute nei paragrafi precedenti sono il prodotto di un approccio che si basa su una moltiplicazione dei punti di vista intorno ad oggetti della teoria dei numeri. Tale approccio sostanzialmente procede nel modo seguente: considera un oggetto della teoria numeri – i numeri quadrati, planici, etc. espressi da un predicato P(n) – e la loro ben nota interpretazione nel piano cartesiano, che offre una certa rappresentazione delle proprietà di questi oggetti. Quindi procede a costruire una nuova rappresentazione di tali oggetti introducendo un nuovo sistema di visualizzazione – i pitogrammi appunto. Questa apparentemente semplice operazione trasforma l’oggetto iniziale in una nuova entità di natura geometrica che può essere indagata e interrogata visualmente e graficamente, in base a principi orga42
Inferenze ampliative
nizzativi come la simmetria, la connessione, le analogie spaziali, etc. – che fanno emergere nuove relazioni e dati visuali. L’interazione con questa nuova rappresentazione e questi nuovi dati visuali permette di individuare proprietà non note e di procedere ad un tentativo di generalizzazione mediante la formulazione di congetture. A questo punto, associando un sistema locale di coordinate, è possibile tornare agli oggetti iniziali ed esprimere analiticamente (ossia mediante equazioni) i risultati ottenuti. Questi risultati tuttavia non avrebbero potuto essere ottenuti mediante un approccio deduttivo-formale, poiché non esiste alcuna relazione che ci consente di passare dall’iniziale serie numerica a quella finale ottenuta mediante la rappresentazione CCG utilizzando passaggi deduttivi e formali. La visualizzazione CCG introduce infatti nuova informazione e organizza e codifica in modo nuovo l’oggetto indagato. Dunque la visualizzazione non solo non è un via succedanea o un semplice correlato di vie più rigorose, che si limita ad accompagnare stili di ragionamento deduttivi e certi, ma è un mezzo proprio per porre e risolvere problemi e per scoprire nuove proprietà e formulare ipotesi.
43
Inferenze ampliative
3 Rappresentazioni multiple e ampliatività
1. Premessa In questo capitolo analizzo in profondità una proprietà essenziale delle inferenze ampliative, quale la sensibilità alla rappresentazione, e sostengo che l’attività della scoperta matematica e della soluzione di problemi dipendono dalla costruzione, moltiplicazione e combinazione delle diverse rappresentazioni (disponibili o costruibili) di entità matematiche. A tal fine mi avvalgo di alcuni esempi tratti dalla topologia, in particolare dalla topologia algebrica (il gruppo fondamentale), dalla teoria delle trecce e dalla teoria dei nodi, che sono domini nei quali la sensibilità alla rappresentazione è particolarmente evidente e feconda, dal momento che su uno stesso problema o sulla trattazione di uno stesso oggetto matematico convergono e interagiscono, richiamandosi a più domini e metodi – come per esempio la geometria, l’algebra, il calcolo combinatorio e metodi algoritmici – diverse rappresentazioni. La tesi sostenuta in questo libro è che la conoscenza matematica, usando una metafora, avanza mediante una continua costruzione e moltiplicazione di differenti rappresentazioni degli oggetti matematici, le quali offrono diversi punti di vista dalla cui interazione e combinazione emerge la produzione di nuova cono45
Capitolo3. Rappresentazioni multiple e ampliatività
scenza. Ciò significa che molte parti della matematica emergono e si accrescono in relazione con altri domini scientifici. Ad esempio alcuni sviluppi recenti della teoria dei grafi, la cosiddetta teoria dei grafi spaziali virtuali (virtual spatial graph theory), è motivata proprio dalla trattazione di problemi biologici, nella fattispecie l’associazione delle proteine con le membrane. Rappresentazioni diverse veicolano, organizzano e combinano informazioni differenti che provengono da domini distinti. Queste rappresentazioni, a parte rari casi, non sono affatto isomorfe, e quindi i modi in cui esse sono costruite e combinate è essenziale per l’ampliamento della conoscenza matematica. La rappresentazione di un oggetto matematico è infatti intrinsecamente incompleta e parziale, e tale risulta essere anche ciò che segue da questa rappresentazione. Quindi diverse rappresentazioni, come abbiamo già visto nel caso della visualizzazione nel corso del capitolo precedente, permettono di scoprire differenti proprietà, fanno emergere aspetti diversi circa l’oggetto indagato e suggeriscono ipotesi diverse per risolvere un problema.
2. Molteplicità di rappresentazioni La costruzione e la combinazione di molteplici rappresentazioni sono alla base della scoperta e del problem-solving matematico. Come osserva Emily Grosholz 1 , in matematica l’idea di rappresentazione viene spesso espressa in termini di isomorfismo, 1
Grosholz 2007, 21.
46
Inferenze ampliative
ossia di una relazione riflessiva e simmetrica tra strutture (intese quali insiemi di proposizioni in un linguaggio oggetto). Ad esempio Hersh (v. Hersh 2007) e Byers (v. Byers 2007) sostengono che la nozione di “equivalenza isomorfica” sia uno strumento essenziale per la produzione di conoscenza matematica in quanto consente di passare da un contesto all’altro della matematica, di usare in modo controllato e persino algoritmico quell’ambiguità che è alla base della fecondità e ricchezza della matematica. Tuttavia, come sottolinea la Grosholz, questa idea di rappresentazione è fondamentalmente sbagliata. La giustapposizione e sovrapposizione di rappresentazioni non isomorfe è il vero motore della produzione di conoscenza matematica e della sua crescita. Inoltre l’attività di costruzione di rappresentazioni implica l’organizzazione, l’invenzione e attività creative che svolgono un ruolo produttivo nella costruzione e strutturazione dell’entità rappresentata. Dunque la rappresentazione implica sempre una interpretazione, che contribuisce a riorganizzare dall’interno l’oggetto che si vuole rappresentare, a produrre un nuovo assetto dell’insieme di dati e delle informazioni che lo caratterizzano. Anche la Grosholz si riferisce alla nozione di ambiguità quale fattore di produzione e crescita della conoscenza matematica, precisando che per ambiguità 2 intende la sovrapposizione e giustapposizione di una varietà di modi di rappresentazione che originano una polisemia in grado di generare intuizioni e scoperte, e non confusione. La costruzione di una nuova rappresentazione, 2
Cfr. Grosholz 2007, 4.
47
Capitolo3. Rappresentazioni multiple e ampliatività
utilizzando la terminologia messa a punto ancora dalla Grosholz, produce degli “ibridi”, ossia delle entità che affrontano problemi e trattano oggetti da una prospettiva nuova, che nasce dall’incontro di diversi domini o ambiti disciplinari e che utilizza le conoscenze, i risultati, i metodi messi a punto in ogni singolo dominio. Dunque la costruzione di una nuova rappresentazione di una entità matematica di per sé può costituire produzione di nuova conoscenza, in quanto permette di stabilire relazioni (ad esempio la dipendenza, l’equivalenza, etc.) tra modi di rappresentazioni differenti, consentendo, per esempio, riduzioni o generalizzazioni. In questo testo e in quanto segue si vuole mostrare come piuttosto che l’ambiguità, è l’istituzione di rappresentazioni multiple che permette di porre nuove domande sugli oggetti indagati e scoprirne proprietà, ampliando la nostra conoscenza. Inoltre questo processo è potenzialmente senza fine. Questa moltiplicazione di rappresentazioni, che dà luogo ad una moltiplicazione dei punti di vista intorno all’oggetto, non affonda le radici nell’ambiguità, ma deriva dalla natura stessa della matematica, che non dà una conoscenza assoluta dell’oggetto, ma gira «intorno all’oggetto, moltiplicando senza fine i punti di vista, o meglio, passando da un punto di vista ad altri sempre più penetranti, cioè da una soluzione del problema ad altre sempre più approfondite, per cercare di completare una rappresentazione dell’oggetto che tuttavia rimarrà sempre incompleta» 3 . 3
Cellucci 2008, 222.
48
Inferenze ampliative
Questa irriducibile, costitutiva incompletezza del processo di rappresentazione degli oggetti matematici che produce la moltiplicazione dei punti di vista è la ragione della fecondità dell’attività matematica.
2.1. Rappresentazioni multiple e topologia algebrica Alla base della nascita stessa della topologia algebrica c’è la costruzione di una nuova rappresentazione, che origina un nuovo punto di vista mediante l’ibridazione di due oggetti apparentemente distinti. La nozione che sta alla base di questa teoria, ossia quella di gruppo fondamentale introdotta da Poincarè (v. Poincarè 1895), infatti, corrisponde alla costruzione di una immagine algebrica di un oggetto geometrico, ossia di una nuova rappresentazione la quale produce un punto di vista fecondo attraverso cui porre e risolvere problemi relativi ad un certo dominio (la topologia) mediante l’introduzione di informazioni e metodi di un altro dominio (l’algebra). In particolare, la teoria dell’omotopia tratta le questioni topologiche creando delle rappresentazioni e riduzioni all’algebra: essa associa agli spazi topologici (una nozione topologica) vari gruppi (una nozione algebrica), che sono invarianti algebrici. Il gruppo fondamentale, introdotto da Poincarè, altro non è che il primo gruppo di omotopia. Dato uno spazio topologico X e dato un suo punto, diciamo x0, il gruppo fondamentale descrive 49
Capitolo3. Rappresentazioni multiple e ampliatività
l’insieme di tutte le classi di omotopia di circoli (loops), aventi il punto base x0, ed è denotato con π 1 ( X , x0 ) (o più semplicemente π ( X , x0 ) ). Esso si comporta come un gruppo e quindi permette di trattare questi semplici oggetti topologici (i circoli) mediante la teoria dei gruppi, una branca dell’algebra. Da questa nuova rappresentazione di un oggetto topologico segue la produzione di nuova conoscenza, e la possibilità di porre e risolvere problemi all’interno della topologia mediante strumenti e concetti algebrici. Il gruppo fondamentale, innanzitutto, permette infatti di costruire una teoria che consente di distinguere differenti categorie di superfici bi-dimensionali: Poincarè ha mostrato infatti come qualsiasi superficie bidimensionale che ha lo stesso gruppo fondamentale della superficie bidimensionale di una sfera sia topologicamente equivalente ad una sfera. Inoltre egli ha posto la congettura che questo risultato valga anche per varietà tridimensionali e in seguito si è arrivati ad estendere tale congettura a casi di dimensioni più alte. Inoltre questo strumento consente di trattare problemi e oggetti di altre discipline. Per esempio, il gruppo fondamentale è usato nella teoria dei nodi dal matematico austriaco Wirtinger per dimostrare che il nodo a trifoglio è davvero annodato (egli dimostra infatti nel 1905 che il gruppo fondamentale del trifoglio è il gruppo simmetrico su tre elementi). In modo ancor più significativo questo concetto viene generalizzato sempre da Wirtinger per costruire il gruppo fondamentale di un link arbitrario (questa presentazione del gruppo fondamentale è infatti nota come la presen50
Inferenze ampliative
tazione di Wirtinger). Dunque un cambio di rappresentazione si rivela essere la radice concettuale della topologia algebrica e un significativo avanzamento nella conoscenza matematica. Una volta che è stato creato un modo di produrre immagini algebriche di oggetti topologici, è possibile indagare questi ultimi, e porre e risolvere problemi attraverso la conoscenza e le tecniche note per i primi. Chiaramente questo intero processo è sensibile alla rappresentazione, in quanto i problemi che possono essere posti e risolti, le proprietà che possono essere scoperte, dipendono fortemente dalle rappresentazioni costruite.
2.2. Rappresentazioni multiple e teoria dei nodi La «teoria dei nodi fornisce un esempio particolarmente ricco di come differenti notazioni – differenti forme di rappresentazione – individuino differenti aspetti di uno stesso soggetto» 4 . Inoltre è interessante osservare che la teoria dei nodi fornisce un esempio particolarmente significativo del legame tra matematica, intesa quale attività di soluzione di problemi, e trattazione dei problemi fisici e biologici. Infatti le origini della teoria dei nodi affondano proprio nella trattazione di problemi fisici, in particolare la questione della struttura degli elementi costituenti la materia (gli atomi). Tait iniziò a sviluppare la teoria dei nodi proprio nel tentativo di co4
Brown 1999, 64.
51
Capitolo3. Rappresentazioni multiple e ampliatività
struire matematicamente una tavola di elementi che si accordasse con la teoria atomica di Thomson – Lord Kelvin , – ossia l’idea che gli atomi fossero vortici. L’intero progetto è crollato, ma la teoria dei nodi ha continuato ad essere sviluppata mediante un continuo processo di ibridazione che ha portato a rappresentare i nodi in molti modi diversi e ad estendere la conoscenza matematica di questi oggetti. La teoria non è rimasta ancorata ai problemi da cui ha avuto origine, ma è tornata nel corso del tempo ad essere applicabile a problemi di natura fisica o biologica. Il fatto che la teoria dei nodi, dopo un così lungo tempo, sia tornata ad essere usata per trattare problemi fisici e biologici dimostra che il processo di continua moltiplicazione dei punti di vista intorno alla nozione di nodo e la sua evoluzione genera entità astratte che possono essere utilizzate quali ipotesi per trattare problemi diversi. Sono dunque i problemi ad essere reali ed esistere, non gli oggetti matematici che vengono ipotizzati e sviluppati per affrontarli. Gli oggetti matematici hanno infatti una esistenza e una natura ipotetica. Nella costruzione e sviluppo della teoria dei nodi entrano in gioco una molteplicità di rappresentazioni e metodi. Essa, infatti, muove dalle proprietà geometriche dei nodi; procede quindi alla loro rappresentazione piana (proiezione), e sviluppa una notazione che consente una loro trattazione algebrica e combinatoria al fine di ampliare la conoscenza matematica (nuove informazioni e dati) intorno a questi oggetti. Nel corso di questo processo di moltiplicazione di punti di vista si forniscono nuove e diverse definizioni, notazioni, codifiche della nozione di nodo e di alcune 52
Inferenze ampliative
sue principali proprietà. Di volta in volta, come vedremo un po’ più in dettaglio, questo processo di costruzione di nuove e diverse rappresentazioni è motivata dal tentativo di soluzione di problemi, sia generali sia locali, e dipende (ed è indirizzata) dalla conoscenza esistente in quel momento che fa da sfondo alla ricerca. Ad esempio, come vedremo nel caso della teoria dei nodi e della teoria dei grafi, la definizione stessa di nodo è continuamente sottoposta a revisione in relazione allo sviluppo di altri oggetti e domini matematici (come i link). Si tenta di rappresentare il nodo come un oggetto (nella fattispecie si costruisce la rappresentazione di un nodo sotto forma di grafo planare mediale) che possa essere trattato come una entità di una teoria all’interno della quale si dispone di conoscenze e risultati che possono risolvere ai problemi e scoprire proprietà intorno ad esso. Chiaramente con la crescita della conoscenza matematica e delle sue teorie questo processo diventa sempre più sensibile e articolato: maggior è il numero di teorie di cui disponiamo (e dei risultati all’interno di ogni teoria), più rappresentazioni possiamo costruire e quindi più ricco e articolabile è il processo di moltiplicazione dei punti di vista che è il motore del processo di ampliamento della conoscenza matematica. Questo processo è così fecondo perché l’uso di rappresentazioni multiple (ad esempio il nodo come un oggetto geometrico – curva nello spazio –, come un oggetto algebrico – gruppo –, come un oggetto combinatorio – una matrice –, come oggetto aritmetico – un numero –) consente di scoprire proprietà e risolvere problemi di volta in volta non accessibili o risolvibili da una sola rappresentazione, mettendo in gioco le conoscenze di 53
Capitolo3. Rappresentazioni multiple e ampliatività
più domini, come abbiamo già sottolineato anche nel caso della visualizzazione nel Cap. 2, dove i pitogrammi permettono di trovare alcune proprietà non accessibili da una codificazione assiomatico-formale o analitica degli oggetti della teoria dei numeri. Il principale obiettivo della teoria dei nodi è quello di risolvere il problema della enumerazione e classificazione dei nodi. Nel tentativo di risolvere questo problema, nella teoria dei nodi si procede alla costruzione di nuove rappresentazioni ed entità volte a istituire il maggior numero possibile di connessioni con la conoscenza esistente al fine dilatare lo spazio combinatorio delle ipotesi. La definizione stessa di nodo è un processo rappresentativo che non è affatto asettico. Infatti la definizione di un oggetto matematico (come osserva e argomenta Cellucci 5 ) non è affatto un primum e un datum, ma è risultato e processo, che avviene sulla base della conoscenza esistente e con il fine di rendere trattabile un oggetto con gli strumenti conoscitivi di cui si dispone. Al variare della conoscenza esistente, infatti, la definizione di un’entità matematica può essere sottoposta a revisione per consentire una sua trattabilità alla luce della conoscenza che si è andata costruendo in alti domini nel corso del tempo. Per esempio Fox 6 procede alla produzione di una nuova definizione di nodo proprio nel tentativo di legare questo oggetto semplicemente geometrico alla topologia, ai risultati e alle tecniche che nel frattempo questa disciplina aveva sviluppato. 5 6
v. Cellucci 2008. v. Fox 1957.
54
Inferenze ampliative
Nella fattispecie, Fox provvede a passare da una definizione di nodo quale curva poligonale in \ 3 ad una definizione di nodo quale insieme di curve in una 3-varietà (3-manifold) compatta. Questa operazione, basata su un cambio di rappresentazione, è feconda e porta ad un processo di ampliamento della conoscenza poiché, mettendo in connessione la nozione di nodo con il resto della topologia, e permette di giungere alla costruzione di nuovi invarianti geometrici, i quali forniscono un avanzamento nella soluzione del problema della classificazione dei nodi. Ma è possibile definire un nodo in molti modi diversi, per esempio come un gruppo, oppure rappresentarlo in modo tale da renderlo un grafo planare. Questa operazione permette di introdurre nella teoria dei nodi informazione e dati non presenti fino a quel momento (relativi alla teoria dei grafi o all’algebra dei gruppi). Questa possibilità di istituire switch tra diverse rappresentazioni è centrale per la crescita della conoscenza non solo perché permette di trasferire all’interno del dominio indagato (la teoria dei nodi) risultati, metodi e tecniche di altri domini (la teoria dei gruppi o la teoria dei grafi planari), ma perché crea una nuova entità matematica polivalente che consente un trasferimento di conoscenza anche nella direzione opposta, ossia dal dominio indagato agli altri domini. Per esempio risultati della teoria dei nodi sono stati utilizzati per ampliare la conoscenza sui grafi, come nel caso del teorema di Lien – Watkins 7 . La possibilità di istituire una relazione tra teoria dei nodi e 7
v. Lien - Watkins 2000.
55
Capitolo3. Rappresentazioni multiple e ampliatività
teoria dei grafi può essere fatta risalire alla nascita stessa della teoria dei nodi, in quanto già lo stesso Tait aveva sviluppato una rappresentazione di nodi come grafi planari. Lo sviluppo di questa idea apre un nuovo e fecondo punto di vista sia sugli oggetti della teoria nodi sia sugli oggetti della teoria dei grafi, permettendo di rappresentare nodi come grafi (e viceversa) e di effettuare operazioni sui grafi proprie dei nodi (come le mosse di Reidemeister). Mi soffermerò su questa connessione per mostrare la fecondità e il carattere ampliativo delle rappresentazioni multiple nella teoria dei nodi. La possibilità di interpretare nodi come grafi planari passa attraverso la costruzione di una preliminare forma di rappresentazione e notazione. Primi di poter trattare un nodo come un grafo, infatti, bisogna innanzitutto proiettare un nodo (ossia un oggetto geometrico tridimensionale) sul piano, creandone una rappresentazione bidimensionale, e poi si deve sviluppare un modo per codificare simbolicamente gli incroci della proiezione del nodo. Chiaramente questo processo codifica solo una parte dell’informazione e dei dati contenuti in un nodo inteso quale oggetto tridimensionale, ma questa rappresentazione incompleta è volta a risolvere un certo problema, quello dell’equivalenza tra nodi, costruendo un’entità polivalente adeguata per quel problema. La costruzione della teoria dei nodi per opera di Tait, Gauss e Maxwell prende le mosse proprio da questo molteplice cambio di rappresentazione. Un grafo G è formalmente definito come G = (V, E), ossia una coppia di (multi)insiemi: V è l’insieme dei vertici ed E è il (mul56
Inferenze ampliative
ti)insieme dei lati, il quale consiste di sottoinsiemi di V a 1 o 2elementi. Una caratteristica topologicamente interessante dei grafi in questa sede è la planarità. Un grafo è planare, brevemente, quando può essere rappresentato sul piano in modo che i suoi lati si intersecano solo ai vertici.
Figura 9. Alcuni grafi fondamentali
Ad esempio nella Figura 9 il grafo K3 è planare, così come K4. Anche G1 è planare, in quanto isomorfo a K4, mentre i grafi K5 e K3,3 non sono planari. Per costruire l’entità polivalente che permetta di trattare nodi mediante grafi, e viceversa, la proprietà della planarità è essenziale. Per poter trattare un nodo come un grafo è infatti necessario costruirne un’altra rappresentazione, nota come grafo mediale della proiezione del nodo. Questa rappresentazione si ottiene partendo dalla proiezione di un nodo. La proiezione del nodo divide il piano in una serie di regioni, che vengono “colorate” con la procedura della colorazione a scacchi, ossia colorando le regioni confinati alternativamente con due (soli) colori (v. Figura 10). 57
Capitolo3. Rappresentazioni multiple e ampliatività
Figura 10. Colorazione a scacchi di un nodo a trifoglio
Una volta che si è costruita la colorazione a scacchi della proiezione di un nodo, è possibile costruirne un grafo, noto come grafo mediale della proiezione del nodo. Il grafo mediale si ottiene ponendo un vertice in ogni regione scura (la scelta della colorazione è chiaramente arbitraria) e quindi aggiungendo un lato tra essi se e solo se esiste un incrocio che connette le regioni alle quali i vertici corrispondono, e assegnando un valore positivo o negativo in base all’inclinazione delle stringhe in corrispondenza degli incroci (v. Figura 11).
Figura 11. Grafo mediale del nodo a trifoglio
Questo processo di costruzione di una nuova rappresentazione 58
Inferenze ampliative
permette di ampliare la conoscenza sui nodi, consentendo lo studio di alcune proprietà interessanti, quali ad esempio la chiralità o amfichiralità, proprio mediante i metodi della teoria dei grafi planari.
2.3. Rappresentazioni multiple e teoria delle trecce La teoria delle trecce è un esempio paradigmatico della fecondità e del carattere ampliativo delle rappresentazioni multiple. La nascita e sviluppo di questa teoria è infatti incentrata sulla costruzione di entità polivalenti che mettono in gioco rappresentazioni geometriche, algebriche, metodi algoritmici (per esempio per risolvere il problema della classificazione), calcolo combinatorio, analisi complessa, etc. La teoria delle trecce, infatti (v. Artin 1925 e 1947) muove dalla trattazione di un oggetto geometrico tridimensionale (v. Figura 12) – una treccia viene considerata come un oggetto nello spazio euclideo, un insieme di curve, o stringhe, che si intrecciano – e quindi costruisce la sua proiezione sul piano (il diagramma della treccia, v. Figura 13).
Figura 12. Una treccia nello spazio euclideo
59
Capitolo3. Rappresentazioni multiple e ampliatività
Questo cambio di rappresentazione, con il passaggio da tre a due dimensioni, costituisce un primo passo euristico decisivo: costruendo un modo di rappresentare un oggetto tridimensionale in due dimensioni che preserva una quantità di informazione in grado di ricostruire la treccia, si produce un modo per generare trecce da semplici elementi costituenti.
Figura 13. Diagramma di una treccia
La teoria si avvale di un ulteriore cambio di rappresentazione per effettuare un altro decisivo passo euristico, con il quale estendere la polivalenza dell’entità matematica indagata. Essa procede infatti alla costruzione del gruppo trecce, un oggetto algebrico, meglio noto come il gruppo di n-treccia di Artin (v. Artin 1925). Questo passaggio è particolarmente significativo poiché l’aspetto costruttivo e attivo dell’ideazione di una nuova rappresentazione è evidente. Al fine di rendere possibile trattare alla luce della nozione di gruppo e delle sue proprietà una treccia, si deve infatti introdurre la 1n treccia (una serie di n-stringhe non60
Inferenze ampliative
intersecantesi, o parallele), ossia la treccia identità, che è l’analogo dell’elemento identità e di un gruppo nell’algebra. Al fine di rendere possibile l’introduzione di nuova informazione, si rimodella dunque l’oggetto indagato in modo che sia suscettibile di una rappresentazione algebrica e del conseguente trasferimento di conoscenze, metodi e risultati. Questa operazione dunque induce una nuova organizzazione e codificazione dell’informazione circa l’oggetto indagato, e permette di indagarlo ponendo e risolvendo problemi e formulando ipotesi. Per esempio, mediante una rappresentazione algebrica del diagramma delle trecce è possibile costruire e indagare alcune sue proprietà come la moltiplicazione tra trecce, scoprendo come essa sia associativa, ma non commutativa, e dunque arrivando al risultato che le trecce non costituiscono un gruppo abeliano. Inoltre, come già mostrato nell’articolo di Artin, mediante l’algebra è possibile porre alcuni problemi fecondi e ottenere alcune risposte circa le trecce, la loro struttura e le loro proprietà. Una volta che il processo di associazione di un gruppo Bn al diagramma della treccia è stato ultimato, e dopo aver mostrato che è possibile dare una presentazione finita per questo gruppo mediante un generatore noto come il generatore di Artin, si è nelle condizioni di produrre nuova conoscenza sulle trecce e sulla loro struttura semplicemente indagando le proprietà del gruppo che le rappresenta. Questa rappresentazione è parziale e incompleta, poiché codifica solo una parte dell’informazione e dei dati dell’iniziale oggetto tridimensionale, ma è motivata dal tentativo di introdurre nuova informazione e conoscenze per indagare 61
Capitolo3. Rappresentazioni multiple e ampliatività
l’oggetto e le sue proprietà alla luce di un problema specifico, quale l’equivalenza tra trecce. Per esempio mediante il gruppo Bn è possibile: - determinare tutti gli automorfismi del gruppo di trecce; - determinare con quali trecce è una data treccia commutativa; - stabilire per due trecce qualsiasi se esse possono essere trasformate l’una nell’altra mediante un automorfismo interno del gruppo; - trovare sottogruppi di Bn che hanno una particolare interpretazione geometrica; Pertanto il gruppo treccia si rivela un modo estremamente fecondo e ampliativo di rappresentare una treccia, in grado di produrre nuovi e fecondi risultati. In particolare il gruppo treccia permette di porre e risolvere sia il cosiddetto problema della “parola” sia quello della “coniugazione”. Questi sono due risultati molto rilevanti. La soluzione del problema della parola permette infatti di avere un metodo (nella fattispecie un algoritmo), per stabilire se due n-trecce qualsiasi siano equivalenti o meno. Da questo risultato possiamo ottenere una classificazione completa delle trecce. La soluzione del problema della coniugazione avviene attraverso la costruzione di un esplicito algoritmo e si rivela molto importante poiché è un risultato che può essere esportato fuori dalla teoria delle trecce, per esempio per classificare i link mediante una opportuna rappresentazione delle trecce in termini di link. Questo passaggio è garantito dal teorema di Alexander (v. Alexander 1923), il quale stabilisce che qualsiasi nodo o link in 62
Inferenze ampliative
S3 può essere rappresentato da una treccia chiusa. Ovviamente ciò richiede un ulteriore adattamento della nozione di treccia. La costruzione di una nuova, ulteriore rappresentazione dell’oggetto treccia è al centro di altri significativi avanzamenti nello studio delle proprietà di questa entità matematica. La costruzione di permutazioni di trecce, trattando il diagramma della treccia come un oggetto algebrico-combinatorio, permette infatti di trovare invarianti delle trecce, creando un successivo fecondo punto di vista. Si consideri un gruppo β ∈ Bn. Qualunque sia la struttura dell’oggetto geometrico che rappresenta, esso è tale che i-esima stringa della treccia unisce Ai a Bj(i), per 1 ≤ i ≤ n. Si definisce dunque la permutazione tra trecce, π: Bn → Sn, dove Sn è il gruppo simmetrico su n elementi, come: 2 n ⎞ ⎛ 1 π(β ) := ⎜ ... ... ⎟ ⎝ j(1) j(2) j(n) ⎠
Quindi si è costruito un modo di associare ad ogni n-treccia β, una permutazione unica dei numeri 1, 2, ..., n con β, che esprime il modo in cui le stringhe di β permutano i punti di partenza della treccia con i punti finali. Ancora una volta l’immagine di β creata mediante π codifica solo parzialmente e in modo incompleto l’informazione della treccia. Si può infatti facilmente verificare che, dato un qualche ρ ∈ Sn, esistono molte differenti n-trecce che possono essere associate a ρ mediante π. Questa rappresentazione è funzionale alla costruzione di una nozione, quale quella di invariante di una treccia, che permette di rispondere in modo efficace alla questio63
Capitolo3. Rappresentazioni multiple e ampliatività
ne dell’equivalenza tra due trecce, ossia di stabilire se due trecce non sono equivalenti, anche se bisogna sottolineare che non è possibile usare questo strumento per stabilire in generale se due trecce siano equivalenti. Ora, sia X un insieme e data f una funzione f: Bn → X, diciamo che f è un invariante di treccia se β β’ ֜ f(β) = f(β′). L’idea che motiva questa nozione è quella di assegnare qualche elemento di X ad ogni β אBn in modo tale che due trecce qualsiasi equivalenti siano assegnate allo stesso elemento. Pertanto questa funzione è invariante rispetto alla relazione di equivalenza. La rappresentazione usata nella trattazione di un problema o di un oggetto matematico è dunque decisiva per investigarne le proprietà. Se si cambia rappresentazione, si possono porre domande diverse e ottenere risposte differenti rispetto a quelle cui si può avere accesso mediante un’altra rappresentazione. La sensibilità alla rappresentazione, ad una molteplicità di rappresentazioni, è dunque particolarmente evidente nella teoria delle trecce. Di volta in volta si costruisce una diversa o nuova rappresentazione in base ai problemi che si vuole porre e risolvere, alle proprietà di cui si vuole dare conto. Tali rappresentazioni, pur essendo incomplete e parziali, svolgono un ruolo euristico decisivo poiché introducono nuova informazione mediante cui possiamo ampliare l’insieme delle conoscenze disponibili su un certo ente matematico. In un certo senso, dunque, la rappresentazione crea l’oggetto e le sue proprietà.
64
Inferenze ampliative
3. Rappresentazione e oggetti matematici Tra rappresentazione e oggetti matematici esiste una correlazione precisa e stretta. La sensibilità alla rappresentazione è una caratteristica essenziale degli oggetti matematici e deriva dalla natura stessa della matematica, che procede mediante una moltiplicazione dei punti di vista intorno ad uno “stesso oggetto” basata sulla produzione di sue diverse rappresentazioni. Questo processo di moltiplicazione dei punti di vista è potenzialmente infinito, poiché gli oggetti matematici sono sempre suscettibili di nuove interpretazioni e nuove rappresentazioni. Questa sensibilità a sempre nuove rappresentazioni degli oggetti della matematica, questo loro intrinseca suscettibilità, deriva dalla loro natura e dalla natura della matematica. Come abbiamo visto nel capitolo precedente, la costruzione di una nuova rappresentazione e la conseguente produzione di un nuovo punto di vista fa sì che si proceda ogni volta ad una organizzazione e codificazione dall’interno (mediante una nuova definizione, o la costruzione di una sua immagine all’interno di un altro dominio) dell’oggetto trattato. L’oggetto non rimane dunque “lo stesso”, non si tratta dello stesso oggetto semplicemente, perché non esiste qualcosa come un’entità matematica fissata di per sé e univoca. Gli oggetti matematici, come abbiamo visto in questo capitolo e come avremo modo di vedere nel corso del successivo, sono semplicemente ipotesi per risolvere i problemi. Hanno uno statuto e una esistenza meramente ipotetica e la loro sensibilità alla rappresentazione ne è una prova diretta. 65
Capitolo3. Rappresentazioni multiple e ampliatività
Sono i problemi che questi oggetti cercano di affrontare e risolvere che sono pratici, problemi che esistono e nascono da questioni fisiche e biologiche. Per esempio, come abbiamo visto, la teoria dei nodi è nata come tentativo di fornire una trattazione e una risposta a problemi della fisica, in particolare la natura degli elementi costituenti della materia. Per questo motivo gli oggetti della matematica che sembrano anche molto astratti possono avere applicazione ed efficacia nella trattazione del mondo fisico e biologico, in quanto la loro “astrattezza” è il risultato di questo continuo processo di moltiplicazione dei punti di vista cui sono sottoposti. È per questo motivo che gli oggetti della matematica dipendono dal linguaggio e dalla rappresentazione adottata, e proprio in questo risiede la fecondità della matematica. Che gli oggetti della matematica non siano univoci e fissati di per sé e, che siano intrinsecamente suscettibili di sempre ulteriori rappresentazioni, può far pensare che essi siano entità così produttive e feconde in quanto ambigue 8 . Tuttavia l’uso del termine ambiguità sembra rimandare all’idea che esista una realtà matematica univoca, che una data rappresentazione non riesce a ritrarre con fedeltà e chiarezza. Invece la tesi sostenuta in questo libro è che non c’è ambiguità in matematica: la produzione di rappresentazioni procede ogni volta a costruire e organizzare dall’interno gli oggetti che definisce e rappresenta, creando una moltitudine di entità che possono essere messe in relazione tra loro per risolvere problemi e ampliare la nostra conoscenza.
8
V. p. es. Byers 2007, Grosholz 2007, Hersh 2007.
66
Inferenze ampliative
4 Analogia e ampliatività
1. Premessa Il continuo processo di costruzione e combinazione di differenti rappresentazioni si basa sulle inferenze ampliative. In particolare in questo capitolo sostengo che l’analogia gioca un ruolo centrale in questo processo. Essa è infatti una forma di inferenza che consente di costruire sempre nuove rappresentazioni di oggetti matematici e di passare dall’una all’altra mediante passaggi inferenziali audaci ma plausibili. Questa forma d’inferenza è dunque uno strumento essenziale e fecondo per modellare lo spazio combinatorio delle ipotesi (ossia lo spazio di ricerca che racchiude le possibili combinazioni tra dati e informazioni che possono dare luogo a ipotesi esplicative), contraendolo o espandendolo in base all’oggetto della ricerca, come avremo modo di sottolineare nei paragrafi seguenti. Dunque l’analogia amplia la conoscenza estendendo la capacità di costruire nuove e diverse rappresentazioni di oggetti matematici, consentendo di stabilire interazioni tra contesti differenti, sia a livello inter-dominio sia a livello intra-dominio. L’analogia costituisce una modalità privilegiata per produrre nuove rappresentazioni di oggetti matematici, di estendere continuamente la loro polisemia perché introduce sempre nuova informazione e 67
Capitolo 4. Analogia e ampliatività
dati da altri domini. Ovviamente esistono molte possibili analogie che possono essere costruite e che danno origine a ipotesi tra cui bisogna operare una scelta. Il criterio per effettuare questa scelta, come abbiamo già sottolineato nel Cap. 1, e come argomenteremo più dettagliatamente in seguito, non può essere di natura probabilistica, ma deve riferirsi ad una nozione diversa, quale la plausibilità 1 . Tra analogia e rappresentazione esiste una relazione bi-direzionale, in quanto da una parte l’analogia produce nuove rappresentazioni consentendo di trattare un oggetto come se fosse un altro, dall’altra parte molteplicità di rappresentazioni possono essere messe in gioco per costruire un’analogia, anche analogie multiple. La forza dell’inferenza analogica risiede nella sua capacità di assimilare enti che possono essere dissimili anche sotto molti punti di vista e di superare queste difformità, di produrre ipotesi e conoscenze “ampliate” in questo modo. L’analogia è inoltre una forma d’inferenza ampliativa dalle caratteristiche tali da porre un problema rilevante per la filosofia della scienza e che ha profonde implicazioni metodologiche ed epistemologiche. Il capitolo analizza mediante alcuni esempi le principali caratteristiche dell’analogia, e il ruolo che essa svolge sia nei processi di scoperta sia nei processi di giustificazione, mostrando come la sua versione parallela rappresenti un argomento forte contro la distinzione tra contesto della scoperta e della giustificazione, e 1
Cfr. Ippoliti 2007, Cap. 5.
68
Inferenze ampliative
che getta nuova luce sulla natura delle inferenze ampliative. Nel capitolo inoltre, in linea con l’approccio dell’intero libro, argomento a favore di una concezione euristica dell’analogia, senza tralasciare di analizzare i limiti intrinseci di questa forma d’inferenza e, più in generale, delle inferenze ampliative.
2. Definizione L’analogia può essere concepita sotto varie forme, che sono comunque riconducibili a due concezioni fondamentali. Essa può essere concepita come una forma di similarità, nella fattispecie una «similarità a un livello più profondo e concettuale» 2 . Ad esempio Polya (v. Polya 1954) ne analizza molti esempi tratti dalla matematica ma anche dalla fisica e dalle scienze sperimentali. In tali domini l’analogia non solo è ovviamente un prezioso strumento didattico, ma anche un potente mezzo euristico: essa infatti «sembra aver un ruolo in tutte le scoperte, ma in alcune fa la parte del leone» 3 . Al contempo l’analogia funge da strumento di valutazione e giustificazione della conoscenza, in quanto permette di corroborare una conoscenza o un’ipotesi esplicativa. Essa può essere sia uno strumento per provare e giustificare ipotesi e conoscenze (p. es. nella dimostrazione automatica di
2 3
Polya 1954, I, 13. Ivi, 17.
69
Capitolo 4. Analogia e ampliatività
teoremi o mediante modelli di conferma d’ipotesi 4 ) sia un mezzo per ottenere nuova conoscenza (p. es. nei processi di generazione di ipotesi e congetture). Queste due caratteristiche, da un punto di vista filosofico, sono tradizionalmente attribuite a due contesti considerati separati e indipendenti sia da un punto di vista logico sia da un punto di vista temporale, quali il contesto della scoperta e il contesto della giustificazione. Questa doppia valenza dell’analogia rappresenta la caratteristica più controversa e allo stesso tempo più feconda di questa forma d’inferenza ampliativa. L’analogia è inoltre una forma d’inferenza ampliativa che dipende in modo essenziale dal contesto, ossia dall’insieme delle conoscenze esistenti e dei dati disponibili a partire dai quali viene costruita. Il
problema
fondamentale
della
conoscenza
prodotta
dall’inferenza analogica è quello sollevato da ogni forma di ragionamento volta a trattare la questione dell’ampliamento della conoscenza: la determinazione di criteri che consentano di specificare un insieme di ragioni per ritenere giustificate le conclusioni che candida. Nella fattispecie l’analogia pone il cosiddetto problema logico dell’analogia, in breve LPA, ossia il tentativo di «trovare un criterio che, se soddisfatto da una particolare inferenza analogica, stabilisca in modo sufficiente la verità della conclusione proiettata sull’obiettivo» 5 . La definizione stessa dell’analogia rappresenta un problema.
4 5
P. es. quelli sviluppati da Polya (v. Polya 1954). Davies 1988, 229.
70
Inferenze ampliative
L’ortodossia prevalente 6 converge nel definire l’analogia una forma di comparazione mediante cui è possibile operare un trasferimento (transfer) di una proprietà o un’informazione nota da un dominio d’origine sufficientemente conosciuto – la fonte – a un dominio di destinazione – l’obiettivo – almeno parzialmente non conosciuto, mediante una relazione d’associazione d’oggetti, di relazioni e di proprietà tra la fonte e l’obiettivo. L’ortodossia prevalente è inoltre caratterizzata da due principali concezioni dell’inferenza per analogia, la concezione induttivista e la concezione strutturalista. Come vedremo entrambe queste concezioni sono inadeguate a render conto dell’analogia poiché non colgono il suo carattere eminentemente rappresentativo e ampliativo. La concezione induttivista è sostenuta ad esempio da Keynes 7 e da Polya e considera l’analogia come una forma d’induzione, in particolare un’induzione su attributi o proprietà. Essa è una forma di generalizzazione – al limite una generalizzazione a partire da un singolo caso – ottenuta dalla congiunzione di somiglianze materiali tra domini. La concezione strutturalista è sostenuta ad esempio da Weitzenfeld 8 e considera l’analogia come un processo d’associazione tra relazioni causali di alto livello – dove per alto livello si intende anche relazioni tra relazioni – tra la fonte e l’obiettivo. Essa è in linea di principio riconducibile ad una forma di isomorfismo, che consente di trasportare tout court strutture e relazioni dalla 6 7 8
Cfr. Black 1962, e cfr. anche Hesse 1966, Melis - Veloso 1998. Cfr. Kaynes 1921. Cfr. Weitzenfeld 1984.
71
Capitolo 4. Analogia e ampliatività
fonte all’obiettivo. Dunque le due concezioni concordano sulla rilevanza della similarità generale tra i domini ai fini del transfer analogico, e si distinguono in quanto la seconda è basata sulla corrispondenza tra relazioni (e non semplicemente sulla corrispondenza tra attributi, come avviene per la concezione induttivista). La concezione strutturalista, per l’esattezza, si richiama al principio di sistematicità, il quale asserisce che un’analogia è giustificata quando crea un’associazione tra relazioni d’alto grado molto strutturate, che usualmente sono quelle causali. Inoltre entrambe le concezioni ritengono di poter offrire una soluzione a LPA, anche se facendo ricorso a strumenti diversi (come per esempio la nozione di grado di similarità o quella di strutture determinanti 9 ).
3. Probabilità e analogia La descrizione dell’analogia come una forma d’inferenza «ampliativa e probabile» 10 è comunemente accettata sulla base del fatto che «gli argomenti analogici non devono essere classificati come validi o invalidi, in questi casi tutto ciò che si può richiedere è la probabilità» 11 . Tale descrizione e giustificazione dell’analogia, tuttavia, è 9 10 11
v. Davies 1988. Per una analisi di questi strumenti v. Ippoliti 2006. Weitzenfeld 1984, 1. Copi 1961, 466.
72
Inferenze ampliative
problematica e si rivela non sostenibile. L’analogia necessita infatti l’analisi di considerazioni materiali e dipendenti dal dominio, che sono tali da sottrarla a un processo di riduzione alla teoria della probabilità. Nella fattispecie si può osservare che «né la teoria classica della probabilità né quella moderna sono state in grado di dare una descrizione soddisfacente e una giustificazione dell’inferenza per analogia» 12 . Ciò è dovuto ad un insieme di ragioni. In primo luogo l’analogia è un concetto di natura qualitativa, perché è una forma di comparazione, mentre la probabilità è un concetto di natura quantitativa, perché è basata sulla quantificazione, sull’enumerazione e sulla successiva istituzione di rapporti numerici. Le ragioni che motivano un’inferenza analogica non sono e non possono essere di natura probabilistica. Infatti a rigore essa può avere una probabilità molto bassa, anche prossima allo zero, eppur essere giustificata e, al contrario, presentare una probabilità molto alta e non essere giustificata. Che il legame tra le premesse e la conclusione di un’analogia non può essere giustificato facendo ricorso alla teoria della probabilità è un’affermazione che ammette almeno due sensi: - le ipotesi candidate per via analogica si basano su un numero anche molto ristretto di osservazioni e si riferiscono a un numero molto vasto di casi, potenzialmente infinito, per cui il rapporto tra casi favorevoli e casi possibili è tale da conferire all’ipotesi un valore probabilistico molto basso o prossimo allo zero. - le inferenze analogiche si possono basare su un vasto nume12
Carnap 1950, 569-570.
73
Capitolo 4. Analogia e ampliatività
ro di dissimilarità (o analogie negative) tra i domini oggetti di transfer il quale supera di gran lunga quello delle similarità (o analogie positive) e quindi, di nuovo, il loro rapporto conferisce una probabilità molto bassa alla conclusione, anche se essa è motivata (ad esempio perché avviene su proprietà rilevanti). Al contrario, inferenze basate su un supporto proveniente da un numero elevato di similarità tra i domini oggetti di comparazione (e quindi su un alto valore probabilistico) possono rivelarsi non motivate. Quindi la probabilità non è essenziale e utile sia nella costruzione, sia nella valutazione, sia, ancora, nella scelta tra varie ipotesi plausibili. Non è infatti possibile ricorrere alla probabilità neanche per effettuare la scelta tra varie ipotesi ottenute per via analogica al fine di risolvere un problema. L’ipotesi che ha un alto valore probabilistico potrebbe non essere quella giusta per risolvere il problema. Tale scelta, ancora una volta, deve avvenire sulla base della plausibilità di un’ipotesi, ossia di una sua valutazione qualitativa. La teoria della probabilità non è uno strumento adeguato a rendere conto della complessità e dell’essenza del processo d’inferenza analogica per un semplice motivo: una soluzione di LPA non può essere data poiché l’analogia, in quanto inferenza ampliativa, è soggetta al cosiddetto paradosso dell’inferenza 13 . Pertanto non è possibile avere una vera analogia, ossia non ridondante, che sia al contempo corretta e ampliativa 14 , ossia tale 13 14
Cfr. Cellucci 2002, 167-168. Per una discussione approfondita della relazione tra correttezza ed ampliatività cfr.
74
Inferenze ampliative
che le sue premesse conferiscano un qualche grado di certezza alla conclusione candidata e al contempo estenda davvero le nostre conoscenze. Il legame che un’inferenza analogica istituisce tra premesse e conclusione è semplicemente plausibile, in un senso che non è riconducibile alla probabilità. In particolare, l’analogia è plausibile nel senso che deve essere compatibile con i dati e la conoscenza esistente. Il fatto che l’inferenza candidata per via analogica non riceva affatto un sostegno probabilistico dalle sue premesse è avvalorato dal fatto che i criteri utilizzati per giustificare l’inferenza analogica non riescono ad assolvere questo compito se non banalizzandola e rendendola «ridondante» 15 . Ossia a meno che non si riduca l’analogia ad una forma di isomorfismo tra strutture (e quindi si riduca de facto il trasferimento analogico a una forma di deduzione), non esiste una giustificazione del salto analogico 16 . Dunque non è possibile pensare di giustificare in termini probabilistici l’inferenza analogica, sia essa intesa come mezzo per generare ipotesi, sia essa intesa come mezzo per sostenere un’ipotesi o una congettura. L’analogia, proprio in quanto ampliativa, è senza dubbio utile, fertile e feconda, ma non fornisce alle conclusioni Cellucci 2002, 165-169. 15 16
Juthe 2005, 1. Almeno non in termini internalisti, ossia senza far riferimento alla realtà. Per una
analisi approfondita circa l’impossibilità di una giustificazione di natura internalista dell’inferenza deduttiva e non deduttiva cfr. Cellucci 2006; per una analisi circa l’impossibilità di giustificare l’analogia mediante i criteri di similarità, tipicità e determinazione cfr. Ippoliti 2006.
75
Capitolo 4. Analogia e ampliatività
che candida un supporto di tipo probabilistico.
4. Analogia, rappresentazione e scoperta Le analogie possono essere costruite mediante l’uso di rappresentazioni multiple. Nel caso che esamineremo nei paragrafi seguenti un problema della teoria dei numeri è risolto mediante una combinazione di due distinte rappresentazioni (algebrica e geometrica), la quale genera l’analogia che produce l’ipotesi risolutrice. Da questa analogia basata su rappresentazioni multiple di una certa entità matematica, le quali trasferiscono nuova informazione all’interno del problema trattato, segue la produzione di nuova conoscenza e la scoperta di nuove proprietà e ipotesi. L’analogia gioca un ruolo essenziale nel processo di scoperta e ampliamento della conoscenza matematica. L’esempio cui ricorro in questa sede per discutere la relazione tra analogia e ampliatività è stato oggetto di varie analisi 17 ed «è d’interesse storico e di gran lunga più bello di qualsiasi esempio molto elementare al quale si possa pensare» 18 . L’esempio in questione è la soluzione del matematico svizzero Eulero al problema di Mengoli 19 , che oggi definiremmo come
17
Cfr. Polya 1954, van Bendegem 2000, Bartha 2002, Corfield 2003 cap. 4, Ippoliti
2006 e 2007. 18 19
Polya 1954, I, 17. Cosiddetto in quanto originariamente formulato dal matematico italiano Pietro Men-
goli nella sua opera Novae quadraturae arithmeticae (1650).
76
Inferenze ampliative
la determinazione del valore ζ(2). Tale soluzione è ottenuta facendo ricorso a una doppia analogia ed è fondata su un passaggio ampliativo, per sua natura «audace e scorretto da un punto di vista logico» 20 . Essa, per ammissione dello stesso Eulero, si avvale di un procedimento che non era mai stato praticato prima e la cui attendibilità andava quindi verificata attraverso il confronto con la conoscenza esistente. La soluzione data da Eulero a questo problema è particolarmente rilevante per discutere il ruolo dell’inferenza ampliativa e della rappresentazione nella matematica. Il problema è quello che riguarda la determinazione del valore della somma infinita dell’inverso dei quadrati: 1
1
1
1
∞
1
(MP) 1 + 4 + 9 + 16 + ... + n 2 = ∑ n 2 = ? . n =1 Nei paragrafi che seguono fornisco pertanto un’analisi del processo di soluzione di Eulero che si discosta da quelle proposte dalla letteratura sull’argomento, che evidenzia il ruolo e la natura euristica dell’analogia, e la quale soprattutto getta luce sulle modalità per cui l’analogia è uno strumento d’ibridazione che si avvale di rappresentazioni multiple per produrre, attendendoci alla nostra metafora iniziale, una moltitudine di punti di vista intorno all’oggetto trattato. Il processo di soluzione di Eulero muove dal tentativo di ridurre il problema a un risultato noto analogo, ossia tale da soddisfare alcune delle condizioni di risolvibilità del problema ricavate 20
Polya 1954, I, 21.
77
Capitolo 4. Analogia e ampliatività
dalla sua preliminare analisi (in un certo senso di analisi 21 ). Pertanto la questione se il problema di Mengoli sia risolvibile o meno è ridotta alla ricerca di tale risultato noto, o meglio ad una combinazione di risultati noti, tali da soddisfare le seguenti condizioni: (a) sia rappresentabile nella forma di una serie infinita; (b) sia rappresentabile nella forma di una somma del tipo: 1 1 1 1 + 2 + 2 + ... + 2 ; 2 x1 x2 x1 xn
(c) le variabili in (b) siano tali che x1=1, x2=2 , … , xn = 2n L’obiettivo del processo di soluzione del problema diventa dunque la generazione di una serie dal valore noto che sia in grado di soddisfare, mediante opportune rappresentazioni, le condizioni (a) - (b) - (c). Pertanto (MP) è risolvibile se è possibile trasformarlo in serie infinita della forma (b) - (c) il cui valore sia noto. Per poter effettuare tale ricercare e dunque costruire una ipotesi adeguata per risolverlo è possibile estendere le informazioni e i dati contenuti nel problema mediante una espansione dello spazio combinatorio delle ipotesi (ossia lo spazio di ricerca che racchiude le possibili combinazioni tra dati e informazioni che possono dare luogo a ipotesi esplicative), che aggiunga conoscenza oltre quella accessibile all’interno della teoria dei numeri. L’analogia svolge proprio questa funzione di modellazione ed espansione/contrazione dello spazio combina21
v. Cellucci 1998 e 2002.
78
Inferenze ampliative
torio delle ipotesi, introducendo mediante il transfer analogico nuovi dati e informazioni che possono essere utilizzati per costruire le varie ipotesi volte a risolvere il problema. Lo spazio combinatorio delle ipotesi è delimitato dalle condizioni di risolubilità (ossia a–b–c) del problema individuate per mezzo dell’analisi, che permettono di effettuare una scelta tra le infinite possibili ipotesi che possono essere generate per risolvere il problema. A questo punto il processo di ricerca ricorre ad una interazione con il corpo di conoscenze esistente al tempo di Eulero (nella fattispecie l’algebra) e permette di trovare un’equazione algebrica che soddisfa la proprietà (b) – istituendo un’analogia positiva, – ma non la proprietà (a) (non è una serie infinita) – fornendo un’analogia negativa. Tale equazione è: ⎛ 1 1 1 1 ⎞ (d) b1 = b0 ⎜ 2 + 2 + 2 + ... + 2 ⎟ x2 x1 xn ⎠ ⎝ x1
la quale deriva da: ⎛ x 2 ⎞⎛ x2 ⎞ ⎛ x2 ⎞ (e) b0 ⎜1 − 2 ⎟⎜1 − 2 ⎟ ... ⎜1 − 2 ⎟ ⎝ β1 ⎠⎝ β 2 ⎠ ⎝ β n ⎠
Per b0≠0, (e) esprime la relazione tra i coefficienti e le radici di un’equazione algebrica generica, ossia: (f) b0 – b1x2 + b2x4 - …+ (-1)n bnx2n+1, la quale ha la proprietà (g) di avere 2n radici β1, -β1, β2 , -β2 , … ,
βn , -βn. Sulla base delle similarità e dissimilarità riscontrate (ma non 79
Capitolo 4. Analogia e ampliatività
sulla base di una loro comparazione quantitativa e quindi riconducibile alla probabilità), Eulero può compiere un primo salto inferenziale: formula infatti per analogia l’ipotesi (I) che una proprietà, ossia (d), che è valida per casi finiti valga anche per casi infiniti. Questo processo di riduzione permette di rappresentare il problema iniziale sotto forma algebrica. Questa rappresentazione è ovviamente parziale e incompleta e non si basa su isomorfismo tra due entità, in quanto sono presenti alcune analogie negative. Esse ha l’effetto di introdurre nuova informazione, che consente di produrre una rappresentazione dell’oggetto iniziale (MP), che è plausibile e che è suscettibile di ulteriore trattazione. Quindi il problema iniziale è ora ridotto alla ricerca di una funzione di tipo (d) che sia in grado di soddisfare le condizioni (f) - (g) - (c). Questa nuova ricerca richiede una nuova espansione dello spazio combinatorio delle ipotesi, che si attua mediante una successiva interazione con il corpo della conoscenza esistente, la quale permette a Eulero di individuare l’esistenza nella trigonometria di una serie infinita di tipo (d) che può essere rappresentata come una funzione di tipo (f), il cui valore è noto. Essa è lo sviluppo in serie di potenze di sin(x) = 0, che è uguale a: x x3 x3 x 7 − + − + ... = 0, 1 3! 5! 7!
che ha 2n+1 radici: 0, π , -π , 2π , -2π , … , nπ , - nπ. A questo punto è possibile effettuare una nuova trasformazione dello sviluppo in serie di potenze di sin(x) in un’equazione 80
Inferenze ampliative
algebrica infinita analoga a (b) semplicemente dividendo i due membri dell’equazione per x, ovvero per il fattore lineare che corrisponde alla radice 0 (ossia per il valore 1): sin x x2 x4 x6 = 1 − + − + ... . x 3! 5! 7!
Otteniamo in questo modo un’equazione di tipo (f) con 2n radici π, -π, 2π, -2π, …, nπ, -nπ, che si accorda con la condizione (c). Ancora una volta, questa rappresentazione di (MP) è incompleta e parziale e non è un isomorfismo, in quanto presenta delle analogie negative. Ma introduce nuova informazione nel problema, ampliandone la nostra conoscenza e la sua trattabilità. Infine, di nuovo per analogia, (ossia sulla base delle similarità riscontrate), Eulero compie il secondo e decisivo salto inferenziale: ipotizza (II) che proprietà – quali (e) e (d) – che sono valide per equazioni algebriche, siano valide anche per equazioni non algebriche (nella fattispecie trigonometriche). Ciò gli permette di compiere il passaggio decisivo per la soluzione del problema, rappresentando
sin x = 0 , in accordo con (e), come x
il prodotto infinito: ⎛ x 2 ⎞⎛ x 2 ⎞⎛ x2 1 1 1 − − − (III) ⎜ π 2 ⎟⎜ 4π 2 ⎟⎜ 9π 2 ⎝ ⎠⎝ ⎠⎝
⎞ ⎟ ... ⎠
ossia, in accordo con (d), 1 1 1 1 1 = + + + ... 3! π 2 4π 2 9π 2 16π 2 .
Da qui, semplicemente moltiplicando per π 2 entrambi i membri 81
Capitolo 4. Analogia e ampliatività
dell’uguaglianza, otteniamo il valore che risolve il problema iniziale (MP): 1
1
1
1
π2
π2
(S) 1 + 4 + 9 + 16 + ... + n 2 = 3! = 6 . Ovviamente questa non è in senso stretto la soluzione del proπ2
blema di Mengoli. Il valore candidato 6 è un valore plausibile supportato da una doppia inferenza analogica, ottenuta mediante la combinazione di differenti rappresentazioni dell’oggetto iniziale. Questa inferenza semplicemente mostra come dalle ipotesi (I) e (II) ricavate per via analogica segue la validità dell’asserzione (S), ossia si ha che: 1 1 1 1 π2 ( I ) ∧ ( II ) → 1 + + + + ... + 2 = . 4 9 16 n 6
La questione relativa alla validità delle ipotesi (I) e (II), e della loro estensione, costituisce a sua volta un altro problema da risolvere. Le ipotesi (I) e (II) candidano pertanto una soluzione del problema mediante inferenze che sono basate su passaggi audaci e scorretti: infatti «da un punto di vista strettamente logico, essa era apertamente una fallacia: egli (Eulero, NdA) aveva applicato una regola a un caso per il quale la regola non era stata fatta, una regola per equazioni algebriche a una equazione che non è algebrica. Da un punto di vista strettamente logico, il passaggio di Eulero non era giustificato» 22 . Al fine di provare la correttezza di tali ipotesi, è prima neces22
Ivi, 21.
82
Inferenze ampliative
sario dimostrare la correttezza del passaggio dal finito all’infinito nel caso delle somme (I), e quindi la correttezza del passaggio dall’algebra alla trigonometria (II). Tuttavia una tale prova non può ovviamente essere data in via generale: le ipotesi (I) e (II) sono basate su inferenze ampliative, che non sono giustificate nel senso in cui lo sono quelle non-ampliative. La loro validità può infatti essere solo di carattere locale, relativa a casi particolari che soddisfano precise condizioni 23 . L’analogia è dunque usata in questo caso come mezzo d’ibridazione 24 , ossia come un processo che permette di trattare in modo multivalente e polisemico un oggetto, il quale viene sottoposto ad un processo di moltiplicazione di punti di vista (si passa dalla teoria dei numeri all’algebra e alla trigonometria) con la conseguente produzione di sue nuove rappresentazioni (ossia organizzazione e codifica dell’informazione e dei dati che lo strutturano) che estendono davvero la conoscenza.
5. Analogie multiple L’inferenza analogica presenta un’ulteriore caratteristica particolarmente rilevante delle inferenze ampliative, che ha ripercussioni sia sulla metodologia della scienza sia su alcuni cardini della filosofia della scienza tradizionale. Essa è infatti una forma di ragionamento parallelo: il processo inferenziale cui può dar luogo si 23 24
Cfr. p. es. Hardy 1906 per una trattazione dei limiti dell’ipotesi (I). Cfr. Grosholz 2000, 81-91, e Cellucci 2002, 285-291.
83
Capitolo 4. Analogia e ampliatività
può articolare sulla base di una molteplicità di fonti, ossia mediante «analogie in cui più di una fonte analoga è usata per ragionare su un obiettivo analogo» 25 , perché «una conclusione analogica da molti casi paralleli è più forte di una da pochi casi» 26 , o da uno solo. Infatti l’analogia singola non che è «il più semplice o almeno più comune caso di ragionamento analogico» 27 , e rappresenta «il principale soggetto delle attuali teorie cognitive e modelli computazionali del ragionamento analogico» 28 . La versione classica dell’analogia è pertanto solo un caso particolare dell’analogia multipla, ossia quella in cui una sola fonte è utilizzata nel processo inferenziale. Il ragionamento parallelo è una forma di ragionamento in cui più processi inferenziali concorrono sia sincronicamente sia asincronicamente alla produzione di conclusioni su un dato problema, le quali sono poi unificate in un'unica conclusione. Nel caso dell’analogia multipla, infatti, più fonti possono essere utilizzate sia sincronicamente sia asincronicamente nel processo inferenziale e i loro risultati possono essere unificati mediante un'unica conclusione. Il processo d’unificazione è un processo che compone le varie conclusioni candidate, e quindi è non-meccanico e problematico, e richiede una valutazione delle varie componenti in gioco. Le conclusioni candidate dalle singole fonti analoghe possono infatti 25 26 27 28
Shelley 2003, 3. Polya 1957, 43. Shelley 1999, 144. Ibid.
84
Inferenze ampliative
essere tra loro in disaccordo sia parziale sia totale: ciò richiede un processo di cooperazione e negoziazione sia tra le fonti sia tra le varie conclusioni che esse candidano. Questo processo di composizione può implicare la revisione o lo scarto di una conclusione candidata a partire da una certa fonte, o un indebolimento della conclusione finale. Per esempio una conclusione analogica da più fonti può essere indebolita assumendo una forma disgiuntiva, in cui i vari disgiunti sono le conclusioni candidate da più o al limite da tutte le fonti impiegate 29 . Ossia se per risolvere un problema p si usa una molteplicità di fonti analoghe f1, f2,…, fn che candidano rispettivamente le conclusioni c1, c2,…, cn, allora la conclusione per analogia multipla può assumere la forma c1 ∨ c2 ∨…∨ cn. È opportuno sottolineare che l’analogia multipla 30 non è una semplice concatenazione d’analogie singole «nel senso che solo una fonte analogica è usata nella comparazione» 31 , ma è una comparazione in cui più fonti, contemporaneamente, interagiscono in modo strutturato a candidare la conclusione per l’obiettivo analogo. Ciò significa che la quantità di fonti disponibili non è tutto per l’analogia multipla: anzi «la qualità è ancora più importante, qui, della quantità. Analogie dal taglio chiaro hanno un peso maggiore di vaghe similarità, istanze assemblate sistematicamente contano di più di collezioni casuali di casi» 32 . L’aspetto qualitativo è essenziale perché, come abbiamo visto, una valuta29 30 31 32
Cfr. p. es. Talaly 1987. Cfr. Shelley 1999, 2002a, 2002b, 2003. Shelley 2003, 4 Polya 1957, 43.
85
Capitolo 4. Analogia e ampliatività
zione quantitativa o probabilistica dell’inferenza ampliativa, e dell’analogia, è insostenibile. L’analogia multipla mostra in modo esemplare come l’inferenza ampliativa possa essere contemporaneamente sia uno strumento di scoperta sia uno strumento di giustificazione. In alcuni processi d’inferenza per analogia multipla, infatti «la stessa analogia può servire entrambi gli scopi» 33 . Come osserva Shelley 34 , si danno casi di scoperte scientifiche in cui l’analogia multipla interviene sia nel processo di generazione dell’ipotesi, sia nel processo di conferma dell’ipotesi generata. In alcuni di questi casi la stessa analogia arriva a fungere sia da strumento di generazione dell’ipotesi sia da strumento di conferma della stessa. Quindi se si accetta il fatto che il compito dell’analogia è quella di fornire credibilità all’ipotesi candidata, nel senso che essa misura quanto credibile è «che qualsiasi successiva fonte analoga che aderisce al target sosterrà la stessa conclusione sostenuta dalle precedenti fonti» 35 , e si conviene nel ritenere questa pratica come legittima, allora ne segue che la distinzione dell’empirismo logico «di scoperta e giustificazione quali fasi indipendenti della ricerca deve essere abbandonata» 36 . Quindi non solo l'inferenza analogica, soprattutto nella sua versione multipla, non fornisce alcun sostegno probabilistico alla conclusione che candida (sia che essa intervenga nella fase della scoperta sia 33 34 35 36
Shelley 2003, 86 Cfr. Shelley 2003, par. 4.3. Ivi, 29. Ivi, 134.
86
Inferenze ampliative
nella fase della giustificazione), ma inficia quest’ultima distinzione. L’analogia per ragionamento parallelo è dunque un argomento contro questa «rappresentazione distorta» 37 e mostra come «la scoperta non si colloca in una prima fase della ricerca matematica a cui poi ne fa seguito un’altra, quella della giustificazione, ma copre l’intero suo arco» 38 . La scoperta non è infatti un processo casuale, ma è la generazione di ipotesi plausibili, cioè compatibili con la conoscenza esistente, e «per vedere se le ipotesi sono compatibili con la conoscenza esistente si devono esaminare le ragioni pro e contro di esse» 39 . Poiché questo esame viene effettuato sulla base di prove che avvalorano le ipotesi o le discreditano, i processi che intervengono nella fase di scoperta sono inseparabili da quelli che intervengono nella fase di giustificazione.
6. La concezione euristica dell’analogia La soluzione di Eulero del problema di Mengoli è ottenuta facendo un uso dell’analogia che si accorda con una concezione alternativa a quella induttivista e strutturalista, nella fattispecie la concezione euristica. La concezione induttivista e la concezione strutturalista non sono infatti in grado di render conto dell’ampiezza e complessità del processo d’inferenza analogica. La con37 38 39
Cellucci 2002, 147. Ivi, 146. Ibid.
87
Capitolo 4. Analogia e ampliatività
cezione euristica invece tratta l’analogia da un punto di vista nuovo, ossia non volto a rintracciare le basi della certezza del processo analogico, ma che considera il paradosso dell’inferenza come costituivo della teoria dell’analogia e dell’inferenza ampliativa in generale. Essa non ha dunque la pretesa di risolvere la tensione tra correttezza e ampliatività, ma la pone a fondamento di una trattazione che dà conto in profondità del processo d’inferenza analogica. Da ciò segue che il compito di una riflessione sull’analogia, e sull’inferenza ampliativa, non è la soluzione di LPA (che per altro non può essere data), ma lo sviluppo e il raffinamento di metodi per indagare oggetti e risolvere problemi, ossia di strumenti per generare ipotesi esplicative e congetture. La concezione euristica analizza l’analogia quale strumento di modellazione dello spazio combinatorio delle ipotesi, che opera all’interno del metodo analitico, in particolare nella versione data da Cellucci 40 , e secondo le dinamiche proprie dei sistemi concettuali aperti 41 , che le conferiscono superiori capacità inferenziali. Il metodo analitico è uno strumento mediante cui ridurre un problema dato ad alcune condizioni di risolubilità, che delimitano lo spazio combinatorio di ricerca delle ipotesi. Nel processo di analisi si arriva dunque a ridurre il problema ad un nuovo problema, lasciando alle inferenze ampliative il compito di generare ipotesi plausibili che si accordino con queste condizioni. Una volta che la riduzione è stata operata, si apre infatti il processo di ricerca e costruzione di ipotesi e congetture per risolverlo: il me40 41
Cfr. Cellucci 1998 e 2002. Cfr. Cellucci 1998, 309-346.
88
Inferenze ampliative
todo analitico non é un metodo per trovare le ipotesi. Tale processo, che procede dal basso verso l’alto (dal problema alle ipotesi), si articola secondo i caratteri propri dei sistemi concettuali aperti 42 e si avvale di inferenze ampliative, di procedimenti per tentativi ed errori, mediante una molteplicità di rappresentazioni non necessariamente isomorfe che trasformano l’oggetto iniziale all’interno dello spazio combinatorio così delimitato. L’analogia è in grado di far fronte a tale esigenza in quanto è un’inferenza ampliativa che fornisce un metodo (non algoritmico) per generare ipotesi che si accordano con le condizioni di risolubilità e la conoscenza esistente in un sistema concettuale aperto. La soluzione di Eulero al problema di Mengoli si accorda con questo processo. In particolare, nonostante non sia possibile ricostruire l’intero processo che ha condotto il matematico svizzero alla formulazione delle ipotesi (I) e (II), la struttura della sua soluzione è tale da rispondere a pieno alla concezione euristica dell’analogia. Infatti è possibile osservare le seguenti caratteristiche del processo di soluzione della serie (MP): 1) il processo di soluzione è di natura bottom-up, dal problema alle ipotesi, in particolare dalla serie (MP) all’ipotesi (III) – ossia la rappresentazione di sin x come un prodotto infinito. 2) Il metodo analitico è il mezzo mediante cui individuare le condizioni di risolubilità del problema iniziale. In particolare esso lo riduce a un altro problema, nel senso che «non mira a stabilire 42
Cfr. Cellucci 1998, 299-304 e 339-346.
89
Capitolo 4. Analogia e ampliatività
definitivamente la risolubilità di un problema, ma solo di ridurlo a un’ipotesi» 43 . Nella fattispecie il problema di Mengoli viene ridotto all’ipotesi (III) mediante la ricerca di un risultato noto che soddisfi le condizioni (a) - (b) - (c). 3) Le ipotesi sono costruite mediante inferenze non-deduttive, come l’analogia e l’induzione, e per tentativi ed errori. Esse ovviamente non sono necessariamente corrette, ma «una volta assunte, si vede se conducono a una soluzione del problema» 44 . Infatti l’analogia, mediante una multipla interazione con il corpo di conoscenze esistenti (in particolare l’algebra e la trigonometria), consente di produrre ipotesi, (I) - (II) - (III), che soddisfano alcune delle condizioni di risolubilità e conducono a una soluzione, ma che non sono corrette, come osserva già lo stesso Eulero. 4) Le ipotesi sono costruite e introdotte mediante l’interazione con altri sistemi. Tale interazione è essenziale per la soluzione di problemi: il sistema iniziale fa appello ad altri sistemi presenti nell’ambiente (nella fattispecie l’algebra e la trigonometria) per aumentare la propria informazione ed espandere lo spazio combinatorio delle ipotesi. L’informazione aggiuntiva può consistere in risultati (lemmi) o ipotesi. Ciò conferisce al metodo analitico superiori capacità inferenziali perché non deve far appello nel corso della soluzione solo alle informazioni del sistema cui appartiene il problema iniziale. 5) Il processo di soluzione è storicamente situato e dipende dal contesto nel quale viene prodotto, nel senso che le ipotesi che 43 44
Cellucci 1998, 299. Ivi, 301.
90
Inferenze ampliative
è in grado di generare dipendono dalla conoscenza esistente. Al variare del contesto possono variare non solo le ipotesi prodotte (e le soluzioni proposte), ma può variare anche la loro plausibilità. 6) Il processo di soluzione è sensibile alla rappresentazione. Anche nel caso di due enunciati equivalenti, il fatto di usare una rappresentazione piuttosto che un’altra può rivelarsi decisivo nei processi di problem-solving o di scoperta: tale scelta consente interazioni con sistemi di conoscenze che altrimenti sarebbero rimate inibite. Per esempio Feynman sottolinea che rappresentazioni distinte della stessa legge fisica, benché identiche da un punto di vista logico, possono innescare immagini mentali diverse e permettere nuove scoperte 45 . Anche se il mio argomento non è di natura psicologica e l’equivalenza logica è un caso particolare di rappresentazione, similmente, nel caso della soluzione di Eulero di (MP), le analogie, innescando una serie di trasformazioni altrimenti non istituibili, consentono quel cambio di rappresentazione di (MP) in sinx quale prodotto infinito, che permette di candidare una soluzione che altrimenti sarebbe rimasta inaccessibile. 7) Le ipotesi formulate sono condizioni ed entità volte a risolvere problemi specifici, non tutti i problemi. Infatti le ipotesi (I) e (II) sono adeguate a trattare e risolvere solo problemi specifici e locali, della forma 46 di quello di Mengoli, per esempio la serie di Leibniz. 45 46
Cfr. Feynman 1967. ossia che rispetta le condizioni (a) – (b) – (c).
91
Capitolo 4. Analogia e ampliatività
8) Lo spazio combinatorio delle ipotesi è sensibile all’ordine. L’ordine d’introduzione delle ipotesi è infatti utile e anche essenziale per la soluzione del problema perché due soluzioni possono essere differenti anche quando usano le stesse ipotesi ma in un ordine differente. Un diverso ordine di introduzione modella infatti in modo diverso lo spazio combinatorio delle ipotesi, organizzando e assemblando i dati e le informazioni disponibili in modi diversi. Nella fattispecie l’ordine delle ipotesi (I) e (II) è utile ed essenziale per la soluzione di (MP). In primo luogo l’ordine è utile poiché l’ipotesi (I) estende la ricerca di risultati noti alle somme infinite, l’ipotesi (II) concentra tale ricerca all’interno delle somme trigonometriche. In secondo luogo è essenziale in quanto invertendo l’ordine non si produce lo stesso risultato: non è possibile iniziare la ricerca all’interno delle somme trigonometriche se prima non si è ipotizzato che le somme infinite godano di (alcune) proprietà delle somme finite. 9) L’analogia è uno strumento d’ibridazione. Mediante l’inferenza analogica Eulero riesce a trattare la serie (MP) - ossia un oggetto aritmetico - allo stesso tempo come un oggetto algebrico e come un oggetto trigonometrico nel sorso del processo di ricerca della soluzione. Sebbene l’analogia sia esplicitamente imperfetta, essa non fuorvia Eulero poiché tenendo ben presenti le differenze tra oggetto trigonometrico e oggetto algebrico, egli può arrivare alla formulazione della sua ipotesi risolutrice. Inoltre l’ibrido generato dalle due analogie, l’ipotesi (III), assume un ruolo cruciale per la crescita della conoscenza: infatti esso permette di risolvere altri problemi, per esempio permette di ottenere 92
Inferenze ampliative
una soluzione della serie di Leibniz in modo diverso. 10) Le ipotesi devono essere plausibili, nel senso che si devono accordare con la conoscenza esistente, mediante un processo di loro valutazione che comporta uno scambio interattivo con la conoscenza esistente. Infatti, innanzitutto, l’ipotesi (III) è adeguata, ossia permette di risolvere il problema di Mengoli. Ma ciò non è ovviamente sufficiente: infatti «un’ipotesi può permettere di risolvere un problema pur essendo falsa, anzi proprio perché è falsa. Per evitare che ciò accada, si deve confrontare l’ipotesi con la conoscenza esistente e verificare che si accordi con essa» 47 . In particolare l’ipotesi (III) si accorda sia con la conoscenza esistente al tempo di Eulero sia con quella successiva 48 . Inoltre l’analogia svolge un ruolo nel processo di valutazione, ossia nel confronto con la conoscenza esistente, quando viene utilizzata per stabilire la plausibilità dell’ipotesi. 11) Il processo di soluzione di un problema e di ampliamento della conoscenza è potenzialmente infinito. Ogni ipotesi costruita durante tale processo rimanda ad altre ipotesi e non esistono ipotesi ultime. Nel caso di (MP) l’ipotesi (III) dipende dalle ipotesi (I) e (II), che a loro volta dipendono da altre ipotesi e così via potenzialmente all’infinito. Il processo attraverso cui le ipotesi vengono fondate su altre ipotesi può essere interrotto temporaneamente, e a quel punto le ipotesi diventano la base per la soluzione del problema. 12) Il processo di soluzione di un problema e di ampliamento 47 48
Cellucci 1998, 301. Cfr. Ippoliti 2007.
93
Capitolo 4. Analogia e ampliatività
della conoscenza si articola mediante una continua moltiplicazione dei punti di vista, e si avvale di rappresentazioni multiple (nuove e diverse organizzazioni e codificazioni dell’informazione e dei dati che lo caratterizzano) per produrre dall’oggetto dato quelle polivalenze in grado di renderlo suscettibili di sempre nuove trattazioni. In conclusione possiamo osservare come la concezione euristica fornisce una trattazione dell’analogia che dà conto della sua dinamica interna e delle sue caratteristiche. Tale concezione, riconoscendo
come
costitutivo
dell’analogia
il
paradosso
dell’inferenza, non mira alla ricerca di una soluzione di LPA ma si concentra sullo studio del ruolo euristico dell’analogia. Inoltre essa muove dall’osservazione che la separazione tra contesto della scoperta e contesto della giustificazione sia insostenibile e in ultima analisi inutile, e analizza come l’analogia (intesa sia come ricerca di ulteriori fonti analoghe, sia come soluzione di problemi analoghi) svolga un ruolo, soprattutto nella sua versione parallela, sia nella costruzione sia nella valutazione di argomenti e ipotesi. Anche se l’analogia è un efficace strumento euristico, essa presenta dei limiti cui bisogna prestare attenzione quando vi si ricorre. Questi limiti sono insiti nella sua natura ampliativa. Infatti l’analogia da una parte è talmente utile, feconda e fertile, che la sua ubiquità e fruttuosità nei processi di formazione d’ipotesi e di ampliamento della conoscenza è talmente « ovvia
94
Inferenze ampliative
che difficilmente necessita di essere sottolineata» 49 . Dall’altra esse è pericolosa 50 e denuncia precisi limiti strutturali 51 , i quali devono spingerci ogni volta a «trattarla con attenzione» 52 . Innanzitutto l’analogia, come abbiamo già sottolineato, dipende dal contesto (la conoscenza esistente ad un certo istante t), e quindi non è possibile sapere in modo conclusivo se sia giustificata o meno, ossia se possano sopraggiungere condizioni e informazioni che inibiscano o favoriscano la costruzione di argomenti analogici. L’evoluzione del contesto, ad esempio della conoscenza e dei risultati noti su due sistemi di conoscenza a un dato istante t, potrebbe autorizzare inferenze analogiche che precedentemente non erano possibili, o viceversa. Ciò rappresenta una ricchezza, ma anche un preciso limite dell’inferenza basata sull’analogia. Un limite che probabilmente attiene a tutta la conoscenza. In secondo luogo l’analogia, proprio per questo motivo, gode di un'efficacia solo locale, come mostra con particolare evidenza il caso dell’analogia finito-infinito per le somme nella soluzione di Eulero del problema di Mengoli. Inoltre l’analogia è una forma di inferenza ampliativa di carattere conservativo: essa amplia la conoscenza in un modo ristretto, ossia suggerendo che ciò che non è noto si comporta come ciò
49 50 51 52
Bunge 1967, 265. Cfr. Poya 1954, I, 34 e 221-222. Cfr. p. es. Bunge 1967, Vogt - Aras - Balzer 2004, Marchildon 2006. Parker 2003, 200.
95
Capitolo 4. Analogia e ampliatività
che è già noto. Come sottolinea Bunge 53 , essa conviene sempre perché è comunque informativa, in quanto permette in ogni caso di conoscere qualcosa di nuovo sul dominio indagato. Esistono infatti due possibili esiti del processo analogico. Se l’ipotesi analogica supera i test di confronto con la conoscenza esistente, e quindi è plausibile, si produce conoscenza del fatto che i due domini sono simili sotto certi aspetti. Se al contrario l’ipotesi candidata per via analogica non supera i test di confronto con la conoscenza esistente, allora sapremo che è necessario ricorrere a qualcosa di davvero nuovo per trattare i fenomeni indagati. Nessuna analogia è dunque davvero cattiva, se non si è acritici. È opportuno sottolineare che nel primo caso, ossia di superamento del test di confronto, l’analogia può naturalmente andare ancora incontro a limitazioni 54 , la quali possono ancora essere istruttive e fruttuose, poiché consentono di comprendere fino a che punto la conoscenza proiettata dall’analogia su un dominio parzialmente ignoto è ulteriormente estendibile o quali siano le ulteriori dissimilarità tra i due sistemi di conoscenze comparati. Il limite intrinseco dell’analogia nasce dal fatto che è proprio ciò che è davvero nuovo, nel senso che amplia in modo radicale la nostra conoscenza (che è differente da ogni proprietà o struttura di cui abbiamo già conoscenza), che non può essere scoperto e trattato anche solo in linea di principio mediante l’analogia. Inoltre l’analogia soffre di un altro limite, di natura diacroni53 54
Bunge 1967. Cfr. p. es. Moore 2005.
96
Inferenze ampliative
ca: infatti inizialmente può avere successo ed essere fruttuosa, per poi rivelarsi un vero e proprio non-senso, e alimentare uno stallo
teorico. Per esempio, come sottolinea dettagliatamente
Bunge,
un
caso
particolarmente
interessante
è
quello
dell’analogia tra sistemi quantistici e le particelle e le onde classiche, che «è diventata una vera e propria barriera che impedisce una interpretazione coerente della teoria» 55 . Un’analogia inizialmente fruttuosa può pertanto diventare un non-senso, che finisce per ostacolare il processo di crescita e ampliamento della conoscenza. Dunque «le analogie sono destinate a collassare anche se inizialmente fertili» 56 . L’unico modo per superare questi limiti è sottoporre le entità ottenute mediante inferenze analogiche, e più in generale ampliative, ad un continuo processo di moltiplicazione dei punti di vista, che produce una molteplicità di valenze e polisemie capaci di renderle suscettibili di sempre nuove trasformazioni e trattazioni. L’esistenza di tali limiti non deve comunque spaventare: essi evidenziano come l’incertezza sia costitutiva di ogni conoscenza che sia davvero ampliativa e come non esista un processo inferenziale e conoscitivo giustificato in modo conclusivo e oltre ogni ragionevole dubbio. Come vedremo nel prossimo e conclusivo capitolo, è proprio l’idea e la fede in una conoscenza al riparo di ogni dubbio a essere illusoria e intrinsecamente limitata.
55 56
Ivi, 265. Ibid.
97
Inferenze ampliative
5 Ampliatività e verità
1. Il problema della verità In questo capitolo conclusivo analizzo in primo luogo il rapporto tra la nozione di ampliatività e quella di verità, il quale mi permette di chiarire lo statuto dell’inferenza ampliativa e di argomentare come una sua attenta analisi motivi un ripensamento della caratterizzazione della nozione di inferenza. Quindi analizzo la natura della conoscenza prodotta dall’inferenza ampliativa, e sostengo la tesi che tale conoscenza non è un surrogato di quella prodotta dal ragionamento dimostrativo. La presunta simmetria tra inferenza ampliativa e inferenza non-ampliativa rispetto alla verità, sostenuta dalla concezione standard dell’inferenza, è in un senso preciso insostenibile. Essa si basa infatti sull’assioma che esista una separazione tra conoscenza vera, ottenuta mediante inferenze deduttive (ossia non-ampliative), e conoscenza solo plausibile, ottenuta al massimo mediante inferenze ampliative, e che la seconda sia in qualche modo un correlato e un surrogato della prima, uno strumento cui si deve ricorrere quando e fino a che non sia possibile determinare la verità. L’obiettivo di questo capitolo è quello di mettere in discussione tale assioma e la posizione che ne discende, mostrando come 99
Capitolo 5. Ampliatività e verità
questo si basa su ipotesi e argomenti che non raggiungono il loro scopo. A tal fine introduco la nozione di plausibilità per caratterizzare la nozione di inferenza, e confuto le basi della separazione tra vero e plausibile mediante una caratterizzazione più primitiva dell’inferenza, dissolvendo l’idea della verità quale strumento adeguato a render conto in profondità della conoscenza e della ricerca scientifica. In conclusione sostengo la tesi che l’utilizzo della plausibilità in luogo della verità quale strumento per caratterizzare l’inferenza sia ampliativa sia non ampliativa non fa venir meno la possibilità della conoscenza, e quindi non comporta lo scetticismo. La tesi dell’asimmetria tra inferenze ampliative e inferenze non-ampliative rispetto alla verità dipende dall’ipotesi, accettata da molte moderne teorie della conoscenza 1 , che esiste una conoscenza certa e indubitabile, che è quella ottenuta con il ragionamento dimostrativo, cui si contrappone una solo incerta e provvisoria, che è quella appunto ottenibile per mezzo dell’inferenza ampliativa, la quale è al massimo plausibile. Per esempio Polya 2 è un esponente significativo di questo punto di vista. Egli muove apertamente dall’ipotesi che esista una discontinuità tra il ragionamento dimostrativo e il ragionamento non dimostrativo (quello basato su inferenze ampliative) rispetto alla verità, che la matematica avrebbe la capacità di esibire in modo esemplare. La discontinuità nasce dal fatto che, secondo questa tesi, il ra1 2
Per una analisi di questa concezione v. Cellucci 2008. v. Polya 1954.
100
Inferenze ampliative
gionamento non-ampliativo (deduttivo) è in grado di giustificare in modo certo e conclusivo le nostre conoscenze tramite processi inferenziali che preservano la verità. Esso «è definitivo, conclusivo, meccanico» mentre il ragionamento ampliativo è al massimo plausibile, quando non produce falsità, ed è «provvisorio, specificamente umano» 3 . Il ragionamento ampliativo è inoltre difettoso e un surrogato del ragionamento dimostrativo, in quanto non è in grado di giustificare in modo definitivo le conclusioni ottenute perché non gode della proprietà di preservare la verità nel corso del processo inferenziale. Queste due forme di conoscenza, di conseguenza, sono contraddistinte da una profonda asimmetria: le loro conclusioni, infatti, «sono su livelli logici differenti» 4 in quanto quelle del ragionamento dimostrativo «sono sullo stesso livello delle premesse» 5 , mentre in quelle ampliative la conclusione non ha lo stesso status o la stessa forza delle premesse. Tale asimmetria è una delle principali ragioni su cui risiede la classica separazione logica e temporale tra scoperta e giustificazione, tesi che, sotto altri aspetti, abbiamo già avuto modo di mettere in discussione occupandoci dell’analogia multipla.
2. Plausibilità e ampliatività La tesi dell’asimmetria tra ampliatività e non-ampliatività rispetto 3 4 5
Polya 1968, II, 115. Ivi, 113. Ivi, 115.
101
Capitolo 5. Ampliatività e verità
alla verità fa capo all’assunzione che la prima deriva la sua certezza da una fonte della conoscenza indubitabile e infallibile e che è garantita da un metodo, quello assiomatico-deduttivo, che la preserva nel corso del ragionamento, mentre la seconda è incerta e fallibile in quanto caratterizzata da premesse o metodi incerti, ossia tali non solo da non preservare la verità, ma capaci al massimo di conferire solo un qualche grado di sostegno alle sue conclusioni, quando non generano vere e proprie falsità. L’inferenza ampliativa, secondo questa posizione, può aspirare al massimo alla produzione di conoscenza plausibile, una forma di conoscenza surrogata rispetto a quella deduttiva, che non dà accesso ad una vera e propria forma di conoscenza. Tuttavia questa assunzione, come vedremo, è insostenibile al vaglio di un rigoroso esame filosofico delle sue ragioni. Questo esame muove da una riconsiderazione del ruolo della plausibilità nella conoscenza e della nozione di inferenza, ossia di cosa debba intendersi per inferenza.
2.1. Caratterizzazione della plausibilità La plausibilità è una nozione complessa 6 , che può essere comunque caratterizzata come una forma di compatibilità con la conoscenza esistente, nel senso che un’ipotesi è plausibile quando attraverso una comparazione delle ragioni a favore e contro l’ipotesi sulla base della conoscenza esistente, «le ragioni a favo6
v. Ippoliti 2007.
102
Inferenze ampliative
re prevalgono su quelle contro di essa» 7 . Questa nozione si basa dunque su un processo qualitativo, che non ha una natura né soggettiva né psicologica. Essa dipende in modo essenziale dal contesto e dalla conoscenza esistente all’interno della quale viene prodotta la valutazione. Poiché l’insieme delle conoscenze esistenti è in continua evoluzione, il processo di confronto dell’ipotesi ottenuta mediante inferenze ampliative con la conoscenza esistente può avere esiti diversi a seconda del contesto cui fa riferimento a un dato tempo t: un’ipotesi plausibile in un certo contesto c a un dato tempo t può risultare non più tale a un tempo successivo t+. E viceversa. Di conseguenza varia anche la possibilità di istituire inferenze ampliative, che dipendono a loro volta dai dati e dall’insieme di conoscenze di cui disponiamo e che intervengono nel corso della modellazione dello spazio combinatorio delle ipotesi. Inoltre esiste una precisa separazione tra la nozione di plausibilità e quella di probabilità. In primo luogo la conclusione di un'inferenza non-deduttiva può non essere probabile, e «tuttavia può essere plausibile, anzi, può persino essere più plausibile delle sue premesse» 8 . Nel caso delle conclusioni di un’inferenza probabilistica, invece, non solo esse sono o equi-probabili o meno probabili delle loro premesse, ma soprattutto, come abbiamo visto nel capitolo precedente occupandoci dell’analogia, un’ipotesi può risultare plausibile anche quando la sua probabilità è molto bassa o virtualmente nulla. La 7 8
Cellucci 2005, 147. Ibid.
103
Capitolo 5. Ampliatività e verità
formulazione di molte ipotesi per mezzo di inferenze ampliative avviene infatti sulla base di un numero anche molto piccolo di osservazioni (al limite anche di una sola) e si può riferire a un numero anche infinito di casi, per cui il rapporto tra casi favorevoli e casi possibili è tale da assegnare all’ipotesi un valore probabilistico molto basso o prossimo allo zero. Inoltre in molte inferenze plausibili il numero delle ragioni adducibili contro la candidatura della conclusione può anche superare di gran lunga quelle a favore, e quindi determinare ancora una probabilità molto bassa, e questa essere comunque motivata. Viceversa, inferenze plausibili basate sul conforto di un numero elevato di ragioni a favore possono rivelarsi non solo non motivate, ma palesemente scorrette. Pertanto probabilità e plausibilità non concordano in almeno due sensi: - la probabilità non fornisce un criterio per formare ipotesi plausibili; - la probabilità non può neanche essere una guida affidabile nella scelta tra diverse ipotesi plausibili.
2.2. Caratterizzazione dell’inferenza La caratterizzazione dell’inferenza adottata in questo testo si basa su una concezione contenutistica, in particolare di natura esternalista, che è l’unica adottabile da una concezione euristica. Essa è motivata dall’esigenza di fornire una risposta ai limiti della carat104
Inferenze ampliative
terizzazione standard dell’inferenza 9 , i quali derivano principalmente dal fatto che, come osserva Cellucci, questa «non offre alcuna spiegazione del ruolo che l’inferenza deduttiva gioca nella conoscenza» 10 . Invece un’adeguata giustificazione delle inferenze deduttive e non-deduttive richiede la costruzione di una spiegazione del ruolo che esse svolgono nella conoscenza. Questo compito necessita dunque un ripensamento degli scopi della logica sia deduttiva sia non-deduttiva. Innanzitutto la definizione, propria della caratterizzazione standard, dell’inferenza semplicemente come il passaggio da un insieme di proposizioni a un’altra proposizione, presenta dei limiti. Infatti l’inferenza può essere più propriamente definita come il passaggio da una quantità di dati a un altro dato, a meno che non si vogliano escludere forme d’inferenza, tra le quali per esempio possiamo annoverare quelle compiute dai neonati o dagli animali o quella basate sulla visione, che non sono di natura strettamente proposizionale. In secondo luogo la distinzione delle inferenze in deduttive e non-deduttive proposta dalla concezione standard, basata sulla proprietà della preservazione della verità, è inadeguata perché si avvale di una proprietà derivata. La preservazione della verità, infatti, non è una caratteristica primitiva dell’inferenza, ma segue dalla proprietà oggetto d’analisi di questo testo, ossia l’ampliatività. Come abbiamo visto all’inizio di questo libro, un’inferenza è 9 10
Cfr. p. es. Popper 1979. Cellucci 2006, 222.
105
Capitolo 5. Ampliatività e verità
non-ampliativa semplicemente quando la sua conclusione non contiene nulla che non sia già contenuto nelle premesse, nel senso che essa rende esplicito nella conclusione ciò che è già implicito nelle premesse, dove per contenuto di una proposizione si intende l’informazione contenuta in essa. Dall’altra parte un’inferenza è invece ampliativa quando il contenuto delle premesse non è già implicito ed esplicitabile nelle premesse, e quindi esse introducono informazione che è davvero nuova rispetto a esse, ossia nuova rispetto ai dati. Questa distinzione si basa su una nozione di contenuto diversa da quella adottata dalla concezione standard 11 , in quanto tale nozione non viene più espressa semplicemente e unicamente in termini proposizionali, ma sulla base della nozione di informazione non-proposizionale, e quindi su un concetto complesso d’informazione. Alla luce di questa caratterizzazione delle inferenze facente riferimento a una proprietà più primitiva, bisogna considerare da una parte le inferenze deduttive come semplicemente nonampliative, e la proprietà della preservazione della verità come una semplice conseguenza della non-ampliatività, e considerare dall’altra parte le inferenze non-deduttive come semplicemente ampliative. Da ciò segue che, da una parte, le inferenze deduttive sono definibili non come tali da preservare la verità, ma come nonampliative, e dall’altra parte che le inferenze non-deduttive non come quelle le cui premesse forniscono solo qualche grado di 11
Cfr. p. es. Popper 1979.
106
Inferenze ampliative
conferma alle conclusioni, ma come ampliative. Questa caratterizzazione dell’inferenza consente di render conto del ruolo svolto dalle inferenze nella nostra conoscenza, offrendo un ripensamento degli stessi scopi della logica sia nella sua forma deduttiva sia nella sua forma non-dedutiva. Sulla base di tale caratterizzazione si può infatti riconsiderare il ruolo delle inferenze deduttive e non-deduttive nel modo seguente: - il ruolo delle inferenze deduttive, in quanto non-ampliative, può essere meglio descritto non come quello di preservare, nel corso dei passaggi inferenziali, la verità, ma piuttosto la plausibilità, rendendo esplicita informazione implicita nelle premesse; - il ruolo delle inferenze non-deduttive, in quanto ampliative, è quello di modellare lo spazio combinatorio delle ipotesi, ossia di trovare ipotesi adeguate alla soluzione dei problemi partendo dalle informazioni e dai dati disponibili, ossia ipotesi plausibili. Conseguentemente si ha che lo scopo della logica deduttiva è quello di ottenere conclusioni plausibili da premesse plausibili, mentre lo scopo della logica non-deduttiva è quello di fornire strumenti per trovare ipotesi adeguate alla soluzione di problemi partendo dai dati disponibili e dalla conoscenza esistente.
3. Ampliatività e conoscenza Sulla base di quanto detto finora è possibile costruire un argomento che mostra come l’ipotesi dell’asimmetria tra verità e am107
Capitolo 5. Ampliatività e verità
pliatività si riveli, in un senso preciso, difettosa e insostenibile. Per poter stabilire la verità di una qualsiasi conclusione da un dato insieme di premesse, bisogna infatti poter fornire una dimostrazione di entrambi i seguenti e nell’ordine in cui compaiono: 1) tali premesse sono vere; 2) esistono metodi che preservano questa proprietà nel corso dei processi inferenziali. Per poter assolvere questo compito è necessario, a sua volta, poter individuare: 1) una fonte conoscitiva che sia certa e non ingannevole, tale da garantire la verità delle premesse da cui segue la nostra conoscenza; 2) una forma di ragionamento capace di trasmettere la verità dalle premesse alle conclusioni. Tuttavia non è possibile soddisfare questi due obiettivi. Infatti non è possibile soddisfare il primo e di conseguenza, come vedremo, viene meno la possibilità di soddisfare anche il secondo. Infatti, in primo luogo, non si dà qualcosa come una fonte conoscitiva in grado di sottrarre all’incertezza gli oggetti della conoscenza, ma tali fonti sono difettose e fallaci, o richiedono procedure non fattibili. Non esistono proposizioni prime immediatamente vere in grado di garantire la verità della nostra conoscenza. Per poter dimostrare che esiste una tale fonte, e di conseguenza proposizioni di questa natura, bisognerebbe infatti essere in grado di poter fornire dimostrazione di uno dei seguenti due fatti: - è possibile dar conto dell’esistenza di una facoltà (p. es. 108
Inferenze ampliative
l’intuizione intellettuale o sensibile) da cui scaturisce la verità di queste proposizioni prime; - esiste ed è fattibile una procedura atta a fissare la verità di tali proposizioni. Tuttavia, ancora, non è possibile fornire un argomento conclusivo a favore di nessuna di queste due asserzioni. Nel primo caso non è possibile dar conto di alcuna facoltà certa e indubitabile in grado di cogliere la verità di un oggetto conoscitivo in modo infallibile e oltre ogni ragionevole dubbio. Anzi non solo come dimostrano gli errori prodotti dall’intuizione sensibile e intellettuale in diversi ambiti scientifici tali fonti conoscitive sono difettose e ingannevoli, ma la loro giustificazione si basa su argomentazioni circolari 12 . Il secondo caso invece è leggermente diverso, in quanto è una questione che ammette almeno in linea di principio una soluzione. Infatti c’è una procedura in grado di fissare la verità di una proposizione o un insieme di proposizioni: la verifica di tutte le sue conseguenze. Se tutte le proposizioni Pn che seguono da una data proposizione A sono vere, allora A sarà vera. Tuttavia anche se in linea di principio questo è un compito possibile, non è umanamente fattibile. A conforto di questa asserzione si può addurre un risultato che è una semplice conseguenza del teorema d’incompletezza di Gödel. Esso asserisce che il numero di Gödel delle conseguenze logiche dell’aritmetica di Peano del secondo ordine non è ricorsivamente enumerabile. Dunque, poiché non esiste una procedura algoritmica per assolvere questo 12
Cfr. Cellucci 2006, par. 2.
109
Capitolo 5. Ampliatività e verità
compito, allora a maggior ragione esso non è fattibile all’interno dei limiti dell’universo fisico a noi noto. Dobbiamo pertanto concludere che non disponiamo di un modo per poter decretare se le premesse da cui dipende la nostra conoscenza siano vere. Esse sono tuttavia plausibili, nel senso di compatibili con i dati esistenti, e tale risulta dunque essere la conoscenza che segue da esse, la quale è sempre provvisoria e fallibile. Ciò vale per tutte le forme di conoscenza, compresa la matematica. Le premesse da cui dipendono i suoi risultati non sono affatto certe e vere, ma hanno uno statuto e una esistenza ipotetici e plausibili nel senso appena specificato, che le assimila a tutte le altre forme di conoscenza scientifica. Dunque la matematica non è in discontinuità con le altre forme di conoscenza, ma ha esattamente lo stesso statuto epistemologico, dà accesso allo stesso tipo di conoscenza (che è poi la conoscenza scientifica in generale). Anche se quanto dimostrato è sufficiente a stabilire la non sostenibilità della tesi dell’asimmetria tra ampliatività e verità, affronto ora brevemente il secondo punto del programma, ossia l’individuazione di forme di ragionamento in grado di preservare la verità, e mostro come anche questo obiettivo sia irrealizzabile. La preservazione della verità, come abbiamo visto, non è una proprietà primitiva dell’inferenza, ma discende dalla ampliatività ed è dunque inadeguata a renderne conto. Inoltre mentre la giustificazione dell’inferenza fornita dal punto di vista standard richiede la nozione di verità e si basa su argomentazioni circolari 13 , la 13
Cfr. ancora Cellucci 2006, par. 2.
110
Inferenze ampliative
giustificazione di carattere contenutistico adottata in questa analisi si basa sulla plausibilità, ed è motivata dal ruolo che le inferenze svolgono all’interno della conoscenza. Le inferenze deduttive, infatti, sono giustificate non perché preservano la verità, ma perché preservano la plausibilità, perché a partire da ipotesi plausibili non fanno altro che esplicitare l’informazione contenuta in essa. Il ragionamento deduttivo non può essere caratterizzato, come fa per esempio Polya, semplicemente come preservante la verità, poiché le premesse sulle quali è basata la nostra conoscenza non sono vere ma solo plausibili: le inferenze deduttive non preservano la verità perché non c’è alcuna verità da preservare, ma solo la plausibilità. La giustificazione delle inferenze deduttive, dunque, è semplicemente una conseguenza della loro non-ampliatività. Infatti «la loro conclusione è una mera riformulazione del contenuto delle premesse e, pertanto, se le loro premesse sono compatibili con i dati esistenti, tale sarà anche la conclusione» 14 . Ciò non toglie nulla alla loro utilità, in quanto il processo di riformulazione del contenuto delle premesse può rendere esplicita informazione che è solo implicita nelle premesse e ciò permette di facilitare «il confronto delle premesse con i dati esistenti, e quindi stabilendo la loro plausibilità, esaminando le loro conseguenze» 15 . Dall’altra parte le inferenze non-deduttive sono giustificate in virtù del fatto che permettono di trovare ipotesi per risolvere pro14 15
Cellucci 2006, 227. Ibid.
111
Capitolo 5. Ampliatività e verità
blemi a partire dai dati disponibili e dalla conoscenza esistenza. Sebbene sia ovvio che nulla è in grado di garantire che le ipotesi così trovate siano plausibili, in quanto le inferenze non-deduttive possono essere - e sono - fonti di falsità, solo le inferenze nondeduttive permettono di trovare ipotesi, tra le quali bisognerà effettuare una scelta mediante un’attenta valutazione delle ragioni a favore e le ragioni contro ognuna di esse. Pertanto sia le inferenze deduttive sia quelle non-deduttive non sono in grado di produrre conoscenza di per sé, dal loro interno per così dire. Nel caso delle inferenze deduttive, per poter valutare la plausibilità delle loro premesse è necessario procedere ad una comparazione con la conoscenza esistente, e quindi con qualcosa di esterno a esse. Nel caso delle inferenze nondeduttive, una volta prodotte le ipotesi a partire dai dati disponibili, è necessario valutarne la plausibilità, ossia compararle con la conoscenza esistente, quindi, ancora, con qualcosa di esterno a esse. Sulla base di ciò possiamo osservare che le inferenze deduttive sono giustificate nel senso in cui lo sono le inferenze nondeduttive, «ossia mediante una giustificazione esternalista, che fa riferimento al loro ruolo nella conoscenza e quindi alla realtà» 16 . Dunque le conoscenze che scaturiscono da queste forme di inferenza non sono essenzialmente differenti e non possono essere poste su piani di alternatività o subordinazione. Sulla base di questa caratterizzazione sia della nozione di inferenza sia della nozione di plausibilità viene a cadere l’asimmetria e l’eterogeneità tra verità e ampliatività, e, con essa, l’illusione di 16
Ivi, 232.
112
Inferenze ampliative
una conoscenza al riparo da ogni forma di dubbio o incertezza. L’ampliatività, pertanto, non fa altro che esibire il carattere più profondo dell’impresa conoscitiva dell’essere umano, evidenziandone tutti i rischi e le debolezze. Tutte le nostre premesse sono incerte, provvisorie e plausibili e i nostri metodi sono al massimo in grado di preservare tale plausibilità e quindi non sottraggono in modo definitivo nessun oggetto conoscitivo all’incertezza e al dubbio. Pertanto non esistono inferenze che danno accesso a conoscenze certe, contrapposte a conoscenze solo plausibili cui si arriva per via ampliativa, ma tutte le nostre conoscenze sono incerte e al massimo plausibili, nel senso che ogni nostra teoria è un insieme di ipotesi plausibili, non vere. Ed è per questo motivo che tali conoscenze sono sempre suscettibili di nuove rappresentazioni e di un processo di moltiplicazione dei punti di vista intorno ai loro oggetti: è sempre possibile organizzare e codificare i dati e le informazioni che essi veicolano in modi nuovi, che producono nuove rappresentazioni che possono essere messe in relazione con la conoscenza di cui disponiamo. Quindi non solo nulla può metterci al riparo dalla possibilità che esse si rivelino false, ma soprattutto esimerci dal compito di incessante ricerca e approfondimento delle ipotesi che sostengono le nostre conoscenze e che dobbiamo essere pronti a rivedere e, quando è il caso, abbandonare. È opportuno sottolineare che il dissolvimento della nozione di verità quale strumento per caratterizzare la conoscenza, e 113
Capitolo 5. Ampliatività e verità
l’utilizzo in suo luogo di quella di plausibilità, non implica lo scetticismo, ossia l’idea che la conoscenza non sia possibile. Né implica un anything goes, l’assunzione di una posizione alla Feyerabend. La concezione euristica è molto più semplicemente il risultato di una posizione che riconosce che la nozione di verità non gioca un ruolo decisivo all’interno dei processi che producono nuova conoscenza e che ne consentono l’ampliamento e l’avanzamento. Non a caso la nozione di verità, nelle varie forme in cui è pensata storicamente e concettualmente, non è uno strumento adeguato a fornire una spiegazione della conoscenza e della ricerca scientifica. Essa non solo non riesce a render conto dei principali strumenti della conoscenza (come l’inferenza), ma si è anche rivelata inessenziale ai fini della nascita e dello sviluppo della scienza moderna 17 . La plausibilità invece gioca un ruolo decisivo e attivo nella conoscenza, perché fornisce strumenti per valutare, estendere e raffinare le ipotesi che sostengono la conoscenza. L’ampliatività non è dunque un surrogato o un semplice correlato della verità, uno strumento da utilizzare provvisoriamente in luogo della verità fino a quando essa non possa venir determinata, ma è l’obiettivo principale della conoscenza umana, l’oggetto della continua tensione e dello sforzo conoscitivo dell’uomo. L’affermazione che la conoscenza è plausibile e non vera non richiede di sostenere la tesi che la conoscenza non sia possibile, ma si basa semplicemente su una diversa caratterizzazione dei 17
Per un’analisi delle varie forme in cui la nozione di verità è stata pensata e della sua
irrilevanza per lo sviluppo della scienza moderna cfr. Cellucci 2008.
114
Inferenze ampliative
suoi oggetti. Essa richiede invece di abbandonare l’idea che esista qualcosa, come la verità appunto, in grado di sottrarre definitivamente la conoscenza a ogni ragionevole dubbio e riconosce l’incertezza come costitutiva e ineliminabile di ogni nostra conoscenza, sviluppando e perfezionando strumenti per gestirla e limitarla. L’incertezza, la provvisorietà e la fallibilità delle conclusioni prodotte dalle inferenze ampliative non producono una conoscenza surrogata, o una assenza di conoscenza, ma sono il prodotto di un pensiero che ha raccolto e raccoglie ogni volta la sfida conoscitiva che i nostri limiti ci pongono di fronte, limiti che le inferenze ampliative contribuiscono a superare, a tentare continuamente di espandere.
115
Inferenze ampliative
Bibliografia
Alexander, J.: 1923, A lemma on a system of knotted curves, «Proc. Nat. Acad. Sci. USA», 9, 93-5. Antonelli, A.: 2004, La logica del ragionamento plausibile, in: L. Floridi (a cura di), «Linee di ricerca», SWIF, 226-52. Artin, E.: 1925, Theorie der Zopfe, «Hamburg Abh», 4, 47-72. Artin, E.: 1947, Theory of braids, «Annals of Mathematics», 48 (2), 101-26. Benaceraff, P.: 1996, What mathematical truth could not be, in: Morton, A. - Stich, S. (a cura di), Benaceraff and his critics, Blackwell, 9-59. Black, M.: 1962, Models and metaphors: Studies in language and philosophy, Cornell University Press, Cornell. Boniolo-Vidali: 1999, Filosofia della scienza, Bruno Mondadori, Milano. Borwein, P. – Jörgenson, L.: 2001, Visible Structures in Number Theory, «The American Mathematical Monthly», 108 (10), 897-910. Brown, J. R.: 1997, Proofs and pictures, «Brit. Jour. Phil. Sci.», 48, 161-80. Brown, J. R.: 1999, Philosophy of mathematics. An introduction to the world of proof and pictures, Routledge, New work. Bunge, M.: 1967, Analogy in quantum mechanics: from insight to 117
Bibliografia
nonsense, «British Journal for the Philosophy of Science», 18 (4), 265-86. Byers, W.: 2007, How mathematicians think, Princeton University Press, Princeton. Carnap, R.: 1950, Logical foundations of probability, The University of Chicago Press, Chicago. Cellucci, C.: 1998, Le ragioni della Logica, Laterza, Roma - Bari. Cellucci, C.: 2002, Filosofia e matematica, Laterza, Roma. Cellucci, C.: 2005, Mathematical discourse vs. mathematical intuition, in: Cellucci, C. - Gillies, D. (a cura di), Mathematical Reasoning and Heuristics, King’s College Publications, London, 137-165. Cellucci, C.: 2006, The question Hume didn’t ask: why we should accept deductive inference, in: Cellucci, C. - Pecere, P. (a cura di), Demonstrative and Non-Demonstrative Reasoning in
Mathematics
and
Naturals
Science,
Edizioni
dell’Università degli Studi di Cassino, Cassino, 207-235. Cellucci, C.: 2008, Perché ancora la filosofia, Laterza, Roma, draft. Copi, I.: 1961, Introduction to logic, trad. it. Lupacchini R., Introduzione alla logica, 1997, Il Mulino, Bologna. Corfield, D.: 2003, Towards a philosophy of real mathematics, Cambridge University Press, Cambridge. Davies, T. R.: 1988, Determination, uniformity and relevance: normative criteria for generalization and reasoning by analogy, in: Helman, D. H. (a cura di), Analogical Reason118
Inferenze ampliative
ing, Kluwer Academic Publisher, 227-250. Elio, R.: 2002, Belief revision and plausible inference, draft. van Es, A.: 2004, Essay on analogy in mathematics, «Philosophy of Mathematics Education Journal», 18. Euler, L.: 1784, Introductio in analysin infinitorum, I, in: Krazer, A. - Rudio, F. (a cura di), Opera Omnia, Serie prima, VIII. Epple, M.: 1999, Geometric aspetcs in the development of knot theory, in: James, I. M. (ed.), History of topology, Elsevier BV, Amsterdam, 301- 358. Feynman, R. P.: 1967, The character of physical law, MIT press, Massachusetts. Fox, R.H.: 1962, A quick trip through knot theory, in: Topology of 3-manifold and related topics, Fort, M.K. Jr. (ed.), Prentice-Hall, Englewood Cliffs (NJ), 120-67. Gelfond, M. - Watson, R.: 2003, Nonmonotonic Logic, in: The Encyclopedia of Cognitive Science, Nature Publishing Group-Macmillan Reference Inc, UK, 375-82. Giaquinto, M.: 1992, Visualizing as a means of geometrical discovery, «Mind and Language», 381-401. Giaquinto, M.: 1993, Visualizing in Arithmetic, «Philosophy and Phenomenological Research», LIII, 385-96. Giaquinto, M.: 1994, Epistemology of visual thinking in elementary real analysis, «The British Journal for the Philosophy of Science», 45 (3), 789-813. Giaquinto, M.: 2007, Visual thinking in mathematics, Oxford University Press, Oxford. Goetgheluck, P.: 1993, Fresnel zones on the screen, «Experimen119
Bibliografia
tal mathematics», 2(4), 301-9. Grosholz, E. R.: 2000, The partial unification of domains, hybrids, and the growth of mathematical knowledge, in: Grosholz, E. - Breger, H. (a cura di), The growth of mathematical knowledge, Kluwer, Dordrecht. Grosholz, E. R.: 2007, Representation and productive ambiguity in mathematics and the science, Oxford University Press, Oxford. Hacking, I.: 1975, The emergence of probability. A philosophical study of early ideas about probability, induction and statistical inference, Cambridge University Press, Cambridge. Hadamar, J.: 1945, The psychology of invention, Princeton University Press, Princeton. Hardy, G. H.: 1908, A course of pure mathematics, Press Syndicate of the University of Cambridge, London. Hesse, M.: 1966, Models and analogies in science, University Notre Dame Press, Notre Dame, Indiana. Hersh, R.: 1999, What is mathematics, Really?, Oxford University Press, Oxford. Hersh, R.: 2007, Review of “How mathematicians think” by William Byers, «Notices of AMS», 54 (11), 1496-1499. Horgan, J. 1993, The death of proof, «Scientific American», 269, 4. Ippoliti,
E.:
2002a,
Mathematical
creativity
by
CCG-
visualization, in: Proceedings of Creativity in Mathematics Education and Education of Gifted Students, University of Latvia, Riga, 22-3. 120
Inferenze ampliative
Ippoliti, E.: 2002b, Cognitive visualization of some integervalued polynomials, «Visual Mathematics», 4 (1). Ippoliti, E.: 2006, Demonstrative and Non-demonstrative reasoning by analogy, in: Cellucci, C. - Pecere, P. (a cura di), Demonstrative and Non-Demonstrative Reasoning in Mathematics and Naturals Science, Edizioni dell’Università degli Studi di Cassino, Cassino, 307-338. Ippoliti, E.: 2007, Il vero e il plausibile, Lulu, Morrisville (NC). James, I. M. (ed.): 1999, History of topology, Elsevier BV, Amsterdam. Juthe, A.: 2005, Argument by analogy, «Argumentation», 19, 127. Kokinov, B.: 1994, A hybrid model of reasoning by analogy. In: Holyoak, K. J. - Barnden, J. A. (a cura di), Analogical Connections, Advances in connectionist and neural computation theory, II, Ablex Publishing Corporation, Norwood, New Jersey, 247-318. Lien, M - Watkins, W.: 2000, Dual graphs and knot invariants, «Linear Algebra Appl.», 306 (1-3), 123–30. Mancosu, P. – Jorgensen, K. – Pedersen, S.: 2005, Visualization, explanation and reasoning styles in mathematics, Springer, Amsterdam. Marchildon, L.: 2006, Bohmian trajectories and the ether: where does the analogy fail?, «Studies in History and Philosophy of modern physics», 37, 263-274. Melis, E. - Veloso, M.: 1998, Analogy in problem solving, in: Farinas del Cerro, L. - Gabbay, D. - Ohlbach, H. J. (a cura 121
Bibliografia
di), Handbook of Practical Reasoning - Computational and Theoretical Aspects, Oxford University Press. Moore, N.T. - Grosberg, A.Y.: 2005, The limits of analogy between self-avoidance and topology-driven swelling of polymer loops, «Phys-ical Review E», 76 (6 Pt 1), 061803-110. Parker, K.: 2003, Analogy: handle with care, «Physics Education», 38 (3), 200-201. Poincarè, H. P.: 1895, Analysis situs, «J. de L’Ecole Polytecnique», II (1), 1-121. Polya, G.: 1954, Induction and analogy in mathematics, I - Induction and analogy in mathematics, II - Patterns of plausible inference, Princeton University Press, Princeton. Polya, G.: 1957, How to solve it, Princeton University Press, Princeton. Popper, K.: 1979, Objective knowledge, Claredon Press, Oxford. Russell, S.: 1988, Analogy by similarity, in: Helman, D. H. (a cura di), Analogical Reasoning, Kluwer Academic Publisher, 251-269. Shelley, C.: 1999, Multiple analogies in evolutionary biology, «Stud. Hist. Phil. Biol. & Biomed. Sci.», 30 (2), 143-80. Shelley, C.: 2002a, Analogy Counterarguments and the Acceptability of Analogical Hypotheses, «British journal for the philosophy of science», 53 (4), 477-96. Shelley, C.: 2002b, The analogy theory of disanalogy: when conclusions collide, «Metaphor and Symbols», 17 (2), 81-97. Shelley, C.: 2003, Multiple analogies in science and philosophy, 122
Inferenze ampliative
John Benjiamins, Amsterdam-New York. Talaly, L. E.: 1987: Rethinking the function of clay figurine legs from Neolithic Greece: an argument by analogy, «American Journal of archaeology», 91 (2), 161-69. Tzanakis, C.: 1998, Discovering by analogy: the case of Schrödinger’s equation, «European Journal of Physics», 19, 69-75. Van Bendegem, J. P.: 2000, Tools for the mathematician, in: Hallyn, F. (a cura di), Metaphor and analogy in the sciences , Kluwer Academic Publisher, 105-27. Vogt, H. - Aras, Ö. - Balzer, R. J.: 2004, The limits of analogy between boiling and gas evolution at electrodes, «International journal of heat and mass transfer», 47, 878-95. Weitzenfeld, J.: 1984, Valid reasoning by analogy, «Philosophy of science», 51, 137-149. Zenkin, A: 1990, Waring's problem from the standpoint of the cognitive interactive computer graphics, «An International Journal - Mathematical and Computer Modelling», 13 (11), 9 - 25. Zenkin, A: 1991, Cognitive Computer Graphics. Applications in Number Theory, NAUKA, Mosca.
123