Prologo
L’E CONOMIA E LA R ICCHEZZA DELLE N AZIONI E DEI P OPOLI
[L’economia è lo studio del] comportamento umano com...
290 downloads
973 Views
5MB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Prologo
L’E CONOMIA E LA R ICCHEZZA DELLE N AZIONI E DEI P OPOLI
[L’economia è lo studio del] comportamento umano come rapporto fra obiettivi dati e mezzi limitati... L. Robbins (1935, p.16)
Una transazione economica è un problema politico risolto... L'economia ha guadagnato il titolo di Regina delle Scienze Sociali scegliendo come dominio i problemi politici risolti. Abba Lerner (1972, p. 259).
Per i suoi fondatori, l’oggetto dell’economia politica era la ricchezza delle nazioni e dei popoli. Nel XIV secolo, Ibn Battuta, uno dei principali geografi ed esploratori dell’epoca, viaggiò in lungo e in largo in Asia, Africa, Medio Oriente, Russia e Spagna. Nel 1347, visitò la regione oggi chiamata Bangladesh. “È un …paese… ricco di riso”, scrisse. Egli descrisse i viaggi lungo i corsi fluviali, che scorrevano “tra villaggi e frutteti, quasi stessimo attraversando un bazar.”1 Sei secoli dopo, un terzo della popolazione del Bangladesh è sottonutrita, ed il paese è tra i più poveri al mondo. Al tempo del viaggo di Ibn Battuta in Bangladesh, l’Europa era soggiogata dalla peste bubbonica, che tolse la vita a più di un quarto della popolazione di molte città. A Londra la mano d’opera, probabilmente tra le più ricche nel continente, consumava meno di 2000 calorie al giorno.2 La scarsità di forza lavoro dovuta alla 1
Il suo racconto è pubblicato in Battuta (1929):267, 271. Una seconda fonte, Yule (1886):457 riporta questa annotazione “Non ho mai visto una regione nel mondo dove le provviste siano così abbondanti,” ma si può trattare di un’errata traduzione di Yule o della fonte francese a cui egli attinge. 2 Per questi dati si veda Allen (2001). Per le serie sui salari del dopo ‘900 si veda Bowles, Samuel and Edwards (1993).
2 | MICROECONOMIA
peste fece aumentare i salari reali in qualche misura sino alla metà del secolo successivo, tuttavia nei successivi quattro secoli i salari reali dei lavoratori non aumentarono in nessuna città europea per la quale esistano dati, e per la maggior parte i salari diminuirono considerevolmente (nel Nord Italia dimezzarono il loro livello iniziale). Negli ultimi due secoli, tuttavia, i salari reali sono aumentati bruscamente, prima in Inghilterra, dove sono aumentati di venti volte, e successivamente, per un ammontare anche maggiore, nelle altre città europee. Che cosa può spiegare un così drammatico capovolgimento della sorte? La risposta più plausibile, molto brevemente, è la seguente. L’emergere e il diffondersi di un nuovo assetto istituzionale, che prenderà il nome di capitalismo, causò un’ampia espansione della produttività del lavoro umano. Ciò portò a più alti salari in un momento in cui il potere di contrattazione dei lavoratori era aumentato a causa dell’espansione dei diritti politici dei lavoratori e a causa dell’indisponibilità di nuove assunzioni nell’agricoltura, nella produzione familiare e in altri settori dell’economia non organizzati secondo queste nuove istituzioni. Tutto ciò accadeva in Europa, ma non in Bangladesh. Ciò che accadde in Bangladesh, così come in gran parte dell’Impero Mughal e in quella che divenne l’India Britannica, fu un crescente radicarsi del potere e dei diritti di proprietà dei potenti proprietari terrieri chiamati zamindari. La loro influenza era già notevole prima dell’Impero Britannico, tuttavia durante la Presidenza bengalese fu rafforzata molto dal Permanent Settlement del 1793. Questo atto dei sovrani coloniali conferì de facto poteri di governo agli zamindari, dando loro il diritto di riscuotere le tasse (e di tenerne una parte considerevole per se stessi). Il fatto che il sistema di tassazione britannico e la politica sul possesso delle terre non fosse uniforme ovunque nel Raj, fornisce un esperimento naturale per provare l’importanza delle istituzioni. Banerjee e Iyer (2002) hanno confrontato i risultati economici e gli indicatori sociali relativi al periodo successivo all’Indipendenza (1948) delle regioni dell’India contemporanea nelle quali agli zamindari fu dato il controllo dai sistemi coloniali di proprietà terriera e di tassazione, con le regioni nelle quali i zamindari furono aggirati a favore delle comunità locali o della tassazione diretta dei singoli coltivatori. Essi hanno riscontrato che le regioni controllate dagli zamindari avevano tassi di crescita della produttività agricola significativamente più bassi, derivanti da più bassi tassi di investimento e da un minore uso di risorse moderne. Le regioni controllate dagli zamindari stentavano a progredire, anche in modo
PROLOGO
|3
significativo, nel campo dell’educazione e della salute.3 Queste conclusioni suggeriscono una notevole persistenza degli effetti di un’innovazione istituzionale avvenuta un secolo, o più, prima. La persistente importanza delle istituzioni è ugualmente suggerita dal lavoro di Sokoloff ed Engerman (2000), che riguarda un analogo capovolgimento di sorte del Nuovo Mondo. Essi stimano che nel 1700, il reddito pro capite del Messico era circa lo stesso delle colonie britanniche, che sarebbero diventate gli Stati Uniti, mentre Cuba e le Barbados erano più ricche almeno della metà. Alla fine del XVII secolo Cuba aveva un reddito pro capite leggermente più alto di quello degli Stati Uniti, ed Haiti era probabilmente la società più ricca al mondo. All’inizio del XXI secolo, tuttavia, il reddito pro capite del Messico era meno di un terzo del livello di reddito degli U.S., e quello di Haiti era ancora più basso. In una serie di lavori Sokoloff e Engerman forniscono la seguente spiegazione.4 Nelle regioni del Nuovo Mondo in cui lo zucchero e gli altri raccolti delle piantagioni poterono crescere (Cuba, Haiti) o in cui i minerali e il lavoro indigeno erano abbondanti (Mexico), le élites economiche poterono contare su lavoro forzato o schiavi e consolidarono il loro potere e i privilegi materiali attraverso istituzioni molto esclusive. Ciò limitò l’accesso dei meno abbienti alla scolarizzazione, alle terre pubbliche, alla protezione brevettuale, alle opportunità imprenditoriali e alla partecipazione politica. Uno dei risultati, nei secoli successivi, anche dopo la scomparsa della schiavitù e di altre forme di coercizione del lavoro, fu che le opportunità di risparmio, innovazione e investimento furono monopolizzate dalle categorie abbienti. L’alfabetizzazione rimase bassa e la proprietà delle terre molto concentrata. Durante il passaggio delle risorse della terra da un’estrazione naturale al settore manifatturiero e ai servizi, queste economie, fortemente disuguali ristagnarono, mentre economie molto più inclusive, quali quelle degli Stati Uniti e del Canada, crebbero rapidamente. Il modo in cui le loro istituzioni meno esclusive hanno contribuito al successo delle economie nord americane rimane al quanto oscuro, ma un’ipotesi plausibile è che l’ampio accesso alla terra, le opportunità imprenditoriali ed il capitale umano abbiano stimolato la crescita. L’origine delle differenze istituzionali tra le colonie del Nuovo Mondo sembra derivare dalle loro dotazioni iniziali di fattori di produzione, piuttosto che dalle 3
I dettagli del legame causale tra il controllo dei latifondisti e i conseguenti risultati resta da esaminare. In quanto le pratiche coloniali cambiarono nel tempo in risposta ad eventi esogeni (come la rivolta dei soldati in India nel 1857) e nello spazio in risposta ad idiosincrasie degli amministratori locali, Banerjee e Iyer sono stati in grado di identificare fonti indipendenti di variazione nel possesso della terra e nelle politiche di tassazione, che non sono dovute a condizioni preesistenti. 4 Si veda anche Engerman, Sokoloff e Mariscal (2002) e Acemoglu, Johnson, e Robinson (2002).
4 | MICROECONOMIA
differenti culture o dalle politiche coloniali degli Stati Europei che le conquistarono. Le britanniche Belize e Guyana seguirono lo stesso cammino delle spagnole Honduras e Colombia, Barbados e Jamaica seguirono il cammino di Cuba e Haiti. I puritani che costituirono Providence Island nei pressi della costa del Nicaragua abbandonarono i loro ideali politici e divennero schiavisti. Sull’isola c’erano più schiavi che puritani quando fu invasa dagli spagnoli nel 1641. Secondo il principale storico dell’isola “[…] la colonia puritana […] con la sua economia sostenuta dall’iniziativa privata e dalla schiavitù, somigliava molto ad una qualsiasi colonia dell’India occidentale.”(Kupperman, 1993, p.2) Nel periodo della sua caduta, Providence Island era un’attrattiva per gli emigranti che provenivano dalle colonie puritane del nord, molto più conosciute, e due navi cariche di sfortunati pellegrini arrivarono dal Massachussetts poco dopo l’occupazione spagnola. Un ultimo esempio è dato dal precipitoso collasso del Partito Comunista che governava l’Unione Sovietica e dei suoi alleati dell’Est Europa intorno al 1990 e dalla transizione dei nuovi stati ad un’economia basata sul mercato. La figura P.1, che mostra i livelli del prodotto interno lordo pro capite relativi agli anni ’90 per quindici di queste nazioni, rivela differenze di andamento drammatiche. Dopo una decade di transizione, il reddito pro capite della Polonia si stabilizzò un 40 percento sopra il livello iniziale (contrassegnato dalla P nella figura), mentre il reddito della Russia era diminuito di un terzo, e quello della Moldavia era sceso a meno del 40 percento del livello iniziale. Nello stesso periodo il reddito pro capite della Cina era più che raddoppiato (il dato non è mostrato). Tra queste economie solo la Polonia ha superato la media (non ponderata) delle economie OCSE. Mentre il successo delle riforme graduali della Cina è stato oggetto di studio approfondito, le differenze tra i paesi che hanno intrapreso una rapida transizione sono scarsamente comprese. Una possibile spiegazione è che, a cominciare da istituzioni molto simili, piccole differenze nel contenuto o nella scelta del momento opportuno per attuare il pacchetto di riforme o le occasioni date dagli eventi hanno avuto come risultato profonde e cumulative differenze nei risultati, dovute al fatto che alcuni paesi (per esempio, Ungheria e Polonia) furono in grado di cogliere gli effetti sinergici delle complementarietà istituzionali, mentre altri non ne furono capaci (Hoff e Stiglitz, 2002). Altre spiegazioni sottolineano le sostanziali differenze istituzionali tra i paesi o i loro divergenti livelli di fiducia o altre norme sociali. Ciò che non è controverso è che divergenze nei risultati di tale portata, che emergono in meno di una decade, suggeriscono sia l’importanza rivestita dalle istituzioni economiche sia l’influenza pervasiva degli effetti di feedback positivo, per cui sia il
PROLOGO
|5
successo che il fallimento sono cumulativi.
Anni
Figura P.1. la divergenza del PIL reale pro-capite nei paesi ex-comunisti (anno base 1990). Fonte: World Bank (Statistical Information Management Analysis data base).
Ho scelto deliberatamente casi che enfatizzano il ruolo centrale delle istituzioni. Altre comparazioni avrebbero potuto suggerire conclusioni diverse o non così evidenti. Nel periodo che va dal 1950 al 1990, per esempio, paesi con regimi democratici e autoritari sembrano differire sorprendentemente poco nell’insieme dei loro risultati economici (controllando anche per altri fattori), mentre differenze maggiori si notano solo nei loro dati anagrafici (una crescita più lenta della popolazione nelle democrazie (Przeworski, Alvarez, Cheibub e Limongi, 2002). Nondimeno, gli esempi sopra riportati – la differenza dei livelli di vita in Europa rispetto a molte altre parti del mondo, il capovolgimento di sorte nel Nuovo Mondo, e le conseguenze eterogenee della liberalizzazione nelle nazioni un tempo comuniste – sono di estrema importanza in quanto tali e, come gli esempi successivi mostrano, difficilmente possono essere considerati atipici. Che cosa può dirci l’economia moderna circa la ricchezza e la povertà delle nazioni e dei loro popoli? Non meno importante, che cosa si può fare a tal proposito? §
6 | MICROECONOMIA
Contrariamente alla sua reputazione conservatrice, l’economia politica si è sempre occupata di cambiare il modo in cui il mondo funziona. I primi economisti – i mercantilisti e i fisiocratici – erano i consiglieri dei sovrani assolutisti dell’Europa all’inizio dell’epoca moderna, oggigiorno i macroeconomisti, i consiglieri dello sviluppo economico e gli architetti della transizione dal comunismo alle società basate sul mercato continuano questa tradizione di impegno nel mondo reale. Gli economisti non sono mai stati estranei alla politica attiva e alla creazione delle costituzioni. La speranza che gli economisti possano aiutare ad alleviare la povertà ed assicurare le condizioni sotto le quali popoli liberi possano fiorire, è al tempo stesso la nostra vocazione più ispirante e la più grande sfida. Come tanti, sono stato attratto dall’economia con questa speranza. Avendo studiato da ragazzo in India ed avendo insegnato in una scuola secondaria in Nigeria prima di dedicarmi all’economia, naturalmente ho approcciato questo campo con l’aspettativa che esso potesse affrontare il persistente problema della povertà globale e dell’ineguaglianza. All’età di undici anni avevo notato come fossi simile rispetto ai miei compagni di classe della Scuola Pubblica di Delhi – nello sport, nei lavori scolastici, in quasi ogni cosa. Da allora una domanda mi ha assillato: com’è possibile che gli Indiani siano tanto più poveri degli Americani, dato che come popolo siamo così simili nelle nostre capacità? Così ho iniziato il Ph.D. sperando che l’economia potesse, per esempio, spiegare perché i lavoratori negli Stati Uniti producono in un mese quello che in India si produce in quasi un anno, e perché la popolazione indiana è corrispondentemente povera (Hall e Jones, 1999). Noi ora sappiamo che le spiegazioni economiche convenzionali hanno fallito: in base a qualsiasi calcolo ragionevole, la differenza nel rapporto capitale-lavoro e nel livello di scolarizzazione della forza lavoro degli Stati Uniti e dell’India spiegano molto meno di quanto faccia la metà della differenza di produttività. Sembra plausibile che il divario derivi da cause più difficili da misurare e, fino a poco tempo fa, meno studiate dagli economisti: ossia differenze nell’esperienza storica, nelle istituzioni e nei comportamenti convenzionali. Questo è l’oggetto principale del presente libro. I Principi di Alfred Marshall (1842-1924) è stato il primo grande testo nell’economia neoclassica. Apre con queste righe: Adesso, in fine, ci stiamo ponendo seriamente la domanda se e’ necessario che esista la cosidetta “classe bassa”: ossia se debba esserci tantissima gente condannata dalla loro nascita a lavorare duro per fornire agli altri i requisiti per una vita raffinata e acculturata, mentre ad essi stessi e’precluso dalla loro povertà e dal loro lavoro, di avere una qualsiasi parte o partecipare a quella vita. ... La risposta dipende in gran parte da fatti ed inferenze, che si trovano nell’ambito dell’economia; e questo è quello che dà agli studi economici il loro principale e più alto interesse.
PROLOGO
|7
(Marshall, 1930, pp.3-4)
Marshall scrisse ciò nel 1890. Immagino che egli sarebbe deluso dal progresso che l’economia ha fatto nei confronti di quei nobili obiettivi nel secolo successivo. § Il paradigma neoclassico che Marshall aiutò a fondare mal si attagliava al compito che egli pose. Le sue ipotesi definitorie preclusero l’analisi di molti aspetti chiave del progresso e della stagnazione economici, tra cui l’esercizio del potere, l’influenza dell’esperienza e di condizioni economiche sulle preferenze e sulle congetture (beliefs) della gente, le dinamiche di disequilibrio e il processo di persistenza e cambiamento istituzionale. Attingendo ai contributi di molti – tra economisti e non – questo libro presenta una teoria su come i comportamenti individuali e le istituzioni economiche interagiscono nel produrre risultati aggregati, e su come sia gli individui che le istituzioni cambino nel tempo. Esso è basato su ipotesi che sono completamente diverse da quelle che definiscono il paradigma neoclassico. In quel che segue, userò il termine paradigma walrasiano (da Leon Walras (1834-1910), un altro dei fondatori dell’economia neoclassica), preferendolo al più ampio termine neoclassico. Con la parola walrasiano intendo riferirmi a un approccio economico che ipotizza che gli individui decidano le loro azioni in base a una valutazione di lungo periodo delle loro conseguenze, basata su preferenze che sono autostimate ed esogenamente determinate, che le interazioni sociali prendono esclusivamente la forma di scambi contrattuali, e che gli aumenti nei rendimenti di scala possono essere ignorati nella maggior parte delle applicazioni. Con alcuni raffinamenti, queste ipotesi spiegano i successi analitici caratteristici e l’orientamento normativo dell’approccio walrasiano. Il termine paradigma allude agli insegnamenti centrali dell’approccio, insegnati agli studenti. L’approccio qui sviluppato conserva molti dei principi fondamentali del paradigma walrasiano e della scuola classica, che ha sostituito. Tra questi vi sono tre idee molto conosciute, ovvero: che, quando gli individui agiscono, essi cercano di conseguire qualcosa; che un’azione intenzionale è vincolata dagli effetti della competizione; e che i risultati aggregati di un gran numero di individui che interagiscono in questo modo sono tipicamente involontari. Questi principi hanno fornito le basi per lo sviluppo dell’economia sin dall’inizio e spiegano molte intuizioni analitiche. Altri aspetti del paradigma walrasiano, tuttavia, sono stati sostituiti.
8 | MICROECONOMIA
L’approccio walrasiano rappresenta il comportamento economico come la soluzione ad un problema di ottimizzazione vincolata affrontata da un individuo perfettamente informato in un ambiente in pratica libero da istituzioni. La celebre definizione di Robbins del problema riflette questa equazione dell’economia con ottimizzazione vincolata. Il passare del tempo è rappresentato semplicemente da un tasso di sconto; le persone non apprendono o acquisiscono nuove preferenze, le istituzioni non evolvono. Le azioni di tutti gli altri non sono rappresentate da niente di più complicato di un vettore dato di prezzi market-clearing, mentre la prossimità è rappresentata da un costo di trasporto. I diritti di proprietà e le altre istituzioni economiche sono rappresentate semplicemente da un vincolo di bilancio. Un agente economico in questo modello è grosso modo Robinson Crusoe con prezzi che si sostituiscono alla natura. I Crusoe dell’economista abitano un mondo in cui i beni sono scarsi, ma tutte le istituzioni necessarie per coordinare le loro attività in maniera ottima sono liberamente disponibili. L’“offerta” di istituzioni ottime può così essere ignorata, per la stessa ragione per cui Adam Smith spiegava che gli economisti non hanno bisogno di formulare delle teorie sul valore dell’acqua: essi sono beni liberi. Questa descrizione del paradigma walrasiano è naturalmente una cariacatura, sebbene riconoscibile, di ciò che gli economisti hanno insegnato nei principali programmi di dottorato fino ai primi anni ’80. Da allora una combinazione di nuovi strumenti analitici – in particolar modo la teoria dei giochi e l’economia dell’informazione – e la sempre più evidente inadeguatezza empirica del modello walrasiano si sono combinati ed hanno modificato il modo in cui l’economia viene insegnata ed esercitata. Gli agenti economici non interagiscono più soltanto con la natura o con un qualche altro ambiente parametrico, bensì gli uni con gli altri, in maniera strategica. Le loro interazioni non sono più descritte completamente dai prezzi dei beni che essi scambiano, in quanto alcuni aspetti delle loro transazioni non sono espresse in contratti enforceable (il cui rispetto può essere assicurato). Nondimeno, nella pratica, anche se alcune delle ipotesi tipicamente walrasiane sono venute meno, i principi comuni del vecchio paradigma sono evidenti in molti dei nuovi approcci. Robert Solow li definiva come “equilibrio, avidità e razionalità”, volendo intendere che quando gli economisti “spiegano” qualcosa – ad esempio, la disoccupazione – essi vogliono dire che può essere rappresentata come un unico risultato stazionario in un modello di interazioni tra individui autointeressati e con capacità cognitive e predisposizioni avanzate. Altri modi per “spiegare” la
PROLOGO
|9
disoccupazione possono essere presi in considerazione, ma questa è l’opzione di base. L’interesse di Solow sull’adeguatezza dei tre principi di base è sempre più supportata da progressi sia empirici che concettuali. L’approccio che presento in questo libro si basa sui più modesti, ma forse più duraturi, principi classici dell’azione intenzionale e della competizione. Proprio come il paradigma walrasiano suppone che vi sia un particolare tipo di interazioni sociali come caso standard – rappresentato in precedenza da Robinson Crusoe – l’approccio qui riportato è concepito per mettere in luce una situazione generica sulla base di tre caratteristiche, osservate empiricamente, delle strutture di interazione sociale, dei comportamenti individuali e delle tecnologie. Qui abbozzo semplicemente quelli che considero essere i fatti salienti di queste generiche interazioni e dimostro alcune importanti implicazioni. Mi faccio carico del compito di definire un modello di queste interazioni (e di fornire alcune rilevanti prove empiriche) nei seguenti capitoli. Interazioni sociali non contrattuali. Quando gli individui interagiscono, è l’eccezione, non la regola, che tutto ciò che avviene tra di loro sia regolato da un contratto perfetto e facilmente enforceable. Invece, le interazioni sociali non contrattuali sono onnipresenti nei vicinati, nelle imprese, nelle famiglie, negli ambienti comuni, nei progetti politici e nei mercati. Benché molte di queste interazioni sociali non contrattuali si collochino in un ambiente non di mercato, esse sono importanti anche per la determinazione dei risultati economici in mercati fortemente competitivi. Per questo motivo, nelle pagine che seguono, tratterò il mercato dei beni in presenza di contrattazione completa – un elemento basilare per un manuale di economia introduttiva – come un caso speciale. Il caso generico è illustrato dai mercati del lavoro e dai mercati del credito – nei quali non è scontato che la promessa di lavorare sodo o di restituire il prestito sia enforceable – o dai problemi della gente comune in un ambiente locale circoscritto – nel quale lo sfruttamento delle risorse individuali impone delle ripercussioni, non contrattabili, sugli altri. Una caratteristica dei mercati con contratti incompleti è che uno o entrambi i partecipanti ad una semplice transazione bilaterale tipicamente ricevono delle rendite, cioè, dei pagamenti superiori al valore della loro prossima miglior alternativa disponibile. Nei mercati del lavoro e del credito alcuni lavoratori e debitori non sono in grado di trattare sulle quantità che essi preferiscono alle condizioni di scambio in vigore, cioè, essi sono limitati quantitativamente, e i mercati che ne risultano non sono in bilancio, manifestando un eccesso di offerta (per esempio, di lavoro) o un eccesso di domanda (di prestiti). Se molti aspetti delle interazioni economiche non sono regolati attraverso i
10 | MICROECONOMIA
contratti, come possono essere regolati? La risposta è: gli aspetti non contrattuali delle interazioni sono regolati attraverso una combinazione di norme e potere. Un contratto di lavoro non richiede alcun particolare livello di sforzo; ma l’etica del lavoratore o il timore del licenziamento o una pari pressione da parte dei compagni di lavoro potrebbero compiere ciò che l’enforcement dei contratti non può. L’ipotesi che il potere sia esercitato regolarmente nelle transazioni dei mercati competitivi colpirà alcuni lettori come un luogo comune; ma ad altri apparirà una contraddizione in termini. Per gli economisti neoclassici (come Abba Lerner, nella citazione introduttiva) “una transazione è un problema politico risolto”. Esso è “risolto” attraverso lo strumento dei contratti completi, così che tutto ciò che è d’interesse per tutte le parti, ai fini di una transazione, può essere applicato attraverso i tribunali. Con tutti i termini di una transazione specificati contrattualmente, non rimane nulla da fare per l’esercizio del potere. Per la stessa ragione, le norme sono ridondanti: se il contratto di un lavoratore specificasse un ammontare dato di lavoro per un ammontare dato di paga e se lo sforzo lavorativo fosse verificabile facilmente, allora il datore di lavoro si interesserebbe poco dell’etica lavorativa dei suoi lavoratori. L’alleggerimento dell’ipotesi di contrattazione completa in questo modo non solo spiega perché in molti mercati non si raggiunge l’equilibrio della domanda con l’offerta, ma rivela anche un importante ruolo economico sia per il potere che per le norme, rendendo la teoria più vicina al modo in cui gli osservatori e i partecipanti guardano gli scambi del mondo reale. Comportamenti adattivi ed etero-interessati. Il recente lavoro sperimentale di alcuni economisti (confermando ed estendendo un primo lavoro di altri studiosi di scienze sociali) così come osservazioni in un ambiente naturale suggeriscono una riconsiderazione sia della “razionalità” che dell’”avidità” nei tre principi di Solow. Gli individui perseguono intenzionalmente i loro obiettivi, ma lo fanno per lo più attingendo ad un repertorio limitato di risposte comportamentali acquisite attraverso l’esperienza passata piuttosto che attraverso l’impegno in processi di ottimizzazione con aspettative razionali, i quali sono considerati nello stesso modo dall’approccio walrasiano e dalla maggior parte della teoria classica dei giochi. In molte situazioni, emozioni come la vergogna, il disgusto o l’invidia si mescolano con la consapevolezza nel generare una risposta comportamentale. Inoltre, benché l’interesse personale sia una motivazione forte, le motivazioni etero-interessate sono altrettanto importanti. Negli esperimenti e nella vita reale, le persone frequentemente sono disposte a ridurre il proprio benessere non solo al fine di aumentare quello degli altri, ma anche al fine di penalizzare coloro il cui comportamento ha danneggiato
PROLOGO
|11
loro o altri, o che hanno violato una norma etica. Queste cosiddette “preferenze sociali” aiuteranno a spiegare perché spesso le persone cooperano per raggiungere fini comuni, anche quando la defezione produrrebbe vantaggi materiali maggiori, perché i piani di incentivo basati sull’interesse personale a volte hanno un effetto contrario, e perché le imprese non vendono i posti di lavoro. Modelli adeguati di gran parte delle interazioni non possono essere popolati da individui identici che si conformano agli assiomi dell’interesse personale dell’Homo economicus, ma piuttosto devono tener conto del fatto – confermato negli esperimenti e nell’ambiente naturale – che le persone sono eterogenee – alcune più autointeressate, altre più attente civicamente, per esempio – e versatili – le nostre azioni si adattano alle situazioni, piuttosto che riflettere una predisposizione comportamentale per un qualsiasi singolo scopo. Come risultato sia della eterogeneità che della versatilità comportamentali, vedremo, piccole differenze nelle istituzioni possono provocare grandi differenze nei risultati, con alcune situazioni che inducono gli individui egoisti ad agire in cooperazione, ed altre che inducono comportamenti egoistici in coloro che sono predisposti a cooperare. Gli economisti hanno comunemente considerato i comportamenti che violano i canoni rigorosi della razionalità formale comportamenti idiosincratici, instabili o irrazionali, in breve, che non mostrano le regolarità che si accorderebbero con l’analisi scientifica. Ma il fatto che i soggetti sperimentali mostrino delle “irrazionalità” come l’intransitività, l’avversione alle perdite, l’incoerenza nello sconto temporale e la sopravvalutazione di eventi con una bassa probabilità, suggerisce che questi comportamenti sono non solo comuni, ma anche suscettibili di analisi. Il processo attraverso il quale le persone acquisiscono le loro risposte comportamentali comprende il copiare i comportamenti di coloro che si è osservato che in situazioni simili hanno ottenuto dei risultati giudicati positivi secondo un qualche standard, o l’agire al fine di massimizzare i propri guadagni date determinate congetture circa le azioni degli altri. Ma vi sono anche altri fattori che agiscono, incluso il conformismo e altre forme di apprendimento basate sulla frequenza e non correlate ai risultati associati ai comportamenti. Conseguentemente, le previsioni di comportamento basate su una massimizzazione dei payoff futuri (forward-looking) potrebbero essere abbastanza fuorvianti. Inoltre, le risposte comportamentali acquisite dagli individui in un particolare ambiente è improbabile che siano acquisite dagli stessi individui in un ambiente totalmente differente. In questo senso non solo le opinioni individuali (sulle conseguenze delle loro azioni) sono endogene. I “fini dati” invocati da Robbins sono una utile semplificazione in molti lavori analitici, ma
12 | MICROECONOMIA
sono una restrizione arbitraria e fuorviante in altri.
Rendimenti crescenti generalizzati. Le interazioni economiche e sociali spesso conducono a percorsi denominati da Gunnar Myrdal (1956) di causazione cumulativa, o di quelli che sono oggi chiamati feedback positivi. I feedback positivi includono le economie di scala nella produzione; tuttavia il termine si riferisce più in senso lato ad ogni situazione in cui il guadagno (payoff ) per chi agisce in un modo è crescente nel numero di persone che agiscono nello stesso modo. Il fatto che i benefici derivanti dall’apprendimento di una particolare lingua dipendano dal numero di coloro che la parlano o che il guadagno dall’impegnarsi in un’azione collettiva dipenda dal numero dei partecipanti, sono illustrazioni più generiche. Per distinguere questa ampia classe di casi di feedback positivi dal sottoinsieme basato sui rendimenti di scala crescenti nella produzione, userò il termine rendimenti crescenti generalizzati. Le sinergie tra istituzioni possono essere molto simili a questi rendimenti crescenti generalizzati. Per esempio, il possesso privato della proprietà, i mercati competitivi e le norme legislative spesso implementano le soluzioni molto efficienti per i problemi allocativi; ma solo se tutte le tre componenti sono presenti e quasi tutti i membri della società aderiscono a questi principi. Rendimenti crescenti generalizzati dovuti a queste complementarietà istituzionali sembrano essere una fonte di divergenza negli andamenti di crescita del Nuovo Mondo e delle economie ex-comuniste, menzionate in precedenza. Possono inoltre aiutare a spiegare l’aumento nella disuguaglianza tra la gente del mondo nell’ultimo secolo e mezzo, nonostante il recupero di Giappone, Cina e altre nazioni dell’Asia dell’Est.5 Questi feedback positivi creano degli ambienti economici in cui piccoli eventi casuali hanno conseguenze durevoli per un lasso temporale molto lungo, e in cui le condizioni iniziali possono avere effetti persistenti, cosiddetti di lock-in. Le “trappole di povertà”, affrontate dai popoli e dalle nazioni così come i “cicli virtuosi” di benessere goduti dagli altri, mostrano queste influenze. La ragione è che, in presenza di rendimenti crescenti generalizzati, tipicamente si ha il caso in cui esiste più di un risultato stazionario con la proprietà che piccole deviazioni da quel risultato si autocorreggono. Questi equilibri stabili multipli possono essere sostituiti da quelli che appaiono nel nostro modello come shock esogeni, mutazioni, o azioni idiosincratiche, ma che nel mondo reale prendono la forma di guerre, cambiamenti climatici, o altri eventi non inclusi nel modello in esame.
5
Si veda Bourguignon e Morrison (2002) e le opere qui citate.
PROLOGO
|13
Un risultato può essere periodi rari ma drammatici di cambiamento nelle istituzioni, i comportamenti, le tecnologie e altro e di conseguenza una popolazione si sposta dall’intorno di un equilibrio a un altro, spesso seguito da lunghi periodi di stabilità. I biologi usano il termine equilibri punteggiati per riferirsi a questo modello alternante di stasi e rapido cambiamento (Eldredge e Gould, 1972). Il collasso del comunismo è un esempio; un altro è la scomparsa della fasciatura dei piedi delle giovani donne in Cina. Questa dolorosa e inabilitante consuetudine è durata per un millennio, resistendo ai tentativi di porvi fine nei secoli; tuttavia è scomparsa nel corso di appena una decade e mezzo nella prima parte dell’ultimo secolo (Macie, 1996). L’esistenza di equilibri multipli può spiegare anche perché popolazioni apparentemente simili potrebbero finire per avere norme, gusti e costumi abbastanza differenti, spesso avendo per risultato un modello, largamente osservato, di omogeneità locale ed eterogeneità globale, cucine nazionali e gusti sul cibo differenti forniscono un esempio. Non ci sono ragioni e vi sono poche prove che suggeriscano che le istituzioni e i comportamenti che ne conseguono siano in qualche senso ottimi. Seguendo la caduta del comunismo nell’Unione Sovietica e nell’Europa dell’Est, per esempio, molti economisti predissero con sicurezza che non appena la proprietà di stato fosse stata abolita, una configurazione realizzabile di istituzioni capitaliste sarebbe emersa spontaneamente. Ma in Russia e molte delle altre economie in transizione, una decade di assenza di legge e di cleptocrazia hanno creato una concentrazione enorme della ricchezza sotto istituzioni che forniscono pochi incentivi per la crescita della produttività e degli investimenti. I risultati economici deludenti della fine del dominio comunista in questi paesi sottolinea la fallacia del parere convenzionale per cui in un mondo di scarsità materiale, delle buone istituzioni siano libere. Nelle pagine che seguono, le istituzioni, come i beni, sono considerate scarse. Le tre assunzioni fondamentali abbozzate in precedenza – la natura non-contrattuale delle interazioni sociali, i comportamenti adattivi ed etero-interessati, e i rendimenti crescenti generalizzati – definiscono il caso generico, la mia situazione di base. I tre sono correlati. L’alleggerimento dell’ipotesi di contrattazione completa senza la modifica delle ipotesi comportamentali dell’economia walrasiana non è convincente, poichè l’importanza delle preferenze etero-interessate come vedremo, aumenta considerevolmente se si prende in considerazione un contesto di contrattazione incompleta. Allo stesso modo, il processo attraverso il quale le preferenze mutano, mostra forti rendimenti crescenti generalizzati. La ragione è che le norme generalmente prendono la forma di convenzioni, alla cui adesione si ha interesse soltanto finché molti altri lo fanno. Così, l’alleggerimento delle ipotesi
14 | MICROECONOMIA
comportamentali convenzionali aumenta i dubbi sui rendimenti non-crescenti. Infine, se i rendimenti crescenti generalizzati sono comuni, gli stati che è probabile osservare dipenderanno in modo critico da istituzioni che governano le dinamiche rilevanti, incluse cose come l’esercizio del potere, l’azione collettiva e altre forme di interazione sociale non contrattuale. § Benchè molto di ciò che segue sia il risultato di una ricerca recente, praticamente tutti i modelli e le idee presentati sono stati anticipati da scrittori mezzo secolo fa o più, a volte molto di più. L’importanza degli agenti adattivi (con capacità cognitive e predisposizioni realistiche), i cui comportamenti erano basati su un’informazione locale, era una parte centrale del lavoro di Frederich Hayek (1945) e Herbert Simon (1955). Il lavoro pionieristico di Simon sulla natura incompleta del contratto di lavoro (Simon, 1951) e il ruolo dell’autorità nel funzionamento delle imprese formalizza il precedente lavoro di Coase (1937) e molto prima di Coase, Marx (1976). I concetti base della teoria dei giochi, la contrattazione e altre interazioni sociali non di mercato furono introdotte nei primi scritti di John Nash (1950a), von Neumann e Morgenstern (1944), Thomas Schelling (1960) e Luce e Raiffa (1957). Nash propose persino le idee base della teoria dei giochi evolutivi nella sua dissertazione dottorale (1950b). La famosa soluzione di Nash al problema della contrattazione fu proposta per la prima volta assai precedentemente da F.Zeuthen (1930), in un lavoro introdotto in maniera entusiastica da Joseph Schumpeter. Le preferenze endogene erano centrali nel lavoro di James Duesenberry (1949) e Harvey Leibenstein (1950), che hanno entrambi attinto all’assai precedente lavoro di Veblen (1899/1934) ed hanno sviluppando temi inizialmente sollevati da Smith (1776) e Marx. Il famoso paradosso di Maurice Allais (1953) dimostrava problemi con ipotesi di utilità attesa che solo recentemente hanno attratto una seria attenzione. Il modo in cui feedback positivi sostengono equilibri multipli era l’idea chiave nelle lezioni al Cairo di Gunnar Myrdal nel 1955, già menzionato. L’applicazione di ragionamenti biologici all’economia ora importante nella teoria dei giochi di evoluzione fu introdotta mezzo secolo fa da Armen Alchian (1950) e Gary Becker (1962). Il fatto che molte delle idee chiave presentate nelle pagine che seguono siano state anticipate durante gli anni ’50 o prima, ma ignorate nelle decadi seguenti pone un’intrigante domanda. Perché il paradigma walrasiano divenne praticamente il sinonimo dell’economia per i tre quarti del secolo precedente, soltanto per essere
PROLOGO
|15
sostituito alla fine del secolo da un insieme di idee, molte delle quali erano state articolate da accademici noti appena prima che crescesse l’importanza del paradigma walrasiano? Herbert Gintis ed io, (Bowles e Gintis, 2000) abbiamo provato a dare una risposta alla questione, ma affrontarla qui sarebbe una digressione. § L’allentamento delle ipotesi walrasiane, per tenere conto delle interazioni sociali non contrattuali, dei comportamenti adattivi etero-interessati, e dei rendimenti crescenti generalizzati, richiederà un metodo basato più empiricamente e meno deduttivo del tipico approccio walrasiano. Facendo scarso riferimento a specificità di tempo, o spazio, o in effetti a qualsiasi fatto empirico, il paradigma walrasiano ha dedotto alcune predizioni piuttosto forti riguardanti i risultati che verosimilmente si osservano nell’economia. L’espansione del dominio dell’economia sino a includere la famiglia, l’organizzazione della produzione, e l’attività politica come la fornitura volontaria di beni pubblici, la creazione di lobby e le votazioni, ha prodotto preziose intuizioni, che non si sarebbero potute raggiungere usando i metodi convenzionali della sociologia e delle scienze politiche. Ma la ricerca in queste aree così come il ritorno all’importanza dell’interesse degli economisti classici per la crescita e la distribuzione economiche di lungo termine hanno fatto sorgere dei dubbi sulla generalità delle ipotesi standard. Per rispondere al malessere, che ora è provato tra gli economisti, il Journal of Economic Perspectives dell’American Economic Association dedica regolarmente una colonna alle “anomalie” che essi definiscono come segue: L’economia può essere distinta dalle altre scienze sociali per la convinzione che la maggior parte (il totale) dei comportamenti possono essere spiegati assumendo che gli agenti razionali con preferenze ben definite e stabili interagiscono nei mercati in cui (alla fine) la domanda e l’offerta sono uguali. Un risultato empirico si qualifica come una anomalia se è difficile da “razionalizzare” o se ipotesi non plausibili sono necessarie per spiegarlo all’interno del paradigma.
I lettori risposero avidamente all’invito di scrivere con i loro esempi preferiti. Invece di dedurre da pochi assiomi comportamentali e istituzionali (un tempo) non controversi l’economia si è spostata sempre più (seppure non deliberatamente per la maggior parte) verso un approccio che combina i progressi matematici dell’ultimo secolo con alcuni dei metodi degli economisti classici. Da Adam Smith a John Stuart Mill e Karl Marx (eccetto David Riccardo) gli economisti classici non avevano un approccio disciplinare (le discipline non erano state inventate), si preoccupavano dei dettagli empirici dei problemi sociali dei loro giorni, ed erano modesti circa il grado di generalità a cui le loro teorie potevano aspirare. Vi sono tre implicazioni. Primo, lo studio dell’economia doveva avvicinarsi a
16 | MICROECONOMIA
comprendere tutto delle scienze comportamentali, incluse ecologia e biologia. Le ipotesi walrasiane fornivano un fondamento logico per una divisione rigida del lavoro tra le discipline. Le sue ipotesi definitorie permettevano agli economisti walrasiani di sconfessare un interesse nei confronti dei comportamenti etero-interessati delle norme, dell’esercizio del potere, o della storia, in quanto di interesse di qualche altra disciplina e non pertinente con i lavori dell’economia walrasiana. Benché il movimento attraverso i confini disciplinari nell’ultimo mezzo secolo sia consistito principalmente nell’esportazione di metodi economici verso le altre scienze comportamentali, vi è molto da esportare nell’economia, se si debbono comprendere il ruolo del potere, le norme, le emozioni e i comportamenti adattivi. Secondo, l’alleggerimento delle ipotesi walrasiane ci mette di fronte all’imbarazzo della scelta. In assenza di certe restrizioni empiriche o di perfezionamenti speculativi, un paradigma rimarrà vuoto. Questa era la conclusione di Hugo Sonnenschein (1973, p. 405) circa la teoria walrasiana della domanda di mercato: “La morale […] è semplicemente questa: se tu ci metti molto poco, produrrai molto poco.” Ma la stessa cosa si applica ad ogni paradigma post walrasiano. Poche previsioni empiriche saranno raggiunte se gli individui si comportano in modo auto-interessato o no a seconda delle persone e delle situazioni, se alcune interazioni sono governate dai contratti, altre da una stretta di mano, ed altre dalla forza bruta, e se esistono equilibri multipli stabili. La necessità di una base empirica per le ipotesi non è in nessun contesto più chiara che nell’analisi del comportamento individuale, in cui il processo di arricchimento delle ipotesi convenzionali sulla conoscenza e le preferenze può facilmente discendere in una spiegazione ad hoc a meno che non sia disciplinato da un riferimento a fatti circa ciò che la gente reale fa. Non è sufficiente sapere che l’interesse personale non è la sola motivazione; abbiamo bisogno di sapere quali altre motivazioni sono importanti e sotto quali condizioni. Queste restrizioni derivano molto più probabilmente da una delle fonti che ha minato il paradigma walrasiano, ovvero i grandissimi progressi nelle scienze sociali empiriche derivanti dalle nuove tecniche nell’econometria, il miglioramento nelle capacità di calcolo e la disponibilità di dati, le tecniche sperimentali e i continui progressi nella storia quantitativa. La teoria, inoltre, può fornire delle restrizioni utili sull’insieme di ipotesi e risultati plausibili. Il modello dell’evoluzione genetica e culturale, per esempio, può aiutare a restringere il campo delle ipotesi comportamentali plausibili attraverso la distinzione tra emozioni, capacità cognitive e altre influenze sui comportamenti, la cui insorgenza e diffusione possono essere spiegate in maniera plausibile nei periodi
PROLOGO
|17
rilevanti della storia umana, da quelle che non possono esserlo. Allo stesso modo, sebbene i rendimenti crescenti generalizzati possano supportare un ampio numero di equilibri, alcuni di questi equilibri sono assolutamente irraggiungibili come esito di un qualsiasi processo dinamico plausibile. Invece, altri equilibri possono essere sia accessibili che robusti. In questo caso, una specificazione di un processo dinamico esplicito – per esempio un resoconto di come gli individui adattano i loro comportamenti alla luce delle loro recenti esperienze e delle esperienze di coloro che essi osservano – permetterebbe l’eliminazione di quelli che potrebbero essere denominati equilibri evolutivamente irrilevanti. La realizzazione delle dinamiche che regolano un sistema esplicito ci dà un resoconto del suo comportamento fuori dall’equilibrio e così non solo ci aiuta nel processo di selezione dell’equilibrio, ma anche nello studio della risposta a shock e ad altri problemi per i quali il metodo della statica comparata non è appropriato. Terzo, la ricerca di teorie sempre più generali continuerà ad impegnare gli studiosi di economia e c’è ancora molto da imparare attraverso lo studio di argomenti come i mercati in generale. Ma, per quanto si possa prevedere in futuro, sembra probabile che le intuizioni provengano, probabilmente, da modelli che tengono conto di specifici aspetti istituzionali e di altri aspetti di particolari tipi di interazioni economiche. Per gli economisti classici era evidente che i mercati del lavoro differivano in maniera fondamentale dai mercati della moneta, i quali a loro volta differiscono dai mercati delle camicie o dai mercati di scambio, e così via. I modelli potrebbero essere più specifici rispetto al tempo e allo spazio, in modo da cogliere l’importanza delle istituzioni che variano nel tempo o delle differenti culture. Se le entusiasmanti novità dell’era walrasiana furono teoremi molto astratti di sorprendente generalità, l’entusiasmo negli anni a venire potrebbe derivare da convincenti risposte a questioni che sono sollevate dai puzzle empirici che riguardano la ricchezza delle nazioni e dei popoli, con cui ho iniziato. Sarebbe salutare per gli economisti focalizzarsi di più sul dare risposta a tali questioni e meno sul dimostrare l’uso dei nostri strumenti sempre più sofisticati. Ma sembra che un approccio guidato più dal problema e meno dallo strumento avrà bisogno di strumenti comunque più sofisticati. Le domande matematiche della struttura speculativa che sto proponendo saranno più grandi, non meno, di quelle del paradigma walrasiano. La ragione è che i modelli che rappresentano interazioni sociali non contrattuali, tra individui che sono sia eterogenei sia versatili nei loro comportamenti in presenza di rendimenti crescenti generalizzati, non consentono le semplificazioni standard, come gli insiemi di comportamenti con prezzi dati e di produzione convessa, che rendevano i modelli walrasiani facili da usare. Come è stato
18 | MICROECONOMIA
riconosciuto a lungo in fisica e biologia, molti importanti problemi non danno soluzioni con una forma chiusa semplice, o in effetti, non danno nessuna soluzione che sia soggetta ad una interpretazione semplice. In questi casi – alcuni dei quali si incontreranno nei capitoli 11 e13 – le simulazioni computerizzate di interazioni sociali rilevanti si dimostreranno intuitive come un complemento (non un sostituto) per i metodi analitici più tradizionali. Le simulazioni sono state usate ampiamente nello sviluppo di idee a cui questo libro attinge. Le simulazioni non danno teoremi o proposizioni che siano veri in generale, piuttosto, come gli esperimenti, esse danno una ricchezza di dati che potrebbe indicare conclusioni ambigue, oppure spesso no. § Benché motivato da un interesse per l’impatto che le istituzioni economiche hanno sul benessere umano, ho adottato un approccio evoluzionistico, piuttosto che di ingegneria sociale. Come l’idea di “geni egoisti” che cercano di massimizzare la loro riproduzione o quella di un banditore che presiede ad un processo di scambio di equilibrio generale, così l’ingegnere sociale onnisciente ed onnipotente che cerca di massimizzare il benessere sociale è una invenzione la cui utilità dipende dal tenere a mente la sua caratteristica fittizia. I risultati sociali – anche quelli che riguardano gli stati e altre strutture potenti – sono la conseguenza combinata di azioni compiute da un ampio numero di persone che agiscono individualmente. Espedienti come banditori fittizi, ingegneri sociali o geni antropomorfici, non si possono sostituire alla comprensione di come gli individui reali si comportano e il modo in cui istituzioni distinte generano dinamiche nei livelli di popolazione, che aggregano questi comportamenti per produrre dei risultati sociali. Il carattere evolutivo dell’analisi diventerà evidente nel modo in cui i comportamenti individuali vengono modellati, nel tipo di dinamiche a livello di popolazione studiate, nei modi in cui i comportamenti e le istituzioni coevolvono, e nell’assenza di un eccezionale programma per il miglioramento umano. L’approccio evolutivo è modesto per quanto riguarda ciò che degli interventi possono conseguire, ma esso non limita l’economista a ricerche puramente contemplative. Tratterò le questioni del buon governo e della buona politica nel capitolo conclusivo. La prima parte del libro introduce una varietà di modelli applicati a ciò che ho appena chiamato l’interazione sociale generica, vale a dire, interazioni sociali non contrattuali tra agenti adattivi in presenza di rendimenti crescenti generalizzati. Comincio con due capitoli sulle istituzioni e l’evoluzione delle strutture di interazione
PROLOGO
|19
sociale, prima di tornare alle preferenze e alle opinioni. L’ordine poco convenzionale di questi argomenti – la maggior parte dei testi di microeconomia inizia con le preferenze – riflette l’importanza delle istituzioni come fattore di influenza sulle norme, i gusti e la comprensione che gli individui conducono alle situazioni in cui essi agiscono. Successivamente, si analizzeranno le inefficienze allocative che avvengono nelle interazioni non contrattuali, e il problema della divisione dei profitti della cooperazione, che emerge quando queste inefficienze possono essere superate. La parte centrale del libro riguarda le istituzioni del capitalismo e, specialmente, i mercati, le istituzioni di prestito, e le imprese. Si presterà particolare attenzione al modo in cui la natura incompleta della maggior parte dei contratti dà origine sia a ben definite strutture politiche dell’economia sia a un importante ruolo delle preferenze sociali. L’ultima parte riguarda il processo di cambiamento culturale ed istituzionale, nella quale sarà attribuito rilievo al ruolo del cambiamento tecnologico, dell’azione collettiva e del conflitto tra i gruppi, come parti costituenti del processo attraverso il quale le regole che governano le interazioni sociali e i comportamenti individuali coevolvono. In quella sede si affronterà l’evoluzione delle istituzioni familiari, come la proprietà privata e le regole consuetudinarie della divisione, così come l’inspiegabile successo evolutivo dei comportamenti individuali etero-interessati. Il capitolo conclusivo compara tre strutture che regolano le interazioni economiche – i mercati, gli stati e le comunità – ed esplora i modi in cui esse potrebbero costituire approcci complementari ai problemi trattati di allocazione e redistribuzione. Nel 1848, John Stuart Mill (1900) pubblicò i Principles of Political Economy, il primo grande manuale di microeconomia. Esso fu l’elemento principale dell’istruzione nel mondo anglofono fino ad essere sostituito dai Principles di Marshall mezzo secolo dopo. I lettori di Mill sarebbero stati rassicurati dal leggere: “Fortunatamente, non c’è nulla nelle leggi sul valore che resti da spiegare per il presente o un futuro scrittore, la teoria in oggetto è completa.” (p.420). Quando io ho studiato economia negli anni ’60, durante i tempi d’oro del paradigma walrasiano, regnava un simile autocompiacimento. Questo libro non comunica tale sicurezza. La nostra comprensione della microeconomia è fondamentalmente in uno stato di flusso. Poco è stabile. Niente è completo.
20 | MICROECONOMIA
Bibliografia Acemoglu, Daron, Simon Johnson, and J.A. Robinson. 2001. "Reversal of Fortune: Geography and Institutions in the Making of the Modern World Income Distribution." Alchian, Armen. 1950. "Uncertainty, Evolution, and Economic Theory." Journal of Political Economy, 58, pp. 211-21. Allais, Maurice. 1953. "Le comportement de l'homme rationnel devant le risque, critique des postulats et axiomes de l'ecole Americaine." Econometrica, 21, pp. 503-46. Allen, Robert. 2001. "The Great Divergence in European Wages and Prices from the Middle Ages to the First World War." Explorations in Economic History, 38, pp. 411-47. Banerjee, Abhijit and Lakshmi Iyer. 2001. "History, Institutions and Economic Performance: The Legacy of Colonial Land Tenure Systems in India." Battuta, Ibn. 1929. Travels in Asia and Africa: 1325-1354. London: Routledge and Kegan Paul, Ltd. Becker, Gary S. 1962. "Irrational Behavior and Economic Theory." Journal of Political Economy, 70:1, pp. 1-13. Bowles, S. and H. Gintis. 2000. "Walrasian Economics in Retrospect." Quarterly Journal of Economics, 115:4, pp. 1411-39. Bowles, Samuel and Richard C. Edwards. 1993. Understanding Capitalism: Competition, Command and Change. New York: Harper-Collins. Coase, R. H. 1937. "The Nature of the Firm." Economica, 4, pp. 386-405. Duesenberry, James S. 1949. Income, Saving, and the Theory of Consumer Behavior. Cambridge, MA: Harvard University Press. Eldredge, Niles and S.J. Gould. 1972. "Punctuated Equilibria: an Alternative to Phyletic Gradualism," in Models in Paleobiology. T.J.M Schopf and J.M. Thomas eds. San Francisco: Freeman, Cooper, pp. 82-115. Engerman, S., K. Sokoloff, and E. Mariscal. 1998. "Schooling, Suffrage, and the Persistente of Inequality in the Americas, 1800-1945." University of California, Los Angeles. Hall, Robert and Charles Jones. 1999. "Why do some countries produce so much more output per worker than others?" Quarterly Journal of Economics, 114:1, pp.
PROLOGO
|21
83-116. Hayek, F.A. 1945. "The Use of Knowledge in Society." American Economic Review, 35:4, pp. 519-30. Hoff, K. and J. E. Stiglitz. 2002. "After the Big Bang: Obstacles to the rule of law in post-Communist societies." Kupperman, Karen Ordahl. 1993. Providence Island, 1630-1641: The Other Puritan Colony. New York: Cambridge University Press. Leibenstein, H. 1950. "Bandwagon, Snob, and Veblen Effects in the Theory of Consumers' Demand." Quarterly Journal of Economics, 64, pp. 183-207. Lerner, Abba. 1972. "The Economics and Politics of Consumer Sovereignty." American Economic Review, 62:2, pp. 258-66. Luce, R. Duncan and Howard Raiffa. 1957. Games and Decisions. New York: John Wiley. Mackie, Gerry. 1996. "Ending Footbinding and Infibulation: A Convention Account." American Sociological Review, 61, pp. 999-1017. Marshall, Alfred. 1930. Principles of Economics (Eighth Edition). London: MacMillan (original publication 1890). Marx, Karl. 1976. Capital I. Harmondsworth: Penguin (original publication, 1859). Milanovic, Branko. 1999. "True World Income Distribution, 1988 and 1993: First Calculation Based on Household Surveys Alone." World Bank: Washington DC. Mill, John Stuart. 1900. Principles of Political Economy. New York: The Colonial Press (first published in 1848). Myrdal, Gunnar. 1956. Development and Underdevelopment: A note on the mechanismof national and international economic inequality. Cairo: National Bank of Egypt. Nash, John F. 1950a. "Equilibrium Points in n-Person Games." Proceedings of the National Academy of Sciences, 36, pp. 48-49. Nash, John F. 1950b. "Non-cooperative games." (doctoral dissertation) Princeton University. Neumann, John Von and Oskar Morgenstern. 1944. Theory of Games and Economic Behavior. Princeton, NJ: Princeton University Press. Przeworski, A, Michael E. Alvarez, Jose Antonio Cheibub, and Fernando Limongi. 2000.
22 | MICROECONOMIA
Democracy and Development: political institutions and well-being in the world, 1950-1990. Cambridge: Cambridge University Press. Robbins, Lionel. 1935. An Essay on the Nature & Significance of Economic Science. London: Macmillan. Schelling, Thomas. 1960. The Strategy of Conflict. Cambrdige, MA: Harvard University Press. Schultz, T.P. 1998. "Inequality in the Distribution of Personal Income in the World: How it is Changing and Why." Journal of Population Economics, 11, pp. 307-44. Simon, Herbert. 1951. "A Formal Theory of the Employment Relation." Econometrica, 19:3, pp. 293-305. Simon, Herbert. 1955. "A Behavioral Model of Rational Choice." Quarterly Journal of Economics, 69, pp. 99-118. Smith, Adam. 1776. An inquiry into the nature and causes of the wealth of nations. London,: W. Strahan and T. Cadell. Sokoloff, K. and S. Engerman. 2000. "Institutions, Factor Endowments, and Paths of Development in the New World." Journal of Economic Perspectives, 14:3, pp. 217-32. Sonnenschein, Hugo. 1973. "The Utility Hypothesis and Market Demand Theory." Western Economic Journal, 11, pp. 404-10. Thaler, Richard. 2001. "Anomalies." Journal of Economic Perspectives, 15:1, pp. 219. Veblen, Thorsten. 1899/1934. The Theory of the Leisure Class. New York: Modern Library. Yule, Henry. 1886. Cathay and the Way Thither: Being a collection of medieval notices of China. London: The Haklyut Society. Zimmerman, L.J. 1962. "The Distribution of World Income, 1860-1960," in Essays in Unbalanced Growth: A Century of Disparity and Convergence. E. De Vries ed. S'Gravanhage: Mouton, pp. 28-47.
I
I NTERAZIONI S OCIALI E S CHEMA I STITUZIONALE
Due confinanti possono accordarsi per drenare un prato che possiedono in comune, dato che è facile per essi sapere cosa l’altro pensa, e ognuno percepisce che la conseguenza immediata della rinuncia a fare la sua parte è l’abbandono dell’intero progetto. Ma è molto difficile, anzi impossibile, che migliaia di persone possano mettersi d’accordo su azioni del genere poiché è difficile concertare un progetto così complicato e ancora più difficile metterlo in pratica; ognuno infatti cerca un pretesto per sottrarsi alla preoccupazione ed alla spesa e cerca di scaricarne l’intero peso sugli altri. - David Hume, A Treatise of Human Nature, Volume II (1739)
Gli uomini potrebbero acquisire facilmente una idea approssimativa del mutuo impegno e dei vantaggi che ne derivano osservandolo in questo modo…In una battuta di caccia al cervo, ognuno dei cacciatori è abbastanza consapevole del fatto che per raggiungere lo scopo egli debba mantenere fedelmente la propria postazione; ma se una lepre passasse a portata di uno tra loro, senza dubbio chiunque l’inseguirebbe senza pensarci due volte e, avendo ottenuto la propria preda, si preoccuperebbe molto poco del fatto di esser stato la causa della perdita della preda dei propri compagni. - Jean-Jacques Rousseau, Discourse on the Origin and Foundations of Inequality among Men (1755)
CERCANDO
L E G IU S T E R E G O L E
Come il treno notturno che mi abbandonò in un luogo deserto distante dalla mia destinazione, così il processo di sviluppo economico ha aggirato la maggior parte delle duecento o poco più famiglie che costituiscono il villaggio di Palanpur. Esse sono rimaste povere, anche se rapportate agli standard indiani: meno di un terzo degli adulti sono alfabetizzati e molti hanno dovuto sopportare la perdita di un figlio a causa della malnutrizione o di altre malattie ormai dimenticate da molto tempo in altre parti del mondo. Ma tranne che per qualche raro orologio da polso, bicicletta o pompa di irrigazione, Palanpur appare come un luogo dell’India dove il tempo si è fermato, che non è stato neanche lontanamente sfiorato dalla crescita economica
2 | MICROECONOMIA
trainata dal settore all’avanguardia del software e dalle regioni agricole maggiormente sviluppate. Cercando di capirne i motivi, mi avvicinai ad un mezzadro e alle sue tre figlie che stavano arando un piccolo appezzamento di terreno1. La conversazione alla fine cadde sul fatto che i contadini di Palanpur seminano le proprie sementi invernali molte settimane dopo la data che permetterebbe loro di massimizzare il proprio raccolto. I contadini non hanno dubbi sul fatto che seminando prima otterrebbero maggiori raccolti, ma il contadino spiegò che nessuno vuole essere il primo a piantare in quanto le sementi di un singolo appezzamento sarebbero rapidamente mangiate dagli uccelli. Chiesi allora se mai un numero relativamente maggiore di contadini fosse mai riuscito ad accordarsi per anticipare la semina, piantando nello stesso giorno per cercare di minimizzare le perdite. “Se sapessimo come fare questo,” mi disse alzando lo sguardo dalla sua zappa, “non saremmo poveri”. Piantare nel momento giusto, come drenare con successo il prato nell’esempio di Hume o prevenire lo scioglimento della compagnia nella battuta di caccia al cervo di Rousseau, è una soluzione al problema definito come dilemma sociale o problema di coordinamento. Thomas Hobbes e gli altri fondatori della filosofia politica europea, così come i grandi economisti classici da Adam Smith fino a John Stuart Mill, cercarono di scoprire quali istituzioni, indirizzandosi alla soluzione di problemi come questi, fossero le più appropriate al raggiungimento del benessere umano. Per essi una domanda era sempre presente: come è possibile strutturare le relazioni sociali in modo tale che le persone siano libere di scegliere le proprie azioni evitando allo stesso tempo risultati che nessuno sceglierebbe? Definisco tale quesito come la sfida costituzionale classica. Ora si potrebbe dire: essi erano interessati nella ricerca delle giuste regole. Una versione contemporanea della sfida definirebbe come “risultati” gli equilibri di un gioco specificato dalla struttura delle interazioni sociali tenendo in considerazione come gli individui, dato l’ambiente istituzionale, possono giungere ad agire in modo tale che un risultato particolare (forse uno dei molti equilibri stabili) possa essere raggiunto e persistere per molti periodi. “Evitando allo stesso tempo risultati che nessuno sceglierebbe” potrebbe essere riformulato come il perseguimento di un risultato Pareto-efficiente, cioè di un risultato tale che nessun altro risultato realizzabile sarebbe preferito da almeno un individuo e non meno preferito da alcuno degli altri.
La prima epigrafe è tratta da Hume (1964:304), la seconda da Rousseau (1987:62). 1 Lanjouw e Stern (1998) forniscono una dettagliata descrizione dell’economia e della struttura sociale di Palanpur.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|3
Dato che farò un uso esteso della nozione di efficienza paretiana, un commento sui suoi difetti è dovuto. Come criterio base per la scelta tra allocazioni, il concetto standard di efficienza paretiana è allo stesso tempo troppo forte e troppo debole. E’ troppo forte perché in ogni applicazione pratica è coinvolto un largo numero di persone e quasi sempre si verifica che cambiamenti politici o istituzionali infliggono dei costi a qualche partecipante, anche nel lungo periodo. In questo caso, il concetto standard di efficienza paretiana ha una forte inclinazione a mantenere lo status quo. Ma il concetto di efficienza paretiana può essere troppo debole in quanto tale criterio non prende in considerazione caratteristiche che per una certa allocazione potrebbero essere desiderate. La più importante di queste è il principio che la distribuzione dei benefici che derivano da una certa allocazione sia giusta. Difficilmente si può credere che i fini costituzionali si riducano all’idea di produrre buone regole che sostengano equilibri Pareto-efficienti, ma, tenendo conto di questi due vincoli, tale idea rientra certamente tra questi fini. Sfortunatamente, l’adozione dell’efficienza paretiana come obiettivo non fornisce molte indicazioni al momento di effettuare scelte politiche. Ci possono essere molte ragioni per preferire un risultato Pareto-inefficiente ad uno Pareto-efficiente; ciò che è escluso è soltanto la preferenza per uno specifico risultato quando un altro possibile risultato è Paretosuperiore rispetto ad esso. Ma poche scelte pratiche assumono tale forma: molte opzioni politiche alternative non possono essere ordinate in questo modo. La sfida costituzionale ha un’ampia rilevanza contemporanea; si pensi alla protezione ambientale su scala globale, alla determinazione dello sforzo lavorativo tra membri di una reparto di produzione, alla produzione e alla distribuzione di informazione, e alla costruzione dei rapporti di vicinato tra individui che vivono in una stessa zona. Il fatto che sin dalla nascita del capitalismo, l’effetto aggregato di milioni di individui, ognuno dei quali agisce in modo indipendente per perseguire i propri obiettivi, ha rappresentato un miglioramento nel lungo periodo nelle condizioni di vita materiali di molti di coloro che vi hanno partecipato suggerisce che delle buone e tollerabili soluzioni possono essere trovate per problemi molto più impegnativi della questione del periodo di semina dei contadini in Palanpur, del prato di Hume e della caccia al cervo di Rousseau. Come possa succedere che un gran numero di individui tra loro sconosciuti, con poca o nessuna preoccupazione per il benessere degli altri, agiscano in modo continuativo in modo tale da apportare mutuo beneficio è uno dei grandi puzzle della società umana ed è uno di quelli che proverò di chiarire. Ma ci sono anche evidenti casi di fallimento nel risolvere i moderni problemi di coordinamento: sovrasfruttamento sistematico di alcune risorse (ambiente naturale) e sottoutilizzazione di altre (capacità produttive umane), per esempio, e la persistente povertà delle persone di Palanpur e di altri villaggi simili in ogni parte del
4 | MICROECONOMIA
mondo. La ragione per la quale attività non coordinate di individui che perseguono i propri fini spesso producono risultati che tutti cercano di evitare è che le azioni di ogni persona influenzano il benessere di altri e che questi effetti spesso non sono inclusi nei processi di ottimizzazione o nelle regole empiriche adottate nei processi di decisione di agenti individualisti. Tali effetti sugli altri sono chiamati esternalità. In passato gli economisti trattavano questi effetti esterni come eccezionali, l’esempio standard è quello delle api dell’apicoltore che impollinano gli alberi di mele del contadino confinante. Ma, come gli esempi precedenti suggeriscono, molti sono i casi nell’economia moderna. La sfida costituzionale classica può essere posta nella seguente maniera: quali regole che governano le interazioni tra le persone potrebbero facilitare il perseguimento dei propri fini inducendo allo stesso tempo ognuno a tenere in adeguata considerazione gli effetti delle proprie azioni sugli altri? La prima proposizione (“perseguimento dei propri fini”) semplicemente riconosce che ogni soluzione ai problemi di coordinamento sarà sostanzialmente decentralizzata, e che una soluzione che cerchi semplicemente di scavalcare le intenzioni individuali non funziona né tanto meno è desiderabile. La sfida centrale è nella seconda proposizione: in circostanze in cui le azioni di una persona influenzano il benessere degli altri, come possono questi effetti essere resi sufficientemente rilevanti da influenzare il comportamento degli agenti in modo appropriato? Se gli altri sono i nostri parenti, o i nostri vicini, o amici, la nostra preoccupazione per il loro benessere o il nostro desiderio di evitare sanzioni sociali può indurci a prendere in considerazione gli effetti delle nostre azioni su di loro. Come riflesso di ciò, un’importante risposta alla sfida costituzionale – una antecedente gli economisti classici – è che le preoccupazioni per il benessere di altri potrebbe estendersi verso tutti quelli con i quali si interagisce, in modo da internalizzare gli effetti delle proprie azioni sugli altri. Con la crescita della dimensione dei mercati nell’ultimo mezzo millennio, comunque, le persone hanno cominciato ad interagire non con poche dozzine di individui, ma con centinaia e indirettamente con milioni di sconosciuti. E quindi, con la maturazione del capitalismo e la crescente influenza del ragionamento economico, il compito del buon governo si è spostato dal coltivare la virtù civica alla sfida di progettare istituzioni che funzionino ragionevolmente bene in sua assenza. Le moderne teoria dell’implementazione, teoria del “mechanism design” e teoria del contratto ottimale incorporano questa tradizione chiedendosi quali forme di contratto,
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|5
diritti di proprietà o altre regole sociali debbano essere utilizzate per poter raggiungere alcuni auspicabili obiettivi sociali aggregati quando questi obiettivi non sono condivisi da nessuno dei partecipanti. Un esempio rilevante è il Teorema Fondamentale dell’Economia del Benessere, che identifica sotto quali condizioni diritti di proprietà ben definiti e mercati competitivi supportano equilibri Paretoefficienti. Il teorema fornisce una formalizzazione di quanto sosteneva Adam Smith, cioè che in presenza di condizioni istituzionali appropriate, individui che perseguano il proprio interesse saranno “condotti da una mano invisibile” al raggiungimento di risultati socialmente desiderabili. Il problema del drenaggio del prato presentato da Hume, così come quello di prevenire lo scioglimento della battuta di caccia al cervo di Rousseau sono esempi interessanti proprio perché – come quasi tutte le interazioni sociali – sono situazioni nelle quali gli assiomi piuttosto stringenti del Teorema Fondamentale non trovano riscontro. Quanto difficile possa essere sostenere i livelli di cooperazione necessaria ad ottenere un risultato che comporti benefici sociali in questi casi dipende dalla sottostante struttura delle relazioni sociali, ossia dalle credenze (beliefs) e dalle preferenze degli individui, dai rapporti di causa ed effetto che governano la trasformazione di azioni in risultati, dalla circostanza che l’interazione sia occasionale o periodica, dal numero delle persone coinvolte e così via. La difficoltà nel risolvere il problema dipende anche dalla struttura dell’informazione nell’interazione – chi conosce cosa, quando e se l’informazione può essere usata per assicurare l’enforcement di contratti o regolamentazioni governative. Ognuno di questi aspetti può influenzare il possibile successo o fallimento del drenaggio, della caccia al cervo o qualsiasi altro progetto comune che dipende dalle particolari istituzioni che regolano le interazioni tra partecipanti. Mercati, famiglie, governi, comunità e altre istituzioni rilevanti per un’interazione influenzano i vincoli e gli incentivi così come le informazioni, le norme e gli altri criteri di valutazione dei partecipanti all’interazione. Un’analisi adeguata dei problemi di coordinamento e della loro possibile attenuazione potrà chiarire come queste istituzioni funzionano. Per assolvere questo compito, la minimale rappresentazione delle istituzioni nel paradigma Walrasiano è sostanzialmente inferiore al più elaborato modo di modellarle reso possibile dalla teoria dei giochi. Il mio obiettivo principale in questo capitolo è sia quello di introdurre alcune nozioni di base della teoria dei giochi sia quello di usare queste nozioni per fornire una tassonomia delle interazioni sociali e dei loro risultati. Posporrò al capitolo 3 un’approfondita riflessione sugli individui e le loro preferenze. Ovviamente molte
6 | MICROECONOMIA
istituzioni non sono progettate – o almeno il loro funzionamento non risponde ad alcun progetto – ma rimanderò la trattazione riguardante le istituzioni come risultato di un processo evolutivo piuttosto che di progettazione al capitolo 2. Anche le questioni relative alla stabilità degli equilibri (o del perché ci si deve interessare agli equilibri) saranno trattate in modo sintetico in questo capitolo dato che potranno essere trattate in modo migliore quando si avrà a disposizione un modello esplicito che spieghi come le cose cambiano in situazioni fuori dall’equilibrio che verrà introdotto nel capitolo 2. Inizio con un esempio che illustra la struttura formale delle sfide lanciate da Hume e Rousseau.
C O O R D IN A M E N TO
E C O N F L IT TO : U N E S E M P I O
Garret Hardin (1968), in una famosa descrizione di un gruppo di pastori che sfruttano eccessivamente un pascolo portandolo alla rovina, coniò il termine tragedia dei comuni (tragedy of the commons) e diede alle scienze sociali una delle metafore più evocative dopo la mano invisibile di Smith. Anzi, Hardin chiamò la sua tragedia un “rifiuto della mano invisibile”. Queste due metafore sono efficaci in quanto catturano due situazioni sociali essenziali ma fortemente in contrasto tra loro. Quando le interazioni sociali sono guidate da una mano invisibile, queste riconciliano scelte individuali e risultati socialmente desiderabili. Invece, le dramatis personae della tragedia dei comuni che inseguono i loro obiettivi privati portano disastrose conseguenze per sé stessi e gli altri. Hardin sceglie un ambiente bucolico per la sua tragedia esclusivamente per ragioni di concretezza; il problema sottostante si può applicare ad un’ampia classe di situazioni nelle quali gli individui tipicamente non possono o non vogliono prendere in considerazione gli effetti delle proprie azioni sul benessere degli altri. Queste includono il traffico congestionato, il pagamento di tasse o altri contributi per la realizzazione di progetti comuni, la protezione della reputazione di un gruppo, il lavoro di squadra e molte altre ancora. Un esempio sarà utile a chiarire la struttura del problema, dando vita ad un ampio numero di punti di discussione che saranno analizzati in maggior dettaglio nei capitoli successivi. Consideriamo due pescatori, Jay e Eye, che condividono l’accesso ad un lago e che consumano ciò che in esso pescano. Vi sono pesci in abbondanza, così che impiegare più tempo nella pesca consente ad entrambi di pescare più pesce, ma più pesci uno pesca, meno pesci riesce a pescare l’altro in un’ora di pesca. Ognuno di loro decide quanto tempo dedicare alla pesca, scegliendo l’ammontare che massimizza il suo benessere. Supponiamo che questo processo di ottimizzazione, quando è effettuato singolarmente e senza nessun accordo vincolante tra i due, porti
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|7
ognuno a pescare 8 ore al giorno e che i benefici netti di questa attività siano appena sufficienti ad uguagliare la miglior alternativa disponibile a ciascuno (ad esempio, lavorare come salariato nella vicina città). Tabella 1.1. Tragedia dei pescatori: un dilemma del prigioniero
Indichiamo i benefici scaturenti da quella che viene definita “posizione di riserva” (fallback position), cioè il risultato che si ottiene in assenza di accordo nella contrattazione, come u > 0 per entrambi i pescatori. Essi sanno che se entrambi pescassero meno, ciascuno potrebbe raggiungere una posizione migliore in quanto il minor tempo dedicato alla pesca sarebbe più che compensato dal maggior tempo libero che avrebbero a disposizione. Assumiamo che essi studino la faccenda e determinino di quanto potrebbero migliorare la propria situazione se entrambi si limitassero a pescare 6 ore (assumeremo che questa è l’unica alternativa alle 8 ore di pesca), e se uno dovesse pescare 8 ore e l’altro 6. Essi normalizzano i loro payoff2 in modo tale da assegnare 1 al risultato corrispondente al pescare meno entrambi e 0 al risultato corrispondente alla circostanza che solo uno di essi riduce la quantità di tempo dedicata alla pesca. La tabella 1.1 mostra i payoff relativi (come da convenzione, il primo payoff in ogni casella si riferisce al giocatore riga quindi, nella tabella 1.1, Jay.). La tragedia dei pescatori è un dilemma del prigioniero. Questa è una situazione in cui per ogni individuo esiste un’azione che, se adottata, porta ad un payoff più alto rispetto a quello connesso alle altre azioni disponibili, indipendentemente dall’azione scelta dall’altro individuo (le altre azioni vengono dette dominate). Ma quando gli individui agiscono in modo da massimizzare i propri payoff scegliendo questa azione, il risultato finale è per entrambi peggiore rispetto al risultato che essi avrebbero potuto ottenere se si fossero comportati in modo differente. Così pescare per 6 ore è dominato perché > 0 e u > 0 ed è Pareto-superiore rispetto ad 8 ore perché u < 1. Potrebbe sembrare una faccenda semplice determinare che i due si debbano solo mettere d’accordo affinché ognuno peschi 6 invece di 8 ore, ma non è così, per due ragioni. La prima è che potrebbe non esistere il modo per far rispettare un accordo o anche solo per sapere se tale accordo è stato violato. Se è possibile che ognuno dei due possa essere a conoscenza di quante ore ha pescato l’altro in una 2
In teoria dei giochi, il payoff rappresenta la vincita (o la penale) associata alla scelta da parte di un giocatore di una determinata strategia, date le scelte degli altri.
8 | MICROECONOMIA
giornata di cielo limpido, lo stesso non si può dire in una giornata nebbiosa e, ad ogni modo, le informazioni di cui ognuno dei due è in possesso circa le quantità pescate dall’altro possono essere insufficienti a far imporre l’osservanza dell’accordo per vie giudiziarie dinanzi un tribunale. Questo è il problema dell’informazione asimmetrica o non verificabile, laddove il primo termine si riferisce a situazioni in cui un individuo ha informazioni di cui altri non sono a conoscenza, mentre il secondo al caso in cui informazioni di cui un soggetto è a conoscenza non possono essere usate in giudizio. Il secondo problema sorge dal fatto che l’accordo di pescare 6 ore al giorno è un accordo sia per pescare meno, sia implicitamente per dividere i benefici ad esso collegati in un certo modo, cioè in parti uguali. Ma i pescatori naturalmente si rendono conto che non necessariamente devono accordarsi per lavorare ognuno 6 ore. Potrebbero mettersi d’accordo che Eye pescherà 8 ore e Jay 6 ore, o viceversa. I pescatori hanno due problemi, non uno. Il primo, che riguarda l’allocazione, è determinare quanto pescare in totale, cioè come limitare le ore di pesca,. Il secondo, che concerne la distribuzione, è come dividere i benefici di pescare meno. La figura 1.1 illustra le opportunità e i problemi che i pescatori hanno di fronte. Nella figura 1.1, come prima, 6 e 8 ore di pesca sono le uniche alternative in un certo giorno, ma ora Eye e Jay in un certo periodo di tempo possono adottare strategie per le quali essi pescano 8 ore un giorno e 6 quello successivo, così come altre combinazioni. Inoltre, si assume che ogni allocazione debba essere concordata da entrambi i pescatori. I payoff {1 , 1} sono realizzabili e possono essere implementati applicando la regola delle 6 ore, ma accordi più complessi possono implementare ogni punto che si trova all’interno dell’insieme abcd. Per esempio, il punto d può essere implementato semplicemente se Eye concorda di pescare 6 ore ogni giorno e Jay 8 ore. Mentre Eye sicuramente non sarà d’accordo con questo (Eye ottiene un risultato peggiore rispetto al caso in cui si pesca 8 ore), Jay potrebbe offrirsi di pescare 6 ore per un certo periodo di tempo pari a u + ( è un infinitesimale numero positivo) e 8 ore il resto del tempo chiedendo a Eye di pescare 6 ore tutto il tempo, minacciando di pescare sempre 8 ore qualora Eye dovesse rifiutare. Eye potrebbe accettare, aspettandosi che per un certo periodo di tempo il suo guadagno netto sarà di u + e per il resto del tempo sarà 0, in quanto l’alternativa sarebbe di ottenere u in tutto il periodo, il che potrebbe succedere se Jay tenesse fede alla sua minaccia. Jay in tal modo avrebbe un guadagno netto di 1 quando entrambi pescano 6 ore, il che succede ( u + ) volte del tempo, e di ( 1 + ) il resto del tempo, quando Jay pesca 8 ore ed
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|9
Eye solo 6. Il contratto proposto da Jay è indicato dal punto f nella figura 1.1. Tutti i punti lungo cfd possono essere ottenuti da un contratto della seguente forma: Jay lavora 6 ore per una certa frazione di tempo, , e 8 ore il resto, mentre Eye lavora 6 ore tutto il tempo, ottenendo un’utilità pari a ui = e ui = + (1 )(1 + ) . Naturalmente Eye rifiuterà contratti lungo fd.
Figura 1.1. La tragedia dei pescatori. Nota che in c entrambi i pescatori pescano 6 ore mentre in a entrambi pescano 8 ore.
Se Jay ha la capacità di impegnarsi a presentare un’offerta per primo, è detto first mover3 e ha un vantaggio da first mover. Naturalmente, Eye potrebbe avere un’analoga offerta per Jay. In questo caso l’ordine del gioco (incluso chi è il primo a giocare) fa differenza. Un momento di riflessione ci confermerà che non esiste solo uno ma piuttosto un infinito numero di accordi che sono allo stesso tempo mutuamente benefici (rispetto alla regola delle 8 ore) ed efficienti. Un accordo efficiente è un accordo rispetto al quale non esiste alcuna alternativa che consenta ad almeno uno dei due pescatori di trarre beneficio senza peggiorare la condizione dell’altro. Questi cosiddetti miglioramenti Paretiani (rispetto all’equilibrio in strategie dominanti) e accordi Pareto-efficienti sono tutti i punti lungo fcg nella figura (chiamata la frontiera di Pareto). I pescatori potrebbero mettersi rapidamente d’accordo su una limitazione congiunta a 6 ore di pesca se questa fosse l’unica alternativa al pescare entrambi 8 ore. Ma essi potrebbero fallire nel raggiungere l’accordo in presenza di un’ampia gamma di accordi possibili; essi potrebbero ritenere che più opzioni sono peggio di 3
In un gioco sequenziale, ossia in un gioco in cui i giocatori non effettuano simultaneamente la scelta della loro strategia, è detto first mover colui che effettua la prima mossa.
10 | MICROECONOMIA
poche. Questo perché l’indeterminatezza nella divisione dei benefici derivanti dalla riduzione delle ore di pesca fa sorgere il problema dell’equità (fairness) nella loro suddivisione, ed apre la strada ad alcune considerazioni che non sono catturate dal gioco così come descritto sopra. Eye, per esempio, potrebbe rifiutare lo svantaggioso “prendere o lasciare” offerto da Jay. Ma lo stesso risultato potrebbe risultare accettabile qualora fosse ottenuto in modo imparziale (per esempio lanciando una moneta), o qualora i benefici derivanti dal pescare meno venissero devoluti ad una giusta causa piuttosto che essere appropriati da Jay. Se Eye e Jay non possono mettersi d’accordo su una certa suddivisione, può essere che nessun accordo per limitare il tempo di pesca sia possibile. Ma un soggetto terzo, il governo, potrebbe imporre un limite di 7 ore ad entrambi i pescatori e dopo lasciare che essi contrattino per perfezionare, qualora ne fossero capaci, un qualche accordo tra loro. Oppure i pescatori potrebbero rispettare una norma ambientale che induca in modo indipendente ognuno di essi ad autolimitarsi nella pesca. La norma potrebbe trasformare il gioco comportando una nuova matrice di payoff nella quale vengono presi in considerazione la preoccupazione per i danni ambientali arrecati o l’imposizione di costi all’altro pescatore. Ed è proprio verso questo tipo di indeterminatezza che tanto le istituzioni economiche quanto le altre si rivolgono, rispondendo a domande come: chi si trova in condizione di effettuare una offerta del tipo prendere o lasciare? Quali azioni sono a disposizione per le parti in causa rilevanti? Quali asimmetrie informative o mancanza di verificabilità derivano da un certo problema (e, come risultato, quali accordi si possono far osservare da terze parti)? E, infine, quali norme possono alterare il risultato di un conflitto? I veri pescatori, naturalmente, non stanno recitando come nel copione di una tragedia, come Hardin aveva supposto; né essi sono prigionieri del dilemma che affrontano. Essi sono spesso pieni di risorse nella ricerca di soluzioni all’eccessivo sfruttamento della pesca. I pescatori turchi, per esempio, prima assegnano a sorte i luoghi di pesca e successivamente procedono a rotazione. La condivisione di informazioni tra pescatori scoraggia la violazione degli accordi, mentre la regolamentazione governativa sostituisce l’osservanza delle regole basata sulla locale rete di contatti sociali (Ostrom, 1990). Le esistenti regole che determinano l’accesso alla pesca rappresentano una piccola selezione – di un insieme più ampio di altre regole sperimentate – che ha funzionato almeno abbastanza bene da permettere alle comunità che l’hanno adottata di durare e di non abbandonare le loro regole di comportamento in favore di altre. Come vedremo, il persistere di regole non richiede che esse siano efficienti, solo che esse siano ripetute nel tempo. Ciononostante,
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|11
potremmo aspettarci che una comunità di pescatori, che si è battuta per trovare un modo di sostenere una limitazione congiunta a 6 ore, possa fare meglio in competizione con gruppi che sfruttano eccessivamente la pesca, ed essere quindi imitati da altri gruppi. Ritorneremo sull’esempio dei pescatori nel capitolo 4 per esplorare dal punto di vista analitico come tassazione, relazioni di potere asimmetriche tra agenti, norme sociali e altri aspetti delle interazioni sociali possano modificare i risultati. Come può la teoria dei giochi far luce sulla tragedia dei pescatori e su problemi simili?
G IO C H I I giochi rappresentano un modo di modellare interazioni strategiche, cioè, situazioni in cui le conseguenze di azioni individuali dipendono dalle azioni intraprese da altri, e questa mutua interdipendenza è riconosciuta da coloro che vi sono coinvolti. Un gioco è costituito da una completa identificazione dei giocatori, un elenco per ogni giocatore delle azioni a sua disposizione (includendo azioni contingenti sulle azioni effettuate da altri, o su eventi fortuiti) – conosciuto come insieme di strategie – così come l’ordine di gioco e chi sa cosa, in quale momento del gioco. I giocatori possono essere individui o organizzazioni come imprese, sindacati, partiti politici, o stati nazionali. Nelle applicazioni biologiche, anche entità subindividuali come cellule o geni sono giocatori. Anche questa breve introduzione rivela due grandi pregi della teoria dei giochi nel contribuire allo studio delle istituzioni e dei comportamenti economici (prenderò in considerazione gli svantaggi nella penultima sezione del capitolo). Primo, poche interazioni sociali possono essere ridotte all’interazione di un agente in un ambiente dato (come previsto dall’assioma del prezzo dato e da altre irrealistiche ipotesi del modello Walrasiano). La maggior parte delle interazioni ha una componente strategica e la teoria dei giochi è costruita per analizzare il modo in cui le azioni individuali sono influenzate dal fatto che questa interdipendenza è comunemente riconosciuta da una o più parti in un’interazione. Secondo, la completa specificazione di un gioco richiede un’attenzione dettagliata all’ambiente istituzionale nel quale l’interazione ha luogo; i risultati dipendono spesso da questo dettaglio (per esempio, chi compie la prima mossa) in un modo che potrebbe non essere rivelato in strutture teoriche che sopprimono piuttosto che mettere in risalto i dettagli istituzionali. La teoria dei giochi non fornisce intuizioni reali più di quelle date dalla matematica o da ogni altro tipo di linguaggio. Ma spesso fornisce un chiaro modo per esprimere intuizioni originate altrove e per comprendere il ruolo di particolari ipotesi in una
12 | MICROECONOMIA
certa linea di pensiero. L’esempio della “tragedia dei pescatori” è un gioco, presentato nella sua cosiddetta forma normale (o strategica). Ciò significa che la sequenza delle azioni effettuate da ogni giocatore non è esplicitamente rappresentata, essendo le ipotesi fatte a riguardo tali che ogni giocatore muove senza conoscere la mossa effettuata dagli altri. La forma estesa di un gioco invece rende esplicito in che ordine agiscono i giocatori, e chi conosce cosa ad ogni stadio del gioco. Naturalmente, le mosse effettuate prima in ordine di tempo non devono essere conosciute in anticipo da coloro che effettuano le loro mosse successivamente. Un esempio di un gioco in forma estesa è la rappresentazione in forma d’albero dell’“ultimatum game” utilizzato in un contesto sperimentale nel capitolo 3. La forma estesa trasmette più informazioni riguardo all’interazione nel senso che molti giochi in forma estesa possono essere rappresentati da uno stesso gioco in forma normale. In genere, se si usa rappresentare un gioco in forma normale, ciò è dovuto al fatto che l’informazione addizionale nella forma estesa è ritenuta irrilevante rispetto al modo in cui il gioco sarà giocato.4 Come vedremo nel capitolo 3, i comportamenti sperimentali dei soggetti sembrano essere abbastanza sensibili a dettagli che di primo acchito non sembrano influenzare la struttura del gioco (il nome assegnato al gioco, per esempio, o la classificazione dei giocatori). Così, non è una buona idea ridurre un gioco in forma estesa alla sua forma normale a meno che non ci siano buone ragioni per ritenere che la sequenza temporale nel gioco non avrà nessun effetto sul comportamento dei giocatori. Il risultato di un gioco è un insieme di azioni effettuate dai giocatori (ed i relativi payoff). I risultati di un gioco non possono essere dedotti esclusivamente dalla struttura del gioco ma richiedono in aggiunta un plausibile concetto di soluzione, ossia una specificazione di come i soggetti coinvolti possono giocare. La relazione tra i giochi e i loro risultati è lontana dall’essere stabilita, con approcci tra loro fortemente contrastanti. La teoria dei giochi classica pone in rilievo il fatto che talvolta i giocatori debbano avere valutazioni cognitive sul futuro abbastanza forti. Al contrario, la teoria dei giochi evolutiva pone in risalto comportamenti dettati da regole empiriche che sono aggiornati da un processo di apprendimento rivolto al passato, ossia, alla luce della recente esperienza propria e degli altri individui. Due concetti di soluzione sono ampiamente utilizzati nella teoria dei giochi classica: dominanza ed equilibrio di Nash. Il concetto di dominanza ha il valore di 4
Chi muove per primo può influenzare il comportamento del secondo anche se questo non conosce cosa il primo giocatore ha fatto. Alcuni esempi vengono forniti in Camerer e Weber (2004) e Rapoport (1997).
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|13
indicare cosa non succederà (e in alcuni casi, tramite un processo di eliminazione, fornisce chiarimenti a riguardo di cosa succederà). Il concetto di dominanza predice in modo forte i risultati nei giochi come il dilemma del prigioniero in cui ogni giocatore sceglie una qualche particolare strategia senza tener conto delle scelte effettuate dagli altri giocatori. (I giochi risolti con il concetto di dominanza sono interazioni strategiche degenerate nelle quali le azioni intraprese da ognuno non dipendono dalle azioni effettuate dagli altri). L’idea alla base del concetto di equilibrio di Nash è che possono esistere uno o più risultati tali che nessun individuo ha alcun incentivo a modificare la sua strategia date le strategie adottate dagli altri giocatori. Sia il concetto di dominanza che quello di equilibrio di Nash si basano sulla nozione di strategia della risposta ottima (best response strategy). Una strategia può essere un’azione incondizionata (come, per esempio, guidare sulla destra), ma può essere anche un modo di agire contingente dettato dalle precedenti azioni degli altri individui o dal caso. “Pescare 6 ore al giorno indipendentemente da tutto” è una strategia, così come “Pescare oggi per lo stesso numero di ore in cui l’altro ha pescato ieri” (strategia chiamata “tit-for-tat”, ossia del “colpo su colpo”). Il salario offerto da un’impresa e il piano di promozione correlato alle prestazioni di un lavoratore costituiscono una strategia, così come la scelta del proprio livello di sforzo da parte di un dipendente; il tasso di interesse applicato da una banca, il sistema di monitoraggio dei propri clienti e i metodi di gestione delle situazioni di insolvenza rappresentano a loro volta una strategia, e così via. Così, una strategia è una descrizione di un’azione o di un insieme di azioni effettuabili in ogni situazione che può essere contemplata nel gioco. Un individuo, oltre alle strategie pure che compongono l’insieme delle strategie, può adottare una strategia mista, assegnando delle probabilità ad alcune o a tutte le strategie pure contenute nel suo insieme di strategie. Per esempio, si potrebbe lanciare una moneta per determinare se pescare 6 o 8 ore.5 Si consideri che ci siano n giocatori indicizzati con i = 1… n, e per ognuno un insieme di strategie indicato come Si . Supponete che il j-esimo giocatore scelga una particolare strategia s S . Siano s la strategie adottate da tutti gli altri giocatori (scelte dai loro insiemi di strategia S e (s, s ) il payoff che riceve con il profilo strategico (s, s ) . Il payoff è la valutazione di del risultato prodotto dal profilo strategico (s, s ) . La strategia è la risposta ottima di nei confronti delle strategie j
j
j
j
j
j
j
adottate dagli altri giocatori se nessuna strategia a disposizione di payoff maggiore per . Ossia, 5
si traduce in un
Se le strategie miste forniscono un utile espediente nella trattazione dei modelli (e.g., nell’esempio del monitoraggio e del lavoro nel capitolo 8), hanno ricevuto molta più attenzione da parte degli studiosi di teoria dei giochi più per ragioni tecniche di quanto giustificato da qualsiasi scoperta sul comportamento umano.
14 | MICROECONOMIA
(s, s ) (s', s ) s' S , s' s j
j
j
j
j
L’espressione precedente può essere così letta: il payoff di che gioca la contro il dato profilo strategico di tutti gli altri giocatori (s ) è non strategia inferiore al payoff ottenuto giocando qualsiasi altra strategia s' nell’insieme di strategia j
contro s . Una risposta ottima in senso forte (strict best response) è una strategia in corrispondenza della quale si verifica una stretta disuguaglianza per tutte le strategie s' , mentre una risposta ottima in senso debole (weak best response) è una strategia in corrispondenza della quale l’espressione precedente si verifica come disuguaglianza per almeno una strategia alternativa s' . Una strategia dominante in senso debole (weakly j
dominant strategy) è una strategia tale che nessuna strategia comporta un maggior payoff indipendentemente dalla scelta strategica degli altri giocatori e che per alcuni profili strategici comporta maggiori payoff. Cioè s è dominante in senso debole se (s, s ) (s', s ) s' S and s S j
j
j
j
j
j
j
con la disuguaglianza in senso stresso che si verifica per almeno un profilo strategico. Una strategia è strettamente dominante (strictly dominant) se nessuna strategia la domina in senso debole, ossia, quando la precedente disuguaglianza è stretta in tutti i casi. Riservo i termini “risposta ottima” e “dominanza” (senza l’aggettivo debole o forte) per il concetto più forte. Se esiste una strategia dominante per ogni giocatore, allora il profilo strategico nel quale tutti i giocatori adottano la loro strategia dominante è definito equilibrio in strategie dominanti (equilibrium in dominant strategies). L’eccesso di sfruttamento nella pesca nella tragedia dei pescatori ne è un esempio. Sorprendentemente, non sempre può aver senso giocare una strategia dominante, ma per vedere perché, avrò bisogno di introdurre un altro importante concetto di soluzione – dominanza di rischio (risk dominance) – che tra breve presenterò. Un equilibrio di Nash è un profilo strategico in cui ciascuna delle strategie dei giocatori costituisce una risposta ottima alle altre strategie nel profilo; se tutte le risposte ottime che compongono questo profilo strategico sono uniche (non includono risposte ottime in senso debole), allora l’equilibrio di Nash viene detto stretto. Dato che i giocatori non hanno nessuna ragione di cambiare i loro comportamenti (l’equilibrio è una risposta ottima reciproca), tale equilibrio è detto stazionario, ed è questa caratteristica che giustifica che si possa chiamarlo equilibrio. Questa interpretazione è basata sull’ipotesi che gli individui non possano mettersi d’accordo congiuntamente per alterare le loro strategie. Rispondendo all’obiezione di John Von Neumann secondo la quale le persone sono davvero tutto eccetto che non cooperative, John Nash (verso il quale siamo in debito per questo e altri contributi nella teoria dei giochi) chiamò l’assunto di comportamento non cooperativo “il
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|15
modo americano”. Infine, la dominanza iterata è una procedura per la quale un giocatore può non prendere in considerazione alcune delle strategie degli altri giocatori che sono strettamente dominate (e.g. che potrebbero non essere vantaggiose da adottare in corrispondenza di qualsiasi profilo strategico). Riducendo gli insiemi delle strategie degli altri giocatori con tale procedura cambia la struttura del gioco in modo tale che il gioco ridotto dalla dominanza iterata può avere un equilibrio di Nash o in strategia dominante anche se il gioco completo non lo aveva.
LA
STRUTTURA DELLE INTERAZIONI SOCIALI
Le persone interagiscono in una varietà infinita di modi, ma esistono generiche classi di interazione. Un po’ di terminologia della teoria dei giochi ci fornirà una classificazione intuitiva. La prima distinzione – tra giochi cooperativi e non cooperativi – si riferisce alla struttura istituzionale che regola l’interazione. La seconda – tra giochi di interesse comune e di conflitto – si riferisce alla misura in cui i payoff del gioco esibiscono conflitto o un interesse comune tra i giocatori. Giochi cooperativi e non cooperativi. Immaginate un’interazione nella quale tutto ciò che influenza sia le azioni dei giocatori che ciò che li riguarda è soggetto ad un accordo vincolante (ossia che può esser fatto rispettare senza costi). Questa è definita una interazione cooperativa (o un gioco cooperativo; uso i termini gioco e interazionein modo intercambiabile, quando appropriato). Il termine non si riferisce alle opinioni che le parti hanno degli altri ma semplicemente agli ordinamenti istituzionali che governano le loro interazioni. Come vedremo, i giochi cooperativi possono essere altamente conflittuali: per esempio, l’acquisto di una casa mette generalmente l’uno contro l’altro gli interessi dell’acquirente e del venditore, ma se un accordo è raggiunto, in genere si può far osservare e i termini dell’accordo coprono tutti gli aspetti del trasferimento che sono di interesse per le parti. Più comunemente, comunque, qualche aspetto dell’interazione non è soggetto ad accordi vincolanti. Tali situazioni sono modellate come giochi non cooperativi. In alcuni casi, parte di un’interazione si può sviluppare in modo cooperativo, come quando un datore di lavoro e un lavoratore contrattano su salario e ore di lavoro. Altri aspetti della stessa interazione possono essere non cooperativi a causa dell’impossibilità di scrivere o di far osservare i relativi contratti. Tra gli esempi si possono includere gli aspetti relativi alla definizione dell’impegno con il quale debba lavorare un lavoratore o la scelta del datore di lavoro di investire i profitti che ricava nello stabilimento che li ha prodotti o altrove. Come nel caso delle interazioni
16 | MICROECONOMIA
cooperative, le parti coinvolte in interazioni non cooperative possono avere forti conflitti di interesse, o condividere ampiamente obiettivi comuni; il termine “non cooperativo” si riferisce semplicemente al fatto che la loro interazione non è completamente coperta da un accordo vincolante. Molti aspetti delle relazioni affettive tra amici e parenti hanno lo stesso segno di interazioni non cooperative; per esempio, la promessa di fare del proprio meglio per trovare un lavoro ad un amico può essere completamente sincera, ma non è un accordo vincolante. Interesse comune e conflitto. Alcune interazioni hanno il carattere dei flussi di traffico: gli ingorghi stradali sono in genere un risultato poco desiderabile, e un impegno attivo per evitarli beneficerebbe tutti. In altre interazioni, come quelle che comportano la fissazione di un prezzo per un bene che deve essere scambiato o la suddivisione di una torta, se qualcuno ottiene di più, qualcun altro ottiene necessariamente di meno. Molte delle differenze tra studiosi e politici che affrontano le questioni dell’“institutional design”, ossia della progettazione e definizione delle istituzioni, derivano da credenze diverse circa la questione se i mali della società siano il risultato di problemi di interesse comune come gli ingorghi stradali o di problemi di conflitto di interesse come la suddivisione di una torta di dimensione data. Nel primo caso le istituzioni possono assumono il ruolo di risolutori di problemi e nel secondo caso quello di responsabili dell’enforcement delle regole. Ma molte istituzioni ricoprono entrambi i ruoli. In tal caso può essere impossibile analizzare gli aspetti di risoluzione di problemi e gli aspetti distributivi separatamente. Può essere utile avere qualche termine per differenziare tra queste classi di problemi; per fare questo mi riferirò agli aspetti di interesse comune e di conflitto di un’interazione, partendo dai casi puri. Un gioco nel quale il payoff di solo uno dei profili strategici è ottimo dal punto di vista Paretiano e i payoff associati a tutti i profili strategici possono essere ordinati dal punto di vista Paretiano può essere descritto come un gioco di puro interesse comune.6 La dimensione del conflitto è interamente assente poiché un risultato è migliore di tutti gli altri per almeno un partecipante e non peggiore per qualunque altro partecipante, ed esiste un secondo migliore risultato (second best) che, se Pareto inferiore al primo, è però Pareto superiore agli altri, e così via. Cioè, non esiste risultato tale che ogni giocatore preferirebbe in modo stretto un risultato rispetto al risultato preferito da qualsiasi altro giocatore. Qui di seguito viene riportato un 6
Il termine “gioco di interesse comune” è stato usato per riferirsi ad una struttura di payoff tale che tutti i giocatori preferiscono un certo risultato rispetto ad ogni altro (per esempio, Aumann e Sorin 1989 e Vega-Redondo 1996); la definizione qui è più forte (quindi “pura”) dato che richiede non solo che esista un risultato mutuamente preferito, ma che tutti i risultati siano classificabili dal punto di vista paretiano. I risultati possono essere classificati dal punto di vista paretiano se l’ordine delle preferenze dei risultati - dai maggiori ai minori preferiti – di tutti i partecipanti sono tali che se un individuo preferisce il risultato A rispetto al risultato B, nessun individuo preferisce B ad A.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|17
esempio. Un’impresa è costituita da un datore di lavoro e un dipendente: se l’impresa funziona e ha successo, entrambi ricevono un payoff pari a 1; se fallisce, entrambi ricevono 0. La probabilità di successo dipende dalle azioni intraprese (in modo non cooperativo) dai due: il datore di lavoro può investire nell’impresa oppure no, e il dipendente può lavorare nell’impresa con o senza impegno. Se il datore di lavoro investe nell’impresa e il lavoratore vi si impegna seriamente, l’impresa sicuramente avrà successo. Tabella 1.2. Payoff in puro interesse comune: il gioco della sopravvivenza dell’impresa
Nota: il datore di lavoro è il giocatore colonna, il dipendente il giocatore riga con .
In caso contrario, l’impresa senza dubbio fallirà (tabella 1.2). Se il datore di lavoro investe e il dipendente non lavora, l’impresa avrà successo con probabilità , mentre nel caso opposto l’impresa avrà successo con probabilità . Supponiamo che entrambi i giocatori scelgano le azioni che massimizzano il valore atteso dei loro payoff, ossia, la somma ponderata dei payoff che si ottengono per ogni strategia scelta dagli altri giocatori, pesata dalla probabilità che ogni giocatore assegna ad ognuno di questi eventi. E’ facile confermare che i giochi di puro interesse comune hanno un equilibrio in strategia dominante, cioè un singolo risultato Paretoottimale. (Questo è un gioco nel quale il valore atteso dei payoff dipende da un risultato probabilistico – il successo dell’impresa – che è influenzato da un profilo strategico adottato dai giocatori. La realizzazione di un processo stocastico è talvolta chiamato mossa della natura). Un’interazione è definita un gioco di puro conflitto se tutti i possibili risultati sono ottimali dal punto di vista Paretiano. Un esempio è dato da un qualsiasi gioco a somma zero (ciò significa che per ogni profilo strategico la somma dei payoff è pari a zero). Il puro conflitto è illustrato dall’insieme di equilibri di Nash in senso stretto nel Gioco della Suddivisione originalmente proposto da Schelling (1960). Un dollaro deve essere diviso tra due individui secondo le seguenti regole: senza che a priori ci possa essere comunicazione, ogni giocatore sottopone una richiesta di un qualsiasi valore e, se la somma delle richieste è uguale a 1 o inferiore, la richiesta viene soddisfatta, altrimenti ogni giocatore riceve zero. Una parte della matrice dei payoff di questo gioco è rappresentato dalla tabella 1.3 (dove si assume che le richieste debbano essere state fatte in centesimi). Le coppie di strategie poste al di fuori della
18 | MICROECONOMIA
diagonale chiaramente non sono equilibri di Nash in senso stretto (e.g. la coppia in basso a destra è una mutua debole risposta ottima e quindi un equilibrio di Nash in senso non stretto, così come una richiesta di zero è anche una risposta ottima ad una richiesta di 100). Le coppie di strategie in grassetto sono gli equilibri di Nash in senso stretto del gioco (ve ne sono 101). Notate che ognuno di essi è Pareto-ottimale, così i risultati che compongono l’insieme degli equilibri di Nash del Gioco della Suddivisione descrivono una interazione di puro conflitto. Il fatto che tutti i risultati dei giochi di puro conflitto siano efficienti dal punto di vista Paretiano non significa che le regole che definiscono il gioco siano efficienti; ci possono essere altre regole (cioè altri modi di regolare l’interazione data la sua sottostante struttura) che potrebbero condurre a risultati che sono superiori dal punto di vista paretiano rispetto quelli definiti da un gioco di puro conflitto. Ritorneremo su questo. Tabella 1.3. il gioco della suddivisione
La figura 1.2 mostra i payoff di un generico gioco tra due persone nel quale ogni giocatore ha due strategie; quindi, ci sono quattro profili strategici e relativi payoff classificati da a fino a d. In un gioco di puro conflitto i payoff sono disposti in direzione “nord-ovest – sud-est” (dato che ognuno è un ottimo paretiano, nessun risultato può trovarsi in direzione “nord-est” o qualsiasi altra direzione diversa), mentre nel caso di un gioco di puro interesse comune i payoff si dispongono lungo un asse in direzione “sud-ovest – nord est”, indicando che si possono classificare in senso paretiano. Il gioco della sopravvivenza dell’impresa è un esempio della classe dei giochi di puro interesse comune nei quali i payoff che i giocatori ricevono sono identici per ogni profilo strategico (condividono un “destino comune”) così che i risultati in figura 1.2 potrebbero essere disposti lungo un raggio di 45° uscente dall’origine. Allo stesso modo, un gioco a somma zero è una forma forte di un gioco di puro conflitto in cui i payoff potrebbero essere disposti lungo una retta con pendenza -1.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|19
Figura 1.2. Giochi di puro conflitto e di puro interesse comune. Nota: i punti a, b, c e d indicano i payoff dei due giocatori per ognuno dei quattro profili strategici.
Molte interazioni sociali sono tali che aspetti di conflitto di interesse e di interesse comune sono compresenti. Guidare sul lato destro o sinistro della strada è indifferente per la maggior parte delle persone fin quando gli altri fanno lo stesso. Al contrario, se ci sono mutui guadagni per tutte le persone che parlano tra loro la stessa lingua, le persone sono lontane dall’essere indifferenti rispetto alla scelta di quale lingua si parli; in migliaia sono morti in guerre sul punto. Una delle ragioni per le quali il dilemma del prigioniero ha attirato così tanta attenzione è che esso combina sia gli aspetti di interesse comune che di conflitto d’interesse. La figura 1.1 (la tragedia dei pescatori) illustra entrambe le dimensioni di conflitto (direzione nord-ovest – sud-est) e di interesse comune (sud-ovest – nord est) dei payoff. Una misura naturale dell’estensione degli aspetti dell’interesse comune nei confronti degli aspetti di conflitto è disponibile nei giochi simmetrici come la tragedia dei pescatori. (un gioco simmetrico è un gioco in cui la matrice dei payoff di un giocatore è la trasposta della matrice dei payoff dell’altro). Questa misura, , è data dal valore del miglioramento reso possibile dalla cooperazione (1 u) , relativa alla differenza nei payoff quando i due adottano strategie differenti, (1 + ) : =
1 u . 1 +
Per valori di u e tali che i payoff descrivono un dilemma del prigioniero ( 0, 1 ) , dove valori prossimi a zero indicano praticamente puri conflitti, e valori prossimi all’unità praticamente puro interesse comune.
20 | MICROECONOMIA
Figura 1.3. Aspetti delle interazioni sociali. Nota: non è difficile pensare a certi diritti di proprietà che dovrebbero essere inseriti nel lato del conflitto nel grafico; allo stesso modo si possono pensare alcuni aspetti dell’evoluzione del linguaggio che si sono evoluti via imposizione coercitiva (cioè in modo cooperativo) piuttosto che in modo non cooperativo.
La distinzione dei giochi in cooperativi/non-cooperativi e conflitto/interesse comune ci dà la tipologia delle interazioni presentata nella figura 1.3 con alcuni esempi esplicativi. Per esempio, il rimborso dei prestiti (analizzato nel capitolo 9) è un’interazione conflittuale non cooperativa poiché il rimborso beneficia il prestatore dato che chi prende a prestito gli paga un costo, ma l’enforcement della promessa del prenditore di restituirgli somma e costo non è possibile da far rispettare (se chi prende a prestito non ha fondi). L’evoluzione dei diritti di proprietà individuale durante il periodo della storia umana prima dell’esistenza degli Stati può essere stata almeno inizialmente un’interazione di interesse comune non-cooperativa. Al contrario, i moderni diritti di proprietà sono determinati da interazioni cooperative che prendono la forma di restrizioni enforceable (il cui rispetto può essere assicurato) sugli usi possibili. Un altro aspetto importante delle interazioni sociali è la struttura temporale. Un’interazione può essere ripetuta per molti periodi dagli stessi giocatori per un numero noto di periodi o con una nota probabilità che l’interazione si interrompa al termine di ogni periodo. Questi sono definiti giochi ripetuti; i giochi non ripetuti sono spesso chiamati “one-shot”, cioè giochi a turno unico. Infine, molte interazioni assomigliano a scambi nei quali c’è un singolo compratore ed un singolo venditore; ma in aggiunta a questi giochi a due persone ci sono molte interazioni che coinvolgono numerose persone, genericamente indicate come giochi con n-persone. Giochi simmetrici a due persone con solo due strategie sono chiamati giochi 2 x 2.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
FA L L IM E N T I
|21
D E L C O O R D IN A M E N TO
Torniamo ora alla sfida costituzionale, inizialmente espressa come la sfida di assicurare che il perseguimento degli interessi individuali non porti a “risultati che nessuno sceglierebbe”. Questi risultati indesiderabili sono i fallimenti del coordinamento che si realizzano quando l’interazione non-cooperativa di due o più persone conduce a risultati che non sono Pareto-ottimali.7 Intendo come problemi di coordinamento quelle situazioni in cui i fallimenti del coordinamento occorrono con probabilità significativa. Fallimenti di mercato familiari quali quelli che risultano da esternalità ambientali sono un tipo di fallimento del coordinamento, ma il concetto più ampio include tutte le forme di interazione non cooperativa, non solo quelle che hanno luogo nelle interazioni di mercato. Corsa al riarmo e ingorghi stradali sono esempi di fallimento del coordinamento. Una classe importante di fallimenti del coordinamento – i fallimenti dello Stato – sorgono quando le azioni di equilibrio degli organi ufficiali di governo hanno come esito un risultato Pareto-inferiore. Uso la definizione più ampia di fallimenti del coordinamento (piuttosto che fallimenti di mercato) per attirare l’attenzione sul fatto che tutte le strutture istituzionali condividono con i mercati la tendenza ad implementare risultati inefficienti in senso Paretiano. I fallimenti del coordinamento possono sorgere in situazioni fuori equilibrio, ma dal punto di vista analitico l’attenzione si è focalizzata sui risultati di equilibrio, nei quali i fallimenti del coordinamento avvengono in due casi. Nel primo caso, uno o più risultati Pareto-inferiori possono essere equilibri di Nash; nel secondo caso, non esiste nessun risultato Pareto-ottimale che è un equilibrio di Nash. Come base considerate un gioco 2 x 2 nel quale esiste un singolo equilibrio di Nash ed è Paretoottimale, come nella tabella 1.4. Lo chiamo Gioco della Mano Invisibile perché le azioni individualiste di entrambi i giocatori portano ad un risultato che massimizza il benessere di ciascuno. (Cioè, se Riga coltiva pomodori e Colonna coltiva grano, essi ricevono entrambi 5, che è il meglio che essi possano fare). In questo caso, ognuno non solo persegue i propri obiettivi individualistici ma beneficia del fatto che l’altro fa lo stesso. La scelta di Riga di una strategia dipenderà da cosa egli crede che farà Colonna. Immaginate che Riga Razionale nota che per Colonna coltivare pomodori è una strategia dominata e di conseguenza (usando un ragionamento di dominanza iterata) decide di coltivare pomodori. Ma supponete che invece di perseguire il proprio interesse, Colonna Pazza lanci una moneta e come risultato del lancio decida di coltivare anch’egli pomodori. L’esempio sottolinea che anche se c’è un unico
7
Questa è una definizione inclusiva del termine fallimento della coordinamento, che talvolta è ristretta a situazioni in cui si ottiene un equilibrio Pareto inferiore quando un altro equilibrio (Pareto superiore) esiste. La mia definizione include casi in cui nessun equilibrio esiste.
22 | MICROECONOMIA
equilibrio di Nash, ci resta da capire come i giocatori arrivino ad esso, un argomento sul quale torneremo nel capitolo 2. Invece, nel gioco del Dilemma del Prigioniero abbiamo visto che un equilibrio in strategia dominante esiste ed è Pareto-inferiore. Il fallimento del coordinamento deriva dal fatto che il danno inflitto all’altro dalla propria defezione non si riflette nei payoff di chi la compie, così nessuno dei due prigionieri prende in adeguata considerazione gli effetti delle proprie azioni sull’altro. Tabella 1.4. Il gioco della mano invisibile
Per lo stessi motivo si hanno fallimenti del coordinamento nei Giochi di Assicurazione (Assurance Game). Ma la struttura del gioco differisce per un aspetto sostanziale dal dilemma del prigioniero: la matrice dei payoff del gioco di assicurazione è tale che esistono molteplici equilibri, uno (o più) dei quali può essere Paretoinferiore. (I giochi con questa struttura sono talvolta chiamati giochi di coordinamento, ma non voglio usare questo termine per evitare confusione con i termini di “fallimenti del coordinamento” e “problemi di coordinamento” precedentemente introdotti). Così, se un profilo strategico Pareto-ottimale può essere il risultato del gioco, non necessariamente è detto che esso sia raggiunto. Esempi possono essere dati dalla scelta di imparare una lingua o un programma di scrittura per il PC (il valore che se ne trae dipende da quante altre persone hanno imparato la stessa lingua o lo stesso programma), di partecipare ad azioni collettive quali uno sciopero o un cartello (i benefici attesi dipendono dal numero delle persone partecipanti), e la determinazione dell’occupazione in una economia nel suo complesso (se tutti i datori di lavoro assumono, il salario pagato sosterrà un livello di domanda aggregata tale da giustificare un alto livello d’occupazione). Altri esempi includono l’adozione di uno standard comune (sistemi di pesi e misure, credenziali accademiche, sistemi operativi per computer, sistema VHS in luogo della tecnologia video Betamax), imprese che formano il proprio personale qualificato (se i lavoratori si possono trasferire tra imprese, i guadagni privati per una certa impresa dipendono dal numero delle altre imprese che si impegnano nella formazione), e reputazioni di gruppo (se la vostra comunità commerciale è conosciuta come opportunista, può anche essere per voi una risposta ottima comportarsi in modo opportunistico). Come questi esempi suggeriscono, nei giochi di assicurazione i fallimenti del
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|23
coordinamento si hanno o a causa di guadagni crescenti generalizzati o di quelle che talvolta sono definite come complementarità strategiche: i payoff individuali crescono all’aumentare del numero delle persone che intraprendono la stessa azione. Se io adotto lo stesso programma di scrittura dei miei colleghi, trasmetto loro dei benefici, ma questi benefici non sono inclusi nel mio processo decisionale. (Comparate questo con il precedente Gioco della Mano Invisibile nel quale la specializzazione è vantaggiosa, in modo tale che la coltivazione del grano da parte di una persona rende i payoff relativi alla coltura del grano inferiori per l’altro). Poiché le complementarità strategiche possono dar vita a equilibri multipli, i risultati possono essere path-dependent8 nel senso che, senza conoscere la recente storia di una popolazione, è impossibile dire quale equilibrio si avrà. In questo caso sono possibili risultati abbastanza differenti per due popolazioni con identiche preferenze, tecnologie e risorse ma con storie diverse. Per poter vedere questo, ritorniamo ai contadini di Palanpur, i cui raccolti sarebbero maggiori se tutti seminassero prima nel corso dell’annata. Ma se un contadino dovesse seminare da solo prima, le sementi verrebbero mangiate dagli uccelli che si affollerebbero sul suo terreno. Supponete che ci siano solo due contadini che interagiscono in modo non cooperativo in un periodo singolo con payoff indicati nella tabella 1.5. Ipotizzerò che piantare tardi garantisca un guadagno più alto se l’altro pianta prima rispetto al caso che entrambi piantino tardi. Il primo piantatore subisce tutti i danni dei predatori, ma se i due piantano simultaneamente, i predatori vengono “suddivisi” equamente. Se l’equilibrio che deriva dal piantare congiuntamente prima è chiaramente il solo Pareto-ottimo, piantare congiuntamente tardi è anch’esso un equilibrio. Tabella 1.5. Coltivare a Palanpur: un gioco di assicurazione
La matrice dei payoff descrive una trappola della povertà: individui identici in un identico scenario possono conoscere tanto uno standard di vita adeguato quanto la povertà, e ciò dipende solo dalla loro storia. Il problema di Coltivare in Palanpur è un tipo particolare di gioco d’assicurazione nel quale esistono due o più equilibri simmetrici in strategia pura (ciò significa che tutti i giocatori adottano la stessa strategia pura). Tali equilibri sono chiamati convenzioni, ossia risultati derivanti da una mutua risposta ottima che sono sostenuti dal fatto che in pratica tutti i giocatori credono che tutti gli 8
Un modello viene detto “path-dependent” quando ha una forte dipendenza dalle sue condizioni iniziali e all'evoluzione della sua dinamica.
24 | MICROECONOMIA
altri giocatori giocheranno la risposta ottima. (Ritorneremo sulla contingenza storica dei risultati nel capitolo 2, nel quale verranno introdotti strumenti analitici quali la dinamica nei livelli della popolazione). I giochi finora introdotti (più un altro gioco comunemente giocato dai bambini) permettono di illustrare le fonti dei fallimenti del coordinamento elencate nella tabella 1.6. Nel gioco da bambini, conosciuto in tutto il mondo (gli anglofoni lo chiamano “Sasso Carta Forbice”, in Italia è chiamato anche “Morra Cinese”, in altri paesi è conosciuto come “Forbicina Uomo Elefante”) non c’è nessun equilibrio in strategie pure.9 Cioè, nessun Pareto-ottimo è un equilibrio di Nash, ma dato che il gioco è un gioco a somma zero (la somma dei payoff per ogni profilo strategico è uguale a zero) tutti i risultati sono ottimi paretiani. Dato che non si possono dare risultati Pareto-inferiori, Sasso Carta Forbice non rappresenta un problema di coordinamento, e dunque non esiste un modo ragionevole di giocare questo gioco (e questo è il motivo del perché è divertente giocarlo). La rappresentazione di diverse strutture delle interazioni sociali come giochi ha permesso una tassonomia di come i problemi di coordinamento possono nascere. Suggerisce anche una strategia da indirizzare nei confronti della sfida costituzionale: se il probabile risultato di un’interazione è Pareto-inferiore rispetto altri risultati realizzabili, è possibile introdurre politiche o diritti di proprietà tali da cambiare la struttura del gioco per rendere il secondo risultato più probabile. Qui di seguito un esempio. La differenza cruciale tra dilemma del prigioniero e giochi di assicurazione è che nel primo il risultato indesiderato è l’unico equilibrio di Nash, cosicché l’unico modo per sostenere uno degli altri risultati è un intervento permanente volto a cambiare i payoff o le regole del gioco. Nel gioco di assicurazione, invece, un risultato desiderabile (piantare prima congiuntamente, per esempio) è un equilibrio, così la sfida per i giocatori o per gli organi di governo è limitata al meno difficoltoso problema del come raggiungere l’equilibrio piuttosto che al più gravoso problema del come stare nell’equilibrio. Nei dibattiti sulle modalità appropriate (e la durata) degli interventi dello Stato nell’economia, differenze chiave tra gli economisti riguardano
9
Qui di seguito una variante del gioco: tra tre mosse tu e il tuo compagno di giochi potete scegliere di gettare avanti o il palmo della vostra mano (carta), il pugno (roccia) o due dita a forma di V (forbice) con le seguenti regole: la roccia batte (“rompe”) la forbice, la forbice batte (“taglia”) la carta e la carta batte (“avvolge”) la pietra; il vincitore e lo sconfitto vincono e perdono rispettivamente un punto. (Un pareggio non assegna punti, ma può far scoppiare le risa di entrambi generate dalle battaglie di pietre, guerre di forbici e sovrapposizioni di carta). Come in altre lingue la forbicina possa battere l’uomo rimane per me ancora un mistero; ma allora cercate di spiegarmi perché la carta batte la pietra. Vedi Sato, Akiyama e Farmer (2002).
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|25
l’opinione sul fatto che il problema sottostante rappresenti un Dilemma del Prigioniero o un Gioco d’Assicurazione. Interventi possono essere richiesti in entrambi i casi, ma gli interventi indirizzati a risolvere i problemi correlati ai giochi d’assicurazione possono essere ragionevolmente rappresentati da singoli interventi piuttosto che da interventi permanenti. Ed è, in parte, per questa ragione che un approccio comune per evitare fallimenti del coordinamento è quello di escogitare politiche o costituzioni che trasformino la matrice dei payoff in modo tale da convertire un dilemma del prigioniero in un gioco d’assicurazione rendendo il risultato della mutua cooperazione un equilibrio di Nash. Un’interazione che è un dilemma del prigioniero se si ripete una sola volta, può diventare un gioco d’assicurazione con mutua cooperazione come equilibrio di Nash se ripetuta più volte, come vedremo nel capitolo 7. Tabella 1.6. Fonti dei Fallimenti di Coordinamento
Anche se esiste un equilibrio di Nash Pareto-ottimale in un Gioco d’Assicurazione, questo fatto da solo non è sufficiente a garantire che la soluzione che assicura mutui benefici sia raggiunta; fallimenti del coordinamento che prendono vita da interazioni che hanno forma di Giochi d’Assicurazione sono onnipresenti. Un’importante ragione è che la decisione su come giocare dipende da supposizioni su come gli altri giocheranno, e il modo in cui le persone affrontano questa situazione di indeterminatezza può portare a risultati sub-ottimali. Il problema è illustrato nella figura 1.4, in cui i payoff attesi di piantare tardi e presto ( e , rispettivamente) l
e
sono semplici funzioni lineari dei payoff della matrice del gioco Coltivare in Palanpur presentato prima. Supponete di essere il contadino Riga di Palanpur e di non avere informazione sul probabile modo di giocare del contadino Colonna, e di assegnare una stessa probabilità alle due strategie di Colonna. Voi sceglierete piantare tardi perché il vostro payoff atteso è di 2 (cioè, (3) + (2)), mentre il payoff atteso di piantare prima è di 2. Anche se l’equilibrio in cui si pianta congiuntamente fosse in qualche modo raggiunto, potrebbe essere difficile sostenere la convenzione di piantare prima nel caso in cui voi pensaste che l’altro potrebbe cambiare strategia per dispetto o errore. Per vederne il perché, immaginate che il payoff zero nella figura sia -100, ossia il payoff associato alla distruzione del seminato di uno dei contadini porti come risultato il fatto di restare senza cibo. Dato che l’idea di fondo qui presentata ricorrerà anche nelle prossime pagine,
26 | MICROECONOMIA
poche definizioni (che si riferiscono esclusivamente ai giochi 2 x 2) potranno essere d’aiuto. Chiamiamo una convenzione nella quale entrambi i giocatori adottano la strategia un k-equilibrio. L’altra strategia è . Definiamo il fattore di rischio di un kequilibrio come la probabilità minima tale che se un giocatore crede che l’altro giocatore sta per giocare
con probabilità maggiore di (e con una probabilità minore di (1 p) ) allora e la risposta ottima in senso stretto da attuare per l’individuo. L’equilibrio con il minor fattor di rischio è l’equilibrio rischio dominante. Nell’esempio precedente, il fattore di rischio dell’equilibrio dato dal piantare tardi è 1/3, che è inferiore rispetto al fattore di rischio dell’equilibrio dato dal piantare presto (2/3). Piantare tardi è definita strategia rischio dominante di Riga, ossia la strategia che massimizza i payoff attesi di un giocatore che attribuisce uguale probabilità alle strategie a disposizione dell’altro giocatore. Poiché questo è vero anche per il giocatore Colonna, piantare congiuntamente tardi è l’equilibrio rischio dominante. La figura 1.4 illustra questi concetti. La frazione di coloro che piantano presto è
,
mentre e sono i payoff attesi rispettivamente dal piantare tardi e presto, condizionali alle supposizioni di ognuno circa . L’equilibrio dato dal piantare l
e
presto è definito l’equilibrio dominante nei payoff: un equilibrio è dominante nei payoff se non esiste altro equilibrio che lo domina in senso stretto dal punto di vista Paretiano. Nel nostro esempio, piantare presto è dominante nei payoff perché i payoff in questo equilibrio eccedono i payoff per entrambi i giocatori nell’equilibrio piantare tardi. Notate che si assume che i contadini massimizzino i payoff attesi, il che implica che essi siano neutrali al rischio, così il fatto che l’equilibrio rischio dominante ma inferiore in senso paretiano possa realizzarsi non presume avversione al rischio da parte di essi. (Neutralità al rischio e avversione al rischio sono discussi nei capitoli 3 e 9). Notate anche che il fallimento del coordinamento non è dovuto in questo caso a un conflitto di interesse tra i contadini, come nel dilemma del prigioniero affrontato dai pescatori. Ciascun pescatore preferisce essere colui che pesca di più e che sia l’altro a pescare di meno. Ma entrambi i contadini preferiscono piantare presto congiuntamente rispetto ogni altro risultato. Il loro fallimento nel coordinarsi per ottenere il risultato desiderato è dovuto all’incertezza circa le azioni intraprese dagli altri e non ad un conflitto di interesse. La previsione che l’equilibrio rischio dominante sarà favorito rispetto all’equilibrio payoff dominante è fortemente supportata dall’effettivo modo di giocare di soggetti sottoposti a giochi sperimentali catturanti la logica del problema di Coltivare a Palanpur (Van Huyck, Battalio e Beil 1990). Vedremo (nel capitolo 12) che gli equilibri rischio dominanti possono persistere per molti periodi anche quando esiste un equilibrio payoff dominante.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|27
Figura 1.4. Piantare tardi è rischio dominante. Nota: p* = 2/3 così l > e per p =1/2. Le intercette degli assi verticali sono i payoff nella matrice di payoff su p.
Così, anche se un intervento di politica volto a cambiare un Dilemma del Prigioniero in un Gioco d’Assicurazione viene effettuato, il risultato Pareto-ottimale desiderato potrebbe non darsi. Un obiettivo ancora più ambizioso è cambiare l’interazione sociale sottostante da dilemma del prigioniero a Gioco della Mano Invisibile. Per vedere come questo sia possibile, considerate un generico dilemma del prigioniero con i payoff a , b , c , d nella tabella 1.7. (Ignorate i payoff in grassetto per il momento). L’interazione è un dilemma del prigioniero se a > b > c > d e a + d < 2 b , dove la seconda condizione esprime il fatto che il payoff atteso sia del giocatore Riga che del giocatore Colonna è maggiore se essi cooperano rispetto al caso in cui uno di loro defeziona e l’altro coopera, con l’assegnazione dei due ruoli decisa a sorte. Supponete che Riga e Colonna decidano di scegliere “cooperare” come norma e adottare una regola di responsabilità secondo la quale chiunque violi la norma deve risarcire colui i cui payoff si sono ridotti a causa della violazione con una compensazione tale che sia esattamente sufficiente a bilanciarne la perdita (posponiamo al momento l’importante questione relativa all’enforcement dei nuovi diritti di proprietà, ovvero ai mezzi per garantirne il rispetto). Così se Riga tradisce Colonna, Riga inizialmente ottiene a come prima ma dopo deve pagare a Colonna il costo inflitto dal suo tradimento, cioè una compensazione sufficiente a garantire a Colonna un payoff di b (il payoff che avrebbe ottenuto se la norma non fosse stata violata). Se entrambi tradiscono, entrambi ottengono c ma dopo devono risarcire all’altro con un trasferimento di pari a b - c . La matrice trasformata dei payoff per Riga è data dai valori in grassetto nella tabella. Tabella 1.7. Implementare un risultato desiderato trasformando i diritti di proprietà
28 | MICROECONOMIA
I payoff trasformati sono in grassetto.
Si è avuto un miglioramento nei diritti di proprietà? Poiché a – b + d < b per la definizione di Dilemma del Prigioniero, cooperare è una risposta ottima nei confronti di cooperare e la mutua cooperazione è un equilibrio di Nash. Cooperare è anche una risposta ottima rispetto a tradire (poiché b > c ), così cooperare è una strategia dominante e mutua cooperazione è l’equilibrio in strategie dominanti. Cioè, ridefinendo i diritti di proprietà (così da tenere in conto la responsabilità per danni) implementa un ottimo sociale inducendo ognuno a prendere in considerazione gli effetti delle proprie azioni sugli altri. La ridefinizione dei diritti di proprietà ha trasformato il gioco da un gioco con i caratteri misti del conflitto d’interesse e dell’interesse comune in un gioco di puro interesse comune. Comunque, come vedremo nei prossimi capitoli, molti fallimenti del coordinamento non permettono soluzioni così semplici. La ragione è che l’identificazione della defezione e la stima dei danni pertinenti richiedono informazioni che possono o non essere disponibili alle parti coinvolte, o non essere utilizzabili in un tribunale o in un qualsiasi altro ente incaricato di farne osservare i diritti.
GIOCHI
E D I S T I T U Z IO N I
Possono i giochi spiegare le istituzioni? Le istituzioni (come uso io il termine) sono leggi, regole informali e convenzioni che danno una struttura durevole alle interazioni sociali tra i membri di una popolazione. La conformità ai comportamenti prescritti dalle istituzioni può essere assicurata da una combinazione di coercizioni imposte centralmente (leggi), sanzioni sociali (regole informali) e mutue aspettative (convenzioni) che rendono la conformità una risposta ottima praticamente per tutti i membri del gruppo principale. Le istituzioni influenzano chi incontra chi, quali compiti svolgere, la possibile sequenza delle azioni e quali sono le conseguenze delle azioni svolte congiuntamente. Appare chiaro da questa definizione che le istituzioni possono essere formalmente rappresentate da un gioco. Le istituzioni del mercato del lavoro che verranno esaminate nei capitoli 8 e 10 sono modellate in questo modo: le istituzioni pertinenti definiscono cosa il datore di lavoro può fare (variare il salario, dato che è il primo giocatore; interrompere un rapporto di lavoro) e cosa non può fare (punire fisicamente il lavoratore) e analogamente per il lavoratore (variare il livello dello sforzo lavorativo) con i payoff dei due che dipendono dal profilo
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|29
strategico. Queste istituzioni sul mercato del lavoro a livello di impresa sono modellate come giochi. Le innovazioni istituzionali quali il salario minimo o i regolamenti che governano la fine dei rapporti di lavoro possono essere considerate come modi di alterare gli insiemi di strategia, i payoff, la struttura delle informazioni e i giocatori in modo tale che l’equilibrio del gioco possa essere spostato. Ma per capire perché le istituzioni possano cambiare, potrebbe essere illuminante talvolta rappresentare un’istituzione non come un gioco ma piuttosto come l’equilibrio di un sottostante gioco. Poiché le istituzioni sono persistenti anziché essere momentanee, è naturale rappresentarle come equilibri stabili di un gioco sottostante nel quale l’insieme delle strategie abbraccia un ampio raggio di possibili azioni (frustare il lavoratore scansafatiche, rifiutarsi di consegnare le merci prodotte al datore di lavoro) che non sono osservate nell’ambiente istituzionale descritto prima ma che potrebbero essere parte di un equilibrio derivante da un qualche altro profilo strategico. Cioè, continuando con l’esempio datore di lavoro – lavoratore, l’aspettativa che il datore di lavoro e non il lavoratore avrà il possesso dei beni prodotti è una mutua risposta ottima, cioè, un risultato di un qualche gioco (o più probabilmente, di più giochi), presumibilmente uno in cui i giocatori che sono inclusi non sono solo il datore di lavoro e il lavoratore ma anche la polizia, gli ufficiali giudiziari e altri ancora. Quando un particolare insieme di mutue risposte ottime è adottato in pratica universalmente in una popolazione in un periodo esteso di tempo, questo giunge a costituire una o un insieme di istituzioni. Nei capitoli 2 e dall’11 al 13 modellerò i diritti di proprietà, la mezzadria, le regole che governano la suddivisione delle risorse e altri esempi come equilibri e studierò il modo in cui questi equilibri possono evolvere in risposta ad eventi fortuiti, ad azioni collettive da coloro che ne sono coinvoltiti e a cambiamenti indotti in modo esogeno nella struttura del collegato gioco sottostante. Nel capitolo 2 modellerò il processo della segregazione razziale di una zona residenziale per chiarire come un’istituzione (residenze segregate) possa essere intesa come equilibrio di un gioco.
Rappresentando le istituzioni allo stesso tempo come giochi e come equilibri di un sottostante gioco non si è inconsistenti e si incorre in pochi rischi di far confusione. L’interpretazione appropriata dipenderà dal problema analitico che bisogna trattare. Se siamo interessati a capire perché i poveri hanno vincoli di credito (capitolo 9), modellare il rapporto tra il prestatore e colui che prende a credito come un gioco risulta essere adeguato (e rispondere al quesito dell’origine della responsabilità limitata e gli altri sottostanti diritti di proprietà è un di più). Dall’altro
30 | MICROECONOMIA
lato, se vogliamo conoscere perché esiste la responsabilità limitata, dovremo modellare questo aspetto dei diritti di proprietà come il risultato di un gioco sottostante. In ugual modo, se vogliamo conoscere perché la primogenitura è meno comune in Africa che in Asia, avremo bisogno di modellare le regole di eredità come convenzioni, cioè come equilibri di un Gioco d’Assicurazione. Il termine “istituzione” è qualche volta usato anche per riferirsi a singoli enti quali possono essere un’impresa, un sindacato o una banca centrale; ma per evitare confusione chiamerò questi enti organizzazioni. Uno può trattare anche le organizzazioni come se fossero giocatori individuali in un gioco; questo può essere intuitivo nel momento in cui si può aver ragione di pensare che l’ente agisca come una singola unità; trattare l’impresa come una singola persona può avere maggior senso se si applica la stessa logica alla “classe operaia”. La caccia al cervo descritta da Rousseau illustra la relazione tra giochi e istituzioni. Supponete di osservare un gruppo di cacciatori che caccia la lepre, sebbene ci siano anche cervi nei loro dintorni nella foresta. Vi stupite del perché non stiano cacciando il cervo e quindi consultate il Gioco della Caccia al Cervo (tabella 1.8) alla ricerca di una spiegazione. Ipotizzate che ci si siano due cacciatori che decidono, indipendentemente e senza sapere l’uno cosa faccia l’altro, se cacciare un cervo (catturandone e consumandone in parti uguali uno se entrambi lo cacciano, o altrimenti non catturando – e dunque non consumando - niente) o cacciare lepri (catturandone e consumandone una indipendentemente da cosa faccia l’altro). Per il momento, assumiamo che i cacciatori non si aspettino di incontrarsi di nuovo. Infine, ogni cacciatore valuta un terzo del cervo uguale ad una lepre. La tecnologia di caccia (non i payoff) è riassunta nella tabella 1.8. Il gioco cattura importanti aspetti delle istituzioni rilevanti; per esempio, che i soggetti non decidono congiuntamente cosa cacciare (o, per essere più precisi, non hanno strumenti per vincolare se stessi a qualsiasi decisione essi possano prendere), che se entrambi partecipano alla caccia al cervo la preda sarà divisa equamente e anche che se uno caccia la lepre, rendendo la caccia al cervo dell’altro infruttuosa, può consumare la lepre stessa senza doverla dividere. Questo può servire da esempio di come, usando un gioco, si possa descrivere un’istituzione, con le attinenti relazioni di causa ed effetto circa la tecnologia data. Tabella 1.8. La caccia al cervo di Rousseau
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|31
Nota: i valori sono i risultati del giocatore Riga; i payoff possono essere calcolati sapendo che un terzo di un cervo è valutato da ogni giocatore come una lepre.
Comunque, di per sé il gioco da solo non chiarisce molto. Dati i payoff, sia cacciare lepre separatamente che cacciare cervo in modo congiunto sono convenzioni (si tratta di un Gioco d’Assicurazione), così che senza conoscere niente delle credenze di ciascun cacciatore in merito alle più probabili azioni dell’altro non possiamo essere in grado di prevedere quale tra la caccia alla lepre e la caccia al cervo è la convenzione a rischio. Immaginate ora che l’interazione stia nuovamente avvenendo e che nel periodo precedente entrambi abbiano cacciato la lepre (non importa quale sia il motivo); uno dei cacciatori in questa interazione invece prende in considerazione l’opportunità di cacciare il cervo. Affinché questo sia di interesse per il cacciatore (considerando solo i payoff di questo periodo), questi si deve attendere che anche l’altro faccia lo stesso, assegnando una probabilità che ciò accada di almeno 2/3. Nel fare questa stima dovrebbe avere bisogno di conoscere qualcosa della storia del gruppo di cacciatori e, in particolare, i risultati ottenuti in passato nel gioco, includendo, se possibile, risultati complessi quali cacciare il cervo il fine settimana e cacciare lepre nei giorni feriali. Se il cacciatore indeciso non ha questi elementi per poter assegnare una probabilità maggiore e, quindi, assegna un’identica probabilità alle due azioni a disposizione dell’altro cacciatore, per lui è chiaro che cacciare congiuntamente il cervo è l’equilibrio dominante nei payoff e cacciare lepre è l’equilibrio rischio dominante. Così, le mutue aspettative (sia che sorgano da esperienza storica o da qualsiasi altra fonte) svolgono a loro volta un ruolo importante nello spiegare perché è la caccia alla lepre piuttosto che la caccia al cervo il risultato che si realizza, avendo fatto l’ipotesi che essi non hanno modo di impegnarsi uno nei confronti dell’altro a stringere accordi vincolanti. Notate anche che alcuni aspetti del gioco presi come dati ed esogeni nel precedente esempio possono essere spiegati come il risultato di altre istituzioni, cioè di equilibri di sottostanti giochi. La pratica di permettere ai cacciatori di lepre di consumare la loro preda anche se l’altro non ha catturato niente o di dividere il cervo in parti uguali può (come vedremo in seguito) essere modellata come il risultato di un gioco sottostante nel quale questi particolari diritti di proprietà sono un equilibrio e nel quale altri diritti di proprietà potrebbero essere ottenuti (dividere la lepre, per esempio, o che il cervo è di colui al quale appartiene la freccia che lo ha colpito). Anche se la teoria dei giochi spiega molti aspetti importanti delle istituzioni e del comportamento economico, ci sono comunque serie lacune nel nostro attuale livello di conoscenza. Primo, mentre molti degli usi che si fanno nelle scienze sociali della teoria dei giochi concernono giochi 2 x 2 del tipo qui introdotto, in molte
32 | MICROECONOMIA
interazioni sociali i numeri coinvolti sono molto più grandi e l’insieme delle strategie molto più complesso. L’analisi di giochi con n-persone o giochi con grandi insiemi di strategia manca della semplicità, trattabilità e trasparenza dei giochi precedenti. I giochi 2 x 2 prima introdotti possono quindi essere considerati di gran lunga come metafore di problemi molto più complessi, spesso indicanti importanti aspetti delle interazioni, ma vanno poco lontano nel fornire una adeguata analisi. Comunque i passi per avvicinarsi alla descrizione della realtà non devono costare un prezzo troppo alto né andare a discapito della trattabilità. Le interazioni tra due persone sono spesso incastonate in interazioni all’interno di popolazioni molto più grandi, come nell’analisi del livello della popolazione del Gioco del Falco e della Colomba presentato nel capitolo 2, nei giochi di scambio nel capitolo 7 e nelle convenzioni studiate dal capitolo 11 al 13. Ed è spesso possibile modellare un insieme complesso di interazioni come una serie separabile di interazioni tra due o più persone. Quando ritorneremo all’analisi dell’impresa, per esempio, questa sarà analizzata usando una interazione tra due persone, il datore di lavoro e il dipendente; usando una distinta interazione tra due persone, l’impresa e l’istituzione che fornisce prestiti; e usando una più ampia interazione fra n soggetti sul mercato competitivo dei beni. Ma molte delle soluzioni decentralizzate ai problemi di coordinamento basate sulla ripetizione dei giochi e la reputazione (presentate nel capitolo 7) hanno sicuramente ampia applicabilità nelle interazioni tra due persone (o con un numero limitato di persone) rispetto ad interazioni coinvolgenti un grande numero n di persone che caratterizza molti dei problemi di coordinamento d’interesse. L’esagerata enfasi posta sui giochi a due persone (dovuta in parte al loro valore pedagogico), i quali portano a soluzioni in una struttura di gioco ripetuto, può avere contribuito a formare l’opinione che i fallimenti del coordinamento sono eventi eccezionali piuttosto che aspetti generici delle interazioni sociali.10 Il fatto che la teoria dei giochi abbia compiuto meno progressi con le interazioni non cooperative con n-persone rispetto sia ai giochi cooperativi, sia ai giochi con due persone, può difficilmente essere considerata una critica mossa a questo tipo di approccio, dato che queste difficoltà sorgono in quanto la teoria dei giochi si indirizza intrinsecamente verso aspetti complessi delle interazioni umane dai 10
La pedagogia, non il realismo, deve anche spiegare perché così tanta attenzione è stata data ai giochi simmetrici. I giochi che le persone reali giocano sono asimmetrici nel senso che i giocatori spesso vengono (o acquisiscono) etichette che assegnano loro differenti insiemi strategici e payoff: uomini e donne, insiders e outsiders, datori di lavoro e lavoratori interagiscono tipicamente in modo asimmetrico. Giochi asimmetrici sono comuni nei modelli di teoria dei giochi relativi al mercato del lavoro, del credito e altre situazioni nelle quali le istituzioni assegnano agli individui posizioni diverse per distinguere posizioni strutturali (prenditore di fondi in prestito, concessore di prestiti) con diversi insiemi strategici. Questi modelli appaiono nel capitolo 2 e dal capitolo 5 fino al capitolo 10.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|33
quali si astrae in altri approcci. Ciò che rende l’analisi delle interazioni tra molti individui non trattabile è l’ipotesi che essi agiscano strategicamente invece di prendere le azioni degli altri come date. Quando si può astrarre dalle azioni strategiche – come nei mercati competitivi dei beni governati da contratti completi e in cui si ha solo l’equilibrio di scambio, ossia il paradigmatico caso Walrasiano - molta dell’analisi è ridotta ad un singolo individuo che interagisce con un dato insieme dei prezzi, tecnologie e vincoli. Ma, come vedremo, ci sono molte importanti interazioni – mercati del lavoro, mercati del credito, mercati dell’informazione e dei beni con qualità variabile – per i quali questo particolare modo di raggiungere la trattabilità non è intuitivo. Secondo, i principali concetti di soluzione della teoria dei giochi classica – dominanza (diretta, iterata, e di rischio) ed equilibrio di Nash – sono intesi a fornire gli standard riguardo i ragionevoli modi nei quali il gioco potrebbe essere giocato. Ma non sono interamente adeguati come guida per prevedere cosa succederà. Oltre il dilemma del prigioniero, pochi altri giochi hanno equilibri in strategie dominanti (o in dominanza iterata) e alcuni giochi (in strategia pura) non hanno neanche equilibri di Nash. La dominanza iterata può non essere robusta come concetto di soluzione poiché è un modo ragionevole di giocare solo se gli altri giocatori hanno lo stesso modo di intendere il gioco e i suoi payoff, se stanno usando lo stesso concetto di soluzione e non sono inclini a commettere errori (ipotesi di razionalità comune e conoscenza comune). Il concetto di equilibrio di Nash è più robusto: se è nostra preoccupazione trovare una spiegazione ai fenomeni persistenti (piuttosto che a quelli temporanei), è naturale guardare a risultati per i quali è vero che nessuno con la capacità di alterarli tramite le sue azioni da solo non ha alcun interesse a farlo. Così possiamo dire che un equilibrio di Nash è un risultato per il quale non ci sono fonti endogene di cambiamento (questa è una adeguata definizione per ogni equilibrio). Confinando la nostra attenzione sugli equilibri di Nash stabili, il concetto diventa considerevolmente più utile. Ma come guida per i risultati, anche sotto le ipotesi di razionalità comune e di conoscenza comune, gli equilibri stabili di Nash sono incompleti per due motivi. Primo, abbiamo bisogno di sapere come il giocare in modo ragionevole dovrebbe portare ad un equilibrio di Nash e il perché l’esito potrebbe essere stabile. Questo richiede attenzione su cosa i giocatori fanno in situazioni fuori equilibrio. In alcuni casi, non ha molto senso pensare che giocare in modo ragionevole dovrebbe portare ad un equilibrio di Nash. Secondo, molti giochi hanno molti equilibri di Nash, così il Nash in sé non può predire i risultati; le informazioni circa le condizioni iniziali più un’analisi del comportamento fuori dall’equilibrio sono richieste per capire quale tra i
34 | MICROECONOMIA
molteplici equilibri di Nash si avrà. Per questo, sia la contingenza storica che la dinamica (incluso l’apprendimento) sono necessari complementi al concetto di Nash. Il problema dell’indeterminatezza che sorge dalla molteplicità degli equilibri è stato trattato in modi diversi dalla teoria dei giochi classica e dalla teoria dei giochi evolutiva. La teoria dei giochi classica ha cercato di limitare l’insieme dei possibili risultati tramite restrizioni sui comportamenti dei giocatori basate su sempre più forti nozioni di razionalità. Queste restrizioni aggiuntive, chiamate raffinamenti, escludono equilibri che coinvolgono strategie includenti minacce non credibili (e.g. quelle che non possono essere risposte ottime ex post difficilmente saranno ), o che non sono robusti a piccole deviazioni dal giocare la risposta ottima (“tremanti”) o payoff o che sono supportate da credenze non corrette quando si fa un uso appropriato di tutte le informazioni a disposizione (e.g. che non fanno uso di induzione al contrario o dominanza iterata). Invece, la teoria dei giochi evolutiva e comportamentale tratta le limitazioni precedentemente descritte rilassando le ipotesi di conoscenza comune e di razionalità comune e usando ipotesi fondate sull’osservazione empirica (per la maggior parte sperimentale) del modo in cui le persone reali interagiscono. La teoria dei giochi evolutiva, per esempio, generalmente assume che gli individui hanno informazione limitata sulle conseguenze delle loro azioni e che essi aggiornano le loro credenze tramite metodi di “trial-and-error” (tentativo ed errore) usando una conoscenza locale basata sulla recente esperienza passata propria e di altri. Al contrario dei giocatori molto intelligenti e rivolti al futuro della teoria dei giochi classica, i soggetti della teoria dei giochi evolutiva sono “intellettualmente limitati” e rivolti al passato. Poiché c’è poca evidenza che gli individui siano capaci di (o predisposti a) condurre le alquanto esigenti operazioni cognitive che abitudinariamente sono ipotizzate dalla teoria dei giochi classica, procederò (nei capitoli 2 e 3) a sviluppare un insieme di ipotesi maggiormente in linea con la conoscenza empirica. Una seconda ragione per mettere in dubbio l’approccio classico è che pensare che l’indeterminatezza tra equilibri possa essere risolta dalla teoria dei giochi stessa, senza far riferimento alla storia particolare dei giocatori appare un errore. Accogliere piuttosto che tentare di circoscrivere il fatto che i risultati sociali sono influenzati dal recente passato – che la storia conta – attesta una necessaria insufficienza della teoria, non la sua debolezza. Un terzo motivo di dubbio riguardo all’uso della teoria dei giochi come fondamento dell’analisi delle istituzioni e del comportamento economico è il suo scopo limitato. La società non è ben modellata come gioco singolo o come un gioco con una struttura immodificabile. Un approccio ai giochi che potrebbe essere
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|35
adeguato per capire la società dovrebbe prendere in considerazione le seguenti caratteristiche. I giochi sono sovrapposti: le persone regolarmente partecipano a molti e differenti tipi di interazione sociale che vanno dalle imprese, ai mercati, alla famiglia, alle relazioni tra stato e cittadini, associazioni di quartiere, squadre di calcio e così via. I mercati del credito sono spesso legati ai mercati del lavoro e dei terreni, per esempio, e accordi sui prestiti che non si possono concludere nel mercato del credito considerato di per sé possono essere possibili quando colui che prende a prestito lavora per colui che dà a prestito, o è l’affittuario della sua terra ed in entrambi i casi può essere buttato fuori nel caso sia inadempiente. Il carattere di sovrapposizione dei giochi è anche importante perché la struttura di un gioco insegna ai giocatori ed incide sulla direzione dell’evoluzione culturale, influenzando non solo il modo in cui essi giocano il gioco nei periodi successivi ma quello in cui essi giocano gli altri giochi nei quali sono coinvolti. I cittadini che dispongono di libertà individuali ben definite e diritti democratici nelle loro relazioni con il governo possono, per esempio, cercare di invocarli sul posto di lavoro. I giochi, in altre parole, sono costitutivi delle preferenze dei giocatori. In più, non solo i giocatori si evolvono; anche le regole fanno lo stesso. I giochi sono cioè ricorsivi nel senso che tra i risultati di alcuni giochi ci sono cambi nelle regole dello stesso o di altri giochi. Nelle pagine che seguono introdurrò giochi sovrapposti e asimmetrici nell’analisi delle imprese, dei mercati del credito, dei rapporti di impiego e struttura di classe. Giochi costitutivi e ricorsivi saranno usati per analizzare la co- evoluzione delle preferenze e delle istituzioni.
C O N C L U S IO N I Perché, allora, i contadini di Palanpur rimangono poveri, coltivando tardi e sostenendo i costi del fallimento del coordinamento che sembra limitare le loro opportunità economiche? Perché i canali rimangono non drenati e i cervi girano nella foresta indisturbati? La lunga persistenza di risultati Pareto-inferiori è un puzzle che rappresenta una immensa sfida intellettuale e di importanza pratica.
Numerosi possibili impedimenti alla soluzione dei problemi di coordinamento sono stati menzionati (ritornerò su di essi nei prossimi capitoli). Fallimenti del coordinamento che sono rapidamente evitati quando l’interazione riguarda due individui, possono porre ostacoli insormontabili se centinaia o migliaia di individui interagiscono tra loro così come Hume puntualizza nel suo commento sulla difficoltà di assicurare il drenaggio del prato. La sottostante interazione può essere tale che la strategia dominante sia non cooperare (come nel dilemma del prigioniero). A causa dell’informazione non verificabile o per altre ragioni, può non esserci modo di
36 | MICROECONOMIA
trasformare il gioco per rimuovere quest’ostacolo. Cambiamenti nelle regole del gioco necessari ad evitare un particolare fallimento del coordinamento possono trovare resistenze dovute al limitato campo d’intervento delle istituzioni e alla paura della perdita che possono subire alcuni giocatori per effetto di cambiamenti istituzionali in qualche altro gioco. Anche se un equilibrio dominante nei payoff esiste, questo può non ottenersi perché qualche altro equilibrio è rischio dominante e non c’è modo di coordinare le aspettative. Se, come spesso è il caso, non può essere assicurata una divisione accettabile dei guadagni, coloro che sono coinvolti preferiscono la non cooperazione alla cooperazione. Infine, laddove il grado di interesse comune è limitato (rispetto al grado di conflitto), i guadagni della mutua cooperazione possono essere insufficienti a giustificare il rischio o il costo di assicurare le condizioni per implementare la cooperazione. In passato era ampiamente condivisa l’idea che l’intervento governativo avrebbe potuto attenuare rapidamente i fallimenti del coordinamento più gravi. Ma pochi oggi condividerebbero l’ottimismo di Hume, espresso nella frase immediatamente successiva al passaggio citato nell’epigrafe: “La società politica [intendendo il governo] facilmente rimedia […] questi inconvenienti” (Hume, 1967:304). “Ci sono persone,” scrive Hume, “che noi chiamiamo […] i nostri governatori e governanti, i quali non hanno nessun interesse per alcun atto di ingiustizia […] e hanno un interesse immediato […] nel sostenere la società” (pp. 302-3). Tra le ragioni del nostro moderno scetticismo circa il fatto che “la società politica facilmente rimedia questi inconvenienti” è il fatto di aver realizzato che le istituzioni e le politiche non sono semplicemente strumenti pronti ad essere impiegati dai buoni servitori pubblici di Hume. Piuttosto, esse sono prodotte dall’evoluzione e dalla progettazione e sono esse stesse soggette alle stesse specie di fallimenti del coordinamento introdotte in precedenza. Nelle pagine precedenti ho identificato un certo numero di risultati Paretoinferiori come equilibri di Nash. Comprendere i sottostanti fallimenti del coordinamento, gli impedimenti alla loro soluzione, e come essi possano essere superati richiede il comprendere perché gli individui effettuano le azioni che implementano e sostengono equilibri di Nash inefficienti per lunghi periodi di tempo. Per rispondere a queste domande abbiamo bisogno di capire come sia i comportamenti individuali, sia le istituzioni sociali evolvono nel tempo. Nel capitolo 2 introdurremo gli strumenti dei modelli evolutivi per rispondere a questi problemi.
INTERAZIONI SOCIALI E SCHEMA ISTITUZIONALE
|37
Riferimenti bibliografici Aumann, R. and S. Sorin (1989). "Cooperation and bounded recall." Games and Economic Behavior 1(1): 5-39. Camerer, C., M. Knez, et al. (2004). "Timing and Virtual Observability in Ultimatum Bargaining and 'Weak Link' Coordination Games." Experimental Economics (in press). Hardin, G. (1968). "The Tragedy of the Commons." Science 162(3859): 1243-1248. Hume, D. (1967[1742]). A Treatise of Human Nature. Oxford, Clarendon Press. Lanjouw, P. and N. Stern, Eds. (1998). Economic Development in Palanpur Over Five Decades. Delhi, Oxford University Press. Ostrom, E. (1990). Governing the Commons: The Evolution of Institutions for Collective Action. Cambridge, UK, Cambridge University Press. Rapoport, A. (1997). "Order of Play in Strategically Equivalent Games in Extensive Form." International Journal of Game Theory 26: 113-136. Rousseau, J.-J. (1987). Discourse on the Origin and Foundations of Inequality Among Men. Basic Political Writings. D. A. Cress. Indianapolis, Hackett Publishing Company (original publication, 1755): 25-109. Sato, Y., E. Akiyama, et al. (2002). "Chaos in learning a simple two person game." Proceedings of the National Acadamy of Science 99(7): 4748-4751. Schelling, T. (1960). The Strategy of Conflict. Cambrdige, MA, Harvard University Press. Van Huyck, J., R. Battalio, et al. (1990). "Tacit Coordination Games, Strategic Uncertainty, and Coordination Failure." American Economic Review 80(1): 234-248. Vega-Redondo, F. (1996). Evolution, Games, and Economic Behavior. Oxford, Oxford University Press.
II
O RDINE S PONTANEO : L’A UTO - ORGANIZZAZIONE DELLA V ITA E CONOMICA
Tali furono i Doni di quello Stato; I loro crimini cospiravano per renderli Grandi; Pertanto ogni singola Parte era piena di Vizio; Tuttavia l’intera Massa, un Paradiso;… La peggiore di tutte le Moltitudini Fece Qualcosa per il Bene Comune - Bernard Mandeville, The Fable of the Bees, or Private Vices, Publick Benefits (1705)
Osservo che sarà nel mio interesse lasciare un altro nel possesso dei suoi beni, a patto che egli agisca allo stesso modo nei miei riguardi […] E questa può essere propriamente chiamata convenzione […] La stabilità del possesso […] sorge gradualmente, acquisisce forza attraverso un lento progresso, e tramite la nostra esperienza ripetuta dello svantaggio nel trasgredirla […] Similmente, le lingue sono gradualmente fissate mediante convenzioni umane senza nessuna promessa. Allo stesso modo oro e argento diventano misure comuni di scambio. - David Hume, A Treatise of Human Nature, Volume II (1739)
! Nel Milwaukee, a Los Angeles e Cincinnati, oltre la metà dei residenti bianchi ha affermato che avrebbe preferito vivere in un quartiere in cui il 20 per cento o più dei co-residenti fosse Afro-Americano (uno su cinque preferirebbe un ugual numero di entrambi; Clark 1991). Pochi vivono in quartieri integrati; le loro preferenze si manifestavano nel corso di cause concernenti la segregazione abitativa in queste e in altre città. (La maggior parte degli Afro-Americani preferiva quartieri equamente distribuiti.) Gli intervistati, naturalmente, possono aver travisato le proprie preferenze, ma quelli che cercavano sinceramente quartieri integrati, sarebbero stati delusi. Il mercato immobiliare in queste città forniva pochi quartieri misti del tipo Bianco-Afro Americano, pur se apparentemente richiesti. A Los Angeles, per esempio, tutti i bianchi (più del 90 per cento) vivono in quartieri con meno del 10 per cento di
2 | MICROECONOMIA
residenti di colore, mentre il 70 per cento degli abitanti di colore vive in quartieri con meno del 20 per cento di bianchi (Mare e Bruch, 2001). Perché il risultato aggregato appare opposto alla distribuzione delle preferenze? Si immagini la sorpresa se un’indagine riportasse che una persona su cinque desidera una piscina dietro casa e sarebbe disposta a pagarne il costo; sarebbero ancora in pochi a possedere una piscina? Perché la capacità di pagare concede loro una piscina e non un quartiere integrato? Una delle grandi sfide delle scienze sociali è il comprendere come gli esiti aggregati siano spesso differenti dai fini individuali, alcune volte migliori (come suggeriscono Bernard Mandeville nell’epigrafe precedente e Adam Smith, citato nel capitolo 6) ma a volte peggiori, come potrebbe sospettare una famiglia americana in cerca di un quartiere multi-razziale. Gli economisti sono specializzati nello studio delle conseguenze involontarie e, a partire da Bernard Mandeville e David Hume, hanno studiato il modo in cui le azioni di molti, che agiscono nel proprio interesse, producono risultati aggregati non programmati. Molti modelli complessi che si occupano di questo processo rappresentano uno dei contributi caratteristici dell’economia. Inoltre, più importante dei modelli stessi è la percezione che nessuna relazione evidente leghi le motivazioni delle persone coinvolte in un’interazione e le proprietà normative dei risultati aggregati che derivano dalle interazioni stesse. Le così dette “argomentazioni della mano invisibile” mostrano come l’alchimia di buone istituzioni può trasformare stimoli iniziali in risultati di valore, così che, come nella “favola della api” di Mandeville, “la peggiore di tutte le moltitudini fece qualcosa per il bene comune”. Questo ci riporta indietro al problema classico degli economisti, “comprendere le regole”. Anche le “giuste” istituzioni, per la maggior parte, non sono progettate a livello costituzionale. Al contrario, particolari diritti di proprietà e altre forme di governo economico devono la loro esistenza e funzionamento alle conseguenze di azioni path-dependent, spesso non coordinate, rischiose, eseguite da una moltitudine di attori nel corso di un lungo periodo di tempo. Si possono citare come esempi l’emergere e il persistere di regole consuetudinarie ed altri aspetti dei diritti di proprietà (come l’equa ripartizione delle quote di raccolto e la regola per la quale chi trova qualcosa può appropriarsene), le norme che disciplinano gli scambi di mercato, e l’uso convenzionale di pronomi come espressione di rispetto o solidarietà. Questo capitolo si propone di dare risposta a questo interrogativo: come possono evolvere, in assenza di un progetto volontario, strutture persistenti di interazione in popolazioni
ORDINE SPONTANEO |3
numerose? Questa non rappresenta altro che una formulazione moderna dell’antico interrogativo sull’evoluzione istituzionale: Che cosa spiega l’emergere, il diffondersi e la scomparsa delle regole sociali? Gli economisti classici erano egualmente interessati al modo in cui si formano le regole e alla loro comprensione. Frederick Hayek, il cui approccio a volte viene definito “la teoria dell’ordine spontaneo” o “l’auto-organizzazione della società”, rappresenta un moderno ed importante esponente della corrente evolutiva introdotta da Hume e Smith. In contrasto con l’approccio costituzionale, che presuppone un pianificatore sociale benevolente o altri attori che agiscano per ottenere risultati aggregati ottimali dal punto di vista sociale, nei modelli evolutivi nessun attore ha preferenze definite sui risultati aggregati. Le due correnti - costituzionale ed evolutiva - schierano tecniche analitiche diverse e metafore distinte. La dottrina delle “istituzioni programmate” rappresenta le regole sociali come dispositivi, traenti origine dall’immaginazione umana, valutati secondo la loro capacità di risolvere problemi ed implementati nel caso in cui soddisfino un test di efficacia. I metodi analitici standard di quest’approccio sono la classica teoria dei giochi cooperativi e non cooperativi. Queste tecniche sono usate non solo dagli economisti ma anche da filosofi come Robert Nozick, John Rawls e David Gauthier. La dottrina dell’ordine spontaneo vede, al contrario, le istituzioni come linguaggi: l’evoluzione delle regole sociali, come l’acquisizione di un accento, è il prodotto di innumerevoli interazioni, le cui conseguenze sono spesso involontarie. Le istituzioni quindi evolvono per tentativi ed errori, sviluppandosi, come una volta Marx disse, all’insaputa dei partecipanti. Il titolo del famoso libro di Richard Dawkins paragona i processi evolutivi ad un Orologiaio Cieco. Le metafore di Dawkins o Marx affermano, però, solo cosa questo processo non è, e non chiariscono cosa esso sia in realtà. La tecnica analitica scelta per questo approccio, la teoria dei giochi evolutiva, rappresenta un metodo per fare chiarezza su questo processo. Inizieremo con l’introdurre la struttura base del ragionamento evolutivo. In secondo luogo, con l’aiuto di un esempio – la segregazione abitativa – illustreremo alcuni strumenti usati dai modelli evolutivi. In seguito, presenteremo un modello formale del processo di riproduzione differenziale, il modello dinamico del replicatore. I concetti di stabilità evolutiva, che verranno introdotti, forniscono un fondamento comportamentale al concetto di equilibrio di Nash. Per illustrare come questi strumenti analitici possono essere usati per studiare le istituzioni economiche, useremo un’estensione del gioco Falco-
4 | MICROECONOMIA
Colomba per modellare l’evoluzione dei diritti di proprietà. Infine, termineremo con una valutazione critica dell’approccio evolutivo.
S C IE N Z A S O C I A L E E V O L U T I VA Studiamo il comportamento individuale principalmente per comprendere i risultati aggregati. Il nostro interesse non si concentra sul perché una determinata persona è senza lavoro, ma sul tasso di disoccupazione, non quanto sia scrupoloso un individuo nel pagare le tasse bensì la distribuzione della propensione a pagare le tasse nella popolazione. Comprendere le preferenze e le credenze individuali, e il modo in cui le istituzioni organizzano i vincoli che gli individui affrontano, permette la previsione del comportamento individuale. Per spiegare i risultati aggregati, tuttavia, non è possibile semplicemente sommare i comportamenti individuali previsti. Le azioni intraprese da ciascun individuo, tipicamente, influiscono sui vincoli, sulle credenze o sulle preferenze degli altri. Per poter tenere conto di questi effetti di reazione bisogna utilizzare modelli (population-level) che collegano le azioni individuali a risultati per la popolazione intera. L’approccio population-level maggiormente sviluppato nelle scienze sociali è il modello generale di equilibrio economico concorrenziale, perfezionato a metà dell’ultimo secolo da Kenneth Arrow, Gerard Debreu, Tjalling Koopmans, e altri. Con assunzioni piuttosto restrittive, questo modello aggrega le azioni individuali di produttori e consumatori, un vettore ampio di prezzi, output e l’allocazione di risorse per usi alternativi. Il modello di equilibrio generale prepara lo scenario per il Teorema Fondamentale dell’Economia del Benessere (citato nel capitolo 1 ed approfondito nel capitolo 6). Versioni semplificate di questo modello hanno richiamato numerose applicazioni in economia e nelle scienze sociali in genere, nelle quali sono state trovate analogie all’equilibrio economico competitivo, nella competizione elettorale, nel mercato matrimoniale, e simili. Nell’introduzione, abbiamo menzionato i limiti del modello e ritorneremo su questo argomento, brevemente, nelle pagine che seguono, specialmente dal capitolo 6 al 10. All’infuori del modello di equilibrio generale Walrasiano, la sola classe pienamente sviluppata di modelli population-level è quella che descrive le dinamiche evolutive dei sistemi biologici sulla base dell’influenza congiunta di casualità, eredità, e selezione naturale. La similitudine tra questi due approcci (quello economico e quello biologico) è sorprendente: entrambi modellano sistemi di competizione in cui proliferano le consuetudini o i progetti a cui corrispondono payoff più elevati. Nemmeno questo deve sorprenderci: Charles Darwin (1809-1882) ebbe l’idea della selezione naturale, nel 1838, durante la lettura dell’economista classico Thomas
ORDINE SPONTANEO |5
Malthus (1766-1834). La stretta associazione dei due approcci preannuncia anche questo; la prima precisa trattazione di una dinamica evolutiva in un modello biologico di cui siamo a conoscenza ( un modello predatore-preda del tipo reso famoso da Alfred Lotka [1880-1949] e Vito Volterra [1860-1940]) fu pubblicata appena dieci anni dopo “ La ricchezza delle nazioni”, da Joseph Townsend (1971) nella sua “Una Dissertazione sulle Leggi per i Poveri da parte di Uno che desidera il bene dell’Umanità” . I modelli biologici però differiscono da quelli economici per alcuni particolari importanti. I biologi impiegano i concetti di equilibrio in maniera simile agli economisti, ma prestano maggior attenzione al modellare esplicitamente i processi dinamici che governano la distribuzione dei caratteri in una popolazione. Questo compito è facilitato dal fatto che dispongono di un modello del processo di innovazione ereditabile basato sulla mutazione e sulla ricombinazione. L’economia, diversamente, non ha in genere accettato la teoria dell’innovazione a dispetto del diffuso riconoscimento della sua importanza. Le applicazioni del modello biologico all’evoluzione umana hanno prodotto importanti risultati. Queste, però, trascurano la capacità, che gli esseri umani hanno, di produrre cambiamenti intenzionalmente, spesso attraverso azioni collettive; e questo non può essere semplicemente spiegato dalla casualità. (Affronteremo questo argomento nel capitolo 12.) Inoltre, nell’approccio economico l’ottimizzazione è un postulato comportamentale, mentre esso rappresenta necessariamente un espediente (un as if ) nei modelli biologici, dove il lavoro di ottimizzazione è messo in pratica dal processo di competizione e selezione piuttosto che mediante la consapevole scelta di strategie ad opera dei membri individuali di una specie. Pertanto, se i modelli economici esigono troppo dalle capacità cognitive umane, i modelli biologici applicati agli esseri umani domandano troppo poco. Negli ultimi anni, antropologi, biologi, economisti e altri hanno adattato i modelli biologici allo studio delle popolazioni umane nelle quali i caratteri possono essere trasmessi sia mediante il processo di apprendimento sia geneticamente. Un primo indirizzo di questa letteratura ha sviluppato modelli di evoluzione culturale modificando i modelli biologici per tenere conto delle particolari capacità umane, specialmente l’abilità di imparare dalla propria e dall’altrui esperienza, e la capacità di aggiornare le strategie alla luce delle informazioni ottenute.
6 | MICROECONOMIA
Un secondo indirizzo, la teoria dei giochi evolutiva, ha modificato la teoria dei giochi classica per tenere conto delle nostre capacità cognitive limitate, assumendo che gli agenti aggiornano i loro comportamenti basandosi su informazioni locali non perfette. Le due correnti, la teoria dell’evoluzione culturale e la teoria dei giochi evolutiva, hanno perfezionato due differenti punti di partenza, accrescendo il livello di capacità cognitiva assunto nel primo caso, riducendolo nel secondo. Entrambe le teorie descrivono l’interazione di agenti adattivi, tralasciando sia gli agenti ad intelligenza zero dei modelli biologici standard sia quelli ad elevata conoscenza dei modelli di teoria dei giochi. Gli agenti adattivi adottano comportamenti nello stesso modo in cui si adotta un accento o si parla una particolare lingua. Le decisioni basate sulla previsione dei payoff ottenibili non sono completamente assenti (ad esempio coloro i quali aspirano ad elevarsi socialmente adotteranno accenti “aristocratici”), ma l’ottimizzazione consapevole non basta a spiegare tutto. La risposta alla domanda “perché parli in questo modo?” è generalmente “perché sono nato dove la gente parla in questo modo” non “ho considerato tutti i modi di parlare e ho deciso che la mia utilità sarebbe stata massimizzata parlando in questo modo”. Questo significa che gli individui sono “depositari” di regole comportamentali. L’analisi è volta ad osservare il successo o il fallimento di queste regole comportamentali, intendendo per successo la loro diffusione in una popolazione, e per fallimento l’essere confinate in una nicchia più ristretta o l’eliminazione. I protagonisti della dinamica sociale non sono gli individui, bensì le regole comportamentali: il modo in cui esse si muovono assume una rilevanza principale; cosa gli individui fanno è, inoltre, importante alla luce del fatto che le azioni individuali contribuiscono al successo o al fallimento delle regole comportamentali. Altre caratteristiche particolari dell’approccio evolutivo includono il modo in cui vengono modellate la casualità, la riproduzione differenziale, le dinamiche fuori dall’equilibrio e la struttura della popolazione. Il caso gioca un ruolo centrale nelle dinamiche evolutive, anche quando gli eventi stocastici sono piccoli o non frequenti. Gli eventi casuali possono prendere la forma di cambiamenti ereditabili (mutazioni). Il caso può essere introdotto anche come innovazione comportamentale che (come la mutazione) non è una risposta ottima. A differenza delle mutazioni, le innovazioni comportamentali non sono trasmissibili geneticamente. Possono, invece, essere passate alla generazione
ORDINE SPONTANEO |7
successiva e copiate da altri attraverso una trasmissione culturale, cioè, attraverso un processo di apprendimento di agenti adattivi. Un altro modo in cui il caso influisce sulle dinamiche evolutive è il così detto matching noise (disturbo derivante dall’appaiamento casuale). Quando un piccolo numero di individui, in una popolazione eterogenea, viene accoppiato in modo casuale, la distribuzione di tipi con cui si è accoppiati, realizzata in un determinato periodo di tempo, può differire significativamente dalla distribuzione attesa. La differenza tra la distribuzione realizzata e quella attesa riflette un “disturbo” di abbinamento e può avere effetti sostanziali. Nessuno può dubitare che gli eventi casuali abbiano un’incidenza: i cambiamenti esogeni nei gusti o nelle tecnologie modificano il prezzo e la quantità di equilibrio nel modello standard di statica comparata di un equilibrio di mercato. In cosa i modelli evolutivi sono diversi? In primo luogo, le mutazioni, le innovazioni comportamentali e i disturbi di abbinamento sono differenti in quanto queste fonti di eventi stocastici risultano essere endogene ai modelli evolutivi. In secondo luogo, in presenza di rendimenti di scala crescenti, eventi casuali di piccola portata spesso hanno effetti ampi e persistenti a causa delle reazioni positive che essi provocano, piuttosto che essere neutralizzati da reazioni negative. Si può credere che gli eventi casuali introducano il “disturbo” nei modelli evolutivi e che ciò influisca solo sulla velocità del cambiamento o sulla presenza di stati di equilibrio esatti oppure di stati in un intorno dell’equilibrio. Questo non è assolutamente ciò che accade: spesso la casualità influisce sulla direzione (non solo sulla velocità) del cambiamento evolutivo e spesso ci permette di dire di più (piuttosto che meno) sul probabile risultato. (Esempi di questo genere vengono trattati di seguito e nei capitoli 5 e 12). Il caso e l’innovazione intenzionale non sono però sufficienti per comprendere l’evoluzione dei comportamenti e delle istituzioni umane. Queste fonti di cambiamento combinate con la seconda caratteristica dell’approccio evolutivo – la replicazione differenziale (talvolta chiamata selezione) – dirigono i processi evolutivi. L’idea principale è che le caratteristiche istituzionali e comportamentali degli individui e delle società che noi comunemente osserviamo sono state copiate e diffuse – cioè replicate – mentre regole, credenze e preferenze alternative a queste si sono estinte (o sono state replicate solo in nicchie marginali). Come mostreremo a breve, la replicazione differenziale può assumere molte forme, che possono essere distinte in “genetiche” e “culturali”. La distribuzione dei comportamenti che sono
8 | MICROECONOMIA
influenzati da geni può cambiare a causa della proliferazione di alcuni genotipi piuttosto che di altri. La distribuzione dei genotipi cambia nel tempo a causa di eventi casuali (deviazione) e a causa della selezione naturale. In questi modelli, i payoff misurano il successo riproduttivo dei fenotipi associati, in altre parole, la fitness1. Ignorare i dettagli dell’eredità genetica e della relazione tra genotipo e fenotipo, trattare un comportamento come se esso fosse l’espressione fenotipica di un singolo gene e studiare le determinanti del successo riproduttivo di quel gene semplifica e non induce necessariamente in errore. (Ne vedremo un esempio nel gioco del Falco e della Colomba). La correlazione tra geni e comportamenti è, tuttavia, per la maggior parte, sconosciuta e certamente contiene poche se non nessuna delle semplici corrispondenze gene-comportamento assunte da questo metodo. I caratteri culturali si riferiscono a comportamenti che sono acquisiti piuttosto che trasmessi geneticamente dai genitori. L’apprendimento familiare è definito trasmissione culturale verticale mentre l’apprendimento scolastico o derivante da appartenenti alla generazione dei genitori è detto trasmissione obliqua. Imparare da membri di un gruppo della propria generazione è detto trasmissione orizzontale. Il concetto analogo alla fitness differenziale nei modelli di evoluzione culturale è il tasso al quale la gente abbandona un comportamento in favore di un altro. Questo processo di riproduzione differenziale, come l’eredità genetica, è difficile da comprendere, ma implica la tendenza ad adottare un dato comportamento per via di una o più delle seguenti ragioni: poiché è comune in un determinato luogo (conformismo, mimesi), poiché nella propria esperienza passata esso ha prodotto payoff maggiori rispetto ad altri comportamenti (apprendimento rinforzato), o poiché il comportamento massimizza i payoff attesi, date le credenze individuali sulla distribuzione dei comportamenti altrui nella popolazione (aggiornamento delle risposte ottime). Per la semplicità e la versatilità della sua trattazione la trasmissione culturale sarà qui modellata utilizzando l’aggiornamento delle risposte ottime combinato con il conformismo. I processi di evoluzione genetica e culturale sono influenzati !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 1
Quando due o più assortimenti di caratteri ereditari conferiscono ai rispettivi organismi un diverso successo riproduttivo, allora si dice che presentano una fitness diversa. Si tratta di un termine che può essere tradotto come “idoneità”. La fitness si misura per mezzo del successo riproduttivo, cioè dal numero medio dei figli in grado, a loro volta, di riprodursi. Il numero di figli, da solo, non è rilevante in questo contesto. Poiché nessun individuo è identico a un altro, anche il suo valore di fitness sarà diverso da quello dei propri simili. Detto in altri termini, nell’ambito di una specie ogni individuo è dotato di capacità riproduttive legate al particolare genotipo di cui è portatore. I processi ereditari non sono, quindi, “perfetti” proprio perché caratteri diversi conferiscono fitness diverse agli organismi.(Ndt)
ORDINE SPONTANEO |9
fortemente dalla struttura sociale - assortimento, modelli di residenza, migrazione, e simili. Questi, e molti altri aspetti della struttura sociale, si basano su comportamenti acquisiti. Per questo motivo, la distribuzione di caratteristiche trasmesse culturalmente in una popolazione può influenzare l’evoluzione genetica. Questo, assieme al processo inverso – per il quale le distribuzioni genetiche influenzano l’evoluzione culturale – sono definiti processi evolutivi gene-cultura (un esempio è presente nel capitolo13). I cambiamenti genetici e culturali si influenzano vicendevolmente, ma la velocità dei cambiamenti culturali è di gran lunga maggiore di quella genetica. I cambiamenti nella distribuzione genetica avvengono con il passare delle generazioni e in risposta a rari eventi casuali, mentre l’apprendimento culturale può avvenire sottoforma di un’epidemica diffusione di comportamenti, come è accaduto con la proliferazione dell’uso generale dei pronomi informali in molte lingue europee durante il corso di una sola decade, gli anni ’60. Il processo di riproduzione differenziale, sia esso culturale o genetico, è sviluppato mediante l’uso delle equazioni del replicatore che descrivono una dinamica riproduttiva. Una dinamica riproduttiva fornisce un’analisi alternativa alla statica comparata e ad altri approcci in cui il tempo non è modellato esplicitamente. Questo approccio fornisce una panoramica completa dei movimenti delle frequenze della popolazione fuori dall’equilibrio. Si basa su assunzioni empiricamente plausibili sulle capacità cognitive e sui comportamenti individuali e su una rappresentazione dei dettagli delle interazioni sociali (chi incontra chi, per fare cosa, con quali payoff, con quale informazione, e simili). Una terza caratteristica degli approcci evolutivi, quindi, è lo studio delle dinamiche fuori dall’equilibrio. L’analisi esplicita della dinamica evolutiva comporta due vantaggi. Primo, si possono scoprire quelli che noi definiamo equilibri irrilevanti per l’evoluzione. Le dinamiche esplicite illuminano la relazione tra i concetti di soluzione del capitolo precedente – l’equilibrio di Nash e la dominanza – e la più completa e robusta nozione di stabilità evolutiva. Vedremo (qui, nel capitolo 6, e specialmente nel capitolo 12) che, quando si tiene conto dei processi evolutivi, utilizzando particolari modelli di replicazione differenziale, alcuni equilibri di Nash possono divenire irrilevanti rispetto al comportamento reale della società. Un secondo vantaggio che deriva dal modellare esplicitamente i processi dinamici è l’esistenza di stati di non equilibrio di sostanziale importanza per il funzionamento delle economie reali. Illustreremo con un esempio pratico questo concetto in quanto la precedente affermazione sfida un principio base del pensiero
10 | MICROECONOMIA
economico comune. Molti mercati mostrano una coesistenza di lunga data di quelli che sono comunemente definiti vincitori e perdenti, contrariamente a ciò che ci aspetteremmo di osservare se le economie fossero in equilibrio. Tra le imprese che producevano lo stesso prodotto e che vendevano agli stessi consumatori nell’industria metallurgica degli Stati Uniti nei primi anni Novanta, per esempio, le imprese più produttive lo erano ben oltre tre volte di più delle minori, con il settantacinquesimo percentile pari a circa due volte il venticinquesimo (Luria 1996). Nell’industria elettronica indonesiana – una parte del fortemente competitivo mercato globale – i dati degli ultimi anni ’90 mostrano che le imprese nel settantacinquesimo percentile erano otto volte più competitive delle imprese posizionate nel venticinquesimo (Hallward-Driemeier, Iorossi e Sokoloff 2001). Naturalmente, il caso indonesiano è estremo, alcune di queste differenze sono solo disturbi statistici, e le imprese ad alto rendimento si espanderanno e quelle a basso rendimento usciranno dall’industria. Tuttavia, il processo di selezione sembra sufficientemente debole, anche in queste industrie molto competitive, da far dubitare dell’assunzione che tutte le imprese operino sulla frontiera delle possibilità produttive. Il raggiungimento istantaneo dell’equilibrio è ancor meno probabile da osservare in ambienti in cui l’entrata e l’uscita sono più limitate, ambienti in cui i soggetti in questione non sono specialisti nel fabbricare denaro ma semplicemente individui che affrontano la vita. Non considerare gli stati di non equilibrio sulla base del fatto che essi sono solo passeggeri è generalmente poco utile. Continuando con l’esempio sopra citato, un significativo contributo alla fine dell’età dell’oro di rapida crescita produttiva nell’economia statunitense, successivo alla seconda guerra mondiale, fu offerto dalla riduzione del tasso al quale le imprese a bassa produttività venivano tagliate fuori dal mercato (Bowles, Gordon, e Weisskopf, 1983). L’elevato tasso di crescita produttiva nell’economia svedese durante il terzo quarto del secolo passato fu in parte dovuto allo spostamento del lavoro e di altre risorse dalle imprese a bassa produttività a quelle ad alta produttività e il conseguente fallimento delle imprese a basso rendimento, indotto da una politica di pareggiamento dei salari (Hibbs, 2000). Sebbene illuminante su queste questioni di politica e su altro, l’analisi delle dinamiche fuori dall’equilibrio è considerevolmente più esigente dell’approccio convenzionale di statica comparata. I comportamenti medi di lungo termine delle variabili di interesse possono però essere spesso studiati analiticamente o simulati, producendo spesso risultati abbastanza robusti. Ne sono forniti esempi nei capitoli 11 e 13. Una quarta idea caratteristica nei modelli evolutivi è che le popolazioni sono
ORDINE SPONTANEO |11
strutturate gerarchicamente, e la riproduzione differenziale può agire su più di un livello. Individui interagiscono con individui, ma gli individui costituiscono anche gruppi (ad esempio, famiglie, imprese) e altre entità di ordine superiore (nazioni, gruppi etnici), e anche questi gruppi multi-individuali interagiscono. Gli individui a loro volta sono un raggruppamento di cellule che interagiscono. Questo significa che il processo di riproduzione differenziale avviene a molti livelli: all’interno degli individui, tra individui, tra gruppi e così via. All’interno di un’impresa, ad esempio, differenti comportamenti (lavorare sodo o non sforzarsi affatto) possono essere replicati o abbandonati dagli individui. Tra imprese, le strutture organizzative delle più profittevoli saranno replicate mentre, al contrario, le meno profittevoli falliranno. Ne deduciamo che le caratteristiche individuali come le preferenze o credenze possono essere o meno replicate; ma le istituzioni e altre caratteristiche di gruppo delle imprese, comunità etniche, o nazioni sono anche esse soggette alla riproduzione differenziale. Una teoria adeguata deve essere in grado di far luce sia sul processo mediante il quale una struttura di gruppo emerge in una popolazione di individui, sia sul come i confini tra le entità di alto livello siano mantenuti e come essi svaniscano. Il lavoro simultaneo di replicazione a più di un livello, detto selezione multi-livello (o selezione di gruppo), produce il così detto processo co-evolutivo che governa le traiettorie dinamiche delle caratteristiche sia individuali che di gruppo. (Un esempio della co-evoluzione delle preferenze individuali e delle strutture di gruppo è fornito nel capitolo 13.) La tabella 2.1 riassume la molteplicità dei processi introdotti in precedenza, distinguendo tra i replicatori (caratteri copiati) e i livelli di selezione (le unità tra le quali ha luogo la competizione implicita per il successo nella riproduzione). Un replicatore è qualcosa che viene copiato; i geni sono replicatori, come lo sono le preferenze individuali, le credenze, le consuetudini di gruppo e altre istituzioni.
Tabella 2.1. Alcuni processi alla base dell’evoluzione comportamentale
Livello di selezione Replicatore
Individuo
Comportamenti appresi
Apprendimento sociale ( conformismo, apprendimento per rinforzo, risposta ottima )
Geni
Successo riproduttivo differenziale, deriva (drift)
Gruppi di individui Emulazione di consuetudini appartenenti ad altri gruppi, assimilazione culturale di gruppi fallimentari Estinzione biologica di gruppi fallimentari, fitness ridotta di popolazioni sottomesse
12 | MICROECONOMIA
! Spiegare i comportamenti e le istituzioni riferendosi alla riproduzione differenziale può sembrare un’ovvia tautologia. La replicazione differenziale è un sistema contabile estremamente utile per verificare la logica di un argomento complesso ma è anche una struttura analitica che offre intuizioni difficilmente ottenibili da altre prospettive. Naturalmente, per sostanziare questa affermazione sarà necessario un resoconto del processo di replicazione stesso, sia esso la regolamentazione della sopravvivenza o della fine delle imprese con diverse strutture organizzative, l’adattamento biologico differenziale o l’emulazione culturale di individui con modelli comportamentali differenti, la diffusione o la fine di istituzioni della società attraverso il processo di conflitto all’interno dei gruppi o qualche altro processo di selezione. Un esempio chiarirà alcune delle diverse caratteristiche dell’approccio evolutivo.
L A S E G R E G A Z IO N E A B I TAT I VA : U N P R O C E S S O E V O L U T I V O Come può uno studioso di scienze sociali spiegare la coesistenza di preferenze per quartieri multirazziali con l’evidenza empirica che solo pochi quartieri sono in realtà integrati? Introdurremo un esempio che illustra alcuni risultati caratteristici dei modelli evolutivi: equilibri multipli e dipendenza storica (path dependency) dei risultati, il modello di omogeneità locale e eterogeneità globale e la persistenza di lungo termine di risultati Pareto-Inferiori. Consideriamo un singolo quartiere (uno di tanti) nel quale tutte le unità abitative sono egualmente desiderabili da tutti i membri della popolazione. Le preferenze di ogni individuo dipendono solo dalla composizione razziale del quartiere. In questo quartiere e nella popolazione circostante i “verdi” preferiscono vivere in un quartiere misto in cui essi sono più numerosi dei “blu” per una piccola frazione, e i “blu” non preferiscono la segregazione ma non vorrebbero essere superati in numero dai “verdi”. Rappresenteremo queste preferenze mediante i prezzi p e p , che i verdi e i blu, rispettivamente, sono disposti a pagare per una casa nel g
b
quartiere. Ciascuno di essi dipende dalla frazione di case nel quartiere occupata dai verdi, f [0 , 1] . Le equazioni seguenti esprimono le preferenze sopra descritte (vedi figura 2.1): p (f) = (f +) - (f +)2 + p b
p ( f) = (f - ) - (f - )2 + p g
(2.1)
Dove (0 , ) e p è una costante positiva che riflette il valore intrinseco di case identiche. Differenziando entrambe le funzioni rispetto ad f ed eguagliando il
ORDINE SPONTANEO |13
risultato a zero possiamo notare che il quartiere ideale per i verdi (che massimizza p ) è composto da + verdi, mentre i blu preferiscono un quartiere con - verdi. g
Poiché la differenza tra i due quartieri ottimali è 2, ci riferiremo a come misura discriminante dei gusti dei due tipi ( può differire tra i due gruppi, oppure un gruppo può non curarsi affatto della composizione razziale). Normalizzeremo l’ampiezza del mercato all’unità in modo da poterci riferire indifferentemente alla frazione di verdi e al numero di verdi. Supponiamo che durante ciascun periodo una frazione , sia di blu che di verdi, del quartiere decida di vendere la propria casa ad un membro della popolazione circostante. Gli eventuali acquirenti esterni alla zona visitano il quartiere in proporzione all’attuale composizione del quartiere stesso. La frazione dei potenziali acquirenti verdi è perciò f . Potenziali acquirenti e venditori sono accoppiati in maniera casuale. Si immagini che i compratori bussino alla porta di una casa selezionata a caso. In ogni periodo, il numero atteso di verdi che cerca di vendere la propria casa contattato da un acquirente blu sarà f (1 f ) . Ciascun venditore potenziale incontra solo un compratore per periodo, che venda o meno. La probabilità di effettuare una vendita dipende dalla differenza tra la valutazione del compratore sulla casa e quella del venditore (se il primo supera il secondo), entrambi dati dall’equazione (2.1). Quindi, se un venditore blu incontra un verde e se f è tale che p > p allora la probabilità che una vendita sia effettuata sarà ( p p ) , Dove è una costante positiva che collega la differenza nei prezzi alla probabilità di vendita. g
g
b
b
Il nostro obiettivo è lo studio dell’evoluzione nel tempo della distribuzione di tipi nel quartiere. Assumiamo che il quartiere sia grande abbastanza in modo tale da poter considerare i valori attesi come una buona approssimazione dei valori realizzati. Usando il simbolo (‘) per indicare il “periodo successivo” possiamo indicare f’ come funzione di f. In ogni periodo alcuni verdi possono vendere a tipi blu e alcuni blu a tipi verdi. Quindi, f ' = f f (1 f ) p ( p p ) + (1 f ) fp ( p p ) b
b
g
g
g
(2.2)
b
Dove p = 1 se p > p e uguale zero altrimenti, e p = 1 se p p e uguale a zero altrimenti. (Ovviamente, p + p =1 ). b
b
g
g
b
g
b
g
L’equazione può essere interpretata in questo modo: la frazione attesa di verdi nel periodo successivo è rappresentata dalla frazione di verdi di questo periodo meno tutti i verdi che abbiano venduto ad un blu (il secondo termine nel membro destro
14 | MICROECONOMIA
dell’equazione), più tutti i blu che abbiano venduto ad un verde (il terzo termine). Il secondo termine del lato destro dell’equazione, per esempio, rappresenta la perdita di verdi dovuta ad una vendita ai blu; f rappresenta il numero di verdi che cerca di vendere, di questi (1 f ) sarà accoppiato con un blu, e se il prezzo del blu eccede quello del verde, la vendita avrà luogo con probabilità ( p p ) . Il terzo termine b
g
può essere interpretato analogamente. Nel caso in cui i prezzi dei verdi superino i prezzi dei blu questi ultimi venderanno ai verdi. Usando il fatto che p + p =1 possiamo rielaborare l’equazione in questo modo: b
g
f = f ' f = f (1 f ) ( p p ) g
b
(2.3)
Dalla quale risulta chiaro che f = 0 se p = p (non verrà effettuata nessuna vendita tra i potenziali venditori e acquirenti di diversi tipi che si incontrano poiché gli acquirenti non valutano le case più dei venditori). Inoltre, f = 0 anche se f = 0 o g
b
f =1 (quando la popolazione è già omogenea il quartiere è visitato solo da potenziali
acquirenti dello stesso tipo).
L’equazione (2.3) è detta “equazione dinamica del replicatore”. Con qualche altra manipolazione l’equazione (2.3) può essere presentata in una forma più conveniente: f = f ( p p) dove p rappresenta il prezzo medio, ossia g
p = fp + (1 f ) p . g
b
Un valore stazionario di f rappresenta un equilibrio stabile se un cambiamento esogeno in f produce (tramite la dinamica descritta nell’eq.2.3) un f di segno opposto, in altre parole, se df /df < 0 . Se questa disuguaglianza è soddisfatta un cambiamento in f è auto-correttivo.
La figura 2.1 illustra questo modello. Un’analisi della figura (e un po’ di calcoli) conferma che una composizione del quartiere equamente distribuita tra tipi blu e verdi è un equilibrio ( f = 0 poiché p = p ), ma non è stabile (poiché df /df > 0 ). g
b
Ciò significa che una piccola variazione casuale della frazione di verdi (o di blu), rispetto alla distribuzione paritaria, non sarà auto-correttiva ma piuttosto si accumulerà portando ad un quartiere totalmente segregato. Si noti inoltre che per <1/ 4 sia verdi che blu preferirebbero un quartiere integrato ad uno segregato in
cui vivano solo persone del loro stesso tipo. (Ciò può essere confermato notando che p (1/2) = p (1/2) > p (1) = p (0) .) b
g
b
g
ORDINE SPONTANEO |15
Gli equilibri stabili di “segregazione razziale” che ci aspettiamo essere gli unici risultati solidi di questa interazione sono Pareto-inferiori ad un insieme di composizioni di quartieri integrati che non rappresentano però in questo modello equilibri stabili. Questo risultato è mantenuto anche quando è arbitrariamente piccolo. Risultati di segregazione completa vengono riscontrati anche se i due gruppi hanno effettivamente gli stessi gusti e il quartiere ottimale per entrambi è molto vicino alla parità dei tipi (50-50). Infine, risulta semplice confermare che la completa segregazione è (per ogni tipo) un equilibrio stabile.
! Figura 2.1. Segregazione spontanea in una comunità abitativa. Le due funzioni rappresentano il prezzo massimo che un blu ed un verde sono disposti a pagare per una casa come funzione di f , la frazione di verdi nella comunità- Si noti che sia i verdi che i blu preferiscono un quartiere integrato invece che vivere unicamente con vicini dello stesso tipo in una comunità completamente segregata.
Questo significa che i quartieri saranno localmente omogenei e, diversamente, quartieri identici saranno composti interamente da gruppi diversi, esibendo una eterogeneità globale. La composizione di un quartiere dipenderà dalla storia passata: se, nel recente passato, f è stato inferiore a f *, ci aspetteremo di trovare per esempio, f = 0.
Il problema di coordinamento riscontrato in questo caso dipende dal fatto che quando una persona decide di vivere in una comunità, la sua scelta influenza sia la comunità da cui si muove che quella in cui arriva. La composizione di una comunità è quindi sia il “bene” che la famiglia sta scegliendo, sia il prodotto non intenzionale delle scelte di tutte le famiglie. Non c’è nessuna ragione per cui il risultato debba essere efficiente, indipendemente dal fatto che la selezione sia basata sulle preferenze di composizione razziale, come in questo caso, su preferenze relative al livello culturale dei vicini (Benabou 1993), sul fatto che il quartiere sia abitato da proprietari (Hoff e Sen 2002), oppure su altri aspetti.
16 | MICROECONOMIA
Abbiamo modellato il processo di riequilibrio del mercato tracciando esplicitamente i risultati delle interazioni sociali (chi incontra chi, e cosa essi fanno). Gli individui fanno uso solo di una conoscenza locale: essi non fanno l’affare migliore, essi semplicemente effettuano una transazione con probabilità positiva se ne possono beneficiare entrambe le parti, altrimenti non effettuano nessuna transazione. La composizione razziale del quartiere è determinata da un processo di replicazione che determina l’occupazione delle case da parte di membri di entrambi i gruppi. La dinamica della composizione del quartiere è derivata dallo studio di quali abitazioni abbiano replicato il loro modello di proprietà e quali invece lo abbiano cambiato. Nel capitolo 6 contrapporremo a questo approccio di interazione sociale un approccio che modella i mercati secondo il modello Walrasiano.
M O D E L L A R E L ’ E V O L U Z IO N E
D E L C O M P O RTA M E N TO
La distribuzione delle regole di comportamento individuale o le caratteristiche istituzionali dei gruppi in una popolazione e la loro evoluzione nel tempo, come la composizione razziale del quartiere, dipendono dai caratteri copiati e da quelli abbandonati. I “caratteri” rappresentano qualsiasi caratteristica di un individuo che possa essere adattata ad altri, abbandonata, oppure conservata. Se i figli di Cattolici conservassero con maggiore probabilità la religione dei genitori, mentre i figli dei Protestanti non lo facessero, la frazione di Cattolici, in una popolazione, aumenterebbe (assumendo che tutte le famiglie abbiano lo stesso numero di bambini e che questi siano gli unici due tipi nella popolazione). Se le imprese che ammettono un’organizzazione sindacale tra i dipendenti fallissero ad un tasso maggiore che le imprese che non la riconoscono, e se le nuove imprese tendessero a copiare le più redditizie, il tasso di sindacalizzazione si ridurrebbe. La replicazione differenziale (asimmetrica) può derivare da persone o da organizzazioni che hanno deliberatamente acquisito caratteri, regole, di comprovato successo. La replicazione differenziale, comunque, può anche avere luogo in modi meno strumentali: il processo di riproduzione (di copia) può essere descritto mediante un processo di trasmissione conformista secondo il quale la riproduzione dei caratteri dipende dalla frequenza, con i caratteri maggiormente prevalenti in una popolazione favoriti rispetto agli altri2. Sebbene a volte il processo di replicazione differenziale venga detto “spontaneo”, esso può agire attraverso il potere coercitivo delle nazioni, classi, o organizzazioni, come nel caso di popolazioni sconfitte in guerra e costrette ad assimilare e adottare le culture, l’istruzione e le costituzioni dei !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 2
Alcune ragioni per cui bisogna ritenere importante la trasmissione conformista sono offerte in Boyd e Richerson (1985) e Bowles (2001). Nel capitolo 11 verrà discusso un modello di aggiornamento conformista.
ORDINE SPONTANEO |17
vincitori. I dettagli del processo di trasmissione sono importanti; raccoglieremo questi ed altri casi complessi nei seguenti capitoli quando verrà modellato il modo in cui l’economia e altre istituzioni danno forma all’evoluzione delle preferenze. Adesso modelleremo un caso importante, se pur estremamente semplice, in cui i comportamenti di successo vengono copiati. Questo è il processo di aggiornamento monotono dei payoff, ossia, la classe dei meccanismi di trasmissione con la proprietà che comportamenti con payoff sopra la media sono adottati dagli altri e di conseguenza aumentano le loro quote nella popolazione. Assumiamo che gli individui sono accoppiati casualmente per interagire. Assumiamo, inoltre, che sia presente in ciascun membro di una popolazione3 numerosa uno dei due caratteri (x e y), mutuamente esclusivi. I caratteri possono essere fedeli a diverse regole comportamentali, gusti alimentari, o qualunque aspetto durevole del comportamento che possa influenzare i payoff. X potrebbe essere “il prezzo dei beni al livello del costo marginale”, “lavorare duro”, “avere un altro figlio”, “ricambiare i regali”, o “mangiare una colazione sana ogni giorno”. Il carattere y rappresenta una regola alternativa in ciascun caso. Il modello è semplicemente estendibile a popolazioni con più di due caratteri. Noi modelliamo l’evoluzione di caratteri culturali, ossia, i caratteri acquisiti mediante apprendimento (dai genitori, altri appartenenti alla precedente generazione, coetanei, etc.) piuttosto che attraverso eredità genetiche. Pertanto, il modello rappresenta l’aggiornamento comportamentale come processo di passaggio da un carattere ad un altro piuttosto che la produzione differenziale (o asimmetrica) di discendenza. (Il modello presentato a breve è in ogni caso facilmente adattabile al caso di trasmissione genetica dei caratteri, come mostreremo nell’esempio del Falco e la Colomba.) Ci chiederemo quante copie di ciascun carattere vi siano alla fine di ciascun periodo. (Un individuo che non lascia copie nel periodo successivo è passato all’altro carattere; un individuo che lascia due copie ha mantenuto il carattere ed è stato copiato da un altro.) Assumiamo che gli individui vivono per sempre e sono semplicemente portatori dei caratteri; sono i caratteri stessi che possono essere più o meno abili nel generare copie. L’ampiezza della popolazione è stata normalizzata ad uno. !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 3
La matematica dell’analisi dei sistemi dinamici alla base dei modelli presentati qui è riesaminata chiaramente in Weibull (1995) e presentata in maniera più completa da Hirsch e Smale (1974).
18 | MICROECONOMIA
La struttura del processo di trasmissione è questa: gli individui implementano la strategia, imposta dal carattere, in un gioco che assegna a ciascuno dei payoff, dipendenti dal loro comportamento e da quello degli altri. Di conseguenza, i caratteri sono ripetuti assieme ai caratteri i cui portatori guadagnano payoff più elevati, creando relativamente più copie e così generando una nuova frequenza di caratteri nella popolazione. Supponiamo che i membri della popolazione siano accoppiati in maniera casuale ed interagiscano in un gioco simmetrico con due giocatori, i cui payoff sono indicati con (i, j) , il payoff ottenuto giocando il carattere i contro il carattere j del partner. Per ogni frequenza del carattere x nella popolazione, p [0 , 1] , i payoff attesi sono !
!
!!!!!!!!!!!!!!!!b ( p) = p ( x, x) + (1 p) ( x, y) x
by( p) = p ( y, x) + (1 p) ( y, y)
(2.4)
La prima equazione può essere così interpretata: “Una persona dal carattere x con probabilità p è accoppiata ad un’altra persona dal carattere x , guadagnando così un payoff ( x, x) , e con probabilità (1 p) è accoppiata ad un individuo con carattere y , guadagnando così un payoff ( x, y) ”.
All’inizio di ciascun periodo, una frazione della popolazione, (0 , 1] , può aggiornare il suo carattere a seguito dell’esposizione ad un “modello culturale” (per esempio, un competitore, un insegnante, un collega, o un vicino). Il residuo della popolazione non si rinnova, indipendentemente dalla propria esperienza. Il fatto che non tutti i membri della popolazione si aggiornino, pone l’attenzione sul fatto che tipicamente si adottano comportamenti – spesso durante l’adolescenza – e si mantengono per un periodo di tempo, come suggerisce la citazione di J.S.Mill in apertura del capitolo 3. Naturalmente, il rinnovo di alcuni caratteri può essere più frequente – modo di vestirsi, per esempio – mentre altri caratteri vengono aggiornati solo occasionalmente – la religione, per esempio. La velocità di aggiornamento non è assunta come data, come per gli altri aspetti del processo di apprendimento, bensì risponde essa stessa alle pressioni evolutive. Abbiamo, in questo contesto, semplificato eliminando la natura endogena del processo di aggiornamento stesso. Se il modello culturale e l’individuo hanno lo stesso carattere, esso è mantenuto dall’individuo; questo accade con probabilità p per i caratteri x e con probabilità (1 p) per i caratteri y . (Sia il modello culturale che l’individuo producono una
singola replica – loro stessi – nel periodo successivo). Se invece l’individuo e il modello culturale hanno caratteri diversi, allora l’individuo mantiene o abbandona il
ORDINE SPONTANEO |19
carattere sulla base del payoff ottenuto da entrambi nel precedente periodo. I payoff ottenuti dal modello culturale e dall’individuo dipendono dal particolare appaiamento dei due e quindi variano a seconda della frequenza di ciascun carattere nella popolazione. Naturalmente, l’individuo potrebbe estrapolare informazioni dalle esperienze di payoff di un più ampio gruppo piuttosto che comparare i suoi payoff con quelli del modello, ma questo non comporterebbe grosse differenze. Se l’individuo cambia carattere il modello ottiene due copie (repliche), e l’individuo nessuna. (Nel capitolo 11, useremo questo modello per studiare l’emergere e la diffusione dei diritti di proprietà individuali). Si consideri un modello culturale (una persona di tipo y ) e un individuo x , che hanno ottenuto i payoff B e B , rispettivamente, nel periodo precedente (questi generalmente non saranno uguali a b e b , rispettivamente, a causa del disturbo di y
x
y
x
accoppiamento casuale). Una piccola differenza nei payoff non sarà necessariamente notata o indurrà un cambiamento, così possiamo affermare che con probabilità (B B ) l’individuo con carattere x cambierà se B < B . L’individuo non y
x
x
y
modificherà il suo carattere se B B . Il coefficiente è una costante positiva che riflette il maggior effetto sul cambiamento dovuto a differenze tra i payoff più ampie, scalato in modo tale che la probabilità di passaggio vari in un intervallo unitario. Supponiamo che p =1 , quando il payoff del tipo y eccede quello del tipo x , e sia x
y
y>x
uguale a zero altrimenti. Possiamo scrivere l’equazione che rappresenta la frequenza attesa del carattere x nella popolazione, indicata con p' come:
p' = p p(1 p) p (b b ) +
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
y>x
y
x
+ p(1 p)(1 p ) (b b ) y>x
x
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!(2.5)
y
! Questa espressione può essere interpretata nel modo seguente: in ogni periodo ci sono p individui dal carattere x , una frazione dei quali potrà essere aggiornata, ciascuno di Questi p individui dal carattere x sarà accoppiato ad un modello di carattere y con probabilità (1 p) , e con probabilità p (b b ) l’informazione che essi acquisiscono circa i payoff li indurrà a cambiare. Controbilanciando la riduzione di carattere x , alcuni individui con carattere y incontreranno modelli con carattere x e y>x
y
x
mediante un processo analogo a quello precedente si convertiranno in persone con carattere x . Riordinando, possiamo esprimere l’equazione (2.5) come: p = p' p = p(1 p) (b b ) x
y
(2.6)
20 | MICROECONOMIA
Dall’equazione (2.6) si evince che la direzione e la velocità dell’aggiornamento dipendono dal valore di p in due modi. In primo luogo, la varianza del carattere, p(1 p) , misura il numero di persone x che saranno accoppiate con una persona y , e
valori estremi di p renderanno questa eventualità molto improbabile. Inoltre, l’espressione {b ( p) b ( p)} (che esplicita la dipendenza funzionale di b su p ) ci x
y
mostra l’effetto di p sui payoff e quindi sull’aggiornamento. Si noti che valori elevati di e di – una maggiore frazione di popolazione che si rinnova, e un cambiamento del carattere maggiormente sensibile alle differenze tra payoff – accelerano la dinamica quando b b . x
y
Se definiamo b = pb + (1 p)b come il payoff medio della popolazione, possiamo esprimere in maniera più compatta l’equazione (2.6): x
y
p = p (b b) x
(2.6’)
L’equazione (2.6’) rappresenta la forma generale (applicabile ad ogni numero di caratteri) della dinamica del replicatore in tempo discreto, un modo di modellare i sistemi dinamici formalizzato da Taylor e Jonker (1978) con ampia applicabilità alla biologia della popolazione e alle scienze sociali evolutive4. L’equazione (2.6’) evidenzia chiaramente che esistono due componenti necessarie nell’analisi del cambiamento evolutivo: la varianza e la replicazione differenziale. La varianza, rappresentata dal termine p(1 p) , è essenziale. Maggiore l’omogeneità della popolazione, minore sarà la velocità del processo evolutivo. Si noti che p(1 p) raggiunge un massimo per p =1/2 , così una popolazione equamente divisa, mantenendo costanti le altre influenze, massimizzerà il tasso di cambiamento in p . La replicazione differenziale – a volte detta selezione – è rappresentata dal termine {b ( p) b ( p)}. La pressione della selezione sarà debole se una piccola x
y
frazione della popolazione è soggetta ad aggiornamento, se le differenze nei payoff sono piccole, o se le risposte alle differenze nei payoff sono ridotte. Le equazioni (2.6) e (2.6’) ci danno una completa descrizione del sistema unidimensionale dinamico rilevante. Dato che esistono solo due caratteri, lo spazio degli stati in questa applicazione, ossia, tutti i possibili risultati, è semplicemente rappresentato da tutti i valori che p può assumere nell’intervallo unitario. Per questa ragione il sistema dinamico che ne risulta è detto “uni-dimensionale”. Si noti che !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 4
Abbiamo espresso l’equazione del replicatore in tempo discreto anziché continuo poiché molti dei problemi che affronteremo nelle pagine che seguiranno sono caratterizzati da unità naturali di tempo (come le generazioni). La versione discreta, in questo caso, risulta dare una interpretazione più chiara.
ORDINE SPONTANEO |21
l’equazione (2.6) è identica all’espressione (2.3)(che descrive le dinamiche del mercato immobiliare caratterizzato da quartieri segregati). Per ogni valore di p l’equazione del replicatore esprime la relazione p = ( p) , dove la funzione , detta campo vettoriale, definisce la direzione e la velocità del cambiamento nello stato (per ogni stato incluso nello spazio degli stati possibili). Siamo generalmente interessati a conoscere gli stati p * tali che ( p*) = 0 , chiamati stati stazionari (anche chiamati punti critici della dinamica), e le proprietà di stabilità di questi stati, determinate da ( p * + ) , dove rappresenta una perturbazione di p arbitrariamente piccola. Dall’equazione (2.6’) è chiaro che p = 0 se b ( p) b ( p) = 0 y
(2.7)
x
oppure se p è uguale a zero o uno (poiché quando p =1, b = b ). Per p (0 , 1) p assume il segno di b b , sottolineando il fatto che l’aggiornamento è monotono nei payoff. Data la natura uni-dimensionale di questo sistema dinamico, le proprietà di stabilità dei suoi stati stazionari sono facilmente descrivibili: un equilibrio è asintoticamente stabile (auto-correttivo) se la derivata dell’equazione (2.6’) rispetto a p è negativa (cioè dp /dp < 0 ). Questo si verifica quando: x
x
dby dp
y
dbx = ( y , x ) ( y , y ) ( x, x ) + ( x, y ) > 0 dp
(2.8)
Se la frequenza di x aumentasse per una ragione esogena, la differenza attesa tra i payoff di y e x aumenterebbe (la crescita di x verrebbe vanificata poiché l’aumento stesso genera una differenza nei payoff tale da favorire i tipi y ). La stabilità asintotica di uno stato stazionario, p *, deve essere intesa in questo modo: tutte le perturbazioni, sufficientemente piccole, nella composizione della popolazione producono cambiamenti che generano un ritorno a p * . La stabilità di Lyapunov richiede solo che tutte le piccole perturbazioni su p non implichino successivi movimenti di allontanamento da p * . (La stabilità di Lyapunov è talvolta chiamata stabilità neutrale). Utilizzeremo il termine “stabilità”, per indicare il concetto più forte, quello “asintotico” (auto-correttivo). La stabilità asintotica, ovviamente, implica la stabilità di Lyapunov. La differenza tra i due concetti di stabilità diventa importante quando i comportamenti individuali sono soggetti ad influenze stocastiche (pur se arbitrariamente piccole) come la mutazione, o il comportamento idiosincratico (risposta non ottimale). Questo caso è illustrato nel capitolo 11. L’equazione (2.8) sottolinea semplicemente che gli equilibri per essere asintoticamente stabili devono essere caratterizzati da effetti di reazione negativi:
22 | MICROECONOMIA
accrescere la frequenza di x riduce il vantaggio relativo di x stesso5. Quando l’equazione (2.8) non è verificata (ed è strettamente minore di zero), l’equilibrio è instabile a causa di reazioni positive: un aumento casuale di p beneficerà maggiormente il carattere x rispetto ad y e di conseguenza, allontanerà p da p * . Il processo di aggiornamento può quindi essere analizzato in due modi. Primo, se un equilibrio interno è stabile, si studia il modo in cui le influenze esogene possano rimuovere o spostare l’equilibrio. Si esamina principalmente come p * sia influenzato dai cambiamenti nel gioco e nel processo di rinnovamento.
Questo si ottiene differenziando la condizione di equilibrio (2.7) rispetto alle determinanti esogene dell’equazione del replicatore. Le determinanti esogene includono non solo qualunque dato tecnologico e non che determini la struttura dei payoff e altri aspetti del gioco, ma anche gli aspetti istituzionalmente determinati del processo di trasmissione, come la regola di appaiamento per il gioco o per i modelli culturali di incontro, la frequenza dell’incontro di dati agenti, e la possibile presenza di influenze sull’aggiornamento piuttosto che sui payoff, come il conformismo. Nei capitoli 3, 7 e 11, useremo questo approccio per studiare l’effetto delle istituzioni economiche sull’evoluzione delle preferenze. Secondo, se esiste un unico equilibrio interno instabile, avremo due equilibri stabili con una popolazione omogenea composta solo da x o da y (come nel caso del mercato abitativo segregato). In questo caso siamo interessati allo studio del processo (dipendente dalla storia passata) mediante il quale si può giungere ad uno dei due equilibri. Per indagare sulla realizzazione di uno dei due equilibri abbiamo bisogno del concetto di “bacino di attrazione di uno stato stazionario stabile”. Questo concetto è definito come l’insieme degli stati iniziali per i quali il sistema dinamico imperturbato si muove verso l’equilibrio. Nel sistema uni-dimensionale in questione, l’unico stato stazionario interno p * è instabile. In questo caso il bacino (o l’intervallo) di attrazione di p = 0 è il campo di valori di p in cui p = ( p) < 0 in modo tale che la popolazione graviti intorno a p = 0 . L’equilibrio interno (instabile) p * divide l’intervallo unitario in due bacini di attrazione, con p > 0 per p > p * e p < 0 per p < p *. Nel caso del modello di segregazione abitativa il bacino di
attrazione dell’equilibrio “tutti blu” comprenderebbe i valori di f < f *. Come vedremo, possono essere attutite molte delle semplificazioni usate per derivare il modello. Esiste, però un’assunzione cruciale ed essenziale, difficile da escludere e abbastanza limitante. Abbiamo considerato i valori attesi come approssimazioni !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 5
Esiste una difficoltà tecnica non affrontata. Nella dinamica in tempo discreto trattata qui è possibile che il processo di aggiornamento muova p verso p* quando esso è perturbato, ma lo superi. Assumiamo perciò che il periodo di tempo sia abbastanza breve (e quindi piccolo abbastanza) in modo da eliminare questa eventualità.
ORDINE SPONTANEO |23
ragionevoli dei payoff reali, ma l’ampiezza di molte popolazioni che studiamo – i residenti nel quartiere studiati nella sezione precedente, o i dipendenti di un’ impresa – non è così grande da poter giustificare questa assunzione. Quindi, se p è la frequenza degli individui che possiedono il carattere x e l’appaiamento è casuale, il valore atteso delle x accoppiate con le x è rappresentato da p . Questo valore potrebbe, però, essere in realtà (realizzarsi come) p(assumendo un numero pari di x ) o anche zero, ed entrambe le possibilità si realizzano 2
frequentemente nel caso di piccoli gruppi. Il problema del disturbo dovuto all’accoppiamento ed ad altre piccole influenze sulla dinamica evolutiva può sembrare un cavillo, ma non lo è. Nei capitoli dall’11 al 13 vedremo che gruppi di piccola ampiezza assieme alla casualità influiscono sulla velocità e sulla direzione delle dinamiche evolutive. Una seconda limitazione della dinamica evolutiva è che le equazioni che definiscono il sistema non dipendono dal tempo, cioè, il sistema è autonomo o omogeneo nel tempo. Il sistema, cioè, elimina le influenze storiche sulle equazioni, come ad esempio lo stato della conoscenza, la tecnologia, aspetti istituzionali assunti come dati, o il clima. Naturalmente, se si comprendessero le dinamiche di queste influenze variabili nel tempo, potremmo includerle come variabile di stato nel sistema dinamico. La natura omogenea rispetto al tempo della dinamica del replicatore può rappresentare un problema solo se lo studio in esame ne risente; per alcuni problemi, eliminare i cambiamenti climatici, per esempio, è ragionevole, e per altri meno. L’interpretazione dell’emergere dei diritti di proprietà individuali nel capitolo 11 è un caso in cui le variazioni metereologiche hanno particolare importanza. Se i processi di selezione descritti dalla dinamica del replicatore sono lenti rispetto ai cambiamenti nelle tecnologie e rispetto ad altri dati esogeni definiti nel gioco, il sistema dinamico potrebbe non raggiungere mai le vicinanze dei valori stazionari di p (poichè questi verrebbero continuamente spostati da cambiamenti esogeni). Un terzo problema connesso alla dinamica del replicatore è suggerito dal suo stesso nome: non può essere usata per studiare le innovazioni. Per studiare novità genuine (invece della ripetizione differenziale di caratteri esistenti), bisogna introdurre il concetto complementare di “ strategia evolutivamente stabile”.
S TA B I L I T À E V O L U T I VA
E
R IS U LTAT I S O C IA L I
Quali sono le condizioni per cui una popolazione incorre nel pericolo di “invasione” da parte di un nuovo carattere? Alcuni esempi concreti del tipo di invasione a cui ci riferiamo includono la rapida diffusione in molti paesi nell’ultimo
24 | MICROECONOMIA
secolo della pratica di avere piccole famiglie piuttosto che grandi. Si pensi anche all’ultima società feudale europea, “invasa” da un piccolo numero di italiani e altri mercanti che usavano nuove pratiche commerciali come la contabilità in partita doppia e il sistema di responsabilità sociale dell’enforcement contrattuale (Greif 2002, Padgett 2002). Gli invasori prosperarono ed infine trasformarono l’ordine feudale. Altri esempi includono pratiche commerciali corrotte che invadono una comunità di commercianti onesti, o i pronomi informali che “invadono” i modi rispettosi di rivolgersi di una comunità linguistica. Sebbene la dinamica del replicatore sia uno strumento analitico conveniente, uno dei suoi limiti risiede nel fatto che se un carattere è assente in una popolazione nel periodo t questo significa che esso non potrà essere copiato nel periodo t +1 . Ricordiamo che la condizione di stazionarietà per p è soddisfatta quando p =1 e p = 0 , e questo indipendentemente dai payoff che possono derivare dalla strategia assente, anche se fosse presente. Questi valori di p sono sempre stazionari nella dinamica del replicatore ma possono non rappresentare equilibri di Nash e possono non esser asintoticamente stabili: piccole perturbazioni nell’intorno di p =1 e p = 0 possono non essere auto correttive. Non è difficile, però, estendere il modello del replicatore in modo da considerare anche le innovazioni. Nei capitoli conclusivi ritorneremo su questi modelli evolutivi stocastici. Per ora, piuttosto che introdurre esplicitamente la casualità nell’equazione del replicatore, introdurremo un concetto nuovo, per incorporare l’innovazione, la nozione di “stabilità evolutiva”. Furono i biologi ad aprire la strada ai modelli sull’innovazione. Il loro interesse per la probabilità che un piccolo numero di mutanti potesse proliferare in un’ampia popolazione ha motivato il concetto chiave di strategia evolutivamente stabile. L’idea basilare è che una popolazione in cui si gioca interamente una strategia evolutiva stabile respingerà un’invasione di individui che giocano un’altra strategia. Si consideri un’ampia (per l’esattezza, infinita) popolazione in cui gli individui sono accoppiati in maniera casuale al fine di interagire (secondo il modello precedente). Si supponga, come prima, di considerare due caratteri comportamentali, x e y . Il carattere y è detto evolutivamente stabile rispetto a x se esiste una frazione della popolazione, p˜ , tale che, se la frazione della popolazione che gioca x è minore di p˜ , allora la strategia insediata precedentemente (la y ) si duplicherà più di x eliminando così la strategia in entrata. Introdurremo brevemente un caso in cui vedremo che la “barriera di invasione” p˜ (0 , 1) è un equilibrio interno instabile ed esso definisce il bacino di attrazione di p = 0 e p =1 precedentemente citato. Per vedere cosa implica la stabilità evolutiva cerchiamo di scoprire cosa accade
ORDINE SPONTANEO |25
in un’ampia popolazione, composta interamente dal carattere y , se viene introdotto un piccolo numero di x . Usando l’equazione (2.6’), questo significa valutare p in p = dove sarà arbitrariamente piccolo. Sappiamo che p avrà il segno di:
{
b ( ) b ( ) = ( x, x) + (1 ) ( x, y)} { ( y, x) + (1 ) ( y, y)} x
y
Un carattere comportamentale y è una strategia evolutivamente stabile (ESS) rispetto ad un’altra strategia x se e solo se b ( ) b ( ) < 0 , che, per un arbitrariamente piccolo, risulta quando x
y
( y, y) > ( x, y)
(2.9)
o quando ( y, y) = ( x, y)
e
( y, x) > ( x, x) .
Così, un ESS è una risposta ottima verso se stesso (almeno debolmente, e se esso è una risposta ottima debole verso se stesso allora l’altra strategia non è una risposta ottima a se stessa). Poiché piccole perturbazioni di p attorno ad un ESS si autocorreggono (secondo il precedente ragionamento), sappiamo che ogni ESS è un equilibrio di Nash simmetrico, e nella dinamica del replicatore asintoticamente stabile. Quando il mutante è una risposta ottima debole a se stesso (cioè, l’ultima disuguaglianza nell’equazione (2.9) non è stringente, bensì ( y, x) ( x, x) ), allora y potrebbe essere neutralmente stabile: l’invasore non può essere eliminato ma esso non prolifererà a causa dell’aggiornamento monotono dei playoff 6. Naturalmente, questo stato di stabilità neutrale (NSS) può essere perturbato attraverso un processo di deviazione (cioè, innovazioni successive generate esogenamente) e questo ha implicazioni importanti in alcune applicazioni (si guardi, ad esempio, il capitolo 11). L’NSS e l’ESS sono raffinamenti stringenti (in modo crescente) dell’equilibrio di Nash. Ogni ESS è un NSS ed ogni NSS è un equilibrio di Nash; ma naturalmente non è vero il contrario. Il concetto opposto alla stabilità evolutiva è la capacità di invasione, che Axelrod e Hamilton (1981) definirono capacità di sopravvivenza iniziale. Se x ha capacità di sopravvivenza iniziale contro allora y non è un ESS. Si noti che lo stato di y come ESS rispetto ad x non dice nulla sul suo stato rispetto a qualche altro carattere k o due mutanti k e x che esistano simultaneamente. !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 6
Ciò significa che ogni NSS è stabile secondo Lyapunov.
26 | MICROECONOMIA
A volte si vuole sapere se una popolazione mista (cioè, una in cui p (0 , 1) ) può essere invasa da un mutante raro. Notiamo, in primo luogo, che una popolazione in cui ognuno adotta la stessa strategia mista, è, per questa ragione, omogenea nelle strategie, anche se essa è eterogenea nei comportamenti, nel senso che in ogni momento individui diversi agiscono differentemente. Se rappresentiamo questa popolazione polimorfa come una popolazione in cui tutti gli individui adottano una strategia mista (giocando x e y con probabilità p * e (1 p*) rispettivamente), possiamo riferirci a questa strategia come ad un ESS
interno (o misto) rispetto a qualche altra strategia k se, introducendo un piccolo numero di k , questa venisse eliminata. Affinché p * sia un ESS, esso deve essere stabile asintoticamente e stazionario nella dinamica del replicatore; se non fosse così, i payoff attesi delle strategie miste della popolazione (chiamato il supporto della strategia mista) sarebbero diversi nell’intorno di p * . Il payoff di una delle strategie nel supporto potrebbe eccedere il payoff della strategia mista e un mutante, che sostiene questa strategia pura, potrebbe invadere. Si noti che come il modello del replicatore non spiega le dinamiche degli “estremi” di una popolazione (cioè, per p = 0 o p =1 ), allo stesso modo i concetti di vitalità iniziale e stabilità evolutiva non chiariscono la dinamica che governa p quando è un punto interno. Generalmente, è utile combinare i due approcci, ricavando la stabilità asintotica (ESS) dalla stazionarietà dei valori estremi di p. Il gioco del Falco e della Colomba servirà ad illustrare questi concetti. E’ risaputo che i Falchi sono aggressivi e le Colombe amano la pace. Il gioco è applicato comunemente a caratteri comportamentali umani trasmessi culturalmente o geneticamente come l’aggressività e la condivisione, ma è stato sviluppato inizialmente per studiare le competizioni tra animali. Il gioco si sviluppa in questo modo. Le Colombe, quando si incontrano, si dividono un premio, mentre quando i Falchi si incontrano, lottano per il premio, infliggendo costi gli uni sugli altri; e quando un Falco incontra una Colomba ottiene il premio. La metafora del pennuto, che si svolge in modo simile, in realtà, applicata alle automobili trasforma questa interazione nel “gioco del pollo” in cui i conducenti “ostinati” non sterzano mai, così quando si incontrano, si scontrano, ma quando incontrano un “pollo” (uno che sterza), guadagnano (presumibilmente psicologicamente) dei benefici, mentre colui che devia è umiliato.
ORDINE SPONTANEO |27
Tabella 2.2. Gioco del Falco e della Colomba (payoff dei giocatori di riga)
Falco a =(v-c)/2 c =0
Falco Colomba
Colomba b=v d = v/2
Nota: l’adattamento (numero di progenie generata) è uguale a più i payoffs del gioco
Il premio da dividere è indicato con v , c rappresenta il costo di perdere una lite, e la probabilità che un Falco ha di vincere una competizione con un altro Falco è (i Falchi sono identici) 1 2 . Le Colombe dividono il premio equamente e senza costi. La matrice dei payoff è raffigurata nella tabella (2.2). Si nota facilmente che fintanto c > v F e C non saranno un ESS. (Un modo pratico di cercare un ESS in ampie
matrici con payoff di riga è domandarsi se il termine sulla diagonale principale sia il maggiore della colonna. Se questo è vero, quella colonna rappresenta un ESS). I membri di questa popolazione sono accoppiati in modo casuale. Siano b ( p) f
e b ( p) i payoff attesi del Falco e della Colomba, rispettivamente, in una popolazione in cui la frazione di Falchi è p, i payoff attesi illustrati nella figura 2.2 sono: c
!
!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!b ( p) = pa + (1 p)b ! !
!
f
!
!
b ( p) = pc + (1 p)d
(2.10)
c
!
! ! Per illustrare l’uso dell’equazione del replicatore in un processo evolutivo basato sulla capacità riproduttiva (fitness), assumiamo che, alla fine di un periodo, ciascun membro della popolazione produca un numero di duplicati esatti (escludendo le mutazioni) uguale a più il payoff del gioco. In questo modo i payoff sono valutati in unità di figli sopravvissuti all’età riproduttiva, cioè, la fitness ( è chiamato “base di idoneità”). L’assunzione che un singolo membro (piuttosto che una coppia) generi progenie semplifica il modello; questa assunzione di clonazione o di riproduzione asessuata è una semplice (ma spesso utile) alternativa al modello più realistico basato sulla riproduzione sessuata. Normalizzando la popolazione totale all’unità, possiamo scrivere la frequenza di Falchi nella popolazione dell’anno successivo, come p' =
p(b + ) !! pb + (1 p)b + f
f
!
(2.11)!
!!!!!!!!!!!!!!!!
c
! Il numeratore deve essere interpretato in questo modo: “Quest’anno nella popolazione erano presenti p Falchi e ciascuno di loro ha generato b + figli, producendo p(b + ) Falchi il prossimo anno”. Il denominatore rappresenta il f
f
numero complessivo combinato di Falchi e Colombe per il prossimo anno. Data la normalizzazione dell’ampiezza della popolazione all’unità, i duplicati complessivi
28 | MICROECONOMIA
prodotti sono uguali alla media ossia a b .
!
Falchi come frazione della popolazione, p
!
Figura 2.2. I payoff dipendenti dalla frequenza nel Gioco del Falco e della Colomba. Il numero di copie è dato dai payoff più una costante
! Noi siamo interessati a p , quindi sottraendo p da entrambi i membri dell’equazione (2.11) avremo, p p' p =
{
p(b + ) p p(b + ) + (1 p)(b + )} ! !!!!!!!!!!!!!! (2.12)! b b f
f
c
Che, riordinando e usando i valori nella matrice dei payoff per esprimere (b b ) come 1/2(v pc) , diventa f
c
bp = p(1 p)(b b ) = p(1 p)1/2(v pc) !!!!!!!! f
c
!
(2.12’)!
La (2.12’) corrisponde esattamente all’equazione della dinamica del replicatore precedentemente derivata (mediante un percorso diverso) per il modello di segregazione abitativa e per il caso generale di rinnovamento del carattere culturale presentati nelle precedenti sezioni. I valori interni stazionari di p sono quelli per cui b ( p) = b ( p) . Usando l’equazione (2.10) e risolvendo per p * , la frequenza stazionaria f
c
di Falchi nella popolazione, abbiamo p* =
bd v = !! b+cad c
!
!!!!!!!!!!!!!!!
(2.13)!
! La (2.13) mostra come la frazione di equilibrio di Falchi sia crescente nel premio e decrescente nel costo della lotta. (Sostituendo p* = v /c nell’equazione (2.12’) si può verificare che il valore è stazionario). La condizione di eguaglianza nei payoff, che definisce la stazionarietà di p, rende chiaro che p * è un equilibrio di Nash: se la frazione di Falchi è p * , allora entrambe le strategie sono deboli risposte ottime. L’equilibrio su descritto è stabile? Notiamo che
ORDINE SPONTANEO |29
d(b b ) d {1/2(v pc)} = = 1/2c < 0 ! dp dp f
c
!!!!!!!(2.14)
!
! Ciò significa che un aumento nella prevalenza di Falchi svantaggerà i Falchi stessi (e di conseguenza indurrà una riduzione nella frequenza dei Falchi nel periodo successivo). La condizione di stabilità (2.14) richiede che la funzione del payoff atteso dei Falchi nella figura 2.2 sia “più ripida” (il valore assoluto della sua inclinazione sia maggiore) di quella delle Colombe. Nella dinamica del replicatore p =1 e p = 0 sono anche entrambi stazionari (il primo perché b (1) = b(1) , ma nessuno dei due è un equilibrio di Nash (come si può notare dal fatto che b (0) > b (0) e b (1) < b (1) ). Questo ci ricorda solo che, qualora esistesse un’unica strategia da replicare, la frequenza di una popolazione governata dalla dinamica del replicatore rimarrebbe invariata. Tale popolazione, però, potrebbe essere invasa da un mutante. f
f
c
f
c
Le proprietà di esistenza e stabilità di un equilibrio interno sono collegate al concetto di ESS nel seguente modo (per il caso generale in cui l’insieme di strategie è ( x, y) e p è la frazione della popolazione del tipo x ): se nessuna strategia è un ESS ,
ci sarà un equilibrio interno asintoticamente stabile. Se, invece, entrambe le strategie sono ESS, allora ci sarà un equilibrio interno non stabile mentre sia p =1 e p = 0 sono asintoticamente stabili (come vedremo a breve, nel gioco dell’assicurazione). In questo caso, l’equilibrio interno instabile è rappresentato dalla barriera d’invasione ( p˜ ) che è parte della definizione dell’ESS. Nella tabella 2.3 sono riassunte queste corrispondenze su una popolazione con due strategie, x e y . Tabella 2.3. ESS, l’esistenza e la stabilità di un equilibrio interno y è un ESS x è un ESS
y non è un ESS
p* (0,1) instabile p*=1 stabile
x non è un ESS p*=0 stabile p* (0,1) stabile Nota: p* è una frazione della popolazione di tipo x che è stazionaria nella dinamica del replicatore.
L’analisi della stabilità evolutiva fornisce previsioni sui risultati? Se nessuna delle due strategie è un ESS, se l’innovazione non viene impedita e se il processo di rinnovamento è governato dalla dinamica del replicatore, abbiamo allora una previsione chiara: dovremmo poter osservare frequenze della popolazione circa pari o esattamente uguali a p *. Se questo è il caso, ritornando agli esempi, ci aspetteremmo di trovare la coesistenza di famiglie ampie e piccole, pratiche commerciali oneste e corrotte, e simili. Otteniamo previsioni chiare anche in altri due casi: se una strategia è un ESS e l’altra no, allora ci aspettiamo di vedere una popolazione composta interamente da ESS. Questo accade perché, secondo le
30 | MICROECONOMIA
condizioni discusse in precedenza, ogni comportamento capace di invadere guadagnerà seguaci fino a diventare universale. Cosa accade se entrambe le strategie sono evolutivamente stabili? Come abbiamo visto nel capito 1, in questo caso la storia passata assumerà molto valore. Possiamo dire qualcosa di più. Si supponga che i membri di una popolazione numerosa siano accoppiati in modo casuale per giocare un gioco di assicurazione simmetrico i cui payoff sono descritti nella tabella 2.4 – per esempio, una variante del problema della piantagione di Palanpur nel capitolo 1 con cooperazione e defezione che rappresentano piantagione anticipata e piantagione ritardata, rispettivamente, e con i payoff come indicati. In un Gioco di Assicurazione, sia CC che DD sono risposte ottime reciproche, quindi i payoff devono essere tali che c < a e b < d , e (continuando l’esempio di Palanpur), assumeremo inoltre che a > d . Allora, sia p [0 , 1] la frazione di disertori nella popolazione; possiamo scrivere i payoff attesi come funzione di p , ed eguagliando i payoff attesi per le due strategie, Cooperare e Defezionare troviamo i valori stazionari di p: p* =
ca ba+cd
! ! !
! Tabella 2.4. Gioco dell’Assicurazione (payoff riga) Cooperare Non Cooperare (D) Cooperare "(C,C)=a "(C,D)=b Non Cooperare(D) "(D,C)=c "(D,D)=d Nota: "(D,C)<"(C,C)>"(D,D)>"(C,D)
I payoff attesi dal Cooperare e Defezionare sono rappresentati da b e b , rispettivamente. Il denominatore di p * rappresenta l’effetto delle variazioni in c
d
p dovute alla differenza tra i payoff di cooperazione e i payoff di defezione ossia, d (bc bd ) dp
= (C , D ) (C , C ) + (D, C ) (D, D ) = b a + c d < 0 !
! Se > 0 , allora, b ( p * + ) < b ( p * + ) e quindi i disertori saranno relativamente avvantaggiati. Ciò implica che un piccolo aumento nella frequenza dei disertori causerà un ulteriore incremento di p. Un ragionamento simile mostra Che p = 0 e c
d
p =1 sono ESS ( e quindi sono equilibri di Nash simmetrici e stabili nella dinamica
del replicatore). “La storia conta” in questa situazione perché, escludendo eventi esogeni, una popolazione per cui p < p * nel recente passato, si muoverà verso p = 0 . Possiamo
ORDINE SPONTANEO |31
dire ancora di più. Si supponga di osservare un gran numero di isole sulle quali gruppi isolati di individui giocano lo stesso gioco di assicurazione in un solo round in un lungo periodo di tempo. Inizialmente le loro strategie sono state determinate casualmente, dopo di che essi hanno aggiornato il loro comportamento secondo la dinamica del replicatore. Se l’equilibrio interno instabile p * è minore di 1/2, allora, avremmo ragione di credere che la maggior parte dei gruppi sarà composta interamente da disertori. Se le strategie fossero inizialmente scelte in modo casuale, allora il valore atteso della frequenza iniziale della popolazione sarebbe 1/2, e quindi sarebbe vero che per la maggior parte dei gruppi p > p *, che implica p > 0 . Come risultato, molti gruppi evolverebbero verso una defezione uniforme. Si noti che questo può avvenire anche se (come nell’esempio di Palanpur) la mutua cooperazione fosse dominante in termini di payoff: dove l’equilibrio di defezione mutuale è dominante rispetto al rischio noi sappiamo (dalla definizione di dominanza rispetto al rischio) che p* <1/2 così il bacino di attrazione dell’equilibrio nel quale tutti defezionano sarà il più grande dei due. Il risultato con il bacino di attrazione più grande avviene con maggiore probabilità semplicemente poiché gli eventi casuali collocano la popolazione con più probabilità in bacini di attrazione più grandi che più piccoli. Il gioco di assicurazione con condizioni iniziali determinate stocasticamente illustra due importanti seppur non intuitivi risultati. Primo, aggiungere variazioni stocastiche ad un modello può permettere previsioni più forti di quelle ottenibili senza casualità. Prevedere che tutti defezionano, nell’esempio precedente, come risultato più probabile, è più informativo che dire “la storia conta”. In questo caso, il caso fornisce ciò che è chiamato meccanismo di selezione dell’equilibrio, cioè, un modo per identificare un particolare equilibrio come il più probabile di un gioco quando esiste più di un equilibrio. In secondo luogo, anche gli equilibri di Nash asintoticamente stabili possono essere di fatto irrilevanti per predire risultati sociali; in questo caso, il caso opera una selezione contraria all’equilibrio dominante rispetto ai payoff. La teoria dei giochi evolutiva di tipo stocastico si occupa di studiare casi di questo tipo. Nel capitolo 12 applicheremo l’idea che il caso a volte è un meccanismo di selezione di equilibri forti per spiegare perché alcune istituzioni sono più comuni di altre, e per investigare il processo di innovazione delle istituzioni. Importanti interrogativi sono rappresentati dallo studio delle determinanti dell’ampiezza del bacino di attrazione di un equilibrio e dall’analisi di quali siano i processi stocastici (o meno) che possono spingere una popolazione da un bacino di attrazione ad un altro.
32 | MICROECONOMIA
Introduciamo adesso un semplice esempio che rappresenta la relazione tra giochi ed evoluzione istituzionale.
L’ E V O L U Z IO N E
D E I D IR IT T I D I P R O P R IE T À
Il gioco del Falco e della Colomba può far luce sulle questioni istituzionali sollevate nel capitolo 1. La popolazione di equilibrio p* = v /c è un risultato desiderabile? Chiaramente no. Il payoff medio è massimizzato per p = 0 , in altre parole, quando non ci sono Falchi. Quindi in questa popolazione l’equilibrio è Pareto-inferiore ad ogni valore p < p * (si noti che nella figura 2.2 i payoff dei Falchi e delle Colombe sono entrambi decrescenti nella frazione di Falchi, quindi entrambi trarranno vantaggio quando la frazione di Falchi si riduce). L’equilibrio del Falco e della Colomba è un analogo biologico al fallimento di mercato: la distribuzione stazionaria di tipi comportamentali determinati geneticamente, nella popolazione generata da selezione naturale basata sulla fitness differenziale, fallisce nel massimizzare la fitness media. In p *, sia Falchi che Colombe agiscono seguendo la propria risposta ottima; nessuno potrebbe aumentare la propria fitness cambiando tipo (se possibile). Ma la fitness media è massimizzata in p = 0 . Questo non ci sorprende dato che il successo riproduttivo di ciascun tipo – la sua fitness – non tiene conto dell’effetto che ciascuno ha sulla fitness degli altri. Dato l’incubo Hobbesiano di lotta che l’equilibrio del Falco e la Colomba descrive, non sorprende il fatto che il gioco sia stato usato per indagare sulla possibilità dell’emergenza spontanea di convenzioni che riguardano la proprietà e la divisione di risorse di valore. Le possibilità includono la messa al bando dei Falchi, l’individuare con una etichetta i Falchi e dare alle Colombe l’opzione di rifiutare ogni interazione con un Falco, l’adottare una regola di appaiamento che renda gli accoppiamenti con i simili più comuni (e di conseguenza assicurare che i costi derivanti dall’incontro con un Falco siano sopportati prevalentemente dai Falchi stessi, internalizzando così le diseconomie che essi generano), tirare una moneta quando due Falchi si incontrano invece che farli lottare in modo da determinare chi ottiene V, e così via.
Le questioni evolutive e costituzionali possono essere ora considerate congiuntamente: come può la struttura delle interazioni sociali – chi è accoppiato con chi, per giocare quali giochi – essere modificata in modo da produrre risultati desiderabili in popolazioni di attori autonomi come quelli descritti precedentemente?
ORDINE SPONTANEO |33
Tabella 2.5. Gioco dl Falco-Colomba-Borghese (payoff dei giocatori riga)
Falco Colomba Borghese
Falco Colomba
Borghese
(v-c)/2 v 0 v/2 (v-c)/4 v/2+v/4
v/2+(v-c)/4 v/4 v/2
! Sotto quali condizioni questi rimedi costituzionali sono, con qualche probabilità, evolutivamente vincenti (vale a dire, capaci di proliferare anche se insoliti)? Riferendoci al gioco precedente ci chiediamo: quali cambiamenti nella struttura delle interazioni sociali potrebbero ridurre p * , la frazione di equilibrio dei Falchi, o addirittura eliminare interamente i Falchi? Le perdite che caratterizzano l’equilibrio Falco-Colomba sono la conseguenza della lotta dei Falchi, non del loro sfruttamento delle Colombe (questa idea può sembrare ingiusta, ma lo sfruttamento è svolto senza perdite). Una soluzione è, quindi, quella di trovare il modo di ridurre il numero di interazioni competitive. Un modo, proposto da uno degli ideatori di questo gioco, il biologo John Maynard Smith (1974), è quello di supporre che il premio sia un’area, come la ragnatela di un ragno o un territorio di foraggio, che sia occupata o posseduta in ogni momento da uno dei due nella coppia, e poi introdurre una strategia che è dipendente dallo status di proprietario. La strategia che Maynard Smith suggerì è “se sono proprietario gioco Falco, se intruso gioco Colomba”, che egli definì “Borghese” (vedi tabella 2.5). Assumiamo che il possesso non sia mai in dubbio e che in ogni interazione i membri della coppia abbiano la stessa probabilità di essere proprietari. Per esempio, quando un Borghese incontra un Falco, per metà del tempo il Borghese non è proprietario e quindi si comporta come una Colomba, evitando la lotta, mentre nell’altra metà del tempo il Borghese, in quanto proprietario, litiga (cosa che ovviamente fa anche il Falco). Quando il Borghese lotta, con probabilità 1/2 vince, guadagnando un payoff atteso di (v c) / 4 . L’insieme di strategie (ampliato dalla nuova strategia) e la matrice dei payoff attesi figura come in tabella (i termini in grassetto riproducono semplicemente i payoff del gioco standard). Si noti subito che il Borghese è un ESS (si paragoni il payoff in diagonale con gli altri termini nella colonna del Borghese). Deduciamo che una popolazione Borghese non può essere invasa né da Falchi né da Colombe. L’amadriade maschio (Papio hamadryas) ed un certo numero di altri animali sembrano comportarsi seguendo la strategia del Borghese, rispettando il possesso di femmine o di cibo di altri anche più piccoli membri della stessa specie (Sigg e Falett 1985). La possibilità che i diritti di proprietà possano essere emersi in questo modo
34 | MICROECONOMIA
non preclude la possibilità dell’emergere di altre regole di divisione e proprietà, possibilmente in competizione. Si noti che mentre il Borghese difende ciò che è suo, una strategia equivalente da noi definita “Robin Hood” sarebbe: “ se sono un intruso, agisco come un Falco, se sono possessore, come una Colomba”. (Si potrebbe pensare che questo sia bizzarro ma Maynard Smith (1974) riferisce che almeno un animale – un ragno con il nome improbabile di Oecibus civitas – si comporta in questo modo, riconducendoci al gioco delle sedie musicali versione “ragno”). Le proprietà evolutive del Borghese e del Robin Hood sono identiche poiché entrambi riducono la frequenza di lotte nello stesso modo (se sorgono dubbi, si trascriva la matrice rilevante dei payoff). La chiave del successo del Borghese e del Robin Hood è che entrambi usano un’informazione aggiuntiva – chi è il possessore – per creare una asimmetria tra i giocatori (poiché solo uno della coppia può essere il possessore) in modo da distribuire il premio rivendicato senza l’uso della lotta (assumendo che multipli intrusi del tipo Robin Hood non arrivino simultaneamente). Qualunque altra asimmetria, purchè non sia interpretata erroneamente, avrebbe lo stesso effetto. È, però, più difficile di quanto si pensi trovare asimmetrie che funzionino. Si provi con “Se più alto dell’altro, gioca Falco”. Cosa succederebbe tra due giocatori della stessa altezza? Il possesso, però, può essere più ambiguo della superiorità nell’altezza. Tra gli amadriadi maschi, per esempio, ci sono frequenti lotte causate dall’ambiguità nel possesso. Consideriamo il caso in cui in una frazione di tempo μ [0 , 1] i giocatori Borghesi intrusi credono, sbagliando, di essere possessori, o in ogni caso agiscono in quel modo, giocando Falco, mentre nel ruolo del possessore continuano a giocare Falco come prima. Può questa strategia, definita come “Borghese Litigioso”, essere un ESS? Consideriamo i payoff attesi di questa strategia quando è giocata contro se stessa per determinare se il Borghese Litigioso può essere una risposta ottima reciproca (e quindi un ESS). Usando B( μ) per riferirci alla strategia del Borghese Litigioso, abbiamo (B (μ ), B (μ )) = 1 2 (1 μ )v + μ 1 2 (v c ) + 1 2 μ 1 2 (v c ) = 1 2 (v μ c )
!
! Il primo termine nel membro destro dell’espressione esprime il fatto che, con probabilità un mezzo, l’individuo è un possessore, e gioca Falco, affronta un intruso che quando è un Borghese Litigioso gioca correttamente Colomba (1 μ) delle volte, concedendo V al possessore, ma μ volte “sbagliando” gioca Falco, conducendo al payoff di conflitto (v c) /2 . Il secondo termine ripete il payoff di conflitto dell’errore per il caso in cui l’individuo sia un intruso. Come ci si aspetta, il payoff è decrescente
ORDINE SPONTANEO |35
nel grado di controversia sui diritti di proprietà, μ , e riproduce il payoff del Falco contro il Falco quando μ =1, e il payoff del non litigioso Borghese quando μ = 0 . Un Falco invasore potrebbe proliferare in una popolazione omogenea di Borghesi Litigiosi? I payoff attesi dei Falchi contro i Borghesi Litigiosi sono (H , B (μ )) = 1 2 (v μ c ) + 1 4 (1 μ )(v c ) !
! Siccome questa espressione è chiaramente minore di (B( μ),B( μ)) (B (μ ), B (μ )) per μ <1, l’invasione dei Falchi fallirà. Consideriamo il payoff atteso di una Colomba mutante in un mondo di Borghesi Litigiosi: (1 μ)v / 4 , che, per valori di μ <1 supera (v μc) /2 . Da ciò deduciamo che giocare Colomba è la risposta ottima al Borghese Litigioso. Pertanto il Borghese Litigioso non è un ESS. Se la controversia sui diritti di proprietà è sufficientemente probabile, le Colombe mutanti prolifereranno. Un’invasione di Colombe su una popolazione di Borghesi Litigiosi può sembrare sorprendente. Questo risultato deriva direttamente dal fatto che i diritti di proprietà sono mal definiti o contestati per qualche ragione, e quindi la strategia del Borghese Litigioso non elimina completamente i conflitti costosi. Al contrario, la Colomba soddisfa questa necessità anche se il possesso è ambiguo per la semplice ragione che il comportamento della Colomba non dipende dal possesso. Un’importante deduzione: dove i conflitti sono costosi, regole di equa divisione possono essere vincenti evolutivamente, anche se sono vulnerabili rispetto ad occasionali sfruttamenti da parte di coloro che non rispettano le regole. Gli errori dei Borghesi Litigiosi sono un esempio di una risposta non ottimale di gioco (a volte chiamata idiosincratica o eccentrica). Come la trattazione della dominanza rispetto al rischio del capitolo 1 e della casualità, nel gioco di assicurazione precedente l’analisi della strategia del Borghese Litigioso ci suggerisce che il caso (nella forma di comportamento bizzarro) può aggiungere più di un disturbo ad una dinamica evolutiva. Ma fin a qui il gioco idiosincratico, come la mutazione, è stato semplicemente inaspettato e saltuario piuttosto che significativo. Come vedremo, a volte azioni modellate come “errori” sono fatte per una ragione (nonostante questa non sia catturata dal modello). L’importanza delle azioni di gioco che non rappresentano risposte ottime è sviluppata successivamente nei modelli dei processi delle azioni collettive e cambiamenti istituzionali (capitolo 12) e nella co-evoluzione delle preferenze e delle istituzioni (capitolo 13).
36 | MICROECONOMIA
C O N C L U S IO N I : I S T I T U Z I O N I A C C ID E N TA L I ? Concludiamo con due interrogativi: I modelli evolutivi spiegano i processi storici reali? E, se le istituzioni si fossero evolute spontaneamente, quanto sarebbe stato efficace il lavoro di coordinamento delle attività umane svolto? Il modello precedente mostra che i diritti privati di proprietà avrebbero potuto evolversi spontaneamente, cioè, senza definizione ed enforcement da parte degli stati o da terze parti. Sarebbero comparsi? A questo interrogativo non è ancora stata data risposta. Non solo la proprietà ma altre istituzioni economiche – la moneta e i mercati, per esempio – si è detto si siano evoluti in questo modo, come dato storico. Hayek (1945:528) scrisse: “il regime dei prezzi è solo una di quelle strutture che l’uomo ha imparato ad usare…dopo essserci inciampato sopra senza comprenderlo”. Robert Sugden (1989:86) cerca di spiegare come “le norme che regolano l’azione umana possano evolvere senza un disegno umano consapevole e possano conservarsi senza che ci sia nessun meccanismo che ne imponga l’enforcement”. Egli chiama questo “ ordine spontaneo” e continua suggerendo “che l’istituzione della proprietà stessa potrebbe in definitiva essere una forma di ordine spontaneo”. Di contro, Marx (1967:42), descrive l’eclissi della proprietà comune in favore della proprietà individuale come “la violenta creazione di una classe di proletari fuorilegge, la cruenta disciplina che li ha trasformati in lavoratori salariali, e l’azione vergognosa dello Stato che impiega la polizia per accelerare l’accumulazione del capitale”, e conclude (1967:760): “se la moneta ‘viene al mondo con una macchia di sangue congenita su una guancia’, il capitale viene bagnato dalla testa ai piedi, in ogni orifizio, di sangue e sporcizia.” Non si può descrivere questo processo come spontaneo. Naturalmente nessuno si aspetta che un solo modello semplice come il gioco del Falco, la Colomba e il Borghese fornisca una struttura adeguata per comprendere qualcosa di così complesso e storicamente dipendente come il processo mediante cui i diritti di proprietà sono stati modificati durante gli anni. I modelli non spiegano la storia, ma possono dirci dove guardare. Valutare seriamente l’adeguatezza esplicativa di questo modello (o modelli) dovrebbe richiedere uno studio attento del tipo che è stato dedicato alla trasformazione dai diritti di proprietà feudali a quelli moderni (Aston and Philpin, 1985), la fine della schiavitù (Genovese, 1965; Fogel e Engerman, 1974), la trasformazione dei diritti di proprietà durante il colonialismo o la rivoluzione industriale (Horwitz 1977, Sokoloff e Engerman 2000), o la modernizzazione di semplici società (Ensminger 1996). Le differenze nel punto di vista di Hayek e Sugden da un lato e Marx dall’altro non riguardano l’idea di modello evolutivo per se ma quali devono essere gli ingredienti basilari di un adeguato
ORDINE SPONTANEO |37
modello evolutivo. Per esempio, dalla citazione precedente risulta chiaro che in un modello di ispirazione marxista ci sarebbe un ruolo sostanziale dell’azione collettiva coordinata e del conflitto tra gruppi, mentre per gli altri autori questi aspetti del processo storico sarebbero considerati meno importanti. I modelli evolutivi renderebbero un gran servizio allo studio del cambiamento istituzionale se esso potesse fornire loro una struttura per integrare gli effetti aggregati di un gran numero di individui, ciascuno dei quali agisce singolarmente e cercando di ottenere i suoi scopi, mentre occasionalmente agisce unitamente ad altri, per i quali il cambiamento istituzionale è un progetto, non un incidente. Torneremo su queste domande nel capitolo 11 (dove il modello segue la tradizione dell’ordine spontaneo) e nel capitolo 12 (dove il modello rappresenta un ibrido DarwinianoMarxista). Il secondo ed ultimo interrogativo è il seguente: quanto buono è “l’Orologiaio Cieco”? Se le regole che governano le azioni sociali sono evolute spontaneamente piuttosto che progettate, nonostante tutto, potrebbero essere efficienti? La sorprendente affermazione che deriva dalle teorie della “mano invisibile” sostiene che esse potrebbero esserlo. Il teorema fondamentale di Fisher, un famoso risultato in biologia, asserisce che, sotto appropriate condizioni, la selezione naturale genera livelli di fitness medio crescenti (Fisher, 1930, Price, 1972). Un ragionamento analogo è comune nelle scienze sociali: Douglass North (1981) riassunse questo punto di vista come segue, “ La competizione a dispetto della scarsità molto diffusa ordina che le istituzioni più efficienti sopravvivranno e quelle inefficienti periranno”.7 Proprio come la massimizzazione della fitness suggerisce certe caratteristiche del progetto della specie in diverse ecologie, lo stato assiomatico degli esiti efficienti in alcuni modelli economici fornisce proposizioni forti sui tipi di istituzioni che ci si aspetta di trovare in determinati ambienti (Williamson, 1985; Ouchi, 1980). Analogamente, un’idea centrale nel materialismo storico marxista (espressa nell’epigrafe al capitolo 11) è che il progresso della tecnologia può rendere le istituzioni attuali anacronistiche. Quando questo accade esse sono sostituite da istituzioni capaci di coordinare meglio l’attività economica date quelle che vengono definite “ le nuove forze di produzione”. Nella visione marxista, le istituzioni, infine, si adattano “ai bisogni della questione da risolvere” imposti dal progresso !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 7
Vedi Jensen e Meckling (1979). North, il cui lavoro ha fatto molto per far svanire questo punto di vista, ha commentato:” Ma il fatto che la crescita sia stata più eccezionale che il ristagno o il declino suggerisce che i diritti di proprietà ‘efficienti’ sono insoliti nella storia” (North 1981:6).
38 | MICROECONOMIA
tecnologico. Modelli economici che sostengono affermazioni di questo tipo sono difficili da trovare e da sviluppare. I risultati della mano invisibile non si applicano: le assunzioni del teorema fondamentale di Fisher non sono meno stringenti di quelle del teorema economico con lo stesso nome. Entrambi escludono tipi di interazione empiricamente importanti: nel caso del teorema di Fisher, l’effetto epistatico (non additivo) ed altri effetti di fitness dei geni dipendenti dalla frequenza e, per i teoremi economici, gli effetti interpersonali non soggetti a contrattazione completa (esternalità). Le interazioni con payoff individuali dipendenti dalla frequenza, come quelli considerati in questo e nel precedente capitolo, violano queste assunzioni. Ricordiamo che la media di fitness di una popolazione formata da Falchi e Colombe non è massimizzata nella frequenza di equilibrio dei Falchi, v c , bensì in zero. Questa media di idoneità massima, Dawkins (1989b:200) fa notare, potrebbe essere implementata da “una cospirazione delle Colombe” ma non verrebbe fuori attraverso processi evolutivi spontanei, come descritti in questo capitolo. Nessuno dei due teoremi fondamentali della biologia e dell’economia viene applicato in casi in cui le interazioni sono del tipo descritto in queste semplici ambientazioni apparentemente comuni . L’idea chiave qui afferma semplicemente che l’ottimizzazione individuale – intenzionale o implicita come nel caso della selezione naturale basata sulle differenze di fitness – non produce generalmente risultati globali ottimali, anche se gli individui sono lungimiranti e il processo di selezione opera in orizzonti di tempo molto lunghi8. L’idea che la selezione competitiva delle istituzioni a livello di gruppo (per esempio, le convenzioni studiate nel capitolo 1) possa ottenere ottimi risultati solleva problemi anche più importanti di quelli che affrontano le questioni della mano invisibile applicata ai caratteri individuali o alla fornitura di beni individuali. Ci sono quattro ragioni perché questo è vero. Primo, le istituzioni manifestano concetti equivalenti sia alle economie esterne (spillover) sia ai rendimenti crescenti generalizzati: la praticabilità e l’efficacia di un’istituzione dipende tipicamente sia dalla frazione della popolazione governata da esso e sia dall’insieme delle istituzioni coesistenti. Alcune istituzioni possono essere complementari, accrescendo il funzionamento delle altre, mentre alcune possono !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 8
Il massimo che si può dire è che le strategie strettamente dominate saranno eliminate secondo dinamiche evolutive plausibili – questo perché le strategie dominate non sono mai risposte ottime, indipendentemente da cosa gli altri facciano, così il problema delle interazioni sociali non contrattuali non viene sollevato. Straordinariamente, anche questa debole affermazione non è vera nelle dinamiche in tempo discreto (Weibull 1995).
ORDINE SPONTANEO |39
ridurre l’efficacia di altre istituzioni inducendo ciò che viene detto “spiazzamento istituzionale”. (Torneremo su queste problematiche – con esempi – nel capitolo conclusivo). Questi possono essere interpretati come corrispondenti istituzionali delle esternalità positive e negative tra individui, ed essi rendono altamente improbabile che un processo di selezione competitiva tra istituzioni a livello di gruppo si imbatta nella combinazione più efficace. I comportamenti prescritti da un’istituzione sono risposte ottime reciproche e a causa delle complementarietà istituzionali; tipicamente esistono configurazioni multiple di istituzioni stabili. Alcune di queste potrebbero essere molto inefficienti e persistere ancora dopo lunghi periodi di tempo. Esistono svariati esempi, documentati ampiamente nella letteratura storica ed antropologica. Gli abitanti di Fore in Nuova Guinea persistono in una forma di cannibalismo fatale per loro stessi. La gente della Tasmania e gli islandesi affamati, furono circondati per secoli da oceani che abbondavano di pesce che non si sono mai preoccupati di cacciare9. (Gli abitanti della Tasmania sono stati pescatori ma per ragioni sconosciute hanno smesso di esserlo 4000 anni fa). Secondo, anche dove esistono processi evolutivi che selezionano tra istituzioni a livello di gruppo, questi generalmente falliranno nell’implementare soluzioni efficienti. Una capacità militare di gruppo (piuttosto che ogni plausibile misura di efficienza) potrebbe incidere sul successo in un conflitto tra gruppi (capitolo 13). Una convenzione dominante rispetto ai payoff (per esempio, la semina anticipata a Palanpur) può essere scavalcata da una dinamica evolutiva all’interno del gruppo poiché l’altro equilibrio è dominante rispetto al rischio e quindi ha un bacino di attrazione più ampio (capitolo 12). Terzo, l’intervallo di variazione comportamentale od istituzionale in cui la selezione ha luogo può essere altamente ristretto. Come Ugo Pagano (2001) ha fatto notare, la creazione di nuove istituzioni è affine all’emergere di una nuova specie; richiede la confluenza di un ampio numero di variazioni improbabili nel presente. Tuttavia, sin da quando Darwin ha affrontato il problema nelle Origini della Specie, la produzione di progetti innovativi attraverso variazioni casuali è rimasto un enigma. I biologi riconoscono “nicchie ecologiche libere” (che persistono in un lungo periodo di tempo) che sono capaci di sostenere organismi che occupano nicchie simili altrove, ma mancanti di mutazioni ed altri eventi casuali tali da permettere la loro esistenza (Maynard Smith 1998: 289). Analogamente, le comuni caratteristiche !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 9
Durham (1991), Edgerton (1992), Eggertsson (1996), Henrich (2002).
40 | MICROECONOMIA
comportamentali umane, come ad esempio punire chi non rispetta le regole, potrebbero non essere apparse pienamente sviluppate come risultato di una singola mutazione o di una innovazione comportamentale da parte di un singolo individuo (una norma comune è anche necessaria, un castigatore solitario incorrerebbe in rischi in grado di ridurre la fitness). C’è una miriade di varietà di comportamenti umani ed istituzioni che non sono ancora stati sperimentati. Infine, il tasso di cambiamento indotto dai processi di selezione del mondo reale – che operano su caratteristiche geneticamente o culturalmente trasmesse – può essere lento, relativamente alla velocità di cambiamento indotta da altre fonti, come gli eventi casuali, i cambiamenti esogeni nella conoscenza, il numero di tipi di individui che competono, di organizzazioni, o di tecnologie. Questi quattro punti possono essere espressi visivamente. I processi di selezione implementano una specie di scalata in collina, ma la cima del colle non ha nessuna stretta relazione con criteri normativi come l’efficienza. Ci possono essere molte cime, tanto che una popolazione può non scoprire mai molto della topografia e può scalare la collina sbagliata; la pendenza può essere confusa da spostamenti nella topografia in modo tale che nessuna cima venga mai raggiunta. Hayek fu uno dei principali sostenitori degli argomenti della mano invisibile, e ha avanzato un’attenta argomentazione contro i tentativi di compromesso dei risultati dei processi di selezione evolutiva. Egli fu tuttavia cauto circa ogni affermazione sull’ottimalità di ciò che l’evoluzione produce:” Io non sostengo che i risultati dei processi evolutivi siano necessariamente buoni più di quanto io sostenga che altre cose che sono a lungo sopravvissute come gli scarafaggi abbiano un valore morale” (Hayek 1988:27). Il ragionamento precedente mostra che le argomentazioni riguardo alla mano invisibile sono false quando sono applicate ai caratteri istituzionali e comportamentali, ma non preclude altri modelli mediante i quali i processi evolutivi possono essere mostrati per implementare soluzioni efficienti, almeno in un senso approssimativo o di second best. E anche se noi dovessimo concludere che l’orologiaio cieco non è un così buon artigiano, questo non diminuirebbe l’importanza degli approcci evolutivi. Ritorneremo su questi interrogativi quando considereremo le proprietà di efficienza del processo di cambiamento istituzionale nei capitoli 11 e 13, introducendo due approcci – teoria dei giochi stocastica evolutiva e la dinamica evolutiva basata sulla selezione multi-livello. Entrambi gli approcci danno un’espressione analitica di versioni sorprendentemente forti delle argomentazioni sulla mano invisibile. Farà un’apparizione anche una cospirazione di Colombe.
ORDINE SPONTANEO |41
!"#$%"& $’(")*"+,"-.%/#"0")
Aston, T. H. and C. H. E. Philpin, Eds. (1985). The Brenner Debate: Agrarian Class Structure and Economic Development in Pre-Industrial Europe. Cambridge, Cambridge University Press. Axelrod, R. and W. D. Hamilton (1981). "The Evolution of Cooperation." Science 211: 1390-1396. Benabou, R. (1993). "Workings of a City: Location, Education, and Production." Quarterly Journal of Economics 108: 619-652. Bowles, S., D. Gordon, et al. (1983). "Hearts and Minds: A Social Model of U.S. Productivity Growth." Brookings Papers on Economic Activity(2): 381-450. Bowles, S. (2001). Individual Interactions, Group Conflicts, and the Evolution of Preferences. Social Dynamics. S. Durlauf and P. Young. Cambridge, MA, MIT Press: 155-190. Boyd, R. and P. J. Richerson (1985). Culture and the Evolutionary Process. Chicago, University of Chicago Press. Durham, W. H. (1991). Coevolution: Genes, Culture, and Human Diversity. Stanford, Stanford University Press. Edgerton, R. B. (1992). Sick Societies: Challenging the Myth of Primitive Harmony. New York, The Free Press. Eggertsson, T. (1966). "No Experiments, Monumental Disasters: Why it Took a Thousand Years to Develop a Specialized Fishing Industry in Iceland." Journal of Economic Behavior and Organization 30(1): 1-23. Ensminger, J. (1996). Making a Market: The institutional transformation of an African society. Cambridge, Cambridge University Press. Fisher, R. A. (1930). The Genetical Theory of Natural Selection. Oxford, Clarendon Press. Fogel, R. and S. Engerman (1974). Time on the Cross; the Economics of American Negro Slavery. Boston, Little, Brown. Genovese, E. (1965). The Political Economy of Slavery; Studies in the Economy & Society of the Slave South. New York, Pantheon. Hallward-Driemeier, G. Iorossi, et al. (2001). Manufacturing Productivity in East Asia: Market Depth and Aiming for Exports, World Bank. Hayek, F. A. (1988). The Fatal Conceit: The Errors of Socialism. Chicago, University of Chicago Press. Hayek, F. A. (1945). "The Use of Knowledge in Society." American Economic Review 35(4): 519-530. Henrich, J. (2002). "Demography and Cultural Evolution: Why adaptive cultural processes produced maladaptive losses in Tasmania." Hibbs Jr., D. A. (2000). "Wage Dispersion and Productive Efficiency: Evidence for Sweden." Journal of Labor Economics 18(4): 755-782. Hirsch, M. W. and S. Smale (1974). Differential Equations, Dynamical Systems, and Linear Systems. San Diego, Academic Press. Hoff, K. and A. Sen (2002). "Home-ownership, Community Interactions, and Segregation." Horwitz, M. (1977). The Transformation of American Law. Cambridge, Harvard University Press. Hume, D. (1898). David Hume, The Philosophical Works. London, Longmans, Green, and Co.
42 | MICROECONOMIA
Jensen, M. C. and W. H. Meckling (1979). "Rights and Production Functions: An Application to Labor-Managed Firms and Codetermination." Journal of Business 52(4): 469-506. Luria, D. (1996). "Why Markets Tolerate Mediocre Manufacturing." Challenge 39(4): 11-16. Mandeville, B. (1924). The Fable of the Bees, or Private Vices, Publick Benefits. Oxford, Clarendon Press. Mare, R. and E. Bruch (2001). Spatial inequality, neighborhood mobility, and residential segregation. University of California at Los Angeles, Department of Sociology. Marx, K. (1976). Capital: A critique of political economy, Volume I. Harmondsworth, Penguin (original publication, 1867). North, D. C. (1981). Structure and Change in Economic History. New York, W. W. Norton & Co. North, D. C. (1990). Institutions, Institutional Change and Economic Performance. Cambridge, UK, Cambridge University Press. Ouchi, W. (1980). "Markets Bureaucracies and Clans." Administrative Science Quarterly 25: 129-141. Pagano, U. (2001). The Origin of Organizational Species. The Evolution of Economic Diversity. U. Pagano and A. Nicita. London, Routledge. Price, G. R. (1972). "Fisher's 'Fundamental Therom' Made Clear." Annals of Human Genetics 36(129): 129-140. Smith, J. M. (1998). Evolutionary Genetics. New York, Oxford University Press. Sokoloff, K. and S. Engerman (2000). "Institutions, Factor Endowments, and Paths of Development in the New World." Journal of Economic Perspectives 14(3): 217-232. Sugden, R. (1989). "Spontaneous Order." Journal of Economic Perspectives 3(4): 8597. Taylor, P. and L. Jonker (1978). "Evolutionarily Stable Strategies and Game Dynamics." Mathematical Biosciences 40(2): 145-156. Townsend, J. (1971). A Dissertation on the Poor Laws by a Well Wisher to Mankind. Berkeley, University of California Press [1786]. Weibull, J. W. (1995). Evolutionary Game Theory. Cambridge, MA, MIT Press. Williamson, O. E. (1985). The Economic Institutions of Capitalism. New York, Free Press.
III
P REFERENZE E COMPORTAMENTO
Gli autori di scritti politici hanno stabilito questa come massima, che nell’architettare qualsiasi sistema di governo… si dovrebbe presupporre che ogni uomo sia un delinquente e che non abbia altro fine, in tutte le sue azioni, diverso dal suo interesse privato. Attraverso questo interesse dovremmo governarlo, e, per mezzo suo, farlo cooperare, nonostante la sua insaziabile avarizia e ambizione, al bene pubblico. - David Hume, Essays: Moral, Political and Literary (1742)(Hume (1964):117-118)
Ritorniamo ancora allo stato di natura e consideriamo gli uomini come se… spuntassero dalla terra, ed improvvisamente, come funghi, giungessero all’età adulta senza nessun tipo di legame con gli altri. - Thomas Hobbes, De Cive, (1651) (Hobbes (1949):100)
In Illinois la coltivazione dei cereali è un grosso business. Per mezzo di tecnologie ad elevata intensità di capitale e business plan elaborati da specifici software, alcuni agricoltori coltivano anche più di un migliaio di acri, la maggior parte dei quali affittata da differenti proprietari. A metà degli anni novanta più della metà degli accordi tra agricoltori e proprietari erano contratti di mezzadria. Di questi, più di quattro quinti prevedevano che il raccolto fosse diviso a metà tra i due contraenti. Nel sud dello stato, dove il suolo è in media meno fertile, ci sono contee in cui sono comuni contratti che assegnano al mezzadro due terzi del raccolto. Nonostante la considerevole variabilità della qualità della terra, in queste contee sono pochi i contratti caratterizzati da una ripartizione al cinquanta percento (o in proporzioni differenti da due terzi). In confronto, la coltivazione del riso nell’ovest del Bengala a metà degli anni settanta sembra anni luce lontana da quella dell’Illinois. Gli agricoltori, poveri ed analfabeti, vivevano in villaggi isolati da strade impraticabili per gran parte dell’anno e senza mezzi di comunicazione elettronica. Riuscivano a malapena a sopravvivere su appezzamenti della dimensione media di soli due acri. Nonostante ciò, come
2 | MICROECONOMIA
abbiamo già visto nel Prologo, per un aspetto gli agricoltori del Bengala assomigliavano a quelli dell’Illinois: in entrambi i casi mezzadri e proprietari dividevano il raccolto al cinquanta percento in più di due terzi dei contratti (non solo: Ibn Battuta, la cui visita in Bengala è stata menzionata nel Prologo, aveva notato e deplorato esattamente la stessa divisione del raccolto sei secoli prima). Anche se era possibile osservare altre tipologie contrattuali, nessuna di queste costituiva più dell’8 percento del totale.1 Un esempio ancora più sorprendente è rappresentato dagli Stati Uniti del Sud dopo la Guerra Civile, dove i contratti di mezzadria ripartivano il raccolto in parti uguali tra proprietario terriero e mezzadro senza tenere conto se la terra fosse di buona o cattiva qualità o se il mezzadro fosse un uomo bianco libero o uno schiavo recentemente liberato: “Questa forma di mezzadria venne istituita ovunque nel Sud. Si diffuse in tutte le possibili combinazioni di qualità del suolo e condizioni di lavoro” (Ransom and Sutch 1977, p.91, 215). Il problema sollevato dalla mezzadria con divisione al cinquanta percento è il seguente: una divisione equa del raccolto significa che, per il loro sforzo e per gli altri input utilizzati, i mezzadri che lavorano una terra fertile avranno una ricompensa maggiore rispetto ai mezzadri che lavorano una terra poco fruttuosa. Ma se alcuni mezzadri desiderano lavorare per un minor guadagno sulla terra di qualità inferiore, perché i proprietari della terra di buona qualità dovrebbero concedere ai loro mezzadri metà del raccolto? La teoria economica convenzionale prevede che nella mezzadria il proprietario si appropri del guadagno derivante dalla qualità della terra per mezzo di variazioni nella ripartizione del raccolto (Stiglitz, 1974). Tuttavia, Burke e Young (2000) mostrano che i contratti di mezzadria in Illinois permettono al mezzadro che lavora sul terreno buono di appropriarsi di un terzo del guadagno differenziale attribuibile alla qualità della terra. In questo modo si trasferiscono realmente milioni di dollari dai proprietari agli agricoltori. Un’interpretazione plausibile di questi fatti è la seguente. Da un lato, gli agricoltori e i proprietari in tutto il mondo possono aver trovato apparentemente equa la divisione al cinquanta percento. Dall’altro, i tentativi dei proprietari di appropriarsi di tutti i guadagni derivanti dalla terra di alta qualità per mezzo di ripartizioni variabili sarebbero falliti a causa della ritorsione dei mezzadri. Se ciò è vero, questa interpretazione suggerisce che una predisposizione all’equità (fairness), così come il desiderio di punire chi viola le norme locali, potrebbero essere motivazioni potenti quanto la massimizzazione del profitto e il perseguimento del guadagno individuale.
1
Young e Burke (2001), Burke e Young (2000) e Bardhan (1984).
PREFERENZE E COMPOR TAMENTO
| 3
John Stuart Mill (1965[1848]) notò sia la diffusione a livello globale dello straordinario schema della ripartizione in parti uguali nella mezzadria sia, a livello locale, la conformità a distribuzioni alternative nelle quali non si osserva la divisione cinquanta – cinquanta. Qual è la spiegazione di Mill? “La consuetudine del luogo è la regola universale” (p.149). La consuetudine può certo essere la causa immediata, ma questa spiegazione solleva la domanda: perché cinquanta-cinquanta anziché cinquantadue-quarantotto? Perché Bengalesi ed Americani si sono accordati sullo stesso numero? Sappiamo dall’analisi del gioco della divisione nel capitolo 1 che qualsiasi divisione del raccolto è un equilibrio di Nash Pareto-efficiente: dunque, perché hanno scelto questo in particolare? Una domanda ancor più problematica è: perché tale equilibrio persiste quando sembra che si possano fare enormi profitti offrendo percentuali più basse per i terreni di alta qualità? E quando la distribuzione cambia effettivamente, come è successo nel Bengala dell’ovest negli anni ottanta e novanta, perché cambiano tutti in una volta, riflettendo il modello di omogeneità locale e di equilibrio punteggiato che abbiamo incontrato nel capitolo 2? Dunque, potrebbe avere senso riconsiderare le assunzioni comportamentali della disciplina economica, che convenzionalmente ha preso l’interesse personale – riassunto nell’espressione Homo Economicus – come suo fondamento, se ragioni quali l’equità e la punizione, o semplicemente l’adesione ad una convenzione, sopravanzano l’interesse personale materiale nell’ambiente altamente competitivo dell’agricoltura dell’Illinois. La necessità di riconsiderare l’Homo Economicus è chiara quando si analizzano problemi di distribuzione, quali il caso della mezzadria e altre situazioni di contrattazione in cui la considerazione dell’equità sembra essere fondamentale. Tuttavia il problema è molto più generale: il modello canonico di comportamento sembra fallire di frequente anche quando problemi di equità sono assenti. Si consideri il seguente caso (Gneezy e Rustichini, 2000). In tutto il mondo i genitori, ogni tanto, arrivano in ritardo a prendere i bambini a scuola. Ad Haifa, in sei scuole materne scelte in modo casuale, è stata imposta una multa per i ritardi (in un gruppo di controllo di scuole non è stata imposta alcuna multa). L’aspettativa era che, introducendo questa sanzione, la puntualità sarebbe migliorata. Invece, al contrario, i genitori reagirono alla multa con ritardi ancora più grandi: la frazione che andava a prendere i propri bambini in ritardo più che raddoppiò. Ancora più sorprendente è il fatto che quando dopo sedici settimane la multa fu revocata, l’aumentato ritardo persistette, senza mostrare alcuna tendenza a tornare al precedente status quo. Invece, per tutte le venti settimane dell’esperimento non ci fu alcun cambiamento nel grado di ritardo presso le altre scuole appartenenti al gruppo di controllo.
4 | MICROECONOMIA
Gli autori dello studio sostengono che la multa era un segnale contestuale che forniva non intenzionalmente informazioni riguardo al comportamento appropriato. L’effetto è stato che il ritardo da violazione di un dovere (che i genitori dovevano rispettare con qualche sacrificio) è stato convertito in una merce con un prezzo (che molti erano disposti a pagare). Gneezy e Rustichini hanno intitolato il loro studio “Una multa è un prezzo” e hanno concluso che imporre una multa etichettava l’interazione come situazione analoga a quella di mercato, nella quale i genitori erano più che disposti a pagare per il ritardo. Revocare la multa non ha ripristinato il contesto iniziale della puntualità come dovere, ha semplicemente abbassato il prezzo del ritardo a zero. Il fatto che gli incentivi monetari per la puntualità abbiano indotto ritardi più elevati è sia contrario alle previsioni del modello economico standard, sia di rilevanza generale per il problema della formulazione di modelli di contratti e di politiche economiche efficaci. Parafrasando Hume, si potrebbe dire le scuole di Haifa avevano progettato una costituzione per delinquenti, e che apparentemente hanno prodotto delinquenti anziché migliorare comportamenti. Le debolezze del modello convenzionale, suggerite dal problema della divisione del raccolto cinquanta-cinquanta e dal fatto che l’introduzione della multa per i genitori ritardatari di Haifa ha avuto un effetto opposto a quello desiderato, sono evidenti in settori d’interesse economico convenzionale, quali il mercato del lavoro, la produzione in team, il pagamento delle tasse, la protezione dei beni comuni ambientali ed altre forme di fornitura dei beni pubblici. Inoltre si deve includere anche l’importanza delle motivazioni di equità nella fissazione dei salari e altri scambi (Bewley 1995, Blinder e Choi 1990). Ugualmente problematico nel paradigma standard è la spiegazione del fatto che gli individui si sforzano di votare anche se la probabilità che il loro voto sia decisivo è infinitamente piccola. Analogamente, quando votano, il sostegno a trasferimenti di reddito per mezzo di tasse ai poveri è significativo anche tra coloro che poco verosimilmente potranno beneficiarne, in quanto sufficientemente ricchi e con prospettive di reddito crescente (Fong 2001, Gilens 1999). Infine, alcuni studi presso Continental Airlines, Nucor Steel e altre compagnie hanno rilevato che gli incentivi di gruppo sono efficaci anche quando i guadagni sono divisi tra un numero di persone così grande che il payoff di un individuo derivante dal suo impegno è trascurabile (Hanse 1997, Knez and Simester 2001). Cercando dei fondamenti comportamentali più adeguati per l’economia e le altre scienze sociali, in questo capitolo ci serviremo di ricerche recenti per presentare una riformulazione dell’approccio standard che mantenga un ruolo centrale per le
PREFERENZE E COMPOR TAMENTO
| 5
preferenze, le credenze (beliefs), e i vincoli degli individui che spiegano come si comportano le persone. Inoltre, correggeremo il modello convenzionale in tre modi. In primo luogo, molte preferenze possono essere spiegate in modo migliore dalle cosiddette preferenze sociali: nella scelta di un’azione, gli individui comunemente tengono conto delle conseguenze che le loro azioni hanno sugli altri individui, non solo su loro stessi. In aggiunta, spesso si interessano non solo delle conseguenze, ma anche delle intenzioni degli altri attori. Un importante esempio di preferenze sociali sono le ragioni di reciprocità, per cui le persone sono generose nei confronti di coloro che si sono comportati bene (con loro stessi o con altri) mentre puniscono coloro che non si sono comportati bene. Le motivazioni di reciprocità inducono le persone ad agire in questo modo anche in situazioni (quali ad esempio le interazioni singole, one-shot) nelle quali la generosità e i comportamenti punitivi sono costosi e non producono aspettative di una ricompensa ulteriore o indiretta per l’individuo. Questi casi sono esempi di ciò che definisco reciprocità forte, per distinguere questo comportamento dal comportamento di reciprocità con aspettativa di una ricompensa futura, talvolta definito altruismo reciproco. Altre preferenze sociali da considerarsi sono l’avversione alla disuguaglianza, l’invidia (o il comportamento dispettoso) e l’altruismo. Al contrario, convenzionalmente si assume che il comportamento dell’individuo sia interamente spiegato da ciò che, in modo impreciso, viene definito interesse personale, con il quale, in questo testo, si intendono preferenze auto-interessate (self-regarding) definite sui risultati. Secondo questa prospettiva, non proviamo interesse né per i risultati che vengono ottenuti da altri, né per il processo che genera tali risultati. F. Y. Edgeworth, uno dei fondatori del paradigma neoclassico, espresse questa visione nel suo Mathematical Psychics (Edgeworth 1881, p.104): “Il primo principio dell’economia è che ogni agente è mosso solo dall’interesse personale”. L’interesse personale non è un presupposto dalla razionalità (un individuo può avere preferenze altruistiche o masochistiche e, allo stesso tempo, transitive e complete), ma in economia viene solitamente trattato in modo assiomatico (e talvolta confuso con la razionalità). Dunque, mentre l’interesse personale non è formalmente implicato dall’approccio convenzionale, in pratica generalmente viene postulato. Questa assunzione acquista considerevole potere predittivo in situazioni strategiche quando prende la forma di ciò che definisco l’assioma dell’interesse personale, ovvero l’interesse personale dell’individuo assieme alla supposizione che gli altri siano a loro volta motivati dall’interesse personale. In secondo luogo, gli individui sono agenti che si adattano e seguono delle regole (rule-following adaptive agents). Con questa espressione si intende il processo con
6 | MICROECONOMIA
cui economizziamo sulle nostre limitate risorse cognitive seguendo regole empiriche approssimative. L’espressione “razionalmente limitato” è talvolta usata per descrivere i limiti cognitivi dei reali attori umani, ma verrà usata in quanto veicola un’idea di comportamento irrazionale. Non è sulla limitatezza della nostra razionalità che concentreremo la nostra attenzione, ma piuttosto sulla limitata capacità e predisposizione nel praticare esercizi cognitivi straordinariamente complessi e costosi. Tra queste regole comportamentali evolute si posso trovare prescrizioni etiche che regolano le azioni nei confronti degli altri, ovvero le norme sociali, l’aderenza alle quali è sia considerata di valore dall’attore (i.e., la norma viene internalizzata), sia sostenuta da un sanzione sociale. Questo approccio è in contrasto con la visione convenzionale secondo cui il comportamento è il risultato di processi cognitivi individuali spesso molto impegnativi che affrontano problemi di carattere valutativo e causale (Questo stato è desiderabile? Come posso realizzarlo?). Questa visione incentrata sulla cognizione individuale (individual cognition-centered) esclude un comportamento fondato su reazioni viscerali (come disgusto, paura, o debolezza di volontà), abitudine, o regole empiriche evolute, e presume (in contrasto con una considerevole quantità di osservazioni empiriche) che gli individui siano sia capaci che predisposti a formulare inferenze abbastanza avanzate riguardo a cosa gli altri faranno e su come funziona il mondo. Infine, i comportamenti dipendono dal contesto in tre modi differenti. I segnali relativi alla situazione (situational cue) sono utilizzati per determinare i comportamenti appropriati in qualsiasi contesto. Inoltre, valutiamo i risultati da un particolare punto di vista, ovvero, il nostro stato attuale o lo stato che viene vissuto da un membro del nostro gruppo di riferimento. Infine, le istituzioni sociali influenzano chi incontriamo, per fare cosa, e con che ricompense; come risultato, le nostre motivazioni sono rappresentate dal modello del processo di trasmissione culturale o genetica introdotto nel capitolo 2. Dunque, le nostre preferenze dipendono dalla specificità della situazione e sono endogene. Le preferenze vengono definite endogene se l’esperienza di un individuo può modificarle in modo durevole, la qual cosa può succedere se l’esperienza influenza l’apprendimento sociale o (in un periodo veramente lungo) l’eredità genetica. Queste possono essere confrontate con preferenze dipendenti dal contesto o dallo stato, ma che sono stazionarie (nel tempo, l’individuo si comporta nello stesso modo nella stessa situazione). Poiché le preferenze endogene comportano un apprendimento o cambiamenti genetici, il comportamento in una stessa situazione cambia nel tempo. Questo approccio è in contrasto con la visione convenzionale secondo la quale le preferenze non dipendono dallo stato attuale dell’individuo e non cambiano, o
PREFERENZE E COMPOR TAMENTO
| 7
cambiano solamente sotto l’influenza di influenze2 esogene al problema in esame. George Stigler e Gary Becker (1977) hanno espresso questa visione nel loro saggio De Gustibus Non Est Disputandum: “Non si discute dei gusti per la stessa ragione per cui non si discute delle Rocky Mountains – entrambi sono là, e ci saranno anche il prossimo anno, e sono uguali per tutti gli uomini” (p.76). Il loro intento era quello di parafrasare in termini meno poetici l’osservazione di Hobbes sui funghi. Naturalmente nessuno considera le assunzioni convenzionali alla lettera. Edgeworth osservò che l’assunzione dell’interesse personale è letteralmente vera solo in situazioni limitate (“il contratto e la guerra”) e Hume, nella frase immediatamente successiva alla prima epigrafe di questo paragrafo, espresse una riflessione sul fatto che è “strano che una massima che è in realtà è falsa sia vera nella scienza politica”. Hobbes fece ricorso ad un’analogia deliberatamente fantasiosa al fine di astrarre dalla formazione sociale delle preferenze come parte di un esperimento mentale, non per descrivere delle persone reali. Se si deve riconoscere che le assunzioni standard da un punto di vista empirico sono violate di frequente, la maggioranza degli economisti ha condiviso l’adozione di Becker e di Stigler del semplice modello canonico di preferenze esogene e autointeressate (self-regarding). La vasta accettazione dei principi cardine di questo modello – non come verità empiriche, ma come approssimazioni sufficientemente vicine da essere utilizzate come utili scorciatoie – può essere spiegata in parte dal loro sostanziale contributo alla disciplina intellettuale e alla chiarezza. Le assunzioni standard forniscono una cornice intellettuale comune resistente a spiegazioni ad hoc basate su differenze individuali non osservate empiricamente o sui cambiamenti dei gusti nel tempo. Abbandonare il modello standard apre la porta a spiegazioni dei comportamenti sulla base di concetti vaghi come “reddito psichico” o “spiriti animali.” Affinché una nuova fondazione comportamentale fornisca un contributo alle scienze sociali, piuttosto che una sollecitazione per spiegazioni ad hoc, sono necessarie sia maggiori informazioni empiriche riguardanti le preferenze e la loro formazione, sia modelli di comportamento più adeguati soggetti ad assunzioni meno restrittive riguardanti le preferenze. La straordinaria produzione di risultati empirici degli economisti sperimentali e comportamentali e di altri scienziati sociali in anni recenti ha fatto sì che una simile riformulazione non solo sia possibile, ma anche dovuta. In questo e nei capitoli successivi, ci si servirà ampiamente di risultati sperimentali. La ragione è che questo metodo, relativamente nuovo per la disciplina economica, ha 2
NdT: nell’originale, “the influence of influences”.
8 | MICROECONOMIA
per la prima volta permesso di testare in ambienti controllati ipotesi correttamente formulate inerenti le assunzioni comportamentali dell’economia. Nella prossima sezione introdurremo ciò che si può definire un’interpretazione comportamentale delle preferenze e dell’azione razionale, seguita da una rassegna di numerose anomalie empiriche nella trattazione convenzionale delle preferenze. Passeremo poi alla recente ricerca sulle preferenze sociali, introducendo sia risultati sperimentali, sia due nuove funzioni di utilità. Rimanderò ai capitoli 7, 11, e 13 l’esposizione di un modello formale dell’evoluzione delle preferenze, delle ragioni per cui la gente spesso aderisce a norme etiche e per cui motivazioni etero-interessate, quali la generosità e l’equità, sono comuni. P R E F E R E N Z E , R A G IO N I E C O M P O RTA M E N T I
Quando gli individui agiscono, generalmente stanno provando a fare qualcosa, in modo più o meno saggio. Una implicazione è che i propositi degli individui e il loro modo di capire come portarli a compimento, insieme ai vincoli e agli incentivi posti dalle regole sociali e dalle capacità individuali, sono ingredienti chiave per spiegare le azioni individuali. Ciò che la gente fa in qualsiasi situazione dipende dunque dalle sue preferenze e dalle sue credenze. Le credenze (belief) sono ciò che un individuo conosce della relazione tra un’azione e un risultato. In molti casi le credenze entrano a far parte banalmente di situazioni di scelta e non sono considerati esplicitamente: per esempio, nei giochi semplici abitualmente assumiamo che le persone conoscano le conseguenze delle loro azioni in termini di payoff. In altre situazioni – particolarmente nelle interazioni strategiche senza strategie dominanti – le credenze possono diventare di importanza fondamentale: gli effetti di essere presente ad una riunione possono dipendere da chi sono gli altri partecipanti e dunque la mia decisione di partecipare o no dipenderà dalle mie aspettative riguardo a chi altro parteciperà. La decisione degli altri a sua volta dipenderà dalle credenze di questi ultimi sulla partecipazione degli altri, e così via. In altre situazioni la struttura dell’interazione potrebbe essere ambigua e intesa differentemente da differenti giocatori. In queste situazioni, il modo in cui arriviamo ad avere determinate credenze e il modo in cui aggiorniamo le nostre credenze alla luce della nostra esperienza assume importanza centrale. Le preferenze sono le ragioni del comportamento, ovvero attributi degli individui – diversi dalle credenze e dalle capacità – che spiegano le azioni che essi
PREFERENZE E COMPOR TAMENTO
| 9
intraprendono in una data situazione.3 Dunque le preferenze sono un’eterogenea mescolanza che include: i gusti (alimentari, per esempio), le abitudini, le emozioni (come la vergogna o la rabbia) e le altre reazioni viscerali (come la paura), il modo in cui gli individui interpretano le situazioni (o, più brevemente, il modo in cui elaborano una decisione), gli impegni (come le promesse), le norme applicate socialmente, le propensioni psicologiche (all’aggressione, all’estroversione…) e le relazioni affettive di un individuo con gli altri. Dire che le persone agiscono sulla base delle loro preferenze significa solo che la conoscenza delle preferenze potrebbe essere di aiuto nel fornire una convincente spiegazione delle azioni (sebbene non necessariamente la spiegazione che verrebbe data dall’attore, poiché come è ben noto, gli individui sono talvolta incapaci o riluttanti nel fornire tale spiegazione).4 Questa interpretazione delle preferenze come “ragioni del comportamento” può essere confrontata con due approcci convenzionali. Il primo postula che gli individui cercano di massimizzare la loro utilità, equiparando l’utilità al benessere, al piacere o alla felicità, secondo la tradizione di Jeremy Bentham e degli utilitaristi degli inizi del diciannovesimo secolo. Al contrario, nel più recente approccio delle preferenze rivelate, un ordinamento di preferenze non è niente di più che una completa descrizione di un comportamento coerente, e qualsiasi connessione con un calcolo edonistico è ingiustificata. Nessuno di questi due approcci è interamente adeguato. Se il nostro obiettivo è spiegare il comportamento, l’approccio delle preferenze rivelate è vuoto, perché non si pronuncia sul problema delle motivazioni e delle ragioni: sebbene queste siano difficilmente sufficienti a fornire una spiegazione, raramente esse sono totalmente prive di informazioni. La visione delle preferenze rivelate un tempo ha attratto sostenitori impressionati dal fiat metodologico, ora superato, che gli stati soggettivi non sono conoscibili e che quindi un approccio scientifico debba focalizzarsi sui comportamenti osservabili. Al contrario, l’approccio utilitaristico è concreto; gli stati soggettivi centrali per questa visione – il piacere, il dolore, la soddisfazione, l’ansia, e altre esperienze edonistiche sono ora un campo attivo di studi scientifici e di misura. Tuttavia trattare il comportamento come sinonimo del perseguimento del benessere è fuorviante: le ragioni che muovono le nostre azioni includono anche le dipendenze, la debolezza del volere, i comportamenti miopi, e altre disfunzioni del comportamento umano che sono ben 3
Un’espressione più precisa per questa concezione di preferenze può essere la scomoda espressione suggerita da Nowell-Smith (1954): “pro and con attitudes”. 4 Vedi Nisbett e Wilson (1977). Shafir, Simonson e Tversky (2000) forniscono un’interpretazione di ciò che chiamano “scelta basata sulle ragioni” (reason–based choice) simile a quella presente in NowellSmith (1954) e in questo testo.
10 | MICROECONOMIA
documentati. Il fatto che lo stesso termine - utilità – sia convenzionalmente usato sia come spiegazione del comportamento sia come standard per la valutazione dei risultati sociali ha costretto gli economisti ad assumere una prospettiva eccessivamente limitata sul comportamento e sulla valutazione sociale. Per riassumere, accanto all’insieme delle azioni ammissibili e dei risultati a queste associati, credenze e preferenze forniscono una spiegazione dell’azione individuale. Si ricordi che le istituzioni sono state definite come le leggi a livello di popolazione, le regole informali, e le convenzioni che danno una struttura durevole alle interazioni sociali. In termini di teoria dei giochi, un’istituzione è un gioco (che, come abbiamo visto nel capitolo 1, può anche essere il risultato di un gioco sotteso), le preferenze sono la valutazione dei payoff, e le credenze sono la comprensione dei giocatori delle conseguenze dei payoff attesi di ciascuna strategia nel loro insieme delle strategie (i.e., la loro comprensione del gioco e della sua struttura dei payoff in aggiunta alla probabilità delle azioni degli altri). Siccome preferenze, credenze e istituzioni vengono facilmente confusi, si consideri un caso concreto. In molti paesi la pratica di guidare sul lato destro della strada è un’istituzione; è una convenzione, ovvero un equilibrio di un Assurance Game, e la convenzione è difesa anche da leggi. In questi paesi guidare a destra è una miglior risposta e comportarsi diversamente è anche illegale. La persone non preferiscono guidare a destra in sé, preferiscono evitare incidenti e multe, e se tutti gli altri guidassero a sinistra senza violare la legge, guiderebbero anche loro a sinistra. La credenza che gli altri guideranno a destra sostiene l’istituzione della guida a destra, che a sua volta sostiene la credenza. Le credenze e le preferenze sono fatti che riguardano gli individui che sostengono questo particolare equilibrio, mentre le istituzioni, rappresentate in questo caso dalla posizione di equilibrio con guida a destra – sono fatti che riguardando gruppi di persone. Una versione della struttura di preferenze e credenze che chiamerò “convenzionale” ha fornito i fondamenti comportamentali della disciplina economica e viene sempre più applicata in tutte le scienze sociali. Il modello del comportamento di un individuo si serve di una funzione di utilità: U = U(x, y, z). Gli argomenti di U – x,y, e z – descrivono uno stato che può essere una semplice lista di beni consumati o una formulazione più complessa, come una birra fredda in una serata calda tra tre giorni in compagnia di amici in una società islamica che proibisce il consumo di alcol. La funzione di utilità viene scelta in modo tale da essere una rappresentazione numerica tale che vengono scelti (sono “preferiti”) i valori più elevati di U rispetto ai valori più bassi, poiché lo stato (x,y,z) viene scelto rispetto a (x’,y, z) se U (x, y, z) > U(x’, y, z).
PREFERENZE E COMPOR TAMENTO
| 11
La funzione di utilità è completa, ovvero ciascuno stato può essere ordinato rispetto ad ogni altro stato per mezzo di una relazione di preferenza o indifferenza. L’ordinamento è anche transitivo, ovvero gli ordinamenti che fornisce non includono ordinamenti incoerenti come (x, y, z) è preferito a (x’, y, z) che è preferito a (x’’, y, z), ma (x’’, y, z) è preferito a (x, y, z). Infine si assume (di solito implicitamente) che la funzione di utilità non vari nel tempo nel periodo rilevante: quando, per esempio, i prezzi cambiano esogenamente, l’individuo reagisce solo ai nuovi prezzi e non a cambiamenti concomitanti nella funzione di utilità. Gli individui sono razionali quando agiscono in conformità ad una funzione di utilità completa e transitiva.5 Dunque non sono considerati ir-razionali altri modi di agire (per esempio, scelte incoerenti indotte dall’impulsività, o l’incompletezza delle preferenze rispetto a risultati orribili in modo inimmaginabile), sono semplici forme d’azione non trattate da questo modello, che forse sarebbe meglio considerare non-razionali. Il modello convenzionale è abitualmente esteso per trattare il rischio e l’incertezza. Si dice che esiste rischio se le conseguenze di un’azione nell’insieme di scelta individuale è un insieme di possibili risultati, ciascuno dei quali può verificarsi con una probabilità conosciuta. Al contrario, se una o più delle azioni a disposizione dell’individuo posso condurre a più di un risultato, le cui probabilità sono sconosciute, esiste incertezza. Entrambi sono aspetti pervasivi delle scelte. Decidere se prendere in locazione un cottage sulla spiaggia sapendo che con probabilità p pioverà è un esempio di rischio. In questi casi si assume che l’individuo massimizzi l’utilità attesa. L’utilità attesa di un’azione è l’utilità associata a ciascuna possibile conseguenza di un’azione moltiplicata per la probabilità del suo verificarsi: U(cottage sulla spiaggia) = (1 – p)U(cottage sulla spiaggia sotto il sole) + pU(cottage sulla spiaggia sotto la pioggia). La massimizzazione dell’utilità attesa richiede più di un semplice ordinamento di ogni possibile stato (che è sufficiente per determinare il comportamento in condizioni di certezza) poiché utilizza informazioni relative a quanto uno stato sia meglio di un altro. In uno studio pionieristico di teoria dei giochi, John von Neumann e Oskar Morgenstern (Neumann e Morgenstern 1944) hanno dimostrato come le scelte di un individuo che massimizza l’utilità attesa non cambiano se la funzione di utilità subisce trasformazioni additive o lineari. (Ciò significa che se il comportamento di un individuo è descritto dalla funzione di utilità u allora il suo comportamento è descritto anche da qualsiasi funzione della forma v = + u dove >0.) Le cosiddette utilità di von Neumann-Morgenstern incorporano questa restrizione. 5
Talvolta sono imposte altre restrizioni di razionalità, ad esempio l’assioma debole delle preferenze rivelate richiede che se (x, y, z) è preferito a (x’, y, z) allora (x, y, z, a) sarà preferito a (x’, y, z, a).
12 | MICROECONOMIA
Nel capitolo 1 sono già apparse due volte: nella discussione della risk-dominance e quando si sono normalizzati i payoff associati con le posizioni di riserva (fallback positions) nei giochi sul conflitto di interessi. Le utilità di von Neumann-Morgenstern sono cardinali per stati diversi di un dato individuo, ma non tra diversi individui; indicano quanto sia migliore la spiaggia con il sole rispetto alla spiaggia con la pioggia per te, ma non di quanto sia migliore per te rispetto a quanto lo sia per me. A meno che non sia diversamente specificato, tutti i payoff utilizzati di seguito sono utilità di von Neumann-Morgenstern. Nel caso dell’incertezza i pesi delle probabilità conosciute sono sostituiti dalle stime soggettive dell’individuo riguardo alle probabilità sconosciute. Si assume generalmente che gli individui modifichino le loro stime sulla base dell’esperienza recente per mezzo di un processo denominato aggiornamento bayesiano; il reverendo Thomas Bayes (1702 – 1761) fu uno dei primi studiosi di teoria della probabilità. L’approccio bayesiano all’azione razionale assume che il processo di decisione dell’individuo in situazione di incertezza sia basato sulla massimizzazione dell’utilità attesa a sua volta fondata sulle probabilità soggettive aggiornate in questo modo. (L’approccio bayesiano ovviamente presume l’utilizzo di utilità di von NeumannMorgenstern.) La differenza tra rischio ed incertezza in pratica è spesso sfumata, eccetto in casi limite, dove si considerano probabilità veramente conosciute, come i meccanismi di allocazione che vengono resi casuali dal lancio di una moneta. Un’importante applicazione di queste idee è il concetto di avversione al rischio (risk aversion), misurata dal livello di concavità di una funzione di utilità U(W) dove W è la ricchezza dell’individuo. L’intuizione è che l’utilità marginale della ricchezza è nettamente decrescente nel benessere, come sarebbe nel caso di una funzione di utilità “molto concava”, un individuo valuterebbe un guadagno certo di 75000 euro molto di più di uno di 50000 o 100000 con pari probabilità. Dunque, un individuo la cui utilità è concava nel benessere non sceglierebbe una lotteria tra due premi se potesse avere, invece, un premio certo uguale al valore atteso della lotteria. Per questa ragione, una misura del grado di avversione al rischio è –U’’/U’, denominata misura di Arrow-Pratt.6 Un individuo è neutrale al rischio (risk neutral) se l’utilità è lineare nel benessere o U’’ = 0; se U’’ > 0 un individuo è amante del rischio (risk seeking). Una seconda estensione essenziale riguarda le scelte tra stati in momenti diversi. Tale estensione può essere introdotta scontando gli stati futuri ad un fattore di sconto costante , che è una misura inversa del tasso al quale scontiamo gli eventi futuri a causa di una visione distorta, la scarsa probabilità di sopravvivere oltre una 6
Si veda Mas-Colell, Whinston e Green (1995) per un’ulteriore elaborazione.
PREFERENZE E COMPOR TAMENTO
| 13
qualche data futura, e altre ragioni.7 Un persona che valuta gli stati futuri in modo uguale allo stato attuale avrà = 1, mentre individui che attribuiscono maggior peso al presente avranno < 1. Secondo l’approccio dell’utilità scontata (discounted utility) è definito in un modo tale che un individuo sia indifferente tra aggiungere x al suo consumo y al tempo t e aggiungere un qualche altro incremento, x’, un numero di periodi n più tardi, nel periodo t + n se U(y+x)t + U(y)t+n = U(y)t + U(y+x’) t+n
(3.1.)
Dunque, una volta esteso al trattamento del rischio e della scelta intertemporale, il modello convenzionale coglie importanti aspetti del comportamento umano e combina vasta applicabilità e trattabilità formale. A prima vista, sembra imporre all’analisi del comportamento poche restrizioni concrete diverse dall’esclusione dei casi, forse non importanti, di incompletezza ed incoerenza appena menzionati. Tuttavia ciò non è corretto: la formulazione di cui si è appena detto costituisce una teoria concreta del comportamento ed incorpora affermazioni forti sul tipo di cose di cui la gente tiene conto e su come ciò viene fatto. Questo modello non ottiene ottimi risultati alla luce delle recenti ricerche empiriche sul comportamento.
P R E F E R E N Z E D I P E N D E N T I D A L C O N T E S TO Una delle falsificazioni del modello convenzionale documentate nel modo migliore si verifica poiché le preferenze (e dunque i comportamenti) sono dipendenti dal contesto (situation dependent). Si supponga che sia un vettore che rappresenta uno i
stato i (ad esempio quello descritto sopra da (x, y, z)), un elemento dell’insieme dei possibili stati , e U ( ) sia l’utilità associata con lo stato per un individuo che sta attualmente sperimentando lo stato . Sia U ( ) la rappresentazione dell’individuo i
j
j
i
i
dell’ordinamento delle preferenze di tutti i possibili stati quando l’individuo è nello stato i. Dunque le preferenze saranno dipendenti dal contesto se gli ordinamenti dello stesso individuo in uno stato differente, dato da U ( ) , differiscono da quelli k
dati da U ( ) per qualche i e k. La dipendenza dal contesto è anche chiamata dipendenza dallo stato (state dependence), ma si userà la prima denominazione in riconoscimento della considerevole letteratura in psicologia sull’importanza dell’influenza delle situazioni sul comportamento. i
Un importante esempio di dipendenza dal contesto, denominato avversione alle 7
Il fattore di sconto = 1/(1 + r) dove r è il tasso di preferenza temporale (time preference).
14 | MICROECONOMIA
perdite (loss aversion), si verifica perché le persone valutano le perdite (negativamente) in modo maggiore rispetto a guadagni di pari entità. La dimensione del coefficiente di avversione alle perdite è sorprendentemente grande: stime ottenute per mezzo di esperimenti e in contesti naturali hanno mostrato che la disutilità di una piccola perdita è compresa tra due e due volte e mezzo l’utilità di un piccolo guadagno. La funzione di utilità è dunque bruscamente piegata nello status quo (e la piega si muove quando lo status quo cambia). A ciò è strettamente associato l’effetto dotazione (endowment effect): il prezzo minimo che indurrebbe un individuo a vendere qualcosa che ora possiede è sostanzialmente più alto del massimo prezzo che desidererebbe pagare per acquistare lo stesso bene. (L’avversione alla perdita e l’effetto dotazione sono esempi di una classe più ampia di effetti di dipendenza dal contesto, ovvero le distorsioni derivanti dallo status quo.) L’avversione al rischio e l’effetto dotazione sono stati ampiamente documentati da esperimenti condotti da economisti e psicologi, e forniscono una spiegazione plausibile di importanti anomalie nell’economia di ogni giorno. Per esempio, il fatto che i rendimenti azionari abbiano ecceduto continuamente di un ampio margine i guadagni delle obbligazioni è un problema di rilievo in economia. Una volta si pensava che fosse il risultato dell’avversione al rischio tra gli investitori, ma un semplice calcolo (Mehra e Prescott 1988) ha mostrato che il livello di avversione al rischio necessario a spiegare la differenza è talmente grande da non essere plausibile. Perché l’avversione al rischio possa giustificare il problema dei rendimenti azionari, gli investitori dovrebbero essere indifferenti tra una uguale probabilità di ottenere 50000 euro o 100000 euro e un guadagno sicuro di 51209 euro. Una spiegazione più convincente (Benartzi e Thaler 1995) sostiene che gli investitori non siano avversi alla variabilità dei guadagni in sé (dopo tutto, la maggioranza di essi è abbastanza ricca), ma che reagiscano con veemenza alla prospettiva di una perdita, e i rendimenti delle azioni in un anno sono negativi più di frequente rispetto ai rendimenti delle obbligazioni. L’interpretazione in termini di avversione al rischio del problema dei rendimenti delle azioni rende chiaro che una formulazione precisa dell’avversione al rischio e di altri aspetti della dipendenza dal contesto richiede una trattazione esplicita della dimensione temporale; se gli investitori avessero cinque anni come orizzonte temporale, otterrebbero pochi rendimenti negativi, dunque l’avversione alle perdite implica la considerazione di un orizzonte temporale particolare, evidentemente uno abbastanza corto. Un individuo che subisce una perdita alla fine considererà la nuova situazione come lo status quo. Sappiamo, per esempio, che chi anticipava che un
PREFERENZE E COMPOR TAMENTO
| 15
grave handicap fisico sarebbe stato insopportabile spesso diventa abbastanza soddisfatto della propria vita dopo aver convissuto con l’handicap per un certo numero di anni. Una ben documentata determinante delle preferenze (che dipende dalla situazione) è la semplice esposizione. Le persone valutano di più le cose (per esempio i cibi) ai quali sono stati esposti per un tempo più lungo. I topi non sono differenti: quelli allevati con Mozart preferiscono la sua musica a quella di Schoenberg (Cross, Halcomb, e Matter 1967). Talvolta le preferenze si adattano alle situazioni virtualmente in modo istantaneo – gli studenti negli esperimenti sull’effetto dotazione si affezionavano alla tazza da caffè che era stata loro data in pochi minuti! – ma gli intervalli possono essere considerevolmente più ampi in molti casi. La dipendenza dal contesto – nelle forme di avversione al rischio, effetto dotazione, ed endogeneità di lungo periodo delle preferenze – non esaurisce per nulla i difetti empirici del modello convenzionale. Analogamente all’assunzione di indipendenza dal contesto, la trattazione convenzionale della scelta intertemporale è particolarmente controintuitiva e fortemente contraddetta dalle prove comportamentali.8 Si supponga di essere indifferenti tra un pasto al ristorante preferito ora e due pasti simili da consumare tra un anno. Dunque secondo l’eq. (3.1) si dovrebbe essere indifferenti anche tra un pasto (che chiamiamo x) tra venti anni e due pasti (che chiamiamo x’) tra ventuno anni. Per ottenere questo risultato, si noti che la relazione di indifferenza può essere espressa in modo equivalente (dividendo entrambi i membri di (3.1) per ) come t
U(y+x) - U(y) = {U(y+x’) - U(y)}n Dunque la differenza nell’utilità generata dal ritardo dei due pasti non dipende dal momento in cui avviene concretamente, ma solo dall’ammontare di tempo trascorso tra il momento del primo evento (un pasto) ed il secondo evento (due pasti). Questa cosiddetta proprietà di stazionarietà del modello dell’utilità scontata è un analogo in termini di tempo dell’indipendenza dallo stato: si assume che la valutazione di un individuo degli stati non dipenda dal momento nel quale l’individuo li sta valutando. Ciò non è solo controintuitivo, ma viene contraddetto anche da prove sperimentali e di altro genere (è interessante che ciò valga non solo per gli esseri umani, ma anche per gli animali). Per la maggioranza delle persone, come suggerisce l’esempio, il ritardo di un anno è molto più importante se accade prima piuttosto che tempo dopo, e ciò suggerisce la cosiddetta funzione di sconto iperbolico, secondo la quale uno stato nell’anno t è scontato non al tasso , ma al tasso t
8
Questo paragrafo è scritto sulla base di Loewenstein and Prelec (2000).
16 | MICROECONOMIA
(t) = (1+t)-⁄ con ,>0
(3.2)
che per valori alti di indica che il valore degli stati futuri è rapidamente decrescente nel futuro prossimo, dopodiché la diminuzione è nettamente attenuata (in modo tale che, per esempio, si potrebbe essere abbastanza impazienti nell’aspettare un anno per il pasto favorito, ma solo un po’ meno impazienti nel valutare le conseguenze di lungo periodo del riscaldamento globale).9 Chi sconta in modo iperbolico mostrerà un comportamento caratterizzato da inversione delle preferenze: tra due premi A e B di ammontare differente, che vengono consegnati in differenti date future, un individuo può preferire A rispetto a B nel presente, ma con il passare del tempo preferire B ad A. Scontare in modo iperbolico potrebbe, per esempio far sì che un individuo preferisca prendere un pasto ora rispetto a due pasti tra un anno, ma anche scegliere i due pasti tra ventuno anni rispetto ad un solo pasto fra venti anni, dunque invertendo la propria scelta. Numerosi studi (di cui si può trovare una rassegna in Angeletos, Laibson, Repetto, Tobacman e Weinberg 2001) suggeriscono che l’approccio dello sconto iperbolico fornisce migliori previsioni rispetto all’approccio convenzionale del comportamento per quanto riguarda il risparmio individuale, spiegando la significativa crescita osservata empiricamente nel consumo, derivante da prevedibili aumenti di reddito, e la drastica riduzione dei consumi dopo la pensione. Come nel caso della scelta intertemporale, regolarità empiriche saldamente dimostrate sono anomale dal punto di vista della convenzionale analisi della scelta in presenza di rischio per mezzo dell’utilità attesa. Si ricordi che questo contesto richiede che gli individui valutino le azioni che intraprendono secondo la somma lineare della probabilità di ciascuna possibile conseguenza che si verifica, moltiplicata per le utilità associate a ciascuna conseguenza. Dunque, gli eventi che si verificano con una probabilità arbitrariamente piccola dovrebbero essere trattati in modo virtualmente indistinguibile dagli eventi che con certezza non si verificheranno. Tuttavia è stato ben dimostrato che le persone non valutano le lotterie di eventi rischiosi in questo modo: un evento che accadrà con certezza è considerato in modo abbastanza differente da qualcosa che accadrà con probabilità (1 ) , non importa quanto piccolo sia . Al contrario, sapere di non essere positivi al test HIV è difficilmente la stessa cosa di sapere di poter essere HIV positivo, ma con una probabilità arbitrariamente piccola . Paul Samuelson ha chiamato questo problema “epsilon non è zero”. Sorge inoltre un secondo problema: se l’avversione al rischio (misurata dalla 9
L’allontanamento da uno sconto costante è determinato dal valore di ; questo può essere verificato in quanto se tende a zero, l’eq. (3.2) riproduce la funzione standard di sconto esponenziale (t) = e t .
PREFERENZE E COMPOR TAMENTO
| 17
concavità della funzione di utilità nel benessere) è utilizzata per spiegare perché le persone rifiutano scommesse con premi in un intervallo da 0 a 1000 dollari, allora non può spiegare perché virtualmente qualsiasi scommessa viene accettata per premi ingenti. Un economista che ha osservato un individuo rifiutare l’opportunità di lanciare una moneta per vincere 1010 dollari o perdere 1000 dollari potrebbe servirsi dell’avversione al rischio come spiegazione. Ma Matthew Rabin (2001) ha notato che il livello di avversione al rischio necessaria per spiegare questa scelta dovrebbe implicare anche che lo stesso individuo rifiuterebbe un lancio di moneta per una perdita di 80000 dollari o un guadagno di 349400 dollari. Il problema è che, per piccoli premi, una funzione di utilità concava è approssimativamente lineare, e l’ammontare di concavità necessaria a spiegare perché scommesse con piccoli premi sono talvolta rifiutate implica che la maggioranza delle scommesse con grossi premi – anche quelle molto redditizie in termini di valore atteso – non sarebbero mai accettate. L’idea che un’utilità marginale del benessere fortemente decrescente dovuta ad una funzione di utilità concava renda riluttante un individuo ad assumersi rischio per premi ingenti è sicuramente corretta. Tuttavia i due problemi sopra esposti suggeriscono che la sola concavità non può spiegare il comportamento nei confronti del rischio. Il primo è familiare: l’approccio convenzionale astrae dall’avversione alle perdite (loss aversion). Il secondo è più profondo: anche se la funzione di utilità fosse differenziabile in modo continuo (non piegata nello status quo, come sarebbe il caso se fosse presente l’avversione alle perdite), la sua concavità non consente di cogliere le ragioni per cui la gente desidera evitare il rischio e le emozioni che provano di fronte al rischio. Tra questi ci sono l’ansia e la paura quando non sanno che cosa accadrà o la possibilità di avere rimpianto (o vergogna) per avere scelto una possibilità che ex post non ha avuto successo. In modo simile il modello fallisce nel comprendere le ragioni per cui le persone che possiedono una ricchezza molto limitata si impegnano in attività rischiose come le scommesse: non sembra verisimile che le loro funzioni di utilità siano convesse nel benessere e, se lo sono, ciò suscita la domanda sul perché gli stessi individui acquistino anche delle assicurazioni. Una spiegazione più plausibile per le scommesse, e anche per chi guida troppo velocemente, è che alcune persone si divertono nel prendere particolari tipologie di rischio. Le utilità che dipendono dalla situazione, così come i difetti specifici dell’approccio della massimizzazione dell’utilità attesa al rischio e l’approccio dell’utilità scontata alla scelta intertemporale, suggeriscono che c’è necessità di una visione maggiormente fondata empiricamente delle ragioni del comportamento.
18 | MICROECONOMIA
Daniel Kahneman, Amos Tversky, Richard Thaler e i loro coautori hanno suggerito una serie di riformulazioni chiamate prospect theory (teoria delle prospettive, gli articoli fondamentali sono presentati in Kahneman e Tversky, 2000). Il maggiore contributo di questa teoria è di tenere conto di quattro aspetti della scelta che non sono trattati in modo appropriato nel paradigma convenzionale. Il primo è il problema (menzionato sopra) per cui le persone non valutano le decisioni di rischio secondo l’ipotesi dell’utilità attesa: sopravvalutano l’importanza di eventi improbabili. Il secondo riguarda la considerazione dell’inquadramento (framing), cioè il fatto che risultati equivalenti siano trattati differentemente a seconda del modo in cui sono descritti o del contesto della decisione. Una delle ragioni a favore del comportamento dipendente dal contesto è che le situazioni spesso inquadrano le scelte in un modo particolare. (Nella prossima sezione verranno forniti alcuni esempi.) Il terzo è la reintroduzione da parte di Kahneman e di altri studiosi di una misura concreta, l’utilità edonistica realmente provata (actually experienced hedonic utility), che riprende un aspetto dell’utilitarismo classico. Il quarto è lo sviluppo da parte della prospect theory di una cornice concettuale per trattare la dipendenza dalle situazioni dei comportamenti. Idea centrale di questa fondamentale riformulazione è che se la funzione di utilità deve spiegare il comportamento reale, i suoi argomenti dovrebbero essere cambiamenti negli stati o eventi piuttosto che stati. Dunque il valore che gli individui attribuiscono agli stati dipende dalla relazione dello stato con lo status quo (o forse da qualche altro stato di riferimento, quale uno stato cui si aspira o uno stato gradito ai propri simili). Studi sperimentali e di altro tipo suggeriscono che la risultante cosiddetta funzione valore abbia tre caratteristiche illustrate in figura 3.1, cioè che il valore è definito in cambiamenti di ricchezza piuttosto che in livelli, che la funzione valore è “piegata” nello status quo con un coefficiente di avversione al rischio pari circa a due o un poco più alto (la funzione immediatamente a sinistra dello status quo è due volte ripida rispetto a destra), e che il valore marginale dei cambiamenti è decrescente con deviazioni più ampie dallo status quo che hanno anche effetti marginali minori sulla valutazione dell’individuo dell’evento, tali che la funzione valore sia convessa nelle perdite e concava nei guadagni (chiamato effetto di riflesso). Un difetto di questa letteratura, svelato dall’interpretazione in termini di avversione al rischio del problema dei rendimenti delle azioni, è che la dipendenza dal contesto è una rappresentazione incompleta delle preferenze, a meno che non sia unita ad una spiegazione di come le preferenze si adattano dinamicamente alle nuove situazioni, ovvero come le preferenze evolvono. Gli esperimenti e altri dati introdotti in questa sede mostrano che le situazioni inducono le preferenze; ma ci dicono poco
PREFERENZE E COMPOR TAMENTO
| 19
su come il processo secondo cui la gente si adatta ad una nuova situazione, quale può essere rappresentata da perdite sul mercato azionario, dalla perdita della vista, la promozione in una posizione manageriale, o la trasformazione di una semplice società di cacciatori-raccoglitori in moderna economia fondata sul mercato. Ritorneremo sull’evoluzione delle preferenze in una situazione di cambiamenti economici nel capitolo 11. Valore
V (W )
Perdite
Guadagni
Figura 3.1. Una funzione con valore dipendente dal contesto. W è il cambiamento di richiezza. Nota: la “piega” con W = 0 indica avversione alle perdite.
I difetti e le riformulazioni considerati in questa sezione hanno considerato il nucleo formale della teoria convenzionale dell’azione razionale. Il recente accumulo di anomalie empiriche riguardanti l’aspetto concreto della teoria, cioè l’assioma del comportamento auto-interessato ha inoltre motivato riformulazioni fondate sul concetto di preferenze sociali.
PREFERENZE SOCIALI Negli esperimenti one-shot sul dilemma del prigioniero il tasso di cooperazione è di solito tra il 40 e il 60 percento, nonostante la defezione reciproca sia l’equilibrio in strategie dominanti (Fehr e Rischbacher 2001b). Molti soggetti preferiscono il risultato di mutua cooperazione rispetto al più alto payoff materiale che otterrebbero defezionando con un cooperatore. Quando i soggetti defezionano è perché odiano che qualcuno si approfitti di loro; molti defezionano per evitare questo rischio, e non perché defezionare è la strategia che massimizza il payoff indipendentemente dall’azione scelta dell’altro. Questi risultati suggeriscono che le persone si interessano degli altri, e si interessano del perché le cose succedono, indipendentemente dai risultati. Le preferenze sociali sono queste ragioni etero-interessate (other-regarding) e interessate al processo (process-regarding) che guidano il comportamento.
20 | MICROECONOMIA
Un esempio di preferenza interessata al processo è il seguente: un individuo potrebbe accettare con serenità un cattivo risultato determinato dal lancio di una moneta, mentre rifiutare con rabbia il risultato se fosse imposto da qualcuno la cui intenzione è danneggiarlo. Una preferenza interessata al processo è definita come una valutazione basata sulle ragioni per le quali uno stato accade, piuttosto che una caratteristica intrinseca dello stato. Altri esempi includono il desiderio di aiutare coloro che stanno peggio solo se la loro povertà è il risultato non della pigrizia ma della cattiva sorte, il mantenimento di promesse, e la predisposizione a condividere le cose ottenute per caso, ma non quelle ottenute con il proprio impegno. L’aspetto chiave delle preferenze interessate al processo è che la valutazione di uno stato è condizionale al modo in cui si verifica. I comportamenti sono processi sensibili per due ragioni: i processi che determinano un risultato spesso rivelano importanti informazioni riguardo alle intenzioni degli altri (ad esempio, il povero meritevole) e spesso forniscono suggerimenti riguardanti i comportamenti appropriati da un punto di vista sociale. Le preferenze etero-interessate includono il rancore, l’altruismo e la considerazione della relazione tra i risultati per se stessi e per gli altri. Quelli che Hobbes ha chiamato il desiderio di “grandezza” o la preferenza per risultati “equi” ne sono esempi, come “l’emulazione” di Thorsten Veblen, esemplificata dal desiderio di “non essere da meno dei Jones” (Veblen 1934 [1899]) (“keep up with the Joneses”). L’aspetto chiave delle preferenze etero-interessate è che la valutazione da parte di un individuo di uno stato dipende da come quello stato è vissuto dagli altri. Nell’analizzare le preferenze definite in base alle esperienze altrui (così come in base alle proprie) sarebbe utile considerare la seguente tassonomia (si veda la tabella 3.1.) della distribuzione dei benefici e dei costi quando due persone interagiscono. Tabella 3.1. Una tassonomia dei comportamenti: costi e vantaggi per se stessi e per gli altri. Costo per se stesso Beneficio per se stesso Beneficio per gli altri
Altruismo
Mutualismo
Costo per gli altri
Dispetto
Egoismo
La colonna di sinistra elenca i comportamenti che sono specificamente preclusi dall’assioma dell’interesse personale. Un comportamento è altruistico se conferisce un beneficio ad un altro imponendo un costo a se stessi (questa definizione biologica standard è limitata a costi e benefici e non riguarda le intenzioni). L’imposizione di costi ad un’altra persona in modo costoso per se stessi (in basso a sinistra) può essere motivata dal rancore, dall’invidia, dall’avversione all’ineguaglianza (se l’altro è più ricco), o dal desiderio di punire chi ha danneggiato te stesso o altri, o chi ha violato
PREFERENZE E COMPOR TAMENTO
| 21
norme sociali. La colonna a destra è un territorio familiare agli economisti. Poiché lo scambio di mercato del modello convenzionale avviene per ragioni di interesse personale, deve conferire benefici ad entrambe le parti e dunque è un esempio di ciò che i biologi chiamano mutualismo (quando si verifica tra appartenenti a specie differenti). Altri esempi includono comportamenti apparentemente generosi che aumentano i payoff di un individuo nel lungo periodo a causa di interazioni ripetute o indirette. Seguendo Robert Trivers (1971) questi comportamenti sono talvolta chiamati “altruismo reciproco”, una denominazione errata, dato che l’altruista reciprocante beneficia dai comportamenti in questione. La terminologia del Dalai Lama è più accurata: “Il modo stupido di essere egoisti è… cercare la felicità solo per noi stessi…Il modo intelligente di essere egoisti è lavorare per il benessere degli altri” (Dalai Lama 1994:154). Limito l’utilizzo del termine interesse personale ai comportamenti nella colonna a destra per evitare l’uso tautologico del termine per indicare qualsiasi atto che viene intrapreso volontariamente. L’altruista può dare con piacere, ma non è di aiuto alla trasparenza chiamare ciò interesse personale. L’osservazione quotidiana degli altri, così come l’introspezione, suggerisce che le preferenze etero-interessate ed interessate al processo sono importanti. Di seguito introdurremo brevemente la prova sperimentale che conferma queste impressioni. Ma si vuole sottolineare che la principale prova riguardante le preferenze sociali proviene non dagli esperimenti, ma dai comportamenti economici e di altro tipo del mondo reale che sono inspiegabili in termini di interesse personale (senza ricorrere a ragionamenti ampiamente ad hoc). Si è fatto riferimento ad alcuni di questi comportamenti nell’introduzione di questo capitolo. Altri includono il volontariato per pericolose operazione militari e altri compiti, il pagamento delle tasse molto in eccesso rispetto a ciò che massimizzerebbe il reddito atteso (in alcuni paesi), la partecipazione a varie forme di azione collettiva, e il rispetto delle norme e delle leggi in casi in cui la trasgressione non può essere rilevata. L’elevato grado di cooperazione fra numerosi soggetti non legati da relazione di parentela rende gli esser umani unici tra gli animali; parte di questa cooperazione è sicuramente il risultato di istituzioni che rendono il comportamento cooperativo una risposta ottimale per persone con preferenze auto-interessate (rendendo la cooperazione una forma di mutualismo), ma nessuno seriamente pensa che tutti i comportamenti cooperativi possano essere spiegati in questo modo. Esiste un’ampia letteratura sull’altruismo, il confronto sociale e altri aspetti delle preferenze sociali. Illustreremo l’importanza delle preferenze sociali facendo riferimento alla reciprocità forte, che non deve essere confusa con i comportamenti
22 | MICROECONOMIA
auto-interessati descritti dall’“altruismo reciproco” di Trivers e con concetti connessi quali la “reciprocità indiretta” (procurare benefici a coloro che hanno beneficiato qualcun altro e ottenere altri benefici di rimando). Al contrario di questi “modi intelligenti di essere egoisti”, i motivi di reciprocità forte possono indurre comportamenti che sono altruistici così come intesi dai biologi, procurando benefici ad altri del proprio gruppo e sostenendo dei costi come individuo. Tuttavia, la reciprocità è differente dal comportamento altruistico, che non è condizionato dal tipo o dalle azioni di un altro. Il rifiuto di sostanziose offerte positive nell’esperimento dell’Ultimatum Game è un esempio di motivazioni di reciprocità. I protocolli sperimentali differiscono tra loro, ma la struttura generale dell’Ultimatum Game è semplice. I soggetti vengono accoppiati in modo anonimo per un’interazione singola. Uno di essi è detto “rispondente”, l’altro “proponente”. Al proponente viene assegnato provvisoriamente un ammontare in denaro (“la torta”, “la pentola” o qualche altra metafora culinaria) che il rispondente sa che deve essere diviso tra proponente e rispondente. Il proponente offre una certa porzione della torta al rispondente. Se il rispondente accetta, il rispondente ottiene la porzione proposta e il proponente si tiene il resto. Se il rispondente rifiuta l’offerta, entrambi non ottengono nulla. La figura 3.2 presenta una versione del gioco in forma estensiva, partendo dai payoff di A. In questa versione il proponente semplicemente sceglie tra due offerte: dividere la torta equamente (5, 5) o tenere 8 e offrire al rispondente 2. A offre
(8, 2)
(5, 5)
B accetta o rifiuta
Accetta
(8, 2)
Rifiuta
(0, 0)
Accetta
(5, 5)
Rifiuta
(0, 0)
Figura 3.2. Un Ultimatum Game. Nota: diversamente dal gioco tipico, l’offerta di A è ristretta solo a (5,5) o (8,2).
In questa situazione l’assioma dell’interesse personale prevede che le azioni di un individuo siano miglior risposte definite sui risultati del gioco, fondate sulla credenza che gli altri giocatori si comportino conformemente all’assioma dell’interesse personale. Il proponente auto-interessato A determina (per induzione a
PREFERENZE E COMPOR TAMENTO
| 23
ritroso) che il rispondente B accetterà l’offerta di 2 (perché A crede che B sia a suo volta auto-interessato). Quindi A propone la ripartizione 8 - 2, che B accetterà. In giochi in cui un’offerta inferiore a 2 è possibile, l’assioma dell’interesse personale prevede che il proponente offra o zero o il minor ammontare possibile (nella maggior parte dei giochi, il proponente può scegliere tutti i valori da zero a tutta la torta, qualunque sia l’unità di misura della torta). L’Ultimatum Game è stato giocato anonimamente con denaro reale in ogni parte del mondo in centinaia di esperimenti con studenti universitari. La previsione dell’assioma dell’interesse personale fallisce immancabilmente. La moda delle offerte è tipicamente metà della torta, l’offerta media generalmente eccede il 40 percento della torta e offerte uguali o inferiori ad un quarto vengono rifiutate con una probabilità che varia dal 40 al 60 percento. In esperimenti condotti negli Stati Uniti, in Slovacchia, in Giappone, in Israele, in Slovenia, in Germania, in Russia, in Indonesia e in molti altri paesi la vasta maggioranza dei proponenti offre tra il 40 e il 50 percento della torta (Fehr e Gaetcher 2000b). Questi risultati vengono interpretati da molti come la prova di motivazioni di reciprocità dalla parte del rispondente, che è desideroso di pagare un prezzo (rinunciare ad un payoff negativo) per punire il proponente per aver fatto un’offerta giudicata iniqua. Il comportamento dei proponenti è più complicato. Non si può facilmente determinare se un grande numero di divisioni uguali (ed altre apparentemente eque o quasi) sia spiegato dall’adesione a norme di giustizia o dall’altruismo del proponente o dall’interesse personale assieme alla supposizione che l’altro rispondente possa rifiutare un’offerta iniqua. Offerte sostanziose violano l’assioma dell’interesse personale in entrambi i casi, ma il proponente non manifesta reciprocità per la semplice ragione che, essendo il primo a muovere, non ha informazioni riguardanti B sulla base delle quali condizionare il proprio comportamento. La prova a favore delle motivazioni di reciprocità dunque proviene dalle motivazioni dei rispondenti, non dei proponenti. Altre interpretazioni – i rispondenti possono cercare di implementare un risultato egualitario piuttosto che punire il proponente, per esempio – sono state suggerite, ma come abbiamo appena visto, le prove a favore delle motivazioni di reciprocità sono abbastanza convincenti. I risultati che contestano il modello comportamentale fondamentale in economia erano destinati ad essere sottoposti ad un esame critico accurato. Qualcuno si è chiesto se i risultati sono dovuti ai premi relativamente bassi nei giochi. Esperimenti successivi condotti tra studenti universitari in Indonesia, con una “torta” pari a tre mesi in media di consumi, hanno riprodotto gli stessi risultati (Cameron
24 | MICROECONOMIA
1998). Esperimenti con studenti americani con una torta da 100$ a 400$ non hanno alterato i risultati (Hoffman, McCabe e Smith 1996, Fehr e Fischbacher 2001b). Il comportamento coerente con le preferenze sociali è stato comune in altri giochi con grosse vincite – per esempio un gioco di scambio di doni in Russia con guadagni pari a due o tre volte lo stipendio mensile del soggetto (Fehr e Fischbacher 2001b). Sembra che le violazioni delle previsioni del modello standard non siano il risultato di premi troppo bassi per focalizzare l’attenzione o per ottenere le vere motivazioni dei soggetti sperimentali. Altri hanno suggerito che i soggetti possono avere frainteso il gioco, ma successivi esperimenti in cui i soggetti giocavano il gioco con partner differenti non hanno dato credito a questa preoccupazione (Fehr e Fischbacher 2004). Un ultimo suggerimento scettico è stato che i soggetti possono non aver adattato il loro comportamento alla natura non ripetuta dell’interazione, ad esempio poiché hanno seguito regole di comportamento derivate da altre frequenti situazioni di interazione ripetuta. Ma i soggetti sperimentali distinguono immediatamente fra situazioni ripetute e non ripetute (adattando il loro comportamento di conseguenza). In ogni caso, l’utilizzo di una regola empirica coerente con il gioco osservato contraddice il modello standard, comunque si verifichi. Mentre il dibattito riguardante l’interpretazione dei giochi continua, c’è consenso sul fatto che motivazioni etero-interessate siano coinvolte. Il fatto che le motivazioni etero-interessate sono importanti non è l’unica lezione. Si supponga che l’Ultimatum Game in figura 3.2 debba essere giocato con una leggera modificazione del protocollo. Nell’esperimento chiamato la designazione del 1
proponente (occupata da A nella figura) è determinata, così come accade nella maggioranza degli esperimenti, dal lancio di una moneta: se la moneta attribuisce ad A il ruolo di proponente, il gioco è come in figura 3.2. In il proponente è 2
selezionato come in ma viene lanciata una seconda moneta che determina che azione intraprenderà A. Dopodiché A propone l’offerta e alla fine B accetta o rifiuta. L’introspezione, così come i risultati sperimentali, suggeriscono che i due giochi sono fondamentalmente differenti per il comportamento che suscitano in B, anche se B sta scegliendo tra identici payoff in entrambi. In giochi come vengono accettate 1
2
offerte basse che in sarebbero rifiutate. Una spiegazione plausibile della differenza riguarda la reciprocità. In la motivazione di reciprocità non verrà messa in gioco. 1
2
Infatti, B sa che, se il lancio della moneta ordina ad A il gioco della proposta 8,2, A non intende proporre un’offerta iniqua, ma è meramente costretto a questo dalle regole del gioco. Il confronto illustra preferenze interessate al processo: in entrambi i casi B riceve una cattiva offerta, ma nel secondo caso è chiaro che il processo che determina il cattivo trattamento non deriva come risultato delle cattive intenzioni di A. Se il rifiuto delle cattive offerte in fosse stato motivato da avversione 1
PREFERENZE E COMPOR TAMENTO
| 25
all’ineguaglianza piuttosto che da motivazioni di reciprocità, per esempio, sarebbe stato giocato allo stesso modo. 2
Tabella 3.2. Varietà di Ultimatum Game
Gioco
Risultati
Interpretazione
Fonte
1 Standard
Offerta modale , Reciprocità del offerte< 20% rifiutate rispondente
Citata nel testo
2 Offerte randomizzate
Pochi rifiuti di offerte basse
Il proponente non è responsabile
Blount (1995)
3 Ruoli scelti per mezzo di quiz
Molte offerte basse, poche rifiutate
Il proponente è meritevole
Hoffman, McCabe, Shachat, e Smith (1994)
4 “Gioco dello scambio”
Molte offerte basse, poche rifiutate
Contestualizzazione della situazione
Hoffman, McCabe, Shachat, e Smith (1994)
5 Impossibilità di offerte “eque”No “fair”
Basse offerte non rifiutate
Le intenzioni del proponente contano
Falk, Fehr, e Fischbacher (2003)
6 Punizione da parte di terzi terza
C punisce l’offerta bassa di A a B
Norme generalizzate di equità
Fehr e Fischbacher (2004)
7 Standard: Au/Gnau
Le offerte > sono comuni e vengono rifiutate
Preferenze endogene e dipendenti dalla situazione
Henrich, Bowles, Boyd, Camerer, Fehr, Gintis, e McElreath (2001)
8 Standard: Machiguenga
Molte offerte basse, pochissimi rifiuti
Preferenze endogene e dipendenti dalla situazione
Henrich (2000)
Si consideri ora nel quale la posizione del proponente è determinata non da un sorteggio casuale, ma sulla base di un quiz di attualità che si svolge prima dell’inizio del gioco, con A, che ha totalizzato il risultato più alto, che diventa il proponente al quale B risponde. I soggetti sperimentali giocano in modo differente rispetto allo standard : è più probabile che i proponenti tengano una parte consistente della torta per loro stessi e che proposte abbastanza inique vengano frequentemente accettate. Ora si modifichi nuovamente il gioco, chiamando 3
3
1
4
“Exchange Game”, ovvero semplicemente cambiando il nome del gioco, “Il gioco dello scambio” anziché “Dividete 10$”. La denominazione del gioco non dovrebbe avere effetti sul comportamento in un contesto convenzionale. Invece proprio questo accade: i proponenti hanno offerto meno e offerte più basse sono state accettate. Questi e altri esperimenti sono riassunti nella tabella 3.2.
26 | MICROECONOMIA
Non è difficile pensare alle ragioni per cui la gente gioca in modo diverso rispetto a : i rispondenti possono ritenere che le basse offerte dei proponenti non dovrebbero essere punite in quanto riflettono il merito più grande del proponente (aver guadagnato il ruolo di proponente per mezzo del punteggio del quiz). Ma che dire di , il “gioco dello scambio”? Sembra probabile che i soggetti sperimentali 3
1
4
prendano il nome del gioco come un suggerimento relativo alla situazione e come risultato agiscano sulla base delle motivazioni maggiormente auto-interessate tra quelle presenti nel loro repertorio comportamentale. Ad ogni modo, comunque un individuo comprenda le differenze, queste non possono essere spiegate dalla struttura dei payoff del gioco, poiché questa non viene modificata dai diversi processi di attribuzione dei ruoli, dall’inquadramento e dalla selezione delle azioni. Un’altra variante del gioco ( ) riconferma le impressioni che il rifiuto delle offerte sia 5
motivato dal desiderio di punire l’iniquità da parte del proponente, non semplicemente dal desiderio di evitare l’accettazione di una divisione impari: si mantiene l’offerta 8,2 del gioco standard, ma restringe a 10, 0 (un’offerta ancora più ingiusta) l’unica alternativa del proponente ad 8,2. La frequenza del rifiuto di offerte 8,2 è stata di un quarto inferiore in rispetto a . 5
1
Un ruolo importante dei valori etici è suggerito da , che coinvolge tre persone e non è un Ultimatum Game in senso stretto. A assegna una parte della torta a B (che semplicemente riceve l’offerta e non ha alcun altro ruolo); quindi C, che ha osservato la dimensione della torta e l’offerta, può scegliere di ridurre il payoff di A allocando parte della dotazione di C (come la torta fornita dallo sperimentatore) per questo fine. Le allocazioni di più di metà mela a B non vengono mai punite; ma quando A offre a B meno della metà, C è disposto a pagare per punire A. In questo caso C agisce in modo molto simile al rispondente in un Ultimatum Game standard, ma risponde a un’offerta apparentemente non equa non per lui, ma per un’altra (anonima) persona. Fehr e Fischbacher hanno scoperto che simili punizioni da parte di terze parti come C sono solo leggermente meno dure rispetto a punizioni da parte di chi riceve un’offerta bassa nella situazione di un Ultimatum Game standard. 6
Segnaliamo inoltre altri due esperimenti in cui l’insieme dei soggetti non è – come al solito – composto da studenti universitari, ma invece da membri di quindici società di piccole dimensioni con scarso contatto con mercati, governi o istituzioni moderne. Un team di 17 antropologi ed economisti ha progettato esperimenti per esplorare se i risultati riportati sopra sono comuni in società con culture e istituzioni sociali differenti (Henrich, Bowles, Boyd, Camerer, Fehr, Gintis e McElreath, 2004). Le quindici società includevano cacciatori-raccoglitori, pastori e agricoltori. Tra i popoli Au e Gnau della Papua Nuova Guinea erano comuni offerte più elevate della
PREFERENZE E COMPOR TAMENTO
| 27
metà ed offerte alte e basse venivano rifiutate con uguale frequenza. Se si considera che in queste e in molte altre società della Nuova Guinea la pratica di competere nel fare regali è un mezzo di dimostrazione di status e di subordinazione, questo risultato apparentemente strano non è sorprendente. Al contrario, tra i Machiguenga nel Perù dell’Amazzonia, quasi tre quarti delle offerte erano un quarto della torta o meno e ci fu un solo rifiuto, un pattern singolarmente diverso dagli esperimenti condotti fino ad ora. Comunque, anche tra i Machiguenga, l’offerta media è stata 27 percento, il che suggerisce che le offerte eccedessero l’offerta che massimizzava il payoff atteso. L’analisi degli esperimenti nelle quindici semplici società che abbiamo studiato ci ha portato alle seguenti conclusioni: i comportamenti sono altamente variabili tra gruppi, non un solo gruppo ha approssimato i comportamenti implicati dall’assioma dell’interesse personale, e le differenze di comportamento all’interno di ogni gruppo sembrano riflettere differenze nei tipi di interazione sociale sperimentate nella vita di tutti i giorni. La prova che le condizioni economiche influiscono sulle norme comportamentali è abbastanza convincente. Per esempio gli Aché in Paraguay ripartiscono equamente tra tutti i membri del gruppo certi tipi di cibo procacciati e raccolti (carne e miele). La maggioranza dei proponenti Achè ha contribuito con metà della torta o più. In modo analogo, tra i Lamalera, cacciatori indonesiani di balene che cacciano in un grosso equipaggio e dividono la pesca secondo regole severe, la proposta media è stata 58 percento della torta. In aggiunta, i cacciatori indonesiani di balene hanno giocato in modo molto differente dagli studenti universitari indonesiani sopra menzionati. L’Ultimatum Game è uno dei tanti giochi in cui i soggetti sperimentali si sono comportati in modi che sono fortemente in contrasto con le previsioni dell’assioma dell’interesse personale. Colin Camerer e Ernst Fehr (2004) hanno esaminato sette giochi in cui gli esperimenti hanno suggerito la rilevanza delle preferenze sociali. Uno di questi, il Public Goods Game (Gioco dei Beni Pubblici), è sia importante come analogia di molti problemi economici del mondo reale, sia fornisce informazioni riguardanti il comportamento umano. E’ talvolta chiamato dilemma del prigioniero con n-partecipanti perché ha la stessa struttura di incentivi: se i giocatori si conformano all’assioma dell’interesse personale, non contribuire al bene pubblico (l’analogo della defezione) è l’equilibrio in strategie dominanti, ma il contributo di tutti massimizza i payoff totali. Il gioco è come segue: a ciascuno degli n giocatori viene data una “dotazione” y e simultaneamente essi devono selezionare un ammontare c [0 , 1] i
per contribuire al bene pubblico. I payoff di ciascun giocatore sono = y c + m c i
i
j
j
per j = 1…n. Questa è la descrizione di un Gioco dei Beni Pubblici se m < 1 < mn. La prima di queste disuguaglianze implica che la risposta ottima dell’individuo è non
28 | MICROECONOMIA
contribuire, mentre la seconda implica che i payoff totali (sommando i componenti il gruppo) sono massimizzati se ciascuno contribuisce con la sua intera dotazione. Varianti del Gioco dei Beni Pubblici sono state usate per formulare un modello riguardante l’utilizzo da parte di un individuo di una risorsa ambientale comune; le applicazioni includono la partecipazione a progetti in associazione, quali il pagamento delle tasse e la partecipazione agli scioperi. La previsione dell’assioma dell’interesse personale ( c = 0 i ) è contraddetta invariabilmente negli esperimenti (esaminati da Ledyard 1995). Nei giochi one-shot i contributi sono in media circa metà della dotazione, mentre nei giochi multiperiodali i contributi iniziano verso metà e poi diminuiscono, così che, in un gioco con dieci round, la maggioranza dei giocatori non contribuisce per nulla nel round finale. Inizialmente si pensava che questa diminuzione nella contribuzione confermasse il modello convenzionale: l’idea era che, una volta che i soggetti avessero compreso il problema, non avrebbero contribuito per nulla. Tuttavia un esperimento in cui un secondo gioco dei beni pubblici di dieci round veniva iniziato inaspettatamente alla fine del primo gioco di dieci turni suggerisce che non è questo il caso: nel secondo gioco i giocatori hanno iniziato ancora a contribuire per circa metà. Molti avevano interpretato la diminuzione nei contributi come il riflesso del disappunto per le aspettative che altri avrebbero contribuito di più, assieme con il desiderio di punire chi contribuiva poco (o almeno di non essere sfruttati) in una situazione in cui ciò può essere effettuato solo riducendo il proprio contributo. i
Forte sostegno a quest’ultima prospettiva è fornita da un ingegnoso esperimento progettato da Fehr e Gaechter (2002): ha la stessa struttura di un Gioco dei Beni Pubblici come sopra, eccetto per il fatto che, dopo che gli individui hanno contribuito, il loro contributi venivano resi pubblici (solo per mezzo di un numero di identificazione, non per nome, naturalmente) a tutti i membri del gruppo, che quindi hanno avuto l’opportunità di punire altri nel gruppo, imponendo un costo (una riduzione del payoff) sia al punitore sia al punito.10 In un esperimento con questo gioco, Fehr e Gaechter hanno adottato quello che è chiamato il trattamento del perfetto sconosciuto: dopo ciascun round dell’esperimento con dieci round, i gruppi venivano rimescolati in modo che i giocatori sapessero che nessun giocatore avrebbe incontrato un altro giocatore più di una volta. Dunque la motivazione per la punizione non poteva essere l’interesse personale. Se chi contribuisce poco risponde alla punizione contribuendo di più nei round successivi, aumenta il payoff di altri, ma non quello del punitore (a causa del trattamento del perfetto sconosciuto). Dunque 10
Un precedente esperimento di questo tipo con risultati simili è quello in Ostrom, Gardner e Walker (1994).
PREFERENZE E COMPOR TAMENTO
| 29
anche la punizione è un bene pubblico non meno del contributo iniziale. E’ chiaramente questo il caso nell’ultimo round del gioco, quando l’ultima azione presa da qualsiasi giocatore è la decisione di impegnarsi in una punizione costosa dei membri del gruppo: chi punisce in queste condizioni deve valutare la punizione in sé piuttosto che l’anticipazione di qualsiasi conseguenza che ha la punizione sui loro payoff dovuta alla modificazione del comportamento degli altri. Nel Gioco dei Beni Pubblici con punizione di Fehr e Gaechter i contributi iniziavano da circa metà della dotazione (come nel gioco standard), ma dopo crescevano anziché diminuire nel corso del gioco. Assieme ai miei coautori (questo esperimento viene presentato in Bowles e Gintis 2002a) abbiamo implementato un gioco simile in cui abbiamo confermato ciò che ci si aspetterebbe: la punizione è diretta a coloro che contribuiscono poco. Questi ultimi rispondono in modo forte alla punizione. Quelli che pensavano di imbrogliare nell’ultimo round riducendo i loro contributi hanno pagato caro il loro errore. Abbiamo trovato inoltre qualcosa di abbastanza inatteso. Se quelli che contribuivano sopra la media venivano puniti (come succedeva occasionalmente), riducevano bruscamente i loro contributi. Colpisce ancora di più il fatto che la risposta positiva alla punizione da parte di chi contribuisce poco non è una miglior risposta definita sui payoff del gioco. Tenendo conto della relazione osservata tra l’entità attesa della punizione e la propria offerta, non contribuire rimaneva la miglior risposta, ma, nonostante questo, chi veniva punito reagiva contribuendo di più. Un’interpretazione ragionevole di questi esperimenti è che, come nell’Ultimatum Game, le persone desiderano pagare per punire chi viola norme sociali, anche quando non c’è alcuna aspettativa di una remunerazione indiretta o futura. In altre parole, i soggetti agivano per motivazioni di reciprocità. Tuttavia, sembra esserci qualcos’altro all’opera. Il fatto che la punizione abbia indotto maggiori contributi da parte di chi non contribuiva (diversamente dalla scelta di massimizzare i payoff, nella quale una probabile punizione viene tenuta in conto) suggerisce che la sanzione sociale può suscitare sentimenti di vergogna nelle situazioni in cui la punizione ha qualche legittimazione (nella visione della persona punita). In due esperimenti simili – uno in laboratorio e uno sul campo tra agricoltori dello Zimbawe – la punizione arrecava solamente dispiacere e non riduceva i payoff delle persone punite. Il fatto che chi era stato punito contribuisse di più nei successivi periodi mostra gli effetti forti della sanzione sociale, coerenti con l’interpretazione in termini di “vergogna” (Barr 2001, Masclet, Noussair, Tucker, e Villeval 2003). Nel capitolo 4 presenteremo un modello che analizza come le preferenze sociali quali la vergogna e la reciprocità possono sostenere la cooperazione nelle interazioni in presenza di beni pubblici.
30 | MICROECONOMIA
Il Gioco dei Beni Pubblici fornisce un bell’esempio di contesto e comportamenti dipendenti dalla situazione. Jean Ensminger ha condotto esperimenti con beni pubblici con gli Orma, un popolo pastore in Kenya, come parte del progetto sperimentale multiculturale menzionato sopra. Quando gli Orma hanno bisogno di qualche bene pubblico – una nuova scuola elementare o la riparazione di un strada, ad esempio – si richiede ai membri della comunità un contributo volontario al progetto, in quantitativi crescenti nell’ammontare di ricchezza (il bestiame) della famiglia. Questo sistema di fornitura volontaria di beni pubblici è chiamato harambee. Quando Ensminger ha spiegato il Gioco dei Beni Pubblici ai suoi soggetti, questi l’hanno subito soprannominato “gioco dell’harambee”; i loro livello di contributo era fortemente prevedibile in base alla loro ricchezza nel mondo reale, esattamente come se fosse stato un vero harambee. Quando i soggetti Orma hanno giocato l’Ultimatum Game, non hanno pensato ad una analogia con l’harambee (o, a quanto pare, con nessun aspetto della loro vita quotidiana) e il loro livello di ricchezza non è stato in grado di fornire previsioni su nessun aspetto delle loro giocate sperimentali. Le persone si comportano in ambienti naturali come fanno negli esperimenti? La relazione tra il gioco sperimentale e i comportamenti nel mondo reale è complessa e non vogliamo sostenere una sovrapposizione eccessivamente stretta tra i due. Contrariamente alle speranze (poco sagge, a mio parere) di alcuni sperimentatori, i giochi sperimentali non sfruttano motivazioni astratte incontaminate dalle situazioni. In questo il gioco sperimentale è molto simile a qualsiasi altro comportamento e l’esperimento è solo un’altra situazione.11 La situazione del gioco, le istruzioni degli sperimentatori e cose simili costituiscono una cornice (frame) davvero forte e non possiamo attenderci che siano senza effetto. Gli esperimenti non rivelano l’essenza di un’universale natura umana. Piuttosto, mostrano semplicemente che i comportamenti comuni nelle generiche interazioni sociali sono facilmente spiegabili dalle preferenze sociali, quindi suggerendo che i molti esempi del mondo reale di apparenti violazioni dell’assioma dell’interesse personale non sono il risultato della peculiarità di particolari esempi del mondo reale.
11
Loewenstein (1999) fornisce un giudizio scettico, ma bilanciato. I comportamenti nei giochi hanno dimostrato di prevedere i comportamenti del mondo reale in pochi casi: quelli che si sono fidati in un esperimento sulla fiducia progettato da Glaeser, Laibson, SCheinkman e Soutter (2000), per esempio, hanno mostrato maggiore fiducia in numerose situazioni del mondo reale. Al contrario, risposte alle domande di un’indagine standard sulla fiducia erano completamente non correlate con qualsiasi comportamento misurato (sperimentale o non sperimentale).
| 31
PREFERENZE E COMPOR TAMENTO
UNA FUNZIONE DI PREFERENZE SOCIALI EMPIRICAMENTE FONDATA In risposta alle violazioni dell’assioma dell’interesse personale in numerosi esperimenti, gli economisti hanno tentato di riformulare una funzione di utilità capace di spiegare in maniera parsimoniosa i comportamenti sopra descritti. Esiste una funzione di utilità che sia allo stesso tempo semplice abbastanza da essere trattabile e sufficientemente robusta da spiegare tutte le anomalie sperimentali, e non una sola? Ad oggi esistono numerose funzioni di utilità che possono spiegare un’ampia gamma di comportamenti sperimentali (Falk e Fischbacher 1998, Fehr e Schimdt 1999, Bolton e Ockenfels 1999, Rabin 1993, Charness e Rabin 1999, Levine 1998). Gli ingredienti di base delle funzioni di utilità proposte sono l’interesse personale, l’altruismo, il rancore, l’equanimità e la reciprocità. Le funzioni differiscono nel modo in cui queste componenti sono combinate e nei tipi di comportamento che gli autori desiderano sottolineare. La funzione di utilità (proposta da Fehr e Schimdt) che segue tiene conto sia dell’interesse personale sia di ciò che essi chiamano “avversione all’ineguaglianza”. Una funzione di utilità equa (i.e., contraria all’ineguaglianza) della persona i (che interagisce con solo un’altra persona, j) è data da Ui = i - i max(j - i, 0) - i max(i - j, 0)
(3.3)
Dove e sono i payoff materiali dei due individui, con e [0 , 1] . Questa funzione di utilità esprime la valutazione dell’individuo i dei suoi payoff così come la sua avversione alle differenze nei payoff, attribuendo un maggior peso ( ) alle j
i
i
j
i
i
differenze svantaggiose ( > 0 ) rispetto alle differenze vantaggiose ( ). Il limite superiore di preclude quelli che potrebbero essere chiamati livelli “auto-punitivi” di avversione all’ineguaglianza vantaggiosa: un individuo con =1 si preoccupa solo j
i
i
dei payoff dell’altro (se sono inferiori ai suoi). Al contrario una persona (i) molto avversa ad un’ineguaglianza svantaggiosa potrebbe preferire = = 0 a = 0 e j
i
i
= 2 , in modo tale che possa eccedere 1. j
Per vedere cosa implica l’equanimità sia per i comportamenti punitivi che per i comportamenti compartecipativi, si supponga che i due debbano suddividere un’unità ( + =1 ) e che > . In questo caso dU / d < 0 per tutte le ripartizioni i
j
i
i
i
tali che > 0 . Dunque la ripartizione preferita dall’individuo i sarebbe la divisione dell’unità in parti uguali (così che, se la divisione inizialmente favoriva i rispetto a j, i preferirebbe trasferire parte del payoff a j). In modo simile, se e i i
j
i
32 | MICROECONOMIA
payoff fossero divisi in modo tale che j deve ricevere 0.6 e i 0.4, i sarebbe disposto a pagare 0.1 per ridurre i payoff di j di 0.3, così che entrambi ricevano 0.3. Ancora più notevole, in questo, i rifiuterebbe un’offerta inferiore a 0.25 se facendo così entrambi non ricevessero nulla (come nell’Ultimatum Game). L’equanimità può spiegare un’altra anomalia sperimentale menzionata all’inizio: un considerevole numero di soggetti sperimentali coopera nel gioco del dilemma del prigioniero one-shot (nonostante defezionare sia strategia dominante nei payoff del gioco). Un giocatore-riga equanime (uno caratterizzato dalla funzione di utilità FehrSchimdt sopra riportata) trovandosi di fronte ai payoff materiali del dilemma del Tabella 3.3. Dilemma del Prigioniero Standard con Payoff di Funzione di Utilità Equanime Coopera Defeziona
Coopera
Defeziona
b B a
d (a d)
a (a d)
d c c
Nota: I payoff per l’agente riga equanime è in corsivo
prigioniero standard (a > b > c > d) coopererebbe se sapesse che il giocatorecolonna coopererebbe se la disutilità derivante dall’ineguaglianza vantaggiosa fosse sufficientemente grande, o > (a – b) / (a - d) (vedi tabella 3.3). Se questa disuguaglianza si verifica (come potrebbe, poiché il secondo membro è necessariamente minore di uno), allora il gioco risultante non è più un dilemma del prigioniero, ma un Assurance Game, ed esisterà qualche valore critico p*(0 , 1) tale che se Riga crede che Colonna defezionerà con probabilità minore di p * , allora la sua risposta ottima è cooperare. Si può anche prontamente mostrare che dp * / d > 0 mentre dp * / d < 0 , così, se l’interazione ha luogo tra giocatori equanimi
appaiati in modo casuale in una situazione evoluzionistica del tipo presentato nel precedente capitolo, aumentare la disutilità dell’ineguaglianza vantaggiosa allarga il bacino di attrazione dell’equilibrio di reciproca cooperazione. Invece, aumentare la disutilità dell’ineguaglianza svantaggiosa genera un effetto contrario. In un esperimento progettato per stimare i parametri di una funzione come l’eq. (3.3) Loewenstein, Thompson, e Baserman (1989) hanno creato vari scenari che avevano in comune la divisione di una certa cifra. Le situazioni differivano nella relazione personale tra i partecipanti (negativa, neutrale, o positiva) e nella natura dell’interazione (affari o altro). Hanno trovato che l’ineguaglianza svantaggiosa era fortemente sgradita, a prescindere dalla natura della relazione personale o della
PREFERENZE E COMPOR TAMENTO
| 33
transazione. Al contrario, l’ineguaglianza vantaggiosa era sgradita al 58 percento dei soggetti nella transazione non economica, ma era preferita dalla maggioranza nella transazione economica, essendo sgradita solo al 27 percento. Anche la natura della relazione personale è stata rilevante: nella situazione di relazione positiva o neutrale il 53 percento non gradiva l’ineguaglianza vantaggiosa, mentre nella situazione di relazione negativa era sgradita solo al 36 percento. Questo esperimento fornisce la prova diretta dell’avversione all’ineguaglianza ed è anche coerente con il punto di vista che sostiene che i comportamenti siano comunemente condizionati dalle proprie credenze (positive o negative) riguardo alle altre persone e che siano specifici alla situazione (economica o no). Le preferenze equanimi sono definite sui risultati, ma le preferenze reciprocanti dipendono anche dalle credenze riguardanti l’intenzione o il tipo dell’individuo con cui si sta trattando. Seguendo delle idee inizialmente esposte da Rabin (1993) e Levine (1998), la seguente funzione incorpora l’interesse personale, l’altruismo e la reciprocità. L’utilità di un individuo dipende dal suo payoff materiale e da quello degli altri individui j = 1 … n secondo l’espressione Ui = i + j ijj
per ij
(3.4)
dove ,il peso del payoff materiale di j nelle preferenze di i, è ij
ij = (ai + i aj)⁄(1+ i ) j i
(3.5)
con a [ 1 , 1] e 0 . Il parametro a è il livello assoluto di volontà incondizionata positiva o negativa verso gli altri; e a [ 1 , 1] è la valutazione che i dà della volontà positiva di j, mentre indica la misura in cui i condiziona le sue valutazioni dei payoff degli altri sulla base di credenze (belief) sul tipo degli altri. Se a = 0 e > 0 , allora l’individuo i è un reciprocante non altruista (non mostra volontà né positiva né negativa in assenza di condizionamenti, ma condiziona il suo comportamento alla bontà o alla malevolenza degli altri). i
i
i
j
i
i
i
Se = 0 e a 0 , allora i mostra altruismo incondizionato o malevolenza, a seconda del segno di a . Il denominatore viene aumentato di così che 1 , restringendo in tal modo la propria valutazione dei payoff degli altri a valori non più grandi dei propri. Si noti che d / d ha il segno di (a a ) , il che significa che il i
i
i
i
ij
i
j
ij
i
livello di reciprocità influenza la misura in cui i payoff degli altri entrano a far parte della propria valutazione, aumentandola se l’altro è più generoso di lui stesso e viceversa. Se a = a , allora = a per qualsiasi livello di reciprocità. j
i
ij
i
Come la funzione per l’avversione all’ineguaglianza, questa funzione di utilità
34 | MICROECONOMIA
fondata sulla reciprocità può essere utilizzata per spiegare comportamenti generosi e comportamenti punitivi. L’analisi, comunque, è notevolmente più complicata. Nella maggioranza delle interazioni sociali abbiamo qualche precedente congettura riguardante i tipi degli altri, fondata sulla conoscenza del loro precedente comportamento, suggerimenti fondati su altri fatti che li riguardano (incluso il loro stato di “insider” o di “outsider” nell’interazione) e sulla situazione stessa. Dunque le credenze di un individuo riguardanti le tipologie degli altri, e dunque la sua valutazione dei loro benefici, dipendono plausibilmente dalle loro azioni passate, che dipendono a loro volta dalle credenze sul loro proprio tipo, e così via. Se un individuo è un reciprocante e crede che gli altri siano altruisti, può impegnarsi nella generosità condizionata. Tuttavia, se la generosità non viene ricambiata, l’individuo può aggiornare le sue convinzioni riguardanti i tipi degli altri e impegnarsi in una punizione o nell’abbandono della generosità, come è testimoniato dagli esperimenti dei beni pubblici. Dunque, i comportamenti possono essere sia dipendenti dal percorso (path-dependent) sia specifici alla situazione: una situazione che induce a credere che gli altri sono altruisti può favorire livelli alti e sostenibili di generosità, mentre gli stessi individui, interagendo in un’altra situazione possono impegnarsi in odiose punizioni, reciprocamente costose. La natura path-dependent e specifica alla situazione dei comportamenti può spiegare perché il gioco dei soggetti è così influenzato da cambiamenti nei protocolli sperimentali che sarebbero irrilevanti se il modello convenzionale fosse corretto. Potrebbe anche essere illuminante sul perché, nel nostro studio interculturale, si rilevano così grandi differenze nei comportamenti.
CONCLUSIONI Le funzioni appena presentate, che tengono conto dell’avversione all’ineguaglianza e che sono fondate sulla reciprocità, sono passi importanti verso la costruzione di una concezione più adeguata del comportamento. Tuttavia il processo è in atto e lontano dal suo completamento. La prova che l’avversione all’ineguaglianza e che le motivazioni di reciprocità sono comuni non suggerisce che le persone sono irrazionali. Infatti, una forte prova sperimentale indica che quando gli individui fanno dei doni agli altri (e.g., in un Gioco del Dittatore) si conformano alle assunzioni di transitività e altri requisiti della scelta razionale (Andreoni e Miller, 2002). Inoltre, le persone reagiscono al prezzo della donazione donando di più quando costa loro di meno beneficiare l’altro. Quindi, l’importanza di motivazioni etero-interessate non mette in discussione l’assunzione di razionalità, ma piuttosto suggerisce che gli argomenti della funzione di utilità debbano essere estesi per tener conto dell’interesse degli individui per gli altri.
PREFERENZE E COMPOR TAMENTO
| 35
Le prove sperimentali e di altro tipo suggeriscono anche che una formulazione adeguata dovrebbe tenere conto dell’eterogeneità comportamentale della maggioranza dei gruppi umani. Utilizzando dati provenienti da una vasta gamma di esperimenti, Ernst Fehr e Simon Gaechter stimano che tra il 40 e il 66 percento dei soggetti siano reciprocanti. Gli stessi studi suggeriscono che tra il 20 e il 30 percento dei soggetti abbiano preferenze convenzionali auto-interessate e orientate al risultato (Fehr e Gaechter 2000b, Camerer 2003). Loewenstein, Thompson e Bazerman (1989) hanno distinto tra i seguenti tipi nei loro esperimenti: I santi preferiscono coerentemente l’uguaglianza, e non gradiscono ricevere payoff più alti rispetto all’altra parte anche quando sono in una relazione negativa con l’avversario . . . i leali non gradiscono ricevere payoff più alti in una relazione neutrale o positiva, ma cercano l’ineguaglianza vantaggiosa se si trovano in relazioni negative… i competitori spietati coerentemente preferiscono risultare in vantaggio rispetto all’altra parte indipendentemente dal tipo delle relazioni. Tra i loro soggetti, il 22 percento erano santi, il 39 percento leali, e il 29 percento erano competitori spietati (i rimanenti non potevano essere classificati). Dunque, l’obiettivo di una riformulazione dei fondamenti comportamentali dell’economia non dovrebbe essere un qualche nuovo homo sociologicus per rimpiazzare l’homo economicus, ma un modello capace di tenere conto dell’eterogeneità. Questo compito è essenziale perché l’eterogeneità fa la differenza nei risultati, ma è impegnativo perché gli effetti non vengono adeguatamente catturati da un processo che richiede semplicemente di considerare la media. In generale, il risultato dell’interazione tra una popolazione che è composta da un egual numero di santi e di competitori spietati non sarà la media dei risultati di due popolazioni con un solo tipo, perché piccole differenze nella distribuzione dei tipi in una popolazione possono avere ampi effetti su come ciascuno si comporta. Inoltre, differenze apparentemente piccole nelle istituzioni posso generare grosse differenze nei risultati. Si immagini un Dilemma del Prigioniero giocato tra un giocatore auto-interessato (per il quale defezionare è la strategia dominante nel gioco con mosse simultanee) e un reciprocante (che preferisce cooperare se l’altro coopera e defezionare diversamente) (Fehr e Fischbacher, 2001b). Si supponga che i tipi dei giocatori siano conosciuti a ciascuno. Se il gioco è simultaneo, il reciprocante, sapendo che l’altro defezionerà, farà lo stesso. Il risultato sarà defezione reciproca. Se il giocatore auto-interessato muove per primo, saprà che il reciprocante risponderà ad
36 | MICROECONOMIA
una sua qualsiasi azione con una identica, restringendo così i possibili risultati a {coopera, coopera} o {defeziona, defeziona}. Il giocatore auto-interessato quindi coopererà e la cooperazione reciproca sarà un risultato sostenibile. Si ricordi che, come altro esempio, nel Gioco dei Beni Pubblici con Punizione, chi possedeva preferenze reciprocanti non solo agiva generosamente lui stesso, ma induceva gli egoisti ad agire come se essi fossero generosi. Se ci fossero stati pochi reciprocanti, si sarebbe verificata una convergenza di tutti i giocatori (reciprocanti e auto-interessati) ad un contributo nullo. In aggiunta all’eterogeneità, si deve spiegare anche l’adattabilità degli individui. Nell’Ultimatum Game, i proponenti spesso offrono somme che massimizzano i loro payoff attesi, data la relazione osservata tra offerte e rifiuti: si comportano in modo auto-interessato, ma si aspettano che i rispondenti non lo facciano. Inoltre, gli stessi individui, quando ricoprono il ruolo del rispondente, tipicamente rifiutano offerte sostanziose se non sembrano essere eque, dunque confermando le aspettative del proponente e violando l’assioma dell’interesse personale. Infine, come abbia notato in precedenza (e come discuteremo nel capitolo 11), le preferenze sono in qualche misura apprese, piuttosto che date esogenamente: cambiamenti durevoli nelle ragioni individuali del comportamento spesso costituiscono il risultato dell’esperienza personale. Questo significa che è probabile che le popolazioni che sperimentano differenti strutture di interazione sociale per periodi prolungati mostrino comportamenti diversi, non semplicemente perché i vincoli e gli incentivi richiesti da queste istituzioni sono differenti, ma anche perché la struttura dell’interazione sociale influenza l’evoluzione del repertorio comportamentale, del modo in cui le situazioni suggeriscono i comportamenti e del modo in cui i risultati sono valutati. (Poiché il funzionamento delle istituzioni dipende dalle preferenze degli individui coinvolti, sarà anche vero che le istituzioni sono endogene rispetto alle preferenze; esporrò il processo risultante, chiamato coevoluzione delle preferenze e delle istituzioni, dal capitolo 11 al capitolo 13). Il progresso nella direzione di fondamenti più adeguati per la scienza economica deve tenere conto di questi tre differenti aspetti delle persone: vale a dire, la loro eterogeneità, versatilità, e plasticità. Le nuove teorie devono anche affrontare due sfide. La prima riguarda lo status normativo delle preferenze. Se le preferenze devono spiegare i comportamenti, non possono svolgere senza alcun aiuto anche il lavoro di valutazione dei risultati. La ragione è che alcune comuni motivazioni del comportamento – debolezza di volontà, rancore, e manie che passano per la testa – spesso inducono dei comportamenti dei
PREFERENZE E COMPOR TAMENTO
| 37
quali pochi tollererebbero i risultati.
La seconda sfida sorge in quanto le prove sperimentali e di altro tipo che indicano l’importanza delle preferenze sociali sollevano un difficile problema evolutivo. Se molti di noi sono equanimi e reciprocanti, allora dovremmo avere acquisito queste preferenze in qualche modo. Vedere se può essere fornita una spiegazione ragionevole del successo evolutivo di queste preferenze fornirebbe una buona verifica della plausibilità delle teorie delle preferenze sociali e delle prove empiriche sulle quali sono fondate. La generosità di un individuo verso qualcuno legato da una relazione di parentela genetica è facilmente spiegabile. Il problema evolutivo riguarda comportamenti non egoistici verso chi non è un parente (intendendo comportamenti che comportano costi individuali senza benefici, la colonna di sinistra nella tabella 3.2). Tra chi non è legato da relazioni di parentela, le preferenze egoistiche sembrerebbero favorite da qualsiasi processo evolutivo monotono nei payoff, sia esso genetico o culturale. In considerazione di questo, l’equanimità, che induce le persone a trasferimenti di risorse verso i più deboli, e le motivazioni di reciprocità, che ci spingono a sostenere i costi per punire chi viola le norme di gruppo, sono condannate all’estinzione per mezzo di processi evolutivi di lungo periodo. Se le preferenze sociali sono comuni, questa comune spiegazione evolutiva non deve essere corretta. Negli ultimi capitoli ritornerò su questa domanda e fornirò una serie di modelli in grado di spiegare il successo evolutivo delle preferenze sociali. In particolare, esplorerò il contributo del successo evolutivo dei tratti non egoistici dovuto alla struttura caratteristica dell’interazione umana sociale, ovvero, la segmentazione sociale, le interazioni ripetute e la costruzione di una reputazione (nel capitolo 7), l’enforcement delle norme a livello di gruppo e il conflitto tra gruppi (nei capitoli 7 e 11). In molti casi il successo evolutivo di ciò che sembra essere un tratto egoistico è spiegato dal fatto che quando viene fornita una spiegazione che tenga conto del lungo termine e degli effetti indiretti, i comportamenti massimizzano i payoff e spesso rappresentano forme di mutualismo. Inoltre, introdurremo anche modelli plausibili che spiegano il successo evolutivo dei comportamenti di cui beneficiano gli altri membri di un gruppo, ma che sono costosi per chi li attua. Come la teoria delle preferenze sociali, la prospect theory (“teoria del prospetto”) solleva problemi evolutivi. Chi sconta in modo iperbolico agisce in modo incoerente da un punto di vista temporale; il suo payoff medio su un lungo periodo aumenterebbe se osservasse le regole dettate dal modello dell’utilità scontata.
38 | MICROECONOMIA
Similmente, coloro che sopravvalutano gli eventi con basse probabilità otterranno payoff più bassi rispetto ai concorrenti che attuano la corretta massimizzazione dell’utilità. Questo non significa che coloro che applicano uno sconto time-inconsistent e che violano l’assioma dell’utilità attesa sono condannati, ma dato che l’evoluzione genetica o culturale tende a favorire chi ottiene payoff più altri, ciò pone veramente un problema. In modo analogo, gli individui avversi alle perdite (loss-averse) rinunciano a opportunità di guadagno consistente in situazioni rischiose. La loro avversione alla perdita dunque li svantaggia nella competizione con altri soggetti la cui funzione di utilità non è piegata nello status-quo. Questi interrogativi evolutivi sollevati dalla prospect theory hanno ricevuto meno attenzione rispetto al problema delle preferenze sociali. Non li esamineremo oltre, eccetto per notare che la prova iniziale a favore dello sconto iperbolico proveniva dai piccioni e dai ratti, e che dunque non si tratta di un comportamento unicamente umano.12 Nel capitolo 4 presenteremo una generalizzazione dei tipi di problemi di coordinamento introdotti nei capitoli 1 come giochi 2 2 ed analizzeremo l’impressionante varietà di istituzioni, norme, ed altre modalità che le persone hanno sviluppato per evitare o attenuare i fallimenti del coordinamento. Le preferenze sociali, vedremo, giocano un ruolo centrale in questo processo.
12
Lo sconto iperbolico negli umani e in altri animali è descritto in Ainslie (1975), Green e Myerson (1996) e Richard, Mitchell, de Wit, e Seiden (1997).
PREFERENZE E COMPOR TAMENTO
| 39
Riferimenti bibliografici Ainslie, G. (1975). "Specious reward: a behavioural theory of impulsiveness and impulse control." Psychological Bulletin 82(4): 463-496. Angeletos, G.-M., D. Laibson, et al. (2001). "The Hyperbolic Consumption Model: Calibration, Simulation, and Empirical Evaluation." Journal of Economic Perspectives 15(3): 47-68. Bardhan, P. (1984). Land, Labor and Rural Poverty: Essays in Development Economics. New York, Columbia University Press. Barr, A. (2001). Social dilemmas, shame-based sanctions, and shamelessness: experimental results from rural Zimbabwe. Oxford University, Centre for the Study of African Economies Working Paper WPS/2001.11. Becker, G. S. and G. J. Stigler (1977). "De Gustibus Non Est Disputandum." American Economic Review 67(2): 76-90. Benartzi, S. and R. Thaler (1995). "Myopic loss aversion and the equity premium puzzle." Quarterly Journal of Economics 110(1): 73-92. Bewley, T. F. (1995). "A Depressed Labor Market as Explained by Participants." American Economic Review 85(2): 250-254. Blinder, A. S. and D. H. Choi (1990). "A Shred of Evidence on Theories of Wage Stickiness." Quarterly Journal of Economics 105(4): 1003-15. Blount, S. (1995). "When Social Outcomes Aren't Fair: The Effect of Causal Attributions on Preferences." Organizational Behavior & Human Decision Processes 63(2): 131-144. Bowles, S. and H. Gintis (2002). "'Social Capital' and Community Governance." Economic Journal 112(483): F419-436. Burke, M. and H. P. Young (2000). The Terms of Agricultural Contracts: Theory and Evidence. Washington, DC, Brookings Institute. Camerer, C. (2003). Behavioral Game Theory: Experimental Studies of Strategic Interaction. Princeton, Princeton University Press. Cameron, L. (1998). "Raising the Stakes in the Ultimatum Game: Experimental Evidence from Indonesia." Economic Inquiry 37(1): 47-59. Cross, H., C. Halcomb, et al. (1967). "Imprinting or exposure learning in rates given early auditory stimulation." Psychon.Sci 7(7): 233-234. Edgeworth, F. Y. (1881). Mathematical Psychics: An Essay on the Application of Mathematics to the Moral Sciences. London, C. Kegan Paul and Company. Falk, A., E. Fehr, et al. (2003). "On the Nature of Fair Behavior." Economic Inquiry 41(1): 20-26. Falk, A. and U. Fischbacher (1998). A Theory of Reciprocity. Zurich, Institute for Empirical Economic Research, University of Zurich. Fehr, E. and U. Fischbacher (2004). Third party punishment and social norms. Institute for Empirical Research in Economics, University of Zurich. Fehr, E. and U. Fischbacher (2001). Why Social Preferences Matter. Nobel Symposium on Behavioral and Experimetal Economics. Stockholm. Fehr, E. and S. Gaechter (2000). "Fairness and Retaliation: The Economics of Reciprocity." Journal of Economic Perspectives 14(3): 159-181. Fehr, E. and S. Gaechter (2002). "Altruistic Punishment in Humans." Nature 415: 137-140. Fehr, E. and K. M. Schmidt (1999). "A Theory of Fairness, Competition, and Cooperation." Quarterly Journal of Economics 114(3): 817-868.
40 | MICROECONOMIA
Fong, C. (2001). "Social preferences, self interest and the demand for redistribution." Journal of Public Economics 82(2): 225-246. Gilens, M. (1999). Why Americans Hate Welfare, University of Chicago Press. Glaeser, E., D. Laibson, et al. (1999). What is Social Capital: The Determinants of Trust and Trustworthiness: NBER Working Paper 7216. Gneezy, U. and A. Rustichini (2000). "A Fine is a Price." Journal of Legal Studies 29(1): 1-17. Green, L. and J. Myerson (1996). "Exponential Versus Hyperbolic Discounting of Delayed Outcomes: Risk and Waiting Time." American Zoology 36: 496-505. Hansen, D. G. (1997). "Individual Responses to a Group Incentive." Industrial and Labor Relations Review 51(1): 37-49. Henrich, J. (2000). "Does Culture Matter in Economic Behavior? Ultimatum Game Bargaining among the Machiguenga of the Peruvian Amazon." American Economic Review 90(4): 973-980. Henrich, J., S. Bowles, et al. (2001). "In search of Homo economicus: behavioral experiments in 15 small-scale societies." American Economic Review 91(2): 73-78. Hobbes, T. (1949). De Cive or The Citizen. New York, Appleton-Century-Crofts. Hoffman, E., K. McCabe, et al. (1994). "Preferences, Property Rights, and Anonymity in Bargaining Games." Games and Economic Behavior 7(3): 346380. Hoffman, E., K. McCabe, et al. (1996). "On Expectations and the Monetary Stakes in Ultimatum Games." International Journal of Game Theory 25(3): 289 - 301. Hume, D. (1898). David Hume, The Philosophical Works. London, Longmans, Green, and Co. Kahneman, D. and A. Tversky (2000). Choices, Values and Frames. Princeton, Princeton University Press. Knez, M. and D. Simester (1998). Firm-wide Incentives and Mutual Monitoring, University of Chicago. Levine, D. K. (1998). "Modeling Altruism and Spitefulness in Experiments." Review of Economic Dynamics 1(3): 593-622. Loewenstein, G. (1999). "Experimental Economics from the Vantage Point of View of Behavioural Economics." Economic Journal 109(453): F25-F34. Loewenstein, G. F., L. Thompson, et al. (1989). "Social Utility and Decision Making in Interpersonal Contexts." Journal of Personality and Social Psychology 57(3): 426-441. Loewenstein, G. and D. Prelec (2000). Anomalies in Intertemporal Choice: Evidence and an Interpretation. Choices, Values and Frames. D. Kahneman and A. Tversky. Princeton, Princeton University Press: 578-597. Masclet, D., C. Noussair, et al. (2003). "Monetary and Non-monetary Punishment in the Voluntary Contributions Mechanism." American Economic Review 93(1): 366-380. Mas-Colell, A., M. D. Whinston, et al. (1995). Microeconomic Theory. New York, Oxford University Press. Mehra, R. and E. C. Prescott (1988). "The equity risk premium puzzle: A solution?" Journal of Monetary Economics 21(1): 133-136. Mill, J. S. (1867[1848]). Principles of Political Economy with Some of Their Applications. London, Longmass, Green, Reader, and Diver. Neumann, J. V. and O. Morgenstern (1944). Theory of Games and Economic Behavior. Princeton, NJ, Princeton University Press. Nisbett, R. E. and T. D. Wilson (1977). "Telling more than we can know: Verbal
PREFERENZE E COMPOR TAMENTO
| 41
reports on mental processses." Psychological Review 84(3): 231-259. Nowell-Smith, P. H. (1954). Ethics. [London, Baltimore,, Penguin Books. Ostrom, E., R. Gardner, et al. (1994). Rules, Games, and Common-Pool Resources. Ann Arbor, University of Michigan Press. Rabin, M. (1993). "Incorporating Fairness into Game Theory and Economics." American Economic Review 83(5): 1281-1302. Ransom, R. L. and R. Sutch (1977). One Kind of Freedom: The Economic Consequences of Emancipation. Cambridge, Cambridge University Press. Richards, J. B., S. H. Mitchell, et al. (1997). "Determination of Discount Functions in Rats With an Adjusting-Amount Proceedure." Journal of the Experimental Analysis of Behavior 67(3): 353-366. Samuelson, P. (1963). "Risk and uncertainty: A fallacy of large numbers." Scientia 98: 108-113. Shafir, E., I. Simonson, et al. (2000). Reason-Based Choice. Choices, Values and Frames. D. Kahneman and A. Tversky. Princeton, Princeton University Press. Stiglitz, J. (1974). "Incentives and Risk Sharing in Sharecropping." Review of Economic Studies 41(2): 219-255. Trivers, R. L. (1971). "The Evolution of Reciprocal Altruism." Quarterly Review of Biology 46: 35-57. Veblen, T. (1934). The Theory of the Leisure Class. New York, Modern Library (first published in 1899). Young, P. and M. Burke (2001). "Competition and Custom in Economic Contracts: A Case Study of Illinois Agriculture." American Economic Review 91(3): 559-573. Zajonc, R. B. (1968). "Attitudinal Effects of Mere Exposure." Journal of Personality and Social Psychology Monograph Supplement 9(2, Part 2): 1-27.
IV
FALLIMENTI DEL C OORDINAMENTO E R ISPOSTE I STITUZIONALI
[Nello stato di natura]…non c’e’ posto per l’Industria; perché il frutto che ne deriva è incerto, e di conseguenza nessuna coltura della terra…E quindi ogni cosa è di colui che la ottiene e la trattiene con forza: non è né Proprietá né Comunismo; ma Incertezza. Thomas Hobbes, Leviathan (1651)
Per ora, il mio solo incentivo consiste nell’uscire e catturare tanti pesci quanto posso…ogni pesce che lascio sará solo catturato dal prossimo pescatore. John Sorlein, pescatore di aragoste di Rhode Island
John Sorlien, pescatore di aragoste, non vi impressionerebbe come l'Homo economicus che potete trovare in un manuale o nello stato di natura di Hobbes. Egli e' un vero ambientalista e, come presidente dell'Associazione dei pescatori di aragoste di Rhode Island, è alle prese con seri problemi di incentivi. Quando cominciò ad andare a pesca di aragoste all'età di ventidue anni, usava posizionare le sue trappole appena fuori il porto a Punta Giuditta, entro poche miglia dalla spiaggia, ed aveva un buon tenore di vita. Ma le attività di pesca lungo la riva sono state da tempo esaurite ed ora le sue trappole giacciono settanta miglia al largo. Lui e i suoi uomini pescatori di aragoste a fatica sbarcano il lunario (Tierny, 2000). Dall'altra parte del mondo nel porto di Lincoln, sulla costa meridionale dell'Australia, Daryl Spencer, che lasciò la scuola quando aveva quindici anni e si dedicò per caso all'attività di pesca delle aragoste, ebbe notevolmente più successo. Negli anni Sessanta il governo Australiano assegnava licenze – una per trappola – a tutti i pescatori che lavoravano in quel momento. Da quel momento in poi, qualsiasi persona desiderosa di pescare nei pressi del porto di Lincoln, avrebbe dovuto acquistare una licenza. Spencer acquistò le sue prime licenze per un equivalente attuale di un migliaio di dollari americani ciascuna. Le sue licenze ora valgono più di un milione di dollari (considerevolmente molto più della sua barca). Piuttosto che
2 | MICROECONOMIA
dare a Spencer la possibilità di allevare aragoste, la polizia ha limitato il lavoro del pescatore australiano: Spencer possiede sessanta trappole, il massimo consentito; Sorlien usa ottocento trappole e guadagna molto meno. Punta Giuditta e il porto di Lincoln rappresentano gli estremi di un continuo di fallimenti e successi nel risolvere problemi di coordinamento. Uno si potrebbe chiedere, ovviamente, perchè i pescatori di Punta Giuditta non imitino semplicemente gli Australiani, in particolare dal momento che uno degli amici di Sorlien, pescatore di aragosta del Punta Giuditta, ha visitato il porto di Lincoln ritornando con le storie dei pescatori milionari che vivevano nei palazzi. Ma far funzionare le regole nel modo giusto è molto più difficile di quanto la storia del porto di Lincoln possa suggerire e spesso le buone regole non hanno successo. Uno degli impedimenti comuni ad un efficace coordinamento nei dilemmi sociali consiste nel fatto che le regole che risolvono il problema implementano anche una divisione dei guadagni derivanti dalla cooperazione. Se il giovane Daryl Spencer non fosse stato d'accordo, un giorno, ad aiutare un suo amico pescatore di aragosta sostituendolo, poiché malato, come membro della flotta, qualcun altro sarebbe ora miliardario e Spencer dipingerebbe ancora case e si lamenterebbe degli alti prezzi delle aragoste. I conflitti sulla distribuzione dei guadagni della cooperazione hanno portato al fallimento molti accordi, altrimenti possibili, per limitare l'esaurimento degli stock di pesce. Una confederazione di tribù di pescatori di salmone native del Nord-Ovest dell'America, cercando di limitare la loro pesca decise di allocare delle quote massime di pesca ad ogni tribù1. Nel corso dei mesi di dibattiti ed accordi, in cui varie proposte andavano, più o meno trasparentemente, a beneficio di una o di un'altra tribù o di classi di individui, i seguenti principi di divisione erano stati avanzati: quote allocate in proporzione al numero dei membri della tribù o al numero dei pescatori nella tribù; quote individuali in base all'investimento di ciascun pescatore; una quota per tribù; quote per tribù in base all'investimento aggregato in vivai e protezione dell'habitat; quote a ciascuna tribù sulla base delle risorse impiegate per gli sforzi di trattativa col governo federale americano; infine, quote a ciascuna tribù in proporzione alle relative quantità di pesce pescato al momento del trattato iniziale. Non furono, invece, proposte né la libera concorrenza, né l'utilizzo di permessi, da prezzare sul mercato, per la cattura di specifici quantitativi. La varietà delle proposte e i loro effetti disparati sulla distribuzione del reddito tra le tribù suggerisce quanto sia difficile un accordo sulla divisione dei profitti derivanti dalla cooperazione.
1
Descritto in Singleton (2004).
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|3
I problemi di coordinamento sono presenti ovunque – esaurire uno stock di pesce è di poco differente nella struttura formale di incentivi, dall'intasamento di un'autostrada senza pedaggio o di Internet, da fenomeni di corsa agli armamenti o di free-riding 2 sui lavori di squadra, dal cosiddetto “consumo vistoso” (conspicuous consumption3), dalla competizione fiscale tra nazioni, o dal lasciare a qualcun altro il compito di dire ai vicini di abbassare il volume della loro TV. L'ubiquitá di questi cosiddetti problemi dei beni comuni spiega la notorietà della famosa tragedia di Hardin, introdotta nel capitolo 1, e l'impressionante ammontare di ingegno umano che è stato investito nel trovare i modi per evitare o mitigare le loro costose conseguenze. Tabella 4.1. Una tassonomia dei beni Escludibili Non escludibili
Rivali
Non rivali
Beni privati Proprietà comune
Beni pubblici ‘spuri’ Beni pubblici
La tragedia di Hardin, pur essendo un problema specifico riguardante le risorse di proprietà comune, presenta una struttura sottostante simile a tutti i problemi di coordinamento, i quali, come abbiamo visto nel capitolo 1, sorgono quando l'azione di un individuo comporta dei benefici o dei costi per altri che non siano soggetti a contratti che beneficino l'individuo nel primo caso o lo penalizzino per le sue responsabilità nel secondo. Come risultato, tali effetti “esterni” non vengono considerati quando l'individuo sceglie un'azione. Le risorse di proprietà comune (chiamate anche risorse di fondo comune) sono definite da due caratteristiche: é difficile escludere gli utenti (non escludibilità) e l'uso della risorsa da parte di un utente diminuisce i benefici disponibili agli altri utenti (rivalità). Delle magliette sono beni rivali (il fatto che io la indossi preclude ad un'altra persona di indossarla), mentre l'informazione é tipicamente non rivale (il fatto che io conosca che ore sono non preclude ad altri di trarre beneficio dalla stessa informazione). Queste due caratteristiche definiscono la tassonomia nella tabella 4.1. Esempi di risorse di proprietà comune e dei relativi problemi di coordinamento includono la congestione nel trasporto e nelle reti di comunicazione, l'abuso delle foreste di libero accesso, le riserve di pesca, le riserve di acqua, e persino 2
3
Il problema del “free rider” rappresenta la presenza di consumatori che approfittano dei consumi collettivi non partecipando adeguatamente al loro finanziamento. (Le espressioni free rider e free riding si riferiscono al caso di una persona che usa il mezzo pubblico senza pagare il biglietto contando sul fatto che il costo del trasporto venga pagato dagli altri utenti). Fonte: Zamagni, Microeconomia, pag. 735 La prima formulazione del concetto di “consumo vistoso” (conspicuous consumption) è stata offerta, com’è noto, dal sociologo T. Veblen in ‘La teoria della classe agiata’, Milano 1969 [Ed. orig. 1899].
4 | MICROECONOMIA
gli status symbol e la concorrenza accanita che essi generano. Un esempio importante di bene di proprietà comune ispirato dal concetto di conspicuous consumption di Thorsten Veblen è quello dei beni posizionali, i cui esempi includono potere e prestigio: la rivalità esiste perché il valore del bene dipende dalla sua distribuzione – il potere di una persona è incrementato dalla mancanza di potere di qualcun altro. Similmente, il conspicuous consumption di un bene di lusso ha valore proprio perchè non emulato da tutti. I beni non rivali, ma dai quali gli utenti possono essere facilmente esclusi (l'opposto dei beni di proprietà comune) possono essere chiamati beni pubblici spuri poiché l'esclusione non ne aumenta il valore sotto tali condizioni. Alcuni esempi includono la raccolta del pedaggio in una strada poco usata o il biglietto d'ingresso di un museo poco visitato. Le risorse di proprietà comune condividono le caratteristiche della difficoltà di esclusione con i beni pubblici, e le caratteristiche di rivalità con i beni privati. Al contrario, i beni pubblici sono sia non escludibili che non rivali, distinguendosi per entrambe le caratteristiche dai beni privati. La struttura di incentivi in presenza di beni pubblici e delle risorse ad accesso comune (common pool resources) è la seguente. Un gruppo di n membri ha un progetto comune, al quale tutti possono contribuire e dal quale tutti possono trarre benefici. Chiamando e 0 lo sforzo devoluto al progetto dal membro j, la funzione di utilitá del membro j (identica per tutti i membri) è j
( )
u = be + c e j
j
j
(4.1)
con = ( e ) per k =1...n dove la disutilità del contributo al progetto, ( ) , è una funzione crescente e concava nel suo argomento e l'offerta totale del bene pubblico, , è crescente rispetto alla somma dei contributi dei membri, cosicché ' > 0 . Il progetto produce un bene pubblico se c > 0. (Se c < 0, il progetto k
produrrebbe un “male” pubblico, e la terminologia sopra continuerebbe ad essere valida; ad ogni modo, per mantenere l'esposizione semplice, assumeremo c > 0). Il bene è non escludibile perché be + c > 0 puó essere soddisfatta quando j
e = 0 (ovvero, quando il membro j é un free rider sul contributo degli altri). Il bene è j
non rivale perchè il beneficio tratto dall'individuo j , condizionato al livello del bene pubblico prodotto, vale a dire c, è indipendente dal numero dei partecipanti al progetto. Nel caso in cui c > 0 e b = 0 , abbiamo un bene pubblico puro; se c > 0 e b > 0 , il progetto produce un bene pubblico impuro. (Ovviamente, se c = 0 e b > 0 il
bene è privato).
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|5
I beni pubblici non sono prodotti a sufficienza (e i mali pubblici sono prodotti in eccesso) perché c 0 , cosicché gli individui che agiscono in modo non cooperativo non tengono conto dei benefici che il loro sforzo conferisce agli altri, vale a dire, c ' . Per capire tale punto assumiamo b = 0 (un bene pubblico puro) e, ignorando gli indici (dato che le funzioni di utilità dei membri sono identiche), la somma delle loro utilità, , è = n(c (ne) - (e))
(4.2)
Scegliendo e cosí da massimizzare richiede cn ' = ' , ovvero l'uguaglianza tra il beneficio marginale dello sforzo dedicato alla produzione del bene pubblico e la disutilità marginale dello sforzo. Ogni individuo, selezionare e in modo da massimizzare l'utilità (eq. 4.1) in modo non cooperativo, sceglierà c ' = ' , contribuendo, quindi, in maniera subottimale (questo rappresenta un massimo solo se c '' < '' , ovvero se la disutilità dello sforzo è crescente rispetto allo sforzo con un tasso di crescita maggiore del prodotto marginale dello sforzo). Al contrario del caso del bene pubblico, il problema della risorsa di proprietà comune ha la forma seguente. Assumiamo = ( e ) prima crescente e poi k
decrescente nel suo argomento. Supponiamo che il beneficio individuale derivante dal progetto ( be + c nel caso del bene pubblico) sia s (e ) , dove s =1 per j
j
j
j
j =1...n , con s (
) crescente nel suo argomento ed identica per tutti gli agenti. L'utilità derivante dalla risorsa di proprietà comune per l'individuo j é quindi j
( )
( )
u = s e e j
j
j
(4.3)
j
Quindi, il membro j ottiene una quota del bene, s , determinata dal suo livello di sforzo, e le quote sono esaustive per cui il bene é rivale. Il bene é non escludibile poiché ogni membro é libero di devolvere sforzo nel progetto. Facendo uso, nuovamente, del fatto che membri identici contribuiscono lo stesso ammontare, j
e , l'utilità totale in questo caso é
= ( ne ) n (e )
(4.4)
Dato che la risorsa ad accesso comune (common pool resource) é un bene rivale, l'ottimo sociale (derivato scegliendo e così da massimizzare ) richiede (per e positivo) che ' = ' che, come ci si potrebbe aspettare, impone che il beneficio marginale eguagli la disutilità marginale dello sforzo. Ma l'ottimizzazione dell'individuo non cooperativo (che varia e per massimizzare u nell'equazione j
4.3) dà la seguente condizione di primo ordine per ogni membro:
j
6 | MICROECONOMIA
s' + ' s = ' j
j
j
I termini a sinistra rappresentano il beneficio marginale dell'aumento dello sforzo; essi catturano l'effetto di un maggiore sforzo sulla quota individuale di risorsa comune e l'effetto dello sforzo aggiuntivo sul valore della risorsa moltiplicato per la quota dell'individuo. Se ' < 0 , come avverrebbe nel caso in cui la risorsa fosse una zona di pesca o un'altra risorsa naturale del tipo descritto sopra, l'utilità totale verrebbe massimizzata ponendo e = 0 per ogni membro. Ma a meno che la quota individuale della degradazione della risorsa, ' s , sia ampia, la determinazione non j
cooperativa dei livelli di sforzo risulterà nell'ipersfruttamento. Ciò accade poiché s ' + ' s risulterà positivo (anche con ' < 0 ), determinando un livello positivo di j
j
sforzo profuso. Quando le azioni possibili per un individuo sono limitate ad un set di strategie distinte, sia i problemi riguardanti beni di proprietà pubblica che quelli riguardanti beni di proprietà comune assumono la forma di un Dilemma del Prigioniero ad n-persone con l'equilibrio dato da una strategia dominante Paretoinferiore, introdotta nel capitolo 1. In questo capitolo, analizzeremo un caso più generale in cui gli agenti possono continuamente cambiare le loro strategie in due modelli generici del problema di coordinamento. Generici perchè comprendono la causa sottostante ai fallimenti del coordinamento – incompletezza contrattuale – ed includono l'interazione della “mano invisibile” come caso limite. Di fatto, tutti i problemi di proprietà comune o beni pubblici coinvolgono un ampio numero di persone, ma per motivi di chiarezza la struttura sottostante degli incentivi e le possibili soluzioni dei problemi sono introdotte nell'esempio con due persone (tornando ai pescatori), con il quale inizieremo la prossima sezione. Presenteremo poi una versione ad n-persone dello stesso modello, illustrandolo con il problema della produzione di squadra. Mostreremo come le preferenze sociali, ad esempio la vergogna, il senso di colpa o la reciprocità possano permettere il coordinamento delle azioni di un ampio numero di persone nel loro interesse reciproco. Infine verrà considerata una tassonomia dei problemi di coordinamento basati sulla natura dei sottostanti aspetti non contrattuali.
LA
T R A G E D IA D E I P E S C ATO R I R IV IS ITATA
Le assunzioni. Torniamo ai due pescatori, che chiameremo ora Sopra e Sotto, per facilitare l'esposizione. Essi pescano nello stesso lago, usando il loro lavoro e le loro reti. Essi consumano quanto pescano e non effettuano nessuna attività di scambio, né stipulano alcun accordo su come organizzare le loro attività economiche.
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|7
Eppure l'attività di ciascuno ha effetto sul benessere dell'altro: più Sopra pesca, più difficile diventa per Sotto catturare del pesce, e viceversa. Per essere più specifici (usando lettere minuscole per Sotto e maiuscole per Sopra): y = (1 E)e
Y = (1 e)E
(4.5) dove y,Y = ammontare di pesce pescato da Sotto, Sopra in un certo lasso di tempo dato; = costante positiva che varia al variare della misura delle reti di ciascuno; = costante positiva che misura l'effetto (avverso) della pesca di Sopra sulla pesca di Sotto e viceversa; e e,E = ammontare di tempo (espresso in una frazione di ventiquattro ore al giorno) che Sotto e Sopra impiegano pescando4. E' naturale aspettarsi e differenti per i due pescatori (uno dei due può avere reti più larghe e per tale ragione avere un impatto maggiore sul successo di pesca dell'altro), ma per semplicità le supponiamo uguali. Ognuno dei due pescatori ricava benessere nel consumare pesce e subisce una perdita per lo sforzo addizionale, secondo la seguente funzione di utilità: u = y e U = y E
2
(4.6)
2
Figura 4.1. La condizione di primo ordine di Sotto
2e
(1 E )
e* Tempo di pesca sotto e FIGURA 4.1. La scelta di e di Sotto uguaglia la disutilità marginale del lavoro con il beneficio marginale del tempo permesso per pescare, data l'azione di Sopra, E.
4
La produttività media e marginale di un pescatore non varia con l'ammontare della pesca ma è ridotta dalla pesca dell'altro (ricorda che in ogni contesto pratico l'atro pescatore rappresenta gli sforzi di pesca totali di un largo numero di altri). Assumere che l'output sia lineare nello sforzo di ciascuno, ma decrescente nella somma degli sforzi degli altri e' un'approssimazione ragionevole per un n largo.
8 | MICROECONOMIA
Miglior risposta ed Equilibrio di Nash. Le miglior risposte non sono più delle strategie singole condizionate ad una data azione degli altri (come nel capitolo 1 dove l'insieme delle strategie era discreto) ma sono ora delle funzioni di miglior risposta (best response) che indicano, per ogni azione che può essere intrapresa dagli altri, qual è la miglior risposta (best response), vale a dire, quella che massimizza l'utilità dell'agente rispetto all’azione dell'altro agente. La funzione di miglior risposta (best response) é derivata massimizzando l'utilità di ogni agente condizionata all'azione intrapresa dagli altri. Il fatto che noi siamo soliti derivare la funzione di miglior risposta (best response) in questo modo non implica che gli agenti risolvano il problema di ottimizzazione (talvolta abbastanza complicato) consapevolmente ogni volta che essi intraprendono un'azione. Il punto generale qui, rilevante per il resto del libro, è che l'uso dei modelli ottimizzanti come strumenti analitici non richiede che i modelli siano una descrizione del modo in cui gli individui giungono ad una decisione, a condizione che gli agenti agiscano come se essi stessero risolvendo il problema. In molti, forse la maggior parte dei casi, un'assunzione ragionevole riguardo il comportamento umano é quella degli agenti adattivi modellati nei capitoli 2 e 3; ovvero, noi occasionalmente osserviamo che cosa stanno facendo le persone simili a noi e tendiamo a copiare coloro che sembrano passarsela meglio. Possiamo scegliere consapevolmente una pratica di comportamento disegnata per funzionare nella media e poi adottarla finché non produce risultati insoddisfacenti. L'adattamento di tale comportamento porterà il pescatore ad agire come se fosse un massimizzatore, per lo meno nella media e nel lungo periodo. Il problema di ottimo che produce la funzione di miglior risposta (best response) di Sotto consiste nel variare e così da massimizzare u = (1 E)e e
2
Differenziando u rispetto ad e e ponendo il risultato uguale a zero per trovare il livello ottimo dello sforzo produce la condizione di primo ordine u = (1 E) 2e = 0 e
che chiaramente richiede a Sotto di eguagliare la produttività (utilità) marginale del suo lavoro (il primo termine) alla disutilità marginale del suo sforzo (il secondo termine), come illustrato nella figura 4.1. La condizione di primo ordine fornisce una formula semplice per la funzione di miglior risposta (best response):
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|9
e = (1 E) /2 e
(4.7) La funzione di miglior risposta (best response) per Sopra é derivata allo stesso modo. Esiste un altro modo di rappresentare la funzione di miglior risposta (best response) che sarà illuminante per quanto seguirà. Utilizzando le funzioni di utilità di cui sopra, possiamo scrivere la funzione di utilità di Sotto come funzione del suo livello di sforzo e di quello di Sopra: v = v(e,E) V = V(e,E) Disegnate nel piano (e,E), come nella figura 4.2, tali funzioni descrivono il luogo delle curve di indifferenza (sono presentate solo quelle di Sotto), e ponendo dv = v de + v dE = 0 e
e
vediamo che dE v = de v
e
E
Dunque, sappiamo che le pendenze delle curve di indifferenza (per Sotto) sono v / v , e analogamente per Sopra. L’esperimento consiste nel tenere costante un e
E
certo livello di tempo dedicato alla pesca per Sopra e chiedersi quanto dovrebbe pescare Sotto date tali circostanze. Nella figura 4.2 ciò è rappresentato dalla linea orizzontale tratteggiata che passa per E (che corrisponde ad un livello arbitrario di sforzo per Sopra) come vincolo, e lasciare Sotto massimizzare la sua funzione di utilità, trovando il punto di tangenza tra la sua curva di indifferenza più alta possibile ed il vincolo. La pendenza del vincolo è zero, così che il punto di ottimo richiede che anche la pendenza della curva di indifferenza di Sotto sia zero e ciò richiede che v = 0 come abbiamo visto sopra. La funzione di miglior risposta (best response) di Sotto e
verrà denotata con e*=e*(E), dove l'asterisco indica una soluzione ad un problema di ottimo. La rappresentazione di e*(E) nella figura 4.2 è il luogo dei punti nei quali v = 0 e in corrispondenza dei quali Sotto non avrebbe quindi alcun incentivo a c
cambiare quanto fatto. Sappiamo che l'equilibrio di Nash consiste in una miglior risposta (best response) reciproca. Il valore di equilibrio di Nash di e può quindi essere calcolato sostituendo la funzione di miglior risposta (best response) di Sopra in quella di Sotto e risolvendo per e, come illustrato nella figura 4.3. Data la (assunta) simmetria del problema, abbiamo sia per Sopra che per Sotto: e = /(2 + ) = E N
N
10 | MICROECONOMIA
(4.8) Cosa ci dice tale valore? Senza conoscere la struttura istituzionale delle interazioni tra i pescatori non possiamo dire, in alcun modo, quali saranno i loro livelli di pesca: i valori di equilibrio di Nash possono essere irrilevanti se uno dei pescatori gode del privilegio della prima mossa, per esempio. Ma può trattarsi di un risultato poco probabile per una ragione persino più semplice: l'equilibrio di Nash può essere instabile.
Figura 4.2. La funzione di miglior risposta (best response) per Sotto, e*(E).
Dinamiche di Disequilibrio e Stabilità. La stabilità richiede che piccole deviazioni dal punto di equilibrio siano auto-correttive. Per verificare la stabilità occorre conoscere qualcosa sul comportamento dei pescatori al di fuori del punto di equilibrio: come si comportano quando non si trovano nell'equilibrio di Nash? A volte, può essere illuminante pensare alla figura come ad una mappa topografica con e*=e*(E) a descrivere una cresta. Il processo ottimizzante di Sotto è un algoritmo il cui obiettivo è risalire la cresta: per e e * le condizioni di primo ordine di Sotto non sono soddisfatte, e per e < e * possiamo vedere dalla figura 4.1 che (1 E ) > 2e , ovvero il beneficio marginale della pesca eccede il costo (la disutilità)
marginale del pescare, cosicché Sotto deciderà di pescare di più.
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|11
e*(E)
/2 E
z N
E*(e)
e
N
/2
e
Figura 4.3. La dinamica fuori dall'equilibrio e un equilibrio di Nash stabile. Si noti: la frecce indicano una risposta al disequilibrio dei due pescatori (movimento orizzontale per Sotto, verticale per Sopra). Il punto z rappresenta l'equilibrio di Nash.
Le dinamiche al di fuori dell'equilibrio vengono modellate come segue: coerentemente con l'idea che le persone hanno capacità cognitive limitate, assumiamo che i pescatori si comportino nel modo seguente. Alla fine di ciascun periodo il comportamento viene modificato nella direzione che sarebbe stata ottima data l'azione scelta dall'altro. Tale atteggiamento è miopico in entrambe le direzioni: si guarda al passato di un solo periodo (usando solo l'informazione del periodo precedente per determinare cosa fare nel periodo successivo), e non si guarda affatto ai periodi successivi (assumendo che l'azione dell'altro non cambi tra questo periodo e quello precedente). Tale comportamento equivale a seguire la regola seguente: nel prossimo periodo, ci si muove nella direzione dell'azione che sarebbe stata ottima in questo periodo. Chiamando e' e E' l'azione dei pescatori nel prossimo periodo, abbiamo e = e'- e = (e* -e) E = E'- E = (E* -E)
12 | MICROECONOMIA
Figura 4.4. Un equilibrio di Nash instabile (z). Si noti che vi sono anche due equilibri di Nash stabili (z' e z'').
dove e sono entrambe frazioni positive (0,1] che denotano la velocità di aggiustamento (la misura in cui il gap tra il livello desiderato ed effettivo di pesca si riduce per effetto della scelta del livello di pesca del prossimo periodo). Ovviamente la velocità di aggiustamento può differire tra i due pescatori (Sotto può avere vicino a zero e Sopra rispondere come un Homo economicus con =1). La dinamica del sistema espressa da queste equazioni rivela come, decidendo la propria mossa, ciascuno si avvicini alla propria funzione di miglior risposta (best response), come indicato dalle frecce nella figura 4.3. In ogni caso, e forse sorprentemente, il fatto che ogni pescatore muova verso la rispettiva funzione di miglior risposta (best response) non è sufficiente ad assicurare la stabilità dell'equilibrio di Nash, definito dalla loro intersezione. Per capire tale punto, supponiamo che le funzioni di miglior risposta (best response) siano tali che se Sopra ha pescato un'ora in più, Sotto pesca due ore in meno (de*/dE= -2), e viceversa; ed immaginiamo che i due stiano pescando ai rispettivi valori di equilibrio di Nash. La figura 4.4 descrive la dinamica al di fuori dell'equilibrio: l'equilibrio di Nash é un punto di sella e le perturbazioni dai valori di Nash non sono auto-correttive. Il fatto che un equilibrio di Nash sia asintoticamente stabile dipende dalle pendenze relative delle due funzioni di miglior risposta (best response). Consideriamo, per iniziare, il caso stabile, la figura 4.3. Affinché i valori di Nash siano stabili, nessun pescatore deve essere troppo reattivo all'altro; ovvero, nella figura 4.3, è necessario che la funzione E*(e) sia meno pendente della funzione e*(E). Usando le funzioni di miglior risposta (best response) derivate sopra, ciò richiede che /2 < 2/
(4.9)
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|13
ovvero richiede che < 2 , il che implica che l'effetto delle variazioni della pesca di Sopra su Sotto, de*/dE sia minore, in valore assoluto, di 1. L'espressione sarebbe più complessa nel caso in cui e differiscano per i due pescatori, ma l'intuizione sottostante rimarrebbe la stessa: la stabilità richiede che gli agenti non reagiscano eccessivamente. La stabilità può essere considerata una condizione necessaria ma non sufficiente affinché l'equilibrio di Nash sia una buona predizione di un comportamento effettivo. Una ragione di ciò é familiare: come abbiamo visto nel capitolo 2, vi possono essere molti equilibri di Nash, come nella figura 4.4. La seconda ragione é meno trasparente: le norme realistiche sulla base delle quali gli individui adattano i loro comportamenti possono non riuscire a muovere i giocatori in direzione dell'equilibrio di Nash, anche se esso é unico e stabile. In ogni interazione complicata, gli individui possono fallire nell'imparare a giocare un equilibrio di Nash. Ma anche in un gioco apparentemente semplice – per esempio Sasso, Carta, Forbice – nessun agente reale o simulato al computer gioca una strategia di equilibrio di Nash anche dopo centinaia di giocate (Sato, Akiyame e Farmer 2002). Sasso, Carta, Forbici ha un'unica strategia mista di equilibrio di Nash (giocare ogni strategia a caso con probabilità un terzo), ma pochi giocatori lo fanno. I giochi con un'unica strategia di equilibrio di Nash pura sono molto più facili da giocare, anche se la struttura del gioco é molto più complicata di Sasso, Carta, Forbici. Risultati Pareto-Inferiori. L'equilibrio di Nash è un ottimo Paretiano? Sappiamo che ciò richiederebbe la tangenza delle due curve di indifferenza dei pescatori: v V = v V e
e
E
E
Questa equazione definisce il luogo dei contratti efficienti, ovvero, il luogo di tutte le coppie Pareto efficienti di tempi di pesca dei due. Sappiamo che rispetto ad ogni allocazione in cui entrambi pescano e i luoghi di indifferenza non sono tangenti – cioè si intersecano – esiste una diversa allocazione che farebbe star meglio entrambi. Ma l'equilibrio di Nash é un punto su entrambe le funzioni di reazione, definito rispettivamente da v = 0 e V = 0 . Nel punto di equilibrio di Nash, i due e
E
luoghi di indifferenza non possono essere tangenti; infatti sono perpendicolari. Per cui, in questo caso, l'equilibrio di Nash non è un ottimo Paretiano. Due punti sul luogo dei contratti efficienti, p e , sono indicati nella figura 4.5. Per capire perchè l'equilibrio di Nash é un'allocazione Pareto-inferiore, immaginiamo che i due pescatori possano raggiungere un accordo in base al quale
14 | MICROECONOMIA
entrambi pescano un ammontare arbitrario di pesce in meno. Quanto inciderebbe sul (poiché il pescare di ciascuno ha loro benessere? Sappiamo che V < 0 e v influenza su quello dell'altro, come indicato da nella loro funzione di produzione). Quindi, rappresentando con de <0 e dE <0, i loro ipotetici accordi di riduzione della pesca, abbiamo bisogno di valutare il cambiamento nell'utilità di ciascuno: e
E< 0
dv = deve + dE v >0 dV = de V + dE V >0 E
e
E
(4.10)
Si noti che V < 0 e v < 0 poiché tali uguaglianze definiscono le funzioni di miglior risposta (best response) dei pescatori e quella di Nash é una miglior risposta (best response) reciproca. Quindi, entrambe le espressioni sono positive: l'utilità di ciascuno verrebbe aumentata da un accordo di riduzione della pesca. Si noti la logica di base: ciascuno vorrebbe che l'altro pescasse meno, e (questa é la parte importante) dato che essi hanno fissato il loro quantitativo di pesca al livello ottimale, non si preoccupano di una riduzione (infinitesimamente piccola) dei loro livelli di pesca. La lente creata dai due luoghi di indifferenza nella figura 4.5, contiene un miglioramento paretiano sull'equilibrio di Nash, z. e
E
Se l'accordo è enforceable, entrambi ne possono beneficiare. Ma come si può arrivare a tale accordo e come lo si può rendere enforceable?
E V I TA R E
L A T R A G E D I A D E I P E S C ATO R I
La tragedia dei pescatori illustra la fonte generica dei fallimenti del coordinamento: date le preferenze, i diritti di proprietà rilevanti nel caso, e gli altri aspetti degli incentivi che formano le decisioni, l'impatto negativo della pesca di uno sull'altro ( v e V , rispettivamente) non è preso in considerazione nel processo E
e
ottimizzante di nessuno. In effetti, date le regole presunte del gioco – non ripetuto, interazione non cooperativa – e preferenze auto-interessate è difficile capire come essi possano evitare la tragedia. Ma, come i pescatori di aragoste del Sud dell'Australia, alcuni pescatori riescono, in effetti, a gestire le risorse comuni molto bene. Quando gli individui cooperano per sostenere un bene comune, generalmente ciò avviene perchè essi sono riusciti a convertire la tragedia dei beni comuni in un gioco differente o non hanno preferenze interamente auto-interessate, o entrambe le cose. E' qui che le istituzioni entrano in gioco.
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
1/
|15
e*(E)
/2
E*(e) /2
1/
Figura 4.5. L'equilibrio di Nash: stabilità e non ottimalità
Hardin (1968) credeva che “la libertà sui beni comuni rovina tutti” (p. 1244), e come soluzione sosteneva “una coercizione per tutti e frutto di comune accordo” (p. 1247). Il suo pessimismo Hobbesiano non teneva conto dei molti modi non coercitivi con cui le comunità locali hanno evitato la tragedia (Ostrom, Burger, Field, Norgaard e Policansky 1999). Alcuni approcci includono una migliore definizione e minori impedimenti allo scambio dei diritti di proprietà, il controllo reciproco, l'aderenza alle norme sociali che beneficiano la collettività, e molti altri. Alla base della regolazione possono essere identificati tre approcci: la privatizzazione dei beni comuni, la regolazione dei beni comuni da parte di un ente governativo o di una terza parte, e la regolazione attraverso le interazioni locali tra i pescatori stessi. Questi tre approcci sono talvolta chiamati, rispettivamente, mercato, Stato e comunità (Ostrom 1990, Ouchi 1980, Taylor 1997, Bowles e Gintis 2002b). L'abilità di ciascun approccio di eliminare o attenuare la tragedia dipende dai modi in cui ogni approccio sfrutta l'informazione disponibile rilevante per il problema ed influenza l'uso di tali informazioni ad opera delle parti rilevanti, così come dalle capacità distintive delle istituzioni rilevanti – Stato, mercati e comunità – di influenzare i comportamenti. Mentre la maggior parte degli approcci osservati nella realtà (quelli citati sopra, per esempio) di fatto combinano elementi di tutti e tre, li introdurremo singolarmente per chiarire le loro proprietà. I modelli che seguono semplificheranno di gran lunga le istituzioni reali con cui le comunità locali affrontano questi ed altri problemi di coordinamento. La diversità e la complessità delle istituzioni effettivamente coinvolte sono sbalorditive.
16 | MICROECONOMIA
Per esempio, Ostrom (1999) e i suoi colleghi hanno scoperto ventisette diverse norme locali volte all'esclusione degli altri dai beni di proprietà comune. Esse erano basate su elementi, come la residenza, l'età, la casta, il clan, il livello di competenza, l'uso continuato della risorsa, l'uso di una particolare tecnologia, e così via. Dato che tali regole di esclusione erano spesso usate contemporaneamente, il numero delle definizioni della frontiera delle istituzioni era molto superiore a ventisette. Le norme che regolavano l'accesso alla risorsa per i non esclusi erano ugualmente svariate (come suggeriscono le norme di allocazione competitiva proposte dai pescatori della costa di Nord-Ovest). Le norme osservate che regolavano l'appartenenza, l'allocazione e gli altri aspetti della gestione dei beni comuni, generano letteralmente migliaia di ipotetiche istituzioni per la gestione dei beni comuni. Nella pratica, se ne osservano molte centinaia. Privatizzazione. Supponiamo che uno dei pescatori, diciamo Sotto, possegga il lago e come proprietario possa escludere Sopra o possa regolare l'ammontare di pesce pescato da Sopra. In questo caso, Sotto massimizzerà la sua utilità variando sia e che E. Assumiamo che la prossima migliore alternativa disponibile a Sopra sia tale che la sua utilità sia pari a zero. Nel problema di ottimizzazione di Sotto, un vincolo ovvio é dato dal fatto che se Sopra partecipa alla pesca, egli deve ricevere almeno tanto quanto la sua prossima migliore alternativa. Tale restrizione é chiamata vincolo di partecipazione di Sopra (se violato Sopra non partecipa; se soddisfatto anche debolmente (con un'uguaglianza) supponiamo che Sopra partecipi). Consideriamo ora perchè non é ottimale per Sotto escludere totalmente Sopra dalla pesca. Nel caso della privatizzazione vi sono due tipi di interazione che hanno luogo. Sotto potrebbe concedere una licenza permettendo a Sopra di continuare a pescare indipendentemente ma senza catturare più di un dato numero di pesci, chiedendo a Sopra di pagare per il permesso una somma che non violi il vincolo di partecipazione. Alternativamente, Sotto potrebbe offrire a Sopra un contratto di impiego con il quale Sopra potrebbe pescare sotto la direzione di Sotto e il pesce catturato sarebbe proprietà di Sotto, mentre Sopra sarebbe compensato con un salario (pagato con il pesce catturato in totale dai due) sufficiente a controbilanciare la disutilità del lavoro di Sopra (e quindi a soddisfare il vincolo di partecipazione). Nel caso dei permessi, Sotto determina i livelli ottimali di sforzo nella pesca ( e˜ e E˜ ) e poi emette un permesso di pescare al livello E˜ in cambio del pagamento del prezzo del permesso, F. Per tenere conto del vincolo di partecipazione, esprimiamo l'offerta che Sotto propone a Sopra come soluzione di un problema di massimizzazione vincolata standard, ovvero, variare e e E per massimizzare
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|17
= (1 E)e e + F soggetto a: (1 e)E E F 2
2
Sappiamo che soddisfare il vincolo di partecipazione di Sopra é costoso per Sotto (i due non sono sazi né amano il lavoro così tanto da provvedere all'altro senza costo), per cui il vincolo sarà soddisfatto come uguaglianza. Possiamo usare questa considerazione per eliminare F dall'espressione sopra. Quindi, Sotto dovrebbe selezionare e ed E per massimizzare = (1 E)e e + (1 e)E E 2
2
Si noti che questa quantità non é altro che il surplus congiunto (l'ammontare totale di pesce pescato meno la disutilità totale derivante dal lavoro). La soluzione a questo problema ( e˜ e E˜ ) coincide con il piano allocativo di Sotto, implementato con un piano di distribuzione che richiede a Sopra di pagare una tassa F˜ = (1 e˜ )E˜ E˜ per il permesso di pescare E˜ ore. Poiché il vincolo é soddisfatto 2
come uguaglianza, la soluzione sarà Pareto-efficiente (é uno dei punti del luogo dei contratti efficienti). Il piano allocativo di Sotto é determinato dalla scelta di e e E secondo le condizioni del primo ordine: = (1 E) 2e E = 0 = (1 e) 2E e = 0 e
E
Si noti come queste differiscano rispetto alle condizioni che definiscono il comportamento ottimo nell'interazione non cooperativa descritta sopra: esse sono identiche a parte l'ultimo termine, che cattura l'effetto della pesca di Sopra sul benessere di Sotto (nella prima equazione) e viceversa (nella seconda). Risolvendo per il livello di pesca di entrambi, abbiamo: e˜ = /(2 + 2 ) = E˜
(4.11) che é ovviamente minore rispetto al livello dell'equilibrio di Nash /(2 + ) , dell'equazione 4.8 per l'interazione non cooperativa modellata nella sezione precedente. Si noti che al tendere di a zero, si elimina l'interdipendenza che dà luogo all'eccesso di pesca, l'equilibrio di Nash diventa la soluzione che massimizza il surplus congiunto, come ci si potrebbe aspettare. L'allocazione che massimizza il profitto congiunto é indicata con il punto nella figura 4.5. Il piano di allocazione ottimo é basato sull'assunzione che il vincolo di partecipazione debba essere soddisfatto. Ma perchè non potrebbe essere ottimale per
18 | MICROECONOMIA
Sotto selezionare semplicemente E=0 ed avere accesso esclusivo al lago? La ragione, in questo caso, é che il costo marginale di compensare Sopra per l'impegno profuso nel pescare tende a zero al tendere di E a zero, per cui un livello positivo di E sarà ottimale. (Specificazioni ragionevoli alternative potrebbero prevedere che Sotto ritenga conveniente escludere Sopra dall'uso del lago – per esempio nel caso in cui Sopra abbia una prossima migliore alternativa molto vantaggiosa cosicché diverrebbe costoso per Sotto soddisfare il vincolo di partecipazione). Anziché emettere un permesso, Sotto potrebbe assumere Sopra. Tale caso differisce dal precedente poiché ora Sotto possiede il pesce che cattura Sopra ma deve utilizzare parte della pesca per pagare un salario W a Sopra sufficiente a soddisfarne il vincolo di partecipazione. Sapendo che il vincolo di partecipazione é soddisfatto come uguaglianza possiamo utilizzare il fatto che il salario pagato deve appena controbilanciare la disutilità per lo sforzo di Sopra, ovvero W = E . Ora, 2
Sotto deve scegliere e e E per massimizzare l'espressione (1 E)e e + (1 e)E W , 2
che (sostituendo il valore di W dato dal vincolo di partecipazione) é identico al problema risolto nel caso dei permessi. La struttura base del permesso e dell'impiego non é distinguibile: poiché in entrambi i casi Sopra guadagnerà solo un ammontare pari alla disutilità del lavoro, Sotto sceglie e ed E così da massimizzare il guadagno congiunto, ricompensa Sopra per la disutilità del suo lavoro e trattiene il resto. La privatizzazione produce un risultato Pareto-efficiente perchè colui che prende le decisioni ottimizza soggetto ad un vincolo di partecipazione dell'altro stringente. L'utilità guadagnata dall'altro é semplicemente data dalla sua prossima migliore alternativa, cosicché la questione della distribuzione tra i due é fissata in anticipo. Come risultato, il proprietario – in qualità di colui che può rivendicare i diritti sul guadagno congiunto – massimizza la sua utilità scegliendo un'allocazione che massimizzi l'utilità totale dei due. Il punto qui é che il proprietario ha potere a sufficienza per determinare la distribuzione dei guadagni indipendentemente dall'allocazione del tempo speso nell'attività di pesca, per cui non ha nessun incentivo ad adottare una strategia che non sia la più efficiente. Nel capitolo 5 mostreremo come questo non é un caso generico e che quando l'indipendenza della distribuzione e dell'allocazione fallisce, le allocazioni private tendono ad essere inefficienti. Regolazione Esterna. Spesso é impossibile per un singolo individuo possedere un'intera risorsa di proprietà comune (immaginiamo di stabilire i diritti di proprietà sulla pesca in oceano aperto). E molte risorse di proprietà comune potrebbero essere
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|19
di tali dimensioni da precludere una competizione effettiva sui mercati rilevanti, inducendo, quindi, fallimenti associati con l'esercizio del potere di mercato. In questo caso un governo o qualche altra parte esterna potrebbe essere in grado di migliorare l'equilibrio di Nash del gioco non cooperativo descritto sopra. Come nel caso della privatizzazione si presentano due alternative. Come prima, il regolatore (il governo), avendo tutte le informazioni rilevanti, potrebbe selezionare e ed E in modo da massimizzare il guadagno totale. Il regolatore potrebbe poi implementare un tale risultato attraverso la regolazione diretta, emettendo semplicemente delle licenze che permettano ai pescatori di pescare un dato numero di ore. Quindi il punto nella figura 4.5 rappresenta l'allocazione ottima del regolatore. Assumendo che il regolatore non abbia, a priori, alcuna ragione di favorire l'uno o l'altro pescatore, in termini di distribuzione, rappresenta il piano sia di allocazione che di distribuzione. Si noti che lo stesso punto corrisponde al risultato allocativo (ma non distributivo) del caso della privatizzazione. Piuttosto che implementare il piano allocativo imponendolo per legge, il regolatore potrebbe desiderare di lasciare decidere ai pescatori quanto pescare, alterando gli incentivi che essi affrontano così da evitare i fallimenti del coordinamento che avvengono senza l'intervento governativo. Questo é l'approccio dell'economia del benessere sperimentato dagli economisti del primo ventesimo del secolo, Alfred Marshall e A. C. Pigou (1877-1959); la forma moderna di questo approccio é la Teoria dell'Implementazione, menzionata nel capitolo 1. Secondo tale approccio, il decisore pubblico propone una tassa sull'attività di pesca finalizzata ad eliminare la discrepanza tra i costi marginali sociali e privati e i benefici della pesca. Assumiamo che il ricavato venga corrisposto ai pescatori mediante una somma fissa che essi ignorano nei loro calcoli (come avverrebbe nel caso ben più realistico in cui vi fossero duemila pescatori anziché due). Il problema per il regolatore consiste nel selezionare una tassa che massimizzi la somma delle utilità dei due pescatori nel caso in cui essi scelgano quanto pescare, data la tassa. Qual'é la tassa ottima? Il problema può essere posto nel modo seguente: occorre trovare la tassa che trasformi le funzioni obbiettivo dei due pescatori così che le loro funzioni individuali di miglior risposta (best response) siano identiche a quelle ricavate dalle condizioni di primo ordine del problema di massimizzazione del profitto congiunto, ovvero e = (1 2E) /2 E = (1 2e) /2.
20 | MICROECONOMIA
Muovendoci a ritroso dalle condizioni di primo ordine ai guadagni individuali che derivano da queste ultime e quindi alla tassa, vediamo che la funzione di utilità trasformata u dovrebbe avere la seguente forma (per Sotto)
u = (1 E)e e e
2
e che, se la condizione di primo ordine di Sotto consiste nell'imitare quella che deriva dalla massimizzazione del profitto congiunto, ovvero
du = (1 E) 2e E = 0 de
l'aliquota della tassa per ogni ora di pesca di Sotto deve essere = E . Il lettore può verificarlo sostituendo l'aliquota nel problema di massimo di Sotto e differenziando rispetto ad e. Il risultato dovrebbe produrre le condizioni di primo ordine per il problema di massimo del profitto congiunto. L'aliquota per Sotto dipende dal tempo di pesca di Sopra perchè l'effetto della pesca di Sotto sull'utilità di Sopra dipende dal tempo di pesca di Sopra. Assumendo che il governo sia in grado di far rispettare la regolazione, esso può implementare il piano desiderato sia nella forma di una regolazione diretta che utilizzando l'incentivo della tassa. Ma come può il regolatore acquisire l'informazione necessaria? Si noti che per fissare l'ammontare appropriato dell'aliquota o determinare i livelli ottimi di e ed E, il regolatore deve usare sia l'informazione sulle preferenze dei pescatori che sulla loro tecnologia. Per capire perchè l'ottenimento di queste informazioni può considerarsi un compito molto difficile, basti immaginare una situazione in cui i pescatori siano molti, ciascuno con una tecnologia, distinta e non osservabile dal regolatore, data da per il pescatore i. Ora supponiamo che i
come i-esimo pescatore, sappiate che la tassa di cui sopra verrà implementata e che il regolatore vi chiede di rivelare il vostro . Quale sarebbe la vostra risposta? E, assumendo che ciascun pescatore conosca la tecnologia di ogni altro pescatore, se il regolatore vi chiedesse di rivelare l' degli altri, quale sarebbe la vostra risposta? i
Sembra plausibile che voi riportiate al regolatore i valori dei vari che massimizzano la vostra utilità, ma tale dichiarazione sarebbe inaccurata (voi sovrastimereste la vostra e sottostimereste quella degli altri). Interazioni Locali. I pescatori stessi potrebbero arrivare ad una soluzione, sfruttando il fatto che essi conoscono quanto il regolatore non conosce. Se vi fossero davvero solo due pescatori nel lago, essi si conoscerebbero e la ripetizione dell'interazione permetterebbe a ciascuno di usare la minaccia della ritorsione per rafforzare un risultato migliore. Nelle relazioni diadiche (per esempio compratore e
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|21
venditore), le interazioni ripetute funzionano bene per mantenere la cooperazione; nel capitolo 7 verrà introdotto il gioco ripetuto come modo di sostenere le norme che sostengono i processi di scambio nella maggior parte dei mercati del mondo reale. Ma, nei contesti in cui vi sono molte persone, appropriati per la maggior parte dei beni pubblici e per i problemi delle risorse di proprietà comune, la cooperazione é molto più difficile da sostenere in questa maniera. Dato che risulterà più semplice spiegarne le ragioni una volta introdotti i giochi ripetuti, questa discussione verrà posposta. Vi sono due tipi di approccio con interazioni locali: quelli basati sulle asimmetrie tra i pescatori, e quelli che possono richiedere un rapporto di uguaglianza o di solidarietà tra loro. Tra i primi vi sono quelli basati sulla ricchezza o il potere sproporzionato di uno dei pescatori. Supponiamo che Sotto abbia il potere di selezionare il suo livello di pesca e di vincolarsi ad esso in modo che Sopra capisca che nessuna sua azione potrebbe alterare l'attività di pesca di Sotto. Sopra, ovviamente, può poi selezionare il suo livello di pesca, data la scelta di Sotto. In tal caso Sotto é il first mover, il leader à la Stackelberg. (Heinrich von Stackelberg [1905-1946] usò questo modello per rappresentare il meccanismo di formazione del prezzo in un duopolio.) Come decide Sotto quale livello di pesca scegliere? Il first mover inizia anticipando cosa fará il second mover come reazione ad ognuna delle azioni del first mover, poi seleziona l'azione che massimizza la sua stessa utilità, data la reazione del second mover o follower (quello di quest’ultimo é un atteggiamento da satellite, cioè di mero adeguamento alle scelte effettuate dal leader). Questo rappresenta un cambiamento semplice ma importante nelle assunzioni del comportamento dei due pescatori: Sotto ora riconosce e si avvantaggia del fatto che, scegliendo i vari livelli di pesca, può influenzare la scelta di Sopra. Il comportamento di Sotto é, dunque, strategico (tiene conto dell'effetto delle sue azioni sulle azioni dell'altro). Notate che in questo caso il processo di ottimizzazione di Sotto é vincolato non più da un livello di utilità di Sopra (come nel caso del vincolo di partecipazione soddisfatto), ma da un comportamento di quest'ultimo, dato dalla sua funzione di miglior risposta (best response). Come risultato, la soluzione non é un ottimo paretiano. Il vantaggio della prima mossa di Sotto gli permette di migliorare la sua posizione rispetto all'equilibrio di Nash, in questo caso alle spese di Sopra, il cui risultato come second mover é peggiore rispetto all'equilibrio di Nash. Il deterioramento della posizione del second mover non é un risultato generale: può sembrare strano ma il second mover puó stare meglio o peggio rispetto all'equilibrio di Nash di un gioco simultaneo.
22 | MICROECONOMIA
(Un esempio di un second mover che migliora la sua posizione come “Stackelberg follower” rispetto all'equilibrio di Nash verrà offerto tra breve). Nel caso in cui Sotto avesse ancora più potere, potrebbe proporre a Sopra un'offerta prendere o lasciare, specificando quanto e in che modo Sopra dovrebbe pescare, forte della minaccia che se Sopra non accettasse l'offerta, Sotto pescherebbe semplicemente al livello dell'equilibrio di Nash di un gioco simultaneo. Tale situazione riproduce semplicemente il caso della proprietà privata del bene con la differenza che ora il vincolo di partecipazione di Sopra deve per lo meno uguagliare il risultato dell'equilibrio di Nash. Il risultato é ovviamente Pareto-efficiente. Come nel caso della privatizzazione e delle soluzioni basate sull’intervento governativo di cui sopra, la soluzione basata sulle interazioni locali, basandosi sulle asimmetrie tra i pescatori, può andare incontro a seri problemi informativi basati sul fatto che l'informazione sottostante é privata e i pescatori possono trovare conveniente nascondere o distorcere le informazioni che essi rendono disponibili. Ciò avviene soprattutto quando l'informazione é richiesta da un outsider (come nel caso della soluzione basata sull'intervento governativo) o fornita da un pescatore all'altro quando i risultati distributivi sono altamente ineguali (e quindi possono generare distanza sociale o perdita di norme comuni come la reciprocità). Un approccio basato su relazioni più simmetriche tra i pescatori può essere quello di un accordo negoziato, rafforzato dal controllo reciproco. I due pescatori possono condividere le loro informazioni e decidere di pescare in corrispondenza dell'ottimo che massimizza il profitto congiunto (ciascuno pesca e gode dello stesso ammontare di pesce), utilizzando un monitoraggio reciproco per scoprire eventuali violazioni dell'accordo, con la minaccia di ritornare a pescare al livello non cooperativo (il risultato di Nash del gioco simultaneo) nel caso in cui l'altro violasse l'accordo. Essi possono dunque definire il risultato non cooperativo come la loro posizione di riserva, laddove il luogo dei contratti efficienti rappresenta (e la posizione di riserva definisce) l'insieme di contrattazione, ovvero, l'insieme di tutti i risultati che sono Pareto-superiori alla posizione di riserva. Svilupperemo gli strumenti analitici per studiare questo caso nei capitoli 5 e 7. La soluzione delle contrattazioni con monitoraggio reciproco si basa su tre caratteristiche importanti che riguardano le interazioni in molti piccoli gruppi: (1) é probabile che i partecipanti abbiano buone informazioni sulle preferenze, le tecnologie e le azioni degli altri, (2) essi raggiungono un accordo sulla considerazione di un principio distributivo giusto, e (3) possono controllarsi l'un l'altro data la vicinanza e le norme sociali condivise. Queste tre caratteristiche fanno sì che i piccoli
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|23
gruppi spesso abbiano una capacità di risolvere i problemi di coordinamento che non è disponibile agli approcci basati interamente sullo stato o sul mercato. Gli esperimenti sul Gioco dei Beni Pubblici, descritti nel capitolo 3, rendono chiaro come le persone tendano a punire membri del gruppo i cui atteggiamenti violano alcune norme stabilite, anche quando l'imposizione della pena é costosa o non vi sono benefici materiali derivanti da un cambiamento di comportamento di coloro che vengono puniti. Torneremo a parlare di controllo reciproco (tra i membri di una squadra di produzione) nella prossima sezione. Un secondo approccio consiste nel considerare il fatto che frequenti relazioni sociali tra i pescatori non forniscono loro solo informazioni sull'altro, ma possono anche generare sentimenti di interesse riguardo il benessere dell'altro. Dagli esperimenti sul Dilemma del Prigioniero e sul Gioco dei Beni Pubblici (Frey e Bohnet, 1996, Sally, 1995; Kollock, 1992) sappiamo che l'identificazione sociale e la comunicazione tra i partecipanti possono risolvere o attenuare i fallimenti del coordinamento – persino quando non si possono stringere accordi vincolanti – mentre la distanza sociale ne costituisce un impedimento. Quindi, le preferenze e i principi rilevanti per il problema possono dipendere dall'approccio istituzionale usato per risolvere il problema: lo stato, il mercato e la comunità (gerarchica o egualitaria), evocano ciascuno preferenze differenti. Per capire come l'interesse riguardo il benessere dell'altro possa aiutare a risolvere il problema di coordinamento, immaginiamo che l'utilità di ciascuno sia definita come sopra con l'aggiunta di un peso a (0,1], basato sull'utilità dell'altro, cosicché l'utilità di Sotto diventa u = (1 E)e e + U 2
e analogamente per Sopra. Le condizioni di primo ordine che definiscono la miglior risposta (best response) individuale sono le seguenti (1 E) 2e aE = 0 (1 e) 2E ae = 0
che mostrano come ciascuno tenga conto di una frazione, a , della disutilità che la propria pesca arreca all'altro. Un tale interesse per il benessere dell'altro può quindi sostituire l'imposizione della tassa per attenuare i fallimenti del coordinamento. Qual’é il livello di interesse al benessere altrui che implementerebbe un ottimo sociale? Affinché le condizioni di cui sopra eguaglino quelle di un problema di massimo del profitto congiunto, ciascun pescatore dovrebbe essere tanto altruista
24 | MICROECONOMIA
quanto auto-interessato (vale a dire a =1). Ciò può suggerire il motivo per cui la maggior parte delle comunità di successo (persino le più utopiche come le Amish o le Hutterites) non si basino interamente su un sentimento di altruismo, ma utilizzino anche il controllo reciproco e la punizione nel caso di violazione delle norme. Una caratteristica comune degli approcci per evitare la tragedia consiste nel fatto che, a prescindere da chi sceglie l'allocazione (e,E), essa é determinata dal fatto che si tiene conto del costo inflitto a ciascuno dalla pesca dell'altro. Nel caso altruistico ciò é ovvio, ma lo é leggermente meno nel caso di un regolatore che massimizza l'utilità congiunta dei due. Lo può essere, a sorpresa, anche nel caso della privatizzazione e del potente first mover che propone un'offerta prendere o lasciare. In questi due casi, il vincolo di partecipazione é stringente, e il proprietario o il first mover tengono conto del benessere del meno fortunato, in maniera non differente da quanto farebbe il pescatore stesso. Questi due casi mettono in luce una differenza principale. Mentre tutti gli approcci (ad eccezione dell'altruismo incompleto e della leadership à la Stackelberg) implementano un'allocazione Pareto-ottima, essi differiscono sostanzialmente per la distribuzione del benessere nell'equilibrio che ne risulta. Introdurremo ora un altro esempio importante, la produzione di squadra, per illustrare l'interazione a n persone e per comprendere come contratti efficienti e preferenze sociali possano, a volte, sormontare i problemi di coordinamento.
P R O D U Z IO N E
DI SQUADRA
Nelle economie moderne, un esempio molto diffuso del problema della risorsa di proprietà comune deriva dalla produzione di squadra; gruppi di produttori – spesso impiegati nella stessa impresa, a volte anche a centinaia – contribuiscono alla produzione e dividono il profitto che ne risulta. La squadra può essere anche composta da un gruppo di professionisti che condividono una professione (comune tra dottori e avvocati) o un'impresa cooperativa di cui sono proprietari i lavoratori. Supponiamo che i membri di una squadra di n persone producano congiuntamente un bene, laddove il livello di prodotto dipende dall'azione (che chiameremo “sforzo sul lavoro”) intrapresa dagli n membri, a [0,1], secondo la i
seguente funzione di produzione q =ga-k (4.12) dove a = a rappresenta la somma per gli n membri e g e k sono costanti positive (conosciute agli n membri). Dato che i membri della squadra sono identici, i
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|25
trascureremo gli indici, con l’esclusione del caso in cui siano necessari per evitare ambiguità. Non vi sono altri input a parte le azioni dei membri della squadra (pensiamo ad una compagnia di danza che si esibisce in luoghi pubblici). Le funzioni di utilità identiche per tutti i membri sono u = u ( y,a ) , dove y rappresenta il guadagno del lavoratore e u é decrescente e convessa in y. La posizione di riserva di ciascun membro é data da z. I membri della squadra cercano una strategia di allocazione del guadagno prodotto dal loro lavoro, riconoscendo la possibilità che alcuni membri potrebbero approfittarsi dello sforzo dei compagni di squadra. Come termine di paragone, i membri della squadra implementano un esperimento, rispolverando il sempre utile caso di Robinson Crusoe, il quale, vivendo isolato, non deve preoccuparsi di problemi di coordinamento ed è quindi in grado di trovare una soluzione efficiente. Essi sanno che se la produzione potesse avvenire ad opera di un unico produttore, proprietario del prodotto finale, il proprietario-produttore selezionerebbe un livello di sforzo per massimizzare l'utilità, con la seguente condizione di primo ordine u g+u =0 y
a
(4.13)
o g = u / u uguagliando la produttività marginale dell'azione al saggio marginale di sostituzione tra lo sforzo ed il bene nella funzione di utilità del produttore. I membri della squadra cercano quindi di implementare l'allocazione (il livello delle a) che deriva da tale condizione di primo ordine per ogni membro. Essi quindi prima sciolgono la squadra in modo che ogni membro possa lavorare da solo come faceva Robinson Crusoe. Ma c'é una ragione per l'esistenza della squadra: assumiamo che l'esistenza di un costo fisso k, faccia sí che il livello dello sforzo implementato dalla condizione di primo ordine di cui sopra, a*, sia tale che u(ga*-k, a*)< z. La soluzione di Crusoe non sarebbe possibile dati gli alti livelli del costo fisso. a
y
Ovviamente, se i membri riuscissero a raggiungere un accordo credibile sulle azioni intraprese da ciascuno, essi potrebbero facilmente implementare il livello di sforzo di Crusoe come soluzione cooperativa. Ma spesso, mentre il prodotto é facilmente misurabile, le azioni intraprese dagli altri membri non sono pienamente osservabili o, più in generale, l'informazione sul comportamento degli altri non é sufficiente a rendere enforceable un contratto scritto su a (ovvero il contratto non é verificabile). Supponiamo che i membri della squadra si incontrino per trovare una soluzione nella forma di un contratto espresso in termini dell'informazione che é
26 | MICROECONOMIA
verificabile. Essi ragionano nel modo seguente: la squadra offre ai suoi membri un contratto al quale ciascun membro reagisce secondo i criteri del best reponse. Si noti la somiglianza con il problema ipotetico del regolatore sociale nella tragedia dei pescatori. Stipulare un contratto giusto richiede che, per ogni contratto proposto, il gruppo prima determini le migliori risposte dei membri e poi li aggreghi per ottenere il prodotto totale che risulterebbe, dato il contratto e la produzione dei vari membri. Le funzioni di miglior risposta (best response) dei membri costituiscono quindi dei vincoli – definiti vincoli di compatibilità agli incentivi -del problema di ottimo della squadra. Ovviamente il contratto deve anche fornire ai membri della squadra un livello di utilità non inferiore a quello della loro posizione di riserva, soddisfacendo quindi i loro vincoli di partecipazione. La squadra, come unico soggetto, ha il ruolo del first mover (e anche del principale in un problema con un singolo principale e molti agenti del tipo analizzato a fondo nel capitolo 8). Supponiamo che i membri considerino una proposta che consiste nel dividere equamente il prodotto netto, offrendo a ciascun membro un reddito per periodo pari a y = (q-x)/n dove x 0 rappresenta l'ammontare che la squadra decide di allocare per i progetti comuni, ed é selezionato per soddisfare il vincolo di partecipazione dei membri della squadra o u{(q*-x)/n), a*} z Gli asterischi stanno ad indicare i livelli di equilibrio dello sforzo e del prodotto di ciascun membro della squadra, dato tale contratto. Come funziona il contratto? Il problema di ottimo di ciascun membro consiste nel variare ai per massimizzare
{
u = [ g(a + ... + a ) x ] / n, a i
1
n
i
}
(In questo caso l'indice i é stato mantenuto per il membro in questione in quanto é essenziale ricordare che, mentre i membri sono – per convenienza analitica – assunti identici, ciascuno agisce indipendentemente e considera le azioni degli altri come esogene nel momento in cui prende la decisione.) Imponendo du / da = 0 , i
abbiamo la condizione di primo ordine u g/n + u = 0 y
a
ovvero g / n = u / u a
y
i
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|27
dove il saggio marginale di sostituzione è uguagliato al prodotto marginale dell'azione diviso per la dimensione della squadra. Mettendo a confronto questa condizione di primo ordine con quella di Robinson Crusoe (eq. 4.13), vediamo come gli incentivi forniti dal contratto proposto vengano diluiti tra i membri del team. Questo esempio di free riding viene chiamato il problema 1/n nella produzione di squadra. La squadra, non scoraggiata, continua a cercare il contratto appropriato. Qualcuno propone di pagare a ciascun membro l'intero prodotto sottratta la costante a, ovvero, di offrire a ciascun membro della squadra y = q * v dove v é una costante tale che q * n ( q * v ) = x (quindi, come prima, x rimane per i progetti comuni una volta che tutti i membri sono stati pagati) e, come prima, gli asterischi indicano i valori finali una volta che i membri hanno agito secondo i criteri della miglior risposta (best response) al contratto. E' facile vedere come i membri della squadra, massimizzando in modo indipendente la propria utilità, scelgono l'azione corrispondente alla condizione di primo ordine di Robinson Crusoe, ovvero u g + u = 0 , simulando quindi Robinson Crusoe e superando, dunque, il problema y
a
1/n. Questo contratto implementa un risultato efficiente perchè induce ciascun membro a considerare il suo intero contributo (marginale) alla produzione (piuttosto che solo un n-esimo di essa). Tali soluzioni, che implementano un ottimo paretiano, sono chiamate contratti ottimi. Forte della brillante idea, l’ideatore del contratto ottimo é sicuro che i compagni di squadra lo approvino. Ma loro non lo fanno. Per capire perchè introduciamo nel problema un elemento del mondo reale, il rischio. Supponiamo che il prodotto sia ora q = {ga -k}(1 +) dove é l'elemento stocastico introdotto nella produzione (con media zero e varianza conosciuta dai membri della squadra). Se fosse osservabile (e verificabile) il contratto precedente, scritto in termini del prodotto atteso anziché realizzato, potrebbe essere implementato a condizione che l'impresa sia in grado di prendere a prestito il necessario per permettere il pagamento di ga-k-v ad ogni membro. Ma se non fosse verificabile, il contratto verrebbe necessariamente scritto in termini del prodotto effettivo. Supponiamo che il contratto ottimo assicuri che i membri della squadra ricevano un guadagno atteso sufficiente a soddisfare il loro vincolo di partecipazione. Data la natura stocastica del prodotto, nel caso di qualsiasi squadra di dimensione significativa, il guadagno realizzato in ogni periodo potrebbe
28 | MICROECONOMIA
essere un multiplo, anche grande, dell'oggetto in questione sia negativo che positivo. Ciò avviene perchè ciascun membro può rivendicare la proprietà dei diritti residuali sulla produzione realizzata dall'intera squadra ed eventuali shock alla produzione totale diminuirebbero le posizioni di riserva di ciascuno. Un contratto secondo il quale un membro della squadra può essere soggetto, in certi periodi, al pagamento di un ammontare notevole alla squadra stessa, non sembra essere una grande attrattiva per nessuno che non sia neutrale al rischio o che non abbia un accesso illimitato al credito. Come risultato, per tutti coloro che non siano particolarmente ricchi o a parte i casi di una squadra estremamente profittevole, nessun contratto di questo tipo soddisfarebbe il vincolo di partecipazione. I membri provano un altro approccio: il monitoraggio alla pari. Mentre le azioni intraprese dagli altri non sono verificabili, ciascun membro ha alcune informazioni su cosa stanno facendo i suoi compagni di squadra e potrebbe usarla per implementare un accordo riguardante il livello di sforzo da profondere, attraverso l'uso di sanzioni informali come la disapprovazione sociale o forse persino delle multe imposte dai membri verso coloro che contribuiscono meno di quanto stipulato nell'accordo. Potrebbe sembrare che, qualora sia costoso (sia materialmente che psicologicamente) per i membri della squadra punire coloro che non rispettano l'accordo, essi siano disincentivati dal farlo, in particolare perchè mentre i costi vanno a ricadere sull'individuo punitore, i benefici andranno divisi tra tutti i membri della squadra. Per cui anche la norma che punisce i violatori dell'accordo sembra presentare lo stesso problema 1/n che induce free riding nella scelta sul livello di sforzo. Ma entrambi i Giochi, l’Ultimatum Game e il Gioco dei Beni Pubblici, analizzati nel capitolo 3, dimostrano che le persone sono desiderose di punire coloro che violano una norma. Una rassegna delle funzioni di preferenza sociale introdotte nel capitolo 3 conferma che sia le preferenze basate sull'equità che quelle basate sulla reciprocità motivano questi tipi di comportamenti che vanno a punire chi viola le norme. Colui che viola una norma impone una disuguaglianza svantaggiosa nei confronti di coloro che la rispettano che, per ragioni di lealtà, potrebbero desiderare di ridurre il guadagno dei violatori anche se questo ridurrebbe i loro stessi guadagni. Inoltre, la violazione della norma può essere indice di mancanza di merito da parte dei violatori e motivi di reciprocità potrebbero far sì che i membri della squadra incrementino la loro utilità attraverso la punizione dei violatori. Ancora, tali punizioni possono anche suscitare sentimenti di vergogna come suggeriscono gli esperimenti nel capitolo 3. Un esempio chiarirà come tali preferenze possano funzionare per attenuare il problema di coordinamento che sorge nelle produzioni di squadra. L'esempio
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|29
spiegherà anche come le preferenze sociali possano essere usate nell'analisi delle interazioni sociali. Supponiamo che i membri della squadra abbiano le seguenti motivazioni. Essi possono essere auto-interessati e quindi si preoccupano solo del proprio guadagno5. Possono essere, incondizionatamente, altruistici o maligni (dispettosi) e quindi attribuiscono un certo peso, positivo o negativo (o zero), ai guadagni degli altri indipendenti dalle loro credenze sulla tipologia o i passati comportamenti degli altri. Possono essere “reciprocatori” e quindi il valore che essi attribuiscono al benessere degli altri dipende (positivamente o negativamente) dalle loro credenze (beliefs) sulla tipologia degli altri. Ancora, possono avere norme riguardo a quanto dovrebbero contribuire; se violano la norma si possono sentire colpevoli. Infine, possono provare vergogna se violano la norma e se sono puniti pubblicamente per il loro comportamento. Queste motivazioni (a parte il dispetto) possono indurre i membri della squadra a tenere maggiormente in considerazione l'effetto delle loro azioni sugli altri. L'altruismo e la reciprocità possono far sì che essi si preoccupino anche dei membri della squadra e quindi contribuiscano al loro benessere. I motivi di reciprocità inducono il membro della squadra a punire coloro che contribuiscono in misura minore alla produzione di squadra. La vergogna può aumentare l'effetto indotto da una punizione imposta dagli altri. Infine, la colpa può indurre un più alto livello di contributo alla produzione. Consideriamo una squadra con due membri, i e j. Come sopra, la produzione della squadra varia linearmente con la produzione dei singoli membri. Ciascuno di essi riceve un ammontare pari a <1 volte la somma dei contributi. Ciascuno può allocare una frazione a [0, 1] per k=i,j di un'unità alla squadra ed il rimanente (1 a ) ad un progetto privato. Dopo che ciascuno ha scelto un'allocazione, i contributi di ciascuno al progetto vengono resi pubblici e i può imporre una penalità μ su j, mentre j può imporre una penalità μ su i al costo c ( μ ) , definito cμ /2 . Astraendo per il momento dal costo della punizione, il guadagno materiale del membro i diventa k
k
2
ij
ji
=1 a + (a + a ) u i
i
i
j
ji
(4.14)
Ogni membro soffre a causa di un costo attribuito al senso di colpa ( a * a ) se il suo contributo devia dal contributo stabilito dalla norma (a*). Può 2
sembrare strano che si possa anche provare colpa per aver contribuito troppo, ma contribuire meno di 1 a * al progetto privato potrebbe violare un'ulteriore norma 5
Il modello che segue é presentato in maggiori dettagli in Bowles e Gintis (2002a).
30 | MICROECONOMIA
(il progetto privato potrebbe consistere, per esempio, nel badare al proprio figlio). Di seguito assumeremo che i membri contribuiscano meno del livello della norma, ma questa é una semplificazione, volta solamente a facilitare l'interpretazione del risultato. Come nel caso della funzione di utilità basata sulla reciprocità del capitolo 3, il peso (“benevolenza”) che ciascun membro attribuisce all'utilità dell'altro, dipende sia dall'altruismo (o malignità) incondizionato che dalla reciprocità. La benevolenza del membro i verso j é = a + (a a *) ij
i
i
j
(4.15)
i
dove [ 1,+1] rappresenta il dispetto o l'altruismo incondizionato di i e i il suo grado di reciprocità [0, 1] . Il livello della motivazione reciproca dipende, quindi, da quanto j ha deviato dal contributo fissato dalla norma di i: se j ha contribuito al progetto comune più della norma di i, e se > 0 , allora i diviene benevolente verso j e valuta positivamente il suo benessere nel suo calcolo dell'utilità. Se, invece, j ha contribuito meno di a* allora i diventa malevolente nei confronti di j ( ij < 0) e la sua utilità aumenta se diminuisce il benessere di j. (Per ridurre la i
i
notazione e la confusione nella computazione, i é stato eliminato nel denominatore dell'espressione nel capitolo 3.) Non includeremo il costo che affronta j nel punire i nella valutazione di i riguardo l'utilità di j, perchè non sembra plausibile che i possa incrementare il suo contributo perchè é interessato a j e realizza che j deve affrontare i costi del punirlo se i non contribuisce in misura sufficiente. Infine, per riflettere il fatto che la vergogna é un'emozione sociale evocata dal disprezzo degli altri, misurato dalla loro volontà di incorrere in costi per punire un comportamento, la vergogna é misurata come segue: s = (a * a ) μ i
i
i
i
ji
(4.16) Quindi, é una misura della suscettibilità alla vergogna. La punizione ad opera degli altri infligge dunque un costo sia materiale che soggettivo, la cui misura totale é data da μ 1 + ( a * a ) . Se entrambi i membri condividono lo stesso contributo ji
(
i
i
j
)
stabilito dalla norma ed astraggono dal dispetto, non accadrà che un membro che ha contribuito in più rispetto la sua stessa norma, viene punito. Per ovviare a questa complicazione nel caso numerico considerato di seguito, assumiamo che i due contributi stabiliti dalle rispettive norme siano identici e che e siano entrambe i
j
non negative. Combinando le informazioni di cui sopra, otteniamo la funzione di utilità dell'individuo i:
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
u = + y (a * a ) (a * a ) μ 2
i
i
ij
j
i
i
i
i
i
i
ji
cμ 2
|31
2
ij
(4.17) L'utilità é quindi espressa come la somma dei guadagni individuali di ciascuno (includendo il costo di essere puniti) e della valutazione del guadagno individuale dell'altro meno la valutazione soggettiva della colpa e della vergogna e il costo del punire j. Una funzione analoga descrive l'utilità di j (basta cambiare e invertire gli indici). Si noti che i fa due scelte: prima sceglie a , poi, sulla base di quanto j ha i
contribuito, decide se e in che misura punire j. Se j decide di contribuire un ammontare tale per cui = + ( a a *) < 0 , il membro i sceglierà di punire j. Il livello di punizione che massimizza l'utilità, ricavato differenziando u rispetto a μ e ponendo il risultato uguale a zero, é dato da cμ = , ovvero, dalla scelta del livello di punizione che uguaglia il costo ij
i
j
i
ij
i
ij
i
ij
marginale della pena (il lato sinistro) con il beneficio marginale della pena, ovvero, la valutazione negativa del benessere altrui (finché < 0 , altrimenti si sceglie un livello ij
di punizione pari a zero). Quando la punizione é positiva, essa cresce al crescere di e decresce in , come ci si potrebbe aspettare. Assumiamo che i sappia che la punizione inflitta da j, se positiva, sarà μ = /c , e sostituendo tale valore nella funzione di utilità di i, i sceglierà il livello di contributo che soddisfi ji
ji
1 + (1 + ) + ij
+ 2 (a * +a ) + + (a * a ) = 0 c c
c j
ji
i
i
i
i
j
i
(4.18)
i
Tale condizione richiede che a venga scelto in modo da uguagliare il costo e il beneficio marginale del contribuire. Il termine 1 + (1 + ) rappresenta il costo marginale del contributo alla produzione sul proprio guadagno individuale e quello dell'altro, quest'ultimo valutato dalla benevolenza di i nei confronti di j, mentre /c i
ij
j
rappresenta la riduzione marginale della punizione derivante dal contribuire di più. Il termine successivo esprime la riduzione marginale del senso di colpevolezza e l'ultimo termine la riduzione del senso di vergogna derivante sia dall'avvicinarsi al contributo stabilito dalla norma che dall’invocare una minore punizione. Ricordiamo che = + ( a a *) , per > 0 la differenziazione totale della condizione di ij
i
i
j
i
i
primo ordine rivela che da / da > 0 , cosicché il contributo di i é crescente rispetto il contributo di j. Inoltre, é anche vero che, per a * > a , da / d > 0 e da / d > 0 , i
j
i
i
i
i
i
i
cosicché un aumento del sentimento di colpa e della suscettibilità alla vergogna di i ne incrementano il contributo. L'utilità del membro j implica una condizione di primo ordine analoga.
32 | MICROECONOMIA
Contributo di j, a j
a (a ;... )
a (a ;...) i
i
j
i
j
a (a ;... ) j
i
j
a (a ;...) j
i
Contributo di i, ai Figura 4.6. I contributi di equilibrio al progetto di squadra, con preferenze sociali. Le linee tratteggiate rappresentano gli effetti di un maggiore altruismo da parte di i e di un maggiore senso di colpa di j.
Si può riscrivere la condizione di primo ordine (4.18) per ottenere un'espressione più semplice di a , come funzione di a e dei parametri introdotti sopra. Tale funzione rappresenta la funzione di miglior risposta (best response) di i (l'espressione é complicata e non necessaria dato che si possono ricavare le considerazioni di statica comparata dalla condizione di primo ordine). Le funzioni di miglior risposta (best response) implicate dalle condizioni di primo ordine di i e j sono mostrate in figura 4.6. Le linee tratteggiate illustrano gli effetti di statica comparata: uno spostamento verso l'alto della funzione di miglior risposta (best response) di j, indotto da un aumento del senso di colpa, , e uno spostamento verso destra della j
i
j
funzione di miglior risposta (best response) di i, causato da un incremento del livello di altruismo di i. Il modello é facilmente generalizzabile ad una squadra a n membri. Se i motivi sociali fossero assenti, nessun membro contribuirebbe (poiché il beneficio materiale marginale é minore del costo marginale di contribuire, finché <1 ). Invece, livelli significativi di reciprocità inducono i membri a punire coloro
che hanno contribuito in misura minore, e questo motivo, da solo o in aggiunta al sentimento di vergogna, può indurre alti livelli di contribuzione. Anche in assenza della punizione, l'altruismo o il senso di colpa possono indurre i membri a contribuire di più. Poiché la loro interazione é talvolta complessa, sembra una buona idea controllare che un equilibrio di Nash plausibile effettivamente esista. Assumendo che i e j siano identici, non altruisti e “reciprocatori” e, tralasciando gli indici, supponiamo = 0.6, = 0.0,a* = 0.5, = 0.3, = 0.6, = 0.6 e c=0.75. Ne risulta che a = 0.5 ; ovvero, i membri implementano le contribuzioni stabilite dalle norme comuni e, come risultato, non provano né senso di vergogna né senso di N
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|33
colpa e non si puniscono l'un l'altro. Quindi, entrambi guadagnano 0.1 in benefici materiali netti derivanti dalla loro contribuzione al progetto (ovvero, 0.6(0.5+0.5)0.5). E' importante ricordare che in assenza di preferenze sociali, i membri della squadra non avrebbero contribuito affatto al progetto comune, per cui il fatto che in equilibrio essi non provino nè senso di colpa, né vergogna o benevolenza verso l'altro non implica che tali preferenze non siano importanti. Come conferma, consideriamo gli stessi due individui in uno stato di disequilibrio, in cui j contribuisce 0.4 ed i contribuisce solamente 0.1. A seguito di tale comportamento, i cattura 0.2 in termini di benefici materiali netti derivanti dal progetto (ovvero, 0.6(0.1+0.4)-0.1). Ma j svilupperebbe una forte malevolenza verso i ( < 0 ) e, come risultato, lo ji
punirebbe duramente, infliggendogli costi materiali pari a 0.16 ed inducendo un senso di vergogna in i che arrecherebbe ulteriori costi soggettivi pari a 0.04. Tali costi, in aggiunta al costo soggettivo dovuto al senso di colpa (0.10) ridurrebbero l'utilità di i a -0.1. In una tale situazione, la miglior risposta (best response) di i é data da un aumento del contributo al progetto. Non c'e' nessuna ragione a priori per cui le preferenze sociali non possano persistere in equilibrio (anche se sembra improbabile che alti livelli di vergogna, colpa o punizione reciproca siano persistenti). Per capire perché di fatto non compaiono in equilibrio, supponiamo che i due membri si attengano a due norme di contribuzione differenti, con a * > a * . Entrambi j
i
potrebbero aderire alle proprie norme una volta in equilibrio e quindi non provare né senso di vergogna né di colpa. Ma, a tali valori di equilibrio, il fatto che i contribuisca meno rispetto a j, può indurre j a punirlo e questa punizione fa parte degli incentivi per i ad aderire alla norma. Vi sono alcuni attributi del modello degni di nota. Anzitutto, l'altruismo e la reciprocità si possono controbilanciare, perchè un membro che contraccambia, se sufficientemente altruistico, non punirebbe un suo compagno di squadra, anche se questi contribuisse in misura inferiore, ma potrebbe nutrire nessuna benevolenza (netta) nei confronti di quest'ultimo. Come risultato, si avrebbero bassi livelli di contribuzione da parte di entrambi. In secondo luogo, una persona che contribuisce poco, a causa di un livello basso di contribuzione definito dalla propria norma, a*, sarà anche meno reattivo ad una punizione. Ciò si può evincere dall'effetto della punizione sull'utilità, ovvero, 1 ( a * a ) . Infine, quando uno o più membri i
i
j
sono “reciprocatori”, l'interazione presenterà degli effetti positivi, in quanto le azioni di un membro inducono cambiamenti sulle azioni degli altri. La figura 4.6 descrive un equilibrio di Nash unico in presenza di tali effetti. Non é comunque difficile pensare a tali interazioni in presenza di equilibri stabili molteplici, alcuni con un alto livello di
34 | MICROECONOMIA
contribuzione ed altri con un livello basso, separati da alcuni equilibri instabili – punti che definiscono le frontiere delle basi di attrazione degli equilibri stabili.
UNA
TA S S O N O M IA D E I P R O B L E M I D I C O O R D I N A M E N TO
La struttura sottostante ai problemi sia dei pescatori che della produzione di squadra può essere espressa mediante un gioco simmetrico. Supponiamo che una popolazione intraprenda un'attività, nella quale ciascun individuo decide un'azione a [0,1] e, come risultato, la funzione di utilità di un membro qualsiasi della
popolazione (ciascuno é identico all'altro) é u = u ( a; p, ) , dove p é il vettore dei prezzi rilevanti, assunti comuni tra tutti i membri della popolazione e rappresenta
il vettore delle azioni intraprese dagli altri individui. Il vettore dei prezzi e sono alla destra del punto e virgola ad indicare che sono assunti esogeni da ciascun individuo nel momento in cui egli sceglie a per massimizzare u. Quindi stiamo considerando interazioni tra molti agenti e l'effetto di ciascun individuo sul contesto economico (p) e sull'azione degli altri ( ) é trascurabile. La funzione di utilità é presentata nella forma ridotta perchè la descrizione dettagliata dei vari stati – l'ammontare dello sforzo profuso, il piacere, i beni di vario tipo, su cui a ha un effetto – è soppressa in modo che ci si possa focalizzare meglio sulle interazioni tra i membri della popolazione. L'attività di produzione é comune perché u 0 : ciò che
gli altri fanno influenza direttamente il benessere dell'individuo. É probabile che il risultato di un'interazione non cooperativa tra questi individui sia Pareto-inefficiente perchè gli effetti diretti dell'azione di un individuo sull'utilità degli altri (ovvero, u )
non sono tenuti in considerazione nell'ottimizzazione individuale. Una soluzione al problema potrebbe essere quella di trasformare il gioco da non cooperativo a cooperativo, per esempio lasciando al governo il compito di determinare a per ciascun individuo. Le ragioni per cui una tale soluzione può essere impossibile o non desiderabile sono state già menzionate. Nell'ambito di un gioco non cooperativo, vi sono tre modi generici per evitare i fallimenti del coordinamento che possono sorgere nelle attività congiunte. Nessuno di essi, in pratica, é in grado di evitare il problema direttamente, ma la comprensione della loro logica può aiutare a chiarire il ruolo di alcune istituzioni rilevanti. La prima soluzione idealizzata é quella di alterare il contesto istituzionale cosicché l'utilità individuale venga massimizzata sotto un vincolo di partecipazione che sia soddisfatto per tutti gli altri. L'allocazione che risulta da questo problema di massimo deve essere un ottimo Paretiano (per definizione). Per capire tale punto, supponiamo che un’allocazione sia tale che il luogo di indifferenza di colui che
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|35
sceglie non è tangente al luogo di indifferenza che rappresenta il vincolo di partecipazione di uno degli altri. Questa allocazione non può essere una soluzione del problema di ottimo vincolato di cui abbiamo parlato, perchè in quel caso colui che sceglie potrebbe fare di meglio adottando un'allocazione differente. La soluzione della privatizzazione proposta per il problema dei pescatori, stabilendo la rivendicazione dei diritti residuali dell’intero ricavato del lago e il controllo del suo uso da parte di un singolo individuo, costringe quest'ultimo a soddisfare il vincolo di partecipazione dell'altro con un'uguaglianza e lo rende padrone delle conseguenze delle sue azioni, come Robinson Crusoe. Questa soluzione viene chiamata soluzione del vincolo di partecipazione stringente. Un secondo modo per evitare i fallimenti del coordinamento consiste nell'alterare l'interazione sottostante così che le azioni degli altri influenzino ciascun individuo solo attraverso il vettore dei prezzi, ovvero u = 0 . La tassa pigouviana
nell'esempio dei pescatori approssimava questo risultato imponendo un prezzo (nella forma di una tassa) sull'attività di pesca di ciascuno pari al costo che essa imponeva all'altro. In questo caso la funzione di utilità diventa u = u (a; p( )), e l'individuo considera il vettore dei prezzi come un vincolo esogeno del processo di ottimizzazione. L'allocazione che ne risulta é tale che, per ogni individuo, il vettore comune dei prezzi é tangente alla curva di indifferenza (i cui argomenti sono le varie determinanti dell'utilità, come lo sforzo profuso al lavoro, i beni e gli altri elementi menzionati sopra). Ma ciò implica che le curve di indifferenza di tutti i membri della popolazione hanno una pendenza comune (tutti i saggi marginali di sostituzione sono uguali tra ogni coppia di beni) implementando, dunque, un ottimo paretiano. Questa é la soluzione della contrattazione completa. La terza soluzione per evitare i fallimenti del coordinamento é la più semplice: può essere possibile strutturare l'interazione tra i soggetti così che le preferenze sociali possano fungere da sostitute ai contratti completi. Nel caso dei pescatori abbiamo visto come l'altruismo completo da parte di tutti gli individui (ovvero quando ciascuno considera il benessere degli altri pari al proprio benessere) sia in grado di implementare un ottimo sociale. Mentre un tale approccio utopistico ha poca rilevanza pratica, delle volte può verificarsi che il controllo reciproco e la punizione da parte di una minoranza del gruppo, motivata da preferenza altruistiche, possano indurre gli altri individui ad agire come se essi si preoccupassero degli altri. Il Gioco dei Beni Pubblici con l'introduzione della punizione, introdotto nel capitolo 3, ne é un esempio. Questa é la soluzione delle preferenze sociali. I problemi di coordinamento, anche se hanno una struttura comune e un
36 | MICROECONOMIA
insieme comune di possibili risposte istituzionali, possono differire per due aspetti importanti: in primo luogo per l'effetto diretto dell'azione dell'altro sulla propria funzione di utilità (esternalità positiva o negativa), in secondo luogo per l'effetto dell'azione dell'altro sulle proprie azioni (che determina se le strategie sono sostitute o complementari). Chiariamo queste due distinzioni con un esempio in cui vi sono due persone e in cui non consideriamo, per semplicità, il vettore dei prezzi, p. Consideriamo, invece, due individui simmetrici (di nuovo, Sopra e Sotto) con identiche funzioni di utilità u=f(a,A) U=f(a,A) dove a e A rappresentano le azioni intraprese dai due individui ed f é una funzione concava nel suo primo argomento. (La simmetria ci permette di usare la stessa funzione f( ) per i due individui, ma con gli argomenti opposti). Il problema di coordinamento nasce a causa dell'effetto diretto dell'azione di ciascuno nella funzione di utilità dell'altro: ovvero, f , la derivata di f rispetto al secondo 2
argomento, non é zero. Supponiamo che le due funzioni abbiano la forma seguente: u = + a + A + aA + a U = + A + a + aA + A 2
2
(4.19) dove < 0 riflette il fatto che intraprendere un'azione é soggettivamente costoso per l'individuo. Le funzioni di miglior risposta (best response) dei due individui (variando a e A per massimizzare, rispettivamente, u e U) sono a* = ( + A) /2
A* = ( + a) /2
(4.20) La prima distinzione, citata sopra, riguarda l'effetto dell'azione dell'altro sul livello dell'utilità individuale, ovvero u A = + a U a = + A
Questi effetti possono essere positivi, come nell'esempio della produzione di squadra, o negativi, come nel caso dei pescatori. Essi sono chiamati, rispettivamente, effetti esterni positivi e negativi. La seconda distinzione riguarda l'effetto dell'azione dell'altro sull'utilità marginale della propria azione:
|37
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
u aA = = U Aa
Se < 0 , le azioni sono sostituti strategici. Come si può vedere dall'eq. 4.20, ciò significa che l'individuo reagirà secondo i criteri della miglior risposta (best response) ad un cambiamento dell'azione dell'altro modificando la sua azione nella direzione opposta. Se, invece, > 0 , l'individuo reagirà cambiando la sua azione nella stessa direzione dell'altro. Tali azioni sono definite complementi strategici. Nel problema dei beni pubblici presentato nell'introduzione di questo capitolo, i livelli di sforzo dei membri del gruppo sono complementi strategici se ' > 0 e '' > 0 . La ragione consiste nel fatto che, se la produzione totale del bene pubblico é crescente e convessa nello sforzo profuso in totale, allora il beneficio marginale dello sforzo del membro i é crescente nel livello di sforzo del membro j, così che de * / de > 0 . Come mostra questo i
j
esempio, la complementarietà strategica genera dei feedback positivi. Al contrario, i livelli di sforzo sono sostituti strategici se ' ' < 0 . Tabella 4.2. Una tassonomia dei problemi di coordinamento.
Alcuni esempi dei quattro casi implicati dalle due distinzioni – esternalità positive o negative, e sostituti e complementi strategici – sono indicati nella tabella 4.2. Può sembrare strano che un'esternalità negativa possa indurre una complementarietà strategica. Ma basta pensare al fenomeno del conspicuous consumption, analizzato per la prima volta da Thorsten Veblen (1934 [1899]) più di un secolo fa. Il consumo di lusso dell'altro non solo fa sentire l'individuo meno ricco ( u < 0,U < 0 ) , A
a
ma lo spinge anche a consumare di più per attenuare il suo stato d'ansia (poiché u > 0,U > 0 ). Il risultato può essere un tipo di consumo simile alla corsa agli aA
aA
armamenti6. Altri esempi includono: l'aumento di armi di un Paese riduce la sicurezza di un altro e può aumentare l'utilità marginale degli armamenti di quest'ultimo, inducendo quindi un feedback positivo. Anche la biologia fornisce molti esempi di corsa agli armamenti, nei quali la concorrenza fra compagni conduce a certe caratteristiche come le elaborate code del pavone, prive di funzione. Un altro esempio di esternalità negativa e di complementarietà strategica è dato dalle pratiche 6
Per un approfondimento il lettore può guardare Schor (1998), Frank (1997), e Bowles e Gintis (2001).
38 | MICROECONOMIA
di corruzione: l'attività corrotta di una persona riduce il benessere degli altri ma può aumentare il beneficio marginale dell'intraprendere un'attività corrotta. In questi casi l'effetto delle azioni degli altri sul livello di utilità di una persona é di segno opposto all'effetto del beneficio marginale della propria azione. Le esternalità positive con sostituti strategici rappresentano il caso opposto. Consideriamo una produzione di squadra in cui vi é, come sopra, un contratto di divisione, ma assumiamo (più realisticamente del caso considerato sopra) che l'utilità marginale di ciascun individuo derivante dal bene sia decrescente rispetto all'ammontare del bene consumato. In questo caso, l'esternalità é positiva (io traggo beneficio dalla tua azione perchè entrambi otteniamo 1/n del risultato). Ma l'utilità marginale decrescente mi induce a ridurre il mio sforzo, se tu aumenti il tuo (il tuo e il mio sforzo sono sostituti strategici). Un esempio finale per illustrare l'esternalità positiva ed i complementi strategici é rappresentato dalla competizione fiscale tra le nazioni o la giurisdizione all'interno delle stesse. Consideriamo due nazioni i cui governi (considerati come individui) cercano di massimizzare una somma ponderata dell'occupazione e del livello di spesa pubblica, finanziata da una tassa lineare sul profitto con le aliquote a e A. Poiché le imprese reagiscono ai differenziali di tassi di profitto al netto della tassazione, il livello di occupazione in uno dei paesi é determinato dalla sua stessa aliquota fiscale e da quelle applicate dagli altri. L'occupazione in un paese decresce rispetto all'aliquota dello stesso paese ed aumenta all'aumentare di quelle imposte dagli altri: quindi, l'esternalità é positiva. Se fosse anche vero che la risposta negativa del livello di occupazione rispetto alla propria aliquota è tanto maggiore quanto minori sono quelle applicate dalle altre nazioni, allora le due aliquote fiscali sarebbero complementi strategici. (Il problema 12 chiarirà questo caso). In un mondo in cui vi sono solo due Paesi (Sopra e Sotto), le funzioni di miglior risposta (best response) sono mostrate nella figura 4.7. La loro intersezione, il punto N, rappresenta l'equilibrio di Nash e il livello di utilità di ciascun paese é dato dalle curve di indifferenza, U e u . Le curve di indifferenza preferite da Sopra N
N
sono quelle sopra U (poiché Sopra trae vantaggio da un'aliquota più alta di Sotto), e le curve di indifferenza preferite da Sotto sono quelle alla destra di u . Ci si accorge N
N
subito che esiste una lente di miglioramento paretiano di tassi di aliquote, al di sopra di U e alla destra di u , benefica per entrambi. La prova dell'esistenza di tale lente N
N
é identica alla prova che l'equilibrio di Nash nel caso dei pescatori é Paretoinefficiente. Qui, però, i miglioramenti paretiani richiedono aumenti nelle azioni intraprese dai due agenti, piuttosto che riduzioni come era il caso dei pescatori. La
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|39
ragione é che l'esternalità é positiva e quindi le azioni dei due Paesi (i tassi delle aliquote) sono sub-ottimali nell'equilibrio di Nash. Vi sono due cose da notare in questo esempio. Anzitutto, se Sotto fosse il first mover, ne trarrebbe, ovviamente, vantaggio. Ma anche Sopra starebbe meglio. Per capire perchè, ricordiamoci che, nel selezionare la sua aliquota, Sotto non considera l'aliquota di Sopra come esogena, come avviene nel caso di Nash, ma tiene conto dell'impatto della sua scelta sulla miglior risposta (best response) di Sopra. Quindi, Sotto varierebbe a per massimizzare u ( a, A ) , soggetto a
A = A( a ) . Questo problema di ottimo fornisce l'equilibrio di Stackelberg (in cui Sotto
é leader), rappresentato nella figura 4.7 con S. Notiamo che S si trova all'interno della lente di miglioramento Paretiano, oltre l'equilibrio di Nash. Se non ci sorprende granché il fatto che Sotto riesca a migliorare la sua posizione, più contro-intuitiva sembra la considerazione che anche lo Stackelberg follower sta meglio rispetto all'equilibrio di Nash simmetrico. La ragione é che in presenza di complementarietà strategica, le azioni del leader inducono il follower ad adottare un'azione simile; sappiamo che nell'equilibrio di Nash entrambi i Paesi adottano un livello sub-ottimale di aliquota fiscale. Esiste quindi un comune aumento delle rispettive azioni che migliora la posizione di entrambi i giocatori. In questo caso, l'esercizio di un’azione egoistica giova anche all'altro agente. (A questo punto potreste voler riconsiderare l'esempio dei pescatori ed assicurarvi di capire perchè il vantaggio della prima mossa non arreca alcun beneficio all'altro: la differenza sta nel fatto che le attività dei pescatori sono sostituti strategici). Ovviamente, nel modello non c'è alcuna ragione a priori che giustifichi il fatto che Sopra non possa essere il leader (il gioco é simmetrico). Nei casi come questo, il risultato é indeterminato e il modello dovrebbe essere arricchito di maggiori informazioni riguardo le situazioni militari o geopolitiche o altre asimmetrie tra le nazioni che possano avere influenza sul loro potere e far sì che un Paese riesca ad imporre impegni vincolanti all'altro, ovvero agire come first mover.
40 | MICROECONOMIA
Sotto aliquota di imposta, a
A(a) t i(t j )
tj u
s
SjS VUiN
a(A) t j(t i )
N
NN
VjS VjN t
Sopra aliquota di imposta, A i
Figura 4.7. Competizione Fiscale: gli equilibri di Nash e Stackelberg. Si noti: Sotto é il leader à la Stackelberg.
Il fatto che il vantaggio del first mover possa arrecare beneficio anche all'altro giocatore (rispetto all'equilibrio di Nash del gioco simultaneo) ricorda che l'esercizio del potere può avere effetti sia allocativi che distributivi. In questo caso, la prima mossa e l'abilità a vincolarsi ad essa non é solo redistributiva, ma anche produttiva: il potere viene usato per ottenere una fetta di torta più grande, ma il suo esercizio riesce anche ad aumentare la dimensione della torta. Quindi, anche quando il potere viene esercitato in modo egoistico, può risultare di mutuo beneficio. Tale idea non é nuova. Thomas Hobbes (1968 [1651]) la usò tre secoli e mezzo fa per giustificare i poteri esecutivi di allocazione ad un sovrano, date le ragioni spiegate nell'epigrafe. Nel capitolo 10, torneremo a parlare dell'uso sia produttivo che redistributivo del potere nelle relazioni economiche. Un secondo aspetto rilevante di questo esempio é dato dal fatto che non esiste garanzia che l'equilibrio di Nash sia stabile e/o unico. Assumiamo, come nel caso dei pescatori, che il comportamento dei giocatori, al di fuori dell'equilibrio, li conduca verso la propria funzione di miglior risposta (best response). Quindi per Sotto, a = {a * ( A ) a} , con > 0 , e, analogamente per Sopra. Data questa dinamica la
figura 4.7 illustra un equilibrio di Nash stabile. Ma, il fatto che le due funzioni di best reponse abbiano la pendenza dello stesso segno potrebbe produrre ulteriori
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|41
intersezioni (ovvero, equilibri di Nash multipli). In tal caso potremo classificare, in base al criterio paretiano, i vari equilibri di Nash stabili (U e u sono crescenti lungo le funzioni di miglior risposta ed hanno entrambe una pendenza positiva). Una domanda interessante – inspirata dal ragionamento sulla mano invisibile rispetto alle istituzioni, discusso nel capitolo 2, potrebbe consistere nel chiedersi se vi sia alcuna ragione per attendersi che un sistema modellato in questo modo, perturbato da influenze stocastiche, possa spendere la maggior parte del tempo in uno stato vicino all'equilibrio costituito dai livelli delle aliquote alte, quindi Pareto superiore. Il problema é simile ai casi di equilibri multipli con strategie discrete anziché continue, già incontrati nei Giochi di Assicurazione (ad esempio, la semina nel Palanpur nel capitolo 1). Senza conoscere la storia recente delle interazioni e i dettagli su come i giocatori cambiano le loro strategie quando si trovano al di fuori dell'equilibrio, non si riesce a dire molto riguardo lo stato probabile del sistema. Ma sembra probabile che gli equilibri con dominanza di rischio siano più persistenti degli equilibri con dominanza nei payoff, nel caso in cui entrambi esistano. Ritorneremo su questa questione nei capitolo conclusivi.
C O N C L U S IO N E Ogni soluzione ai problemi di coordinamento implementa non solo un risultato allocativo – quanto può pescare ciascun pescatore, le aliquote dei vari Paesi, e così via – ma anche un risultato distributivo, il livello di benessere per ciascun giocatore, derivante dal risultato allocativo e qualsiasi misura redistributiva è parte della soluzione (come l’acquisto delle licenze di pesca nel caso della privatizzazione). Nel caso in cui vi è cooperazione, la distribuzione dei benefici che ne derivano dipende dalla particolare trasformazione del Gioco che rende possibile la cooperazione. Ciò implica che possono sorgere conflitti su come affrontare al meglio i problemi di cooperazione: qualcuno può preferire una soluzione meno efficiente del problema allocativo per favorire la distribuzione dei benefici della cooperazione . Come risultato (così come per altre ragioni), le differenze tra i giocatori – in salute, abilità, diritti politici, identità di gruppo, informazione – andranno ad influenzare sia la natura dei problemi di coordinamento che i tipi di soluzioni che possono essere implementate. Mancur Olson (1965), nel suo trattamento classico dei problemi dell’azione collettiva, sosteneva che gruppi piccoli e altamente ineguali avrebbero risolto più prontamente tali problemi. E’ facile capire, ad esempio, che se vi fossero rendimenti marginali decrescenti nel livello aggregato di pesca e uno dei pescatori fosse sicuro di pescare la maggiore quantità di pesce, la sua miglior risposta
42 | MICROECONOMIA
(best response) approssimerebbe l’allocazione del singolo proprietario del lago. In tal caso, l’ineguaglianza nella ricchezza dei pescatori attenuerebbe il fallimento del coordinamento. Similmente, se una nazione fosse molto più estesa delle altre, e potente abbastanza da imporre l’aliquota della tassa, potrebbe, come first mover, implementare un miglioramento paretiano rispetto all’equilibrio di Nash nei giochi simultanei. Ma l’ineguaglianza può anche costituire un impedimento alla cooperazione. Se i membri della squadra di produzione descritti sopra fossero di differenti etnie, o con livelli di ricchezza estremamente diversi, l’altruismo e la reciprocità tra essi non sarebbero sufficienti ad indurre dei livelli di sforzo notevoli. La maggiore distanza sociale tra i membri può mettere in pericolo l’efficacia del controllo reciproco e della sanzione ad opera dei compagni. La ragione di ciò è che la punizione può non essere efficace nelle popolazioni eterogenee in quanto si perde la potenza dell’effetto di vergogna che deriva dalla disapprovazione sociale di chi non fa parte del proprio gruppo. Inoltre, i membri potrebbero rispettare norme di contribuzione meno complicate nel caso in cui i beneficiari dei beni pubblici siano eterogenei, includendo coloro considerati da alcuni membri tanto “outsider” quanto “insider”. Quindi, i risultati dei recenti studi di Alesina e Ferrara (2000) sulla partecipazione alla chiesa, al servizio pubblico, ai gruppi politici, così come alle altre organizzazioni che forniscono beni pubblici negli US, non sono nel complesso così sorprendenti. Gli autori hanno trovato che la partecipazione a tali gruppi è sostanzialmente più alta là dove il reddito viene distribuito più equamente. Quindi, la possibilità di un’allocazione efficiente può dipendere dalla distribuzione del potere e della ricchezza e dall’ammontare e dal tipo di eterogeneità non economica all’interno di un gruppo. Inoltre, anche nei gruppi omogenei vi sono comunque poche ragioni per aspettarci che le soluzioni osservate siano efficienti, dato che gli agenti tipicamente perseguono obiettivi di distribuzione, con le proprietà di efficienza come prodotto secondario piuttosto che come obiettivo. Solo nei rari casi in cui i risultati allocativi e distributivi sono indipendenti (come modellato nel caso della privatizzazione), tale problema non sorge. Studi di settore confermano l’inseparabilità tra gli aspetti allocativi e distributivi nel caso del governo delle risorse di proprietà comune7. Uno studio sulla gestione dell’acqua in quarantotto villaggi nello Stato Sud indiano del Tamil Nadu ha rilevato bassi livelli di cooperazione nei villaggi con un alto livello di ineguaglianza in 7
Gli studi citati sotto sono raccolti in Baland, Bardhan, e Bowles (2006). Il lettore è particolarmente invitato a riferirsi alle tesi di Gaspart e Platteau, Cardenas, e Bardhan e Dayton-Johnson, su cui quanto segue è basato.
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|43
termini di possedimenti terrieri. Inoltre, l’osservanza alle regole che governavano l’offerta dell’acqua, se percepite come un inganno da parte dell’elite del villaggio, era molto bassa. Uno studio simile su cinquantaquattro sistemi di irrigazione utilizzati dagli agricoltori dello Stato messicano del Guanajuato ha trovato che l’ineguaglianza nei possedimenti terrieri era associata a bassi livelli di sforzo cooperativo nella cura dei canali dei campi. Negli altri casi, le ineguaglianze basate sulle gerarchie tradizionali contribuivano positivamente. Ad esempio, un altro studio sulla gestione dell’acqua messicana, descrive come la mobilità maggiore dei residenti rurali metteva in pericolo le relazioni patrizi-plebei che erano alla base del sistema di gestione delle risorse, altamente ineguale ma sostenibile dal punto di vista dell’ambiente (Garcia-Barrios 1990). Ancora, nel porto di Kayar, sulla Petite Cote del Senegal, lo sforzo cooperativo nel limitare la cattura dei pesci (non tanto per proteggere le risorse ittiche quanto per mantenere alti i prezzi) doveva il suo successo soprattutto alla leadership della ricca elite tradizionale locale dei più anziani. L’eterogeneità all’interno dei gruppi influenza i risultati in altri modi. L’accordo sulla pesca nel Kayar, per esempio, era stato minacciato dai conflitti tra i locali e gli outsider che usavano tecnologie differenti, ed altri accordi per limitare la pesca erano falliti a causa dell’indebitamento dei pescatori nei confronti dei venditori del pesce (che opponevano limiti) e a seguito del fatto che le mogli di molti pescatori erano venditrici di pesce. Un esperimento tra gli utilizzatori dei commons nella Colombia rurale suggerisce che l’ineguaglianza può impedire la cooperazione ostruendo la comunicazione. Juan Camino Cardenas ha messo in atto alcuni esperimenti sulle risorse di proprietà comune tra gli abitanti del villaggio che basavano la loro sopravvivenza sullo sfruttamento della vicina foresta. Nel Gioco di Cardenas, i soggetti sceglievano di ritirare un certo numero di monete da un fondo comune, e, dopo che ciascuno aveva avuto il proprio turno, le monete rimanenti venivano moltiplicate da colui che conduceva l’esperimento e quindi distribuite ai giocatori. Questo Gioco è simile al Gioco dei Beni Pubblici nel capitolo 3, a parte il fatto che i soggetti decidono quanto ritirare piuttosto che quanto contribuire. Per un certo numero di giri iniziali del gioco, non veniva permessa alcuna comunicazione. Ma nelle fasi finali, i soggetti venivano invitati a conversare per pochi minuti prima di prendere la loro decisione. Cardenas si aspettava che la comunicazione avrebbe ridotto i livelli di sottrazione delle monete dal fondo comune (come era stato il caso in esperimenti simili), pur non alterando gli incentivi materiali del gioco. La comunicazione risultava, di fatto, efficace tra i gruppi composti da soggetti con livelli di ricchezza relativamente simili (misurati dai possedimenti terrieri, dal bestiame e dalle attrezzature possedute); il loro livello di cooperazione aumentava
44 | MICROECONOMIA
drammaticamente con la comunicazione durante l'esperimento. Ma ciò non era vero nei gruppi in cui vi era una sostanziale differenza di ricchezza tra i soggetti. In un gruppo, uno dei soggetti più ricchi cercò invano di persuadere i suoi compagni a diminuire i rispettivi ritiri, massimizzando quindi i loro guadagni totali. “Non credo in Don Petro”, spiegò più tardi una delle donne più povere di quel gruppo.”Non lo guardo mai in faccia”. Lei aveva ragione: Petro (non era questo il suo vero nome) aveva ritirato il massimo ammontare. Torneremo ad occuparci di distribuzione dei guadagni derivanti da cooperazione e di come i conflitti distributivi possano precludere soluzioni altrimenti possibili nel capitolo 5.
FALLIMENTI DEL COORDINAMENTO E RISPOSTE ISTITUZIONALI
|45
Riferimenti bibliografici
Alesina, A. and E. L. Ferrara (2000). "Participation in heterogeneous communities." Quarterly Journal of Economics 115(3): 847-904. Baland, J. M., P. Bardhan, et al. (2006). Inequality, Cooperation, and Environmental Sustainability. Princeton and New York, Princeton University Press and Russell Sage Foundation. Bowles, S. and H. Gintis (2001). The Inheritance of Economic Status: Education, Class and Genetics. International Encyclopedia of the Social and Behavioral Sciences: Genetics, Behavior and Society. P. Baltes and M. Feldman. New York, Oxford University Press and Elsevier. Bowles, S. and H. Gintis (2002a). "Homo reciprocans." Nature 415(10 January): 125128. Bowles, S. and H. Gintis (2002b). "'Social Capital' and Community Governance." Economic Journal 112(483): F419-436. Frank, R. (1997). "The Frame of Referance as a Public Good." The Economic Journal 107(445): 1832-1847. Frey, B. S. and I. Bohnet (1996). "Cooperation, Communication and Communitarianism." Journal of Political Philosophy 4(4): 322-36. Garcia-Barrios, R. and L. Garcia-Barrios (1990). "Environmental and Technological Degradation in Peasant Agriculture: A Consequence of Development in Mexico." World Development 18(11): 1569-85. Hardin, G. (1968). "The Tragedy of the Commons." Science 162(3859): 1243-1248. Hobbes, T. (1651/1968). Leviathan. New York, Penguin. Kollock, P. (1992). "The Social Construction of Exchange." Advances in Group Processes 9: 89-112. Olson, M. (1965). The Logic of Collective Action: Public Goods and the Theory of Groups. Cambridge, MA, Harvard University Press. Ostrom, E. (1990). Governing the Commons: The Evolution of Institutions for Collective Action. Cambridge, UK, Cambridge University Press. Ostrom, E. (1999). "Coping with tragedies of the commons." Annual Review of Political Science 2: 493-535. Ostrom, E., J. Burger, et al. (1999). "Revisiting the Commons: Local Lessons, Global Challenges." Science 284: 278-282. Ouchi, W. (1980). "Markets Bureaucracies and Clans." Administrative Science Quarterly 25: 129-141. Sally, D. (1995). "Conversation and Cooperation in Social Dilemmas." Rationality and Society 7(1): 58-92. Sato, Y., E. Akiyama, et al. (2002). "Chaos in learning a simple two person game." Proceedings of the National Acadamy of Science 99(7): 4748-4751. Schor, J. (1998). The overspent American : upscaling, downshifting, and the new consumer. New York, Basic Books. Singleton, S. (2004). Managing Pacific Salmon: the role of distributional conflicts in Coastal Salish Fisheries. Inequality, Cooperation, and Environmental Sustainability. J. M. Baland, P. Bardhan and S. Bowles. New York, Russell Sage Foundation. Taylor, M. (1997). The Possibility of Cooperation. Cambridge, UK, Cambridge University Press (originally published in 1976). Tierney, J. (2000). "A Tale of Two Fisheries". New York Times Sunday Magazine:
46 | MICROECONOMIA
August 27, pp 38-43. Veblen, T. (1934). The Theory of the Leisure Class. New York, Modern Library (first published in 1899).
V
L A DIVISIONE DEI PROFITTI DELLA COOPERAZIONE : LA CONTRATTAZIONE E LA RICERCA DI RENDITE
…E’ deplorevole pensare che una grande porzione di tutti gli sforzi e dei talenti nel mondo siano impiegati semplicemente per neutralizzarsi l’un l’altro. E’ quindi giusto obiettivo del governo ridurre al minimo questo spreco, approntando delle misure tali da poter indirizzare le energie che ora sono usate dagli esseri umani per danneggiarsi l’un l’altro, oppure per proteggere se stessi, verso un uso legittimo delle facoltà umane… J.S.D. Mill, Principles of Political Economy (1848) (New York, Kelley, 1965):979
La gente può soddisfare i propri desideri principalmente in due modi: tramite la produzione…oppure attraverso il conflitto (ossia tramite un furto implementato oppure minacciato, la confisca, oppure il litigio). Jack Hirschleifer (1991).
... L’equilibrio fra queste modalità di attività economica – l’una volta al raggiungimento di maggiore ricchezza aggregata e l’altra al conflitto sull’appropriazione delle rendite – costituisce la prima linea evolutiva della storia umana […] Karl Marx, nonostante lo scarso successo come economista, fu uno dei primi a mettere in luce l’importanza del lato oscuro, la possibilità del conflitto. Jack Hirschleifer (1994) Presidential Address, Western Economic Association
I N T R O D U Z IO N E In risposta alla persecuzione giudiziaria, ai debiti e alla povertà, la plebe della Repubblica Romana cercò sollievo economico e legale attraverso una strategia, consolidata nel tempo, la secessione: nel 494 a.C. lasciò Roma in massa e minacciò di stabilirsi permanentemente fuori dalle sue mura e di redigere una propria costituzione. I patrizi romani preoccupati, ha scritto Livy, pensarono a “che cosa sarebbe accaduto se, in questa situazione, ci fosse stata una minaccia di invasione
2 | MICROECONOMIA
straniera” (Livy, 1960/27 b.C, pp.141). La plebe contrattò, naturalmente, e ripeté l’impresa in tre altre occasioni nel corso dei due secoli successivi. L’uso efficace di ciò che noi oggi chiamiamo la loro opportunità alternativa (outiside option) gli procurò propri magistrati (i famosi tribuni) e un provvedimento di autogoverno che includeva l’approvazione di proprie leggi, chiamate plebiscita, da cui deriva la parola plebiscito (Jones (1968):55-56). Un’importante strozzatura nella produzione, nell’industria dei cibi in scatola nella California della fine del XIX secolo, consisteva nel lavoro, altamente specializzato, di mettere i tappi alle lattine, o “capping”, come era chiamato. Il piccolo numero di cappers, difficilmente rimpiazzabili, esigeva rendite considerevoli dai propri datori di lavoro, a causa del ruolo indispensabile nella produzione e della natura deteriorabile dei beni al momento della raccolta. L’invenzione di un congegno chiamato “Cox’s capper” cambiò tutto ciò, ma le imprese che si precipitarono ad acquistare il congegno inizialmente non lo usarono per chiudere le lattine, poiché il costo d’uso non era sostenibile ai salari correnti. Piuttosto, la decisione di acquistare il congegno si spiega come una parte della strategia di ricerca di rendite delle imprese e, semplicemente, era volta ad evitare che le domande di cappers (umani) divenissero eccessive. Scrivendo 26 anni dopo aver inventato il suo congegno, James Cox ricordava la necessità strategica, dei proprietari di scatolami, del capper meccanico: “la mancanza di difese del canner [nei confronti dei cappers umani] lo rese un determinato difensore di tutti i mezzi meccanici, e rese possibile progettare, attraverso numerosi fallimenti e forti perdite, i perfezionati mezzi meccanici oggi in uso.” A volte le imprese investono in tecnologie il cui obiettivo primario è quello di migliorare la loro posizione nella contrattazione. L’installazione di computer a bordo chiamati registratori di viaggio nei camion posseduti da una società, descritta nel capitolo 8, ne è un esempio. Quando le persone collaborano in un’attività produttiva – un’impresa, un matrimonio, un gruppo di pescatori che cercano di limitare l’eccessivo sfruttamento delle loro risorse, un latifondista e un mezzadro – essi tipicamente generano un surplus comune, ossia un livello di benefici al netto dei costi, tali che ciascuno potrebbe stare meglio impegnandosi nell’attività in comune, piuttosto che se non lo facesse. Quando si e' in questo caso, i partecipanti ricevono una quota del surplus comune (o ciò che Aoki (1984) ha denominato rendite organizzative – organizational rents). Il surplus comune e' proprio la differenza tra i benefici (al netto dei costi diretti) che ciascuno guadagna dall’attività comune e i benefici che ciascuno riceverebbe nella sua migliore alternativa. Se i pescatori descritti nel capitolo 1
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|3
(Figura 1.1) cooperassero per limitare la loro pesca a sei ore, essi potrebbero migliorare la propria posizione (ottenendo un payoff di 1 ciascuno) rispetto a quando non riescono a cooperare, e di conseguenza pescano per 8 ore (guadagnando u <1 ciascuno). In questo caso essi si ripartiscono il surplus comune di 2(1 u) in modo uniforme. Ma, come abbiamo visto nel capitolo 1, e come era chiaro dalla tragedia dell’esempio dei pescatori nel capitolo 4, i benefici netti della limitazione della loro pesca avrebbero potuto essere divisi in modo molto diverso; un pescatore, probabilmente, avrebbe potuto guadagnare tutto il surplus netto.
Figura 5.1. L’insieme di contrattazione e la frontiera di contrattazione. La posizione di riserva è l’equilibrio di Nash in un gioco non cooperativo indicato dal punto z mentre la soluzione di contrattazione di Nash è indicata da n. La frontiera di contrattazione è ab e l’insieme di contrattazione è zab.
In questo capitolo, si affronterà la questione di come le rendite organizzative possano essere divise tra coloro che partecipano alla loro produzione.
IL
P R O B L E M A D E L L A C O N T R AT TA Z I O N E
Come scoprirono i patrizi romani, ciascun partecipante ad un progetto comune deve ricevere dei benefici almeno grandi quanto quelli associati alla sua prossima migliore alternativa (altrimenti rifiuterebbe di partecipare). Questo vincolo di partecipazione (participation constraint) restringe il campo delle possibili distribuzioni di benefici tra coloro che collaborano. Se il vincolo di partecipazione è soddisfatto come uguaglianza, allora il problema della distribuzione è risolto, ciascun partecipante ottiene un payoff equivalente a quello che potrebbe ottenere nella sua migliore alternativa disponibile. Tuttavia, quando vi è un surplus comune il vincolo di partecipazione non è necessariamente stringente (soddisfatto come uguaglianza) per ognuno dei partecipanti, e deve non essere stringente almeno per uno di essi (dalla
4 | MICROECONOMIA
definizione di surplus comune). Così come mostrava l’esempio dei pescatori, coloro che partecipano ad attività comuni implementano non solo i risultati allocativi – ossia, cosa, quando, dove e come produrre – ma anche i risultati distributivi – chi ottiene cosa e quando. Potrebbe esistere un unico partecipante che è in grado di pretendere praticamente l’intero surplus comune, rendendo credibile per gli altri partecipanti accettare o rifiutare offerte solo appena superiori alle loro migliori alternative disponibili. Ma laddove questo non sia il caso, le persone si impegnano in un progetto comune, producendo un surplus comune, a fronte di ciò che è chiamato un problema di contrattazione: essi devono determinare come debbono essere distribuite le rendite organizzative. Il termine potere contrattuale (bargainig power) si riferisce convenzionalmente alla divisione relativa del surplus comune guadagnato da un partecipante nell’ambito di un problema di contrattazione. Il fenomeno che si è verificato quando gli affittuari in mezzadria nel Bengala occidentale aumentarono le loro quote dalla metà ai tre quarti, tra la fine degli anni ’70 e l’inizio degli anni ‘80, può essere chiamato un aumento nel loro potere contrattuale. (Nel capitolo 10, saranno indicate alcune delle ambiguità e dei problemi associati al termine, ma per il momento saranno tralasciate.) Poiché il surplus comune è al netto delle migliori alternative disponibili dei partecipanti, il potere contrattuale conferma una relazione non evidente con il reddito totale di un partecipante: il mezzadro potrebbe trovarsi in uno stato di tremenda povertà ed il latifondista potrebbe essere estremamente ricco, ma se essi dividessero in parti uguali il surplus comune, il loro potere contrattuale si direbbe uguale. Una lunga tradizione nell’economia, risalente a John Stuart Mill e Vilfredo Pareto, ha distinto tra i problemi allocativi, che costituiscono materia oggetto di studio da parte dell’economia e il problema di contrattazione ed altri problemi di distribuzione, che sono di interesse proprio di altre discipline. La famosa definizione dell’economia di Robbins equipara la materia oggetto della sua analisi allo studio dei problemi allocativi. Invece, “chi ottiene che cosa, quando, come” è l’autorevole definizione della materia oggetto di studio delle scienze politiche, data da Lasswell e Kaplan (1950). Altri hanno riconosciuto che la distribuzione è centrale per l’economia, ma si sono interessati ad essa indipendentemente dall’allocazione. Ciò avrebbe senso se i risultati allocativi non avessero effetto sui risultati distributivi, e viceversa. Questo potrebbe accadere, per esempio, se una norma incontestata postulasse che il surplus comune di un’impresa potrebbe essere distribuito ugualmente. In questo caso tutti i
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|5
partecipanti preferirebbero l’allocazione che garantisce la massimizzazione del surplus comune. Come conseguenza della questione della determinazione della distribuzione, non ci dovrebbero essere conflitti di interesse sulle questioni allocative. I cacciatori di balene di Lamalera, incontrati nel capitolo 3, forniscono un esempio: essi cooperano nella caccia, senza conflitto, su qual è il miglior modo di pescare, in quanto la divisione della pesca è determinata in anticipo, e non dipende da come la balena viene cacciata. Un altro motivo, proposto, a volte, per separare il problema della contrattazione dal problema allocativo, vede la contrattazione come una conseguenza del disequilibrio o della mancanza di competizione. Secondo questa interpretazione, eccetto nel breve termine, il processo competitivo eliminerà tutte le rendite organizzative, così che in equilibrio tutti i partecipanti sono indifferenti tra le loro alternative correnti e le migliori alternative disponibili in futuro. In questo caso, la distribuzione dei benefici all’interno di un gruppo che collabora è interamente determinata dalle limitazioni alla partecipazione dei membri. Il problema di contrattazione svanisce. Le due idee chiave, che sostengono la separazione tra la distribuzione e l’allocazione, possono essere così riassunte come: la competizione elimina le rendite organizzative e gli effetti reciproci tra distribuzione e allocazione sono assenti. Queste ipotesi sono delle utili semplificazioni nell’analisi di una classe di problemi, per i quali è ragionevole porre due ipotesi aggiuntive. La prima è che tutti gli aspetti delle interazioni individuali sono regolati da contratti completi ed enforceable senza costo. La seconda è che hanno luogo solo transazioni con un equilibrio competitivo. Tuttavia, ora è largamente riconosciuto che queste ipotesi definiscono un caso piuttosto particolare. Io adotto tre ipotesi meno restrittive, che possono essere chiarificatrici per l’analisi delle istituzioni e del comportamento economici. Primo, le rendite organizzative sono una caratteristica onnipresente di tutti i sistemi di produzione, e certamente delle moderne economie capitaliste e competitive. Per esempio, le imprese che operano in mercati dei beni e del lavoro competitivi generano rendite considerevoli, alcune delle quali sono distribuite ai lavoratori sotto forma di pagamenti e di condizioni lavorative superiori alle migliori alternative disponibili dei lavoratori. Come vedremo nel dettaglio nei capitoli successivi, queste ed altre rendite organizzative emergono quando i soggetti privati, che massimizzano l’utilità, non sono in grado di scrivere contratti completi ed enforceable senza costi. Quindi, le rendite emergono nelle interazioni competitive private a causa della scarsità di istituzioni ottime. Le rendite organizzative non
6 | MICROECONOMIA
devono la loro esistenza agli interventi dei governi (benché i loro livelli e la loro distribuzione siano certamente influenzati dalle politiche pubbliche). Né sono semplicemente il riflesso di aspetti di disequilibrio e di mancanza di competitività delle economie reali (sebbene sia le transazioni in disequilibrio sia quelle non competitive influenzino le rendite organizzative). Secondo, avanzare richieste distributive è un’attività che utilizza risorse; quindi, gli individui cercheranno di implementare le allocazioni che favoriscono le loro richieste di rendite organizzative. I datori di lavoro che acquistarono il “Cox’s capper”, e le società di camion che installarono i computer a bordo, stavano facendo proprio questo. Anticipando il conflitto sulla distribuzione del surplus comune, i collaboratori ad un progetto comune allocano il loro tempo e le altre risorse tra attività di ricerca di rendite organizzative e attività produttive. L’allocazione delle risorse, per richieste distributive complicate, non si riduce alla ricerca di rendite organizzative, naturalmente, ed include il furto, le attività politiche mirate alla creazione e all’acquisizione di rendite, l’uso della forza tra le nazioni, e molti altri esempi che non tratterò. Terzo, i conflitti sulla distribuzione delle rendite organizzative contribuiscono all’inefficienza in tre modi. L’esempio più evidente sono i fallimenti della contrattazioneche conducono alla rinuncia di opportunità sicuramente reciprocamente vantaggiose. Se un gruppo di potenziali partecipanti ad un progetto non riesce a mettersi d’accordo su come le rendite organizzative debbano essere distribuite, i soggetti che vi appartengono possono abbandonare il progetto o ritardare il suo completamento, rinunciando interamente al surplus comune, piuttosto che accettare una quota minore. L’abbandono di Roma da parte della plebe è un esempio; durante il periodo di secessione si rinunciò alle interazioni reciprocamente vantaggiose tra i patrizi e la plebe. Altri esempi di rotture della contrattazione sono gli scioperi, le chiusure e i fallimenti nel concludere una transazione anche quando esistano termini che potrebbero conferire dei benefici sia ai venditori che agli acquirenti. Un altro esempio è il rifiuto di offerte considerevoli, negli esperimenti con ultimatum game, in quanto non ritenute eque. Anche quando queste rotture sono evitate, i conflitti distributivi possono contribuire all’inefficienza in un secondo modo, fornendo incentivi alla deviazione delle risorse da un uso produttivo ad attività improduttive di ricerca delle rendite. (I termini produttivo e improduttivo non hanno un’accezione normativa. Un input scarso, che compare come una variabile nella funzione di produzione di un’impresa, è una risorsa produttiva; quando viene utilizzato per un altro scopo, una risorsa produttiva viene
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|7
destinata a una attività non produttiva.) Quantità considerevoli di risorse possono essere dedicate direttamente alla ricerca di rendite organizzative – la presenza di avvocati ed esperti nelle relazioni industriali ne forniscono un esempio nella contrattazione sindacale con i datori di lavoro. Come vedremo, le risorse destinate alla ricerca competitiva di rendite possono (sotto condizioni razionali) eliminare interamente il surplus comune. Una terza fonte di inefficienza è la distorsione nell’allocazione delle risorse produttive. Il potere contrattuale di coloro che contribuiscono al surplus comune sarà influenzato dalle tecnologie utilizzate (basti pensare al “Cox’s capper”), dall’allocazione della produzione, e da altri aspetti dell’allocazione degli input. Una conseguenza è che i partecipanti cercheranno ciascuno di implementare le allocazioni che massimizzano i loro rendimenti, piuttosto che il surplus comune. La mia conclusione è che la ricerca di rendite organizzative è comune ed ha degli effetti importanti sul modo in cui le risorse sono usate nel processo di produzione. Quindi, la comprensione della contrattazione è importante per la comprensione dell’allocazione delle risorse – il fulcro canonico dell’economia – così come lo è per l’analisi dei risultati distributivi. Benché gli economisti della contrattazione abbiano tratto beneficio dai progressi nella teoria dei giochi, non vi è ancora una teoria della contrattazione che sia sostenuta empiricamente e largamente confermata. Per un certo verso, questo stato insoddisfacente riflette semplicemente il fatto che gli studiosi della contrattazione non hanno studiato tutti lo stesso problema. Alcuni hanno cercato – attraverso lo studio empirico delle relazioni di lavoro, o attraverso esperimenti di laboratorio controllati, per esempio – di comprendere come le persone si comportano in situazioni di contrattazione e come le istituzioni che regolano la contrattazione tipicamente conducono a distinti risultati. Un secondo approccio ha mirato a determinare teoricamente che tipo di risultati si avrebbero se gli individui fossero caratterizzati da un buon livello di capacità cognitive e di motivazioni personali – l’interesse personale e le preferenze basate sul risultato a tutti ben noti. Infine, alcuni hanno cercato di determinare quale risultato della contrattazione sarebbe socialmente desiderabile, ovvero un risultato che soddisfa un criterio normativo, così come la giustizia e l’efficienza. Naturalmente, le intuizioni degli studi comportamentali sulla contrattazione possono fare poca luce su che tipo di contratti un Homo economicus molto geniale potrebbe scoprire (se egli dovesse esistere), e viceversa. E nessuno di questi approcci ha una relazione ovvia con il terzo approccio, la teoria normativa della contrattazione. In questo capitolo, riesaminerò i due principali contributi al secondo e al terzo approccio – il modello delle offerte alternate basato sulle procedure di Rubinstein
8 | MICROECONOMIA
(1982) e altri, e il modello normativo della contrattazione di Nash (1950), e porrò in rilievo un certo numero di importanti lacune nella nostra attuale comprensione della contrattazione. Poi introdurrò un modello di evoluzione della contrattazione concepito per essere applicato ad alcuni dei difetti dei modelli esistenti. Nella penultima parte, mostrerò come la ricerca di rendite organizzative possa portare ad allocazioni inefficienti, ed in fine riesaminerò le prove sulla pervasività della contrattazione inefficiente e suggerirò alcuni motivi per cui le inefficienze nella contrattazione possono essere così comuni.
IL
POTERE
C O N T R AT T U A L E
IL MODELLO DI
E
I
NASH
R IS U LTAT I
D IS T R I B U T I V I :
Per concretezza, ritorniamo ai due pescatori, cercando ora di determinare come essi risolveranno il loro conflitto di interesse riguardo alla distribuzione delle rendite organizzative, che risulterebbero se essi cooperassero per limitare la loro pesca. Il cambiamento nella centralità dall’allocazione alla distribuzione è paragonabile a un cambiamento nelle ipotesi. I risultati allocativi studiati nel precedente capitolo sono stati determinati in modo non cooperativo – abbiamo assunto che i pescatori non potessero mettersi d’accordo ed implementare congiuntamente ciascuno un determinato numero di ore di pesca. Per contro, qui si assumerà che se i pescatori si mettono d’accordo su un’allocazione ed una determinata distribuzione del surplus comune, queste possono essere implementate. Come in precedenza, si useranno lettere minuscole in riferimento al primo (che viene chiamato “minuscolo”) e lettere maiuscole per il secondo (“maiuscolo”), e ed E sono rispettivamente lo sforzo di pesca del minuscolo e del maiuscolo. Scriveremo le loro funzioni di utilità in maniera compatta, come v = v(e,E) e V = V (e,E) , con v > 0 , v < 0 , V < 0 e V > 0 su un insieme economicamente e
E
e
E
ammissibile di e ed E. Quando i pescatori agivano in modo non cooperativo (nel capitolo 4), i due ponevano v (e,E) , V (e,E) pari a zero, rispettivamente, il che fornisce la funzione di miglior risposta di ciascuno. L’equilibrio di Nash, ovvero la miglior risposta reciproca, ha generato livelli di sfruttamento del lago pari a e ed E . Questo risultato appariva Pareto-inefficiente in quanto ciascun pescatore sarebbe stato meglio se entrambi avessero pescato meno. Nel capitolo precedente, ho considerato un certo numero di modi in cui i pescatori possono cercare di migliorare questo risultato, inclusi la creazione di diritti di proprietà privata sul lago e l’imposizione di una tassa sulla pesca. Abbiamo concluso che questi ed altri miglioramenti nella gestione delle interazioni dei pescatori migliorano l’utilità di uno o entrambi, e potrebbero (sotto condizioni idealizzate) implementare un’allocazione e
E
N
N
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|9
Pareto ottimale. Questo e' un risultato sul locus dei contratti efficienti, definito da v V = v V e
e
E
E
(5.1)
L’equazione (5.1) significa che le curve di indifferenza dei due sono tangenti, come si mostra nella Figura 4.5 nel precedente capitolo. Possiamo anche rappresentare lo stesso locus dei contratti efficienti nello spazio (v,V ) , come nella Figura 5.1. L’equilibrio di Nash di un gioco non cooperativo
genera utilità v (e ,E ) = z e V (e ,E ) = Z , sebbene il locus dei contratti efficienti (V ,v) = 0 sia l’insieme delle allocazioni (e,E) , per le quali la (5.1) è vera. Dalla definizione di ottimo paretiano, sappiamo che la pendenza del locus dei contratti efficienti non può essere inclinata positivamente, poiché ciò significherebbe che uno spostamento da un punto sarebbe un miglioramento paretiano, il che implicherebbe che il primo punto non era Pareto efficiente, per cui non era un punto sul locus dei contratti efficienti. Quindi / 0 . I punti in alto a destra del locus dei contratti N
N
N
N
v
N
N
V
efficienti non sono possibili. (Puoi verificare di aver compreso la Figura 5.1 collocando su questa figura i punti p e dalla Figura 4.5.) Per determinare il risultato della contrattazione di Nash, prima dobbiamo specificare le utilità che otterrebbero se non riuscissero a raggiungere un accordo (detto il loro punto di disaccordo, posizione di riserva o utilità di riserva). È convenzione nei modelli di contrattazione definire la posizione di riserva come il payoff che essi ottengono se la loro interazione ha fine (divorzio, interruzione dell’impiego, e simili). Ma, si ha spesso il caso in cui se i contraenti non riescono a raggiungere un accordo che possano implementare in modo cooperativo, essi ritornano ad interagire in modo non cooperativo, implementando il risultato di Nash (e ,E ) . (Come prima, N in apice si riferisce all’equilibrio di Nash non cooperativo). N
N
Per questo motivo definiamo le utilità associate, z e Z, come la migliore alternativa disponibile dei pescatori, spesso denominata la posizione di riserva (o fallback position). Ciascuno potrebbe avere delle altre posizioni di riserva, naturalmente, come abbandonare il lago, liberarsi dalla relazione con l’altro, ed occuparsi d’agricoltura. Tuttavia, molte interazioni resistono “nella buona e nella cattiva sorte”: si pensi alle coppie, ai vicini e agli impieghi. In questi casi è intuitivo rappresentare le alternative come interagire in modo cooperativo o in modo non cooperativo, piuttosto che seguire l’interpretazione più standard, ossia rappresentare le alternative come interagire in modo cooperativo o non interagire affatto. Quindi l’insieme dei miglioramenti paretiani possibili sulla posizione di riserva
10 | MICROECONOMIA
(z,Z) è denominato l’insieme di contrattazione e la parte non tratteggiata del locus dei
contratti efficienti, chiamata la frontiera di contrattazione (o la frontiera di Pareto), identifica le allocazioni che si trovano nell’insieme di contrattazione e che sono Pareto ottimali. Poiché la posizione di riserva è data dal risultato di una interazione non cooperativa, e i miglioramenti paretiani su questo risultato possono essere assicurati da un accordo contrattuale, i risultati nell’insieme di contrattazione possono denominarsi profitti da cooperazione; la contrattazione determinerà come questi profitti vengono divisi. Supponiamo che i pescatori possano accordarsi su un risultato tecnicamente possibile (e,E) e che un risultato concordato possa essere implementato senza costo. Quale sarà il risultato della contrattazione? Possiamo restringere l’insieme dei contratti possibili all’insieme di contrattazione (le decisioni al suo esterno o sono non fattibili, o violano la limitazione alla partecipazione, o entrambe le cose). Ma a parte questo, se c’è una lezione comune sia della teoria della contrattazione sia dell’economia comportamentale della contrattazione, è che il risultato dipende dalle istituzioni che regolano il processo di contrattazione, con differenze apparentemente minori nella struttura dell’interazione, che a volte producono enormi differenze nei risultati distributivi. Queste differenze istituzionali sono colte – sebbene solo in modo molto approssimativo – nei due approcci presentati di seguito. John Nash sviluppò il suo modello sulla contrattazione per determinare quali risultati (se ve ne sono) potrebbero soddisfare un insieme di condizioni, che sarebbe meglio descrivere come principi che potrebbero guidare un arbitro imparziale, fedele all’assunto che i confronti interpersonali di utilità sono privi di senso (le utilità sono ordinali). Queste condizioni sono le seguenti. Primo, il risultato dovrebbe essere Pareto ottimale (ovvero, sulla frontiera della contrattazione.) Secondo, il risultato dovrebbe essere simmetrico, nel senso che se il gioco che definisce l’interazione e' simmetrico, allora i payoff contrattuali dovrebbero essere uguali. Terzo, il risultato dovrebbe essere invariante rispetto a trasformazioni lineari delle funzioni di utilità delle parti. Una quarta condizione – denominata l’indipendenza delle alternative inammissibili – richiede che se l’insieme di contrattazione si restringe (così che il nuovo insieme non contiene risultati nel vecchio insieme) ma il precedente risultato di Nash resta possibile e la posizione di riserva rimane invariata, allora il risultato della contrattazione dovrebbe rimanere invariato. Allo stesso modo, se l’insieme di contrattazione dovesse espandersi, allora il nuovo risultato di Nash deve essere o il risultato ex-ante, o un risultato che non appartenga al primo insieme di contrattazione.
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|11
Mentre le prime due condizioni di Nash non sono controverse, non è difficile pensare a situazioni in cui potremmo considerare la decisione, presa da un arbitro di Nash informato, come ingiusta. Il problema più ovvio è che, escludendo confronti interpersonali dell’utilità, il piano dell’arbitro non può tener conto dei bisogni relativi delle due parti. Si potrebbe pensare che la giustizia di un contratto debba essere giudicata dagli stati finali che ne risultano, così che la decisione se un surplus debba essere diviso a metà o in qualche altro modo, dipenda da quanto sono ricche le due parti, indipendentemente dallo specifico contratto. Effettivamente, Nash lascia da parte qualsiasi considerazione sulla giustizia delle posizioni di riserva (e la eventuale necessità di un contratto giusto che compensi le migliori alternative disponibili inique.) Si noti, anche, che ciò deriva dalla quarta condizione, per cui un miglioramento in una delle opportunità dei contraenti (ma non nell’altra) – per esempio un ampio aumento nell’ammontare massimo che essa potrebbe guadagnare – non dovrebbe avere effetti sul risultato contrattuale. Questo aspetto della soluzione della contrattazione di Nash è stato giudicato da molti come ingiusto ed è affrontato nella soluzione alternativa proposta da Kalai e Smorodinsky (1975). Ma poiché il modello di Nash è stato utilizzato principalmente per studiare come i contratti sono, non come dovrebbero essere, lasceremo da parte le origini normative (e i possibili difetti) di questo approccio e lo presenteremo semplicemente come una descrizione del processo di contrattazione. Il solo contratto che soddisfa le quattro condizioni di Nash è quello che massimizza il prodotto dei guadagni in termini di utilità rispetto alla posizione di riserva (o semplicemente il prodotto delle rendite organizzative, se queste sono espresse nelle appropriate unità di utilità). Alcuni lavori successivi hanno abbandonato l’ipotesi di simmetria di Nash, fornendo ciò che è denominato il contratto generalizzato di Nash. Per i pescatori, si definisce come l’allocazione (e*,E*) che massimizza il “prodotto di Nash” , dove
= (v(e*,E*) z) (V (e*,E*) Z)
1
soggetto al vincolo, rappresentato dalla frontiera di Pareto, (v*,(e*,E*) , V *(e*,E*)) = 0 . L’esponente [0,1] (che è uguale a 1/2 nel caso di simmetria) a volte viene denominato il potere contrattuale del minuscolo. L’allocazione che massimizza questa espressione (per [0,1] ) è quella che distribuisce le utilità tra il minuscolo e il maiuscolo come segue: /(1 ) = (v z) / (V Z) v
V
Una semplificazione renderà questo risultato un po’ più evidente. Supponiamo
12 | MICROECONOMIA
che il locus dei contratti efficienti possa essere espresso con v +V 1 = 0 (diciamo che i contraenti stanno dividendo un dollaro). Quindi, il surplus comune è (1 (z + Z) e =1 = . Sostituendo questi termini nell’espressione precedente e risolvendo per v, v
V
otteniamo l’utilità del Minuscolo, che risulta dal contratto di Nash. Indico questo v , con la n minuscola in apice per indicare la soluzione della contrattazione di Nash n
(mentre l’equilibrio non cooperativo di Nash e' indicato dalla N). Quindi abbiamo v = z + (1 (z + Z) = (1 )z + (1 Z) n
(5.2)
L’utilità del Minuscolo è uguale alla sua posizione di riserva (z), più una quota del surplus comune. La seconda espressione rende chiaro che se il Minuscolo
avesse tutto il potere contrattuale otterrebbe 1 Z , mentre senza il potere contrattuale otterrebbe z. La soluzione di Nash spiega i risultati della contrattazione in un modo che è allo stesso tempo semplice e congruente con molte intuizioni comuni. Per esempio, implica che la posizione di riserva di uno influenzerà il risultato e che una divisione a metà è un risultato probabile tra persone che non sono differenti rispetto ad aspetti rilevanti. Data l’importanza delle norme di giustizia nelle situazioni attuali di contrattazione, l’approccio di Nash ha anche il vantaggio di essere esplicitamente normativo. Il fatto che Nash possa non essere riuscito a cogliere le idee intuitive di molte persone su ciò che rende un risultato equo, e' una questione a parte. La presenza di alcuni inconvenienti risponde ad una precisa scelta: Nash voleva definire un buon risultato della contrattazione; egli non voleva che il modello chiarisse i processi di contrattazione nel mondo reale. Di conseguenza, la contrattazione di Nash non fallisce mai; nessuno riceve mai il payoff associato alla posizione di riserva (a meno che non abbia un potere contrattuale pari a zero). Questa implicazione poco realistica viene considerata: gli assiomi di Nash richiedono che il risultato sia sulla frontiera di Pareto. Ugualmente importante, il potere contrattuale è semplicemente ipotizzato (con l’ipotesi di simmetria, =1 =1/2 ) ed il processo di contrattazione – con le sue minacce, offerte e contro offerte – è assente.
IL
P O T E R E C O N T R AT T U A L E E N D O G E N O N E L M O D E L L O C O N
O F F E RT E A LT E R N AT E
Il modello con offerte alternate, come suggerisce il suo stesso nome, applica il problema del potere contrattuale attraverso la creazione di un modello esplicito del processo di contrattazione, invertendo efficacemente l’approccio di Nash. Nash si era
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|13
interrogato su quale risultato fosse consistente con un insieme di assiomi sul benessere sociale che esprimono un concetto di razionalità collettiva, senza considerare perché dei contraenti individuali possano arrivare a questo risultato. Al contrario, il modello con offerte alternate descrive il processo di contrattazione come una sequenza di offerte e contro offerte, regolate da un insieme esplicito di regole e si interroga su quale risultato sia consistente con gli assiomi di razionalità individuale. Esso non esprime alcun giudizio normativo sul risultato. L’approccio coglie due caratteristiche chiave della contrattazione nel mondo reale. Primo, il processo di contrattazione richiede tempo o per altre ragioni è costoso per i contraenti in termini sia di opportunità a cui si deve rinunciare che per altri aspetti. Secondo, la parte per cui i costi sono minimi ha un maggiore potere contrattuale e si assicura una quota più ampia. Se il modello di Nash corrisponde al caso in cui i due pescatori ingaggiano semplicemente un arbitro per aiutarli ad ottenere una soluzione al loro problema di contrattazione, nella struttura con offerte alternate, il Maiuscolo ed il Minuscolo determinano loro stessi il risultato, nei limiti posti dalle regole del processo di contrattazione. Queste regole determinano che il soggetto che muove per primo, fa un’offerta all’altro che, se accetta, termina l’interazione. Se l’offerta viene rifiutata, ciascun contraente riceve i payoff di riserva z e Z in quel periodo. Coerentemente con la nostra interpretazione della posizione di riserva, così come dei payoff per un gioco non cooperativo, ciò significa che a seguito del rifiuto dell’offerta (e di conseguenza in ogni periodo precedente ad un accordo), i contraenti interagiscono in modo non cooperativo e ricevono z e Z (si immagini un gruppo di lavoro e un datore di lavoro che continuino a produrre senza un contratto mentre la trattativa ha luogo). Se l’offerta del first mover è stata rifiutata, un dato lasso di tempo, , passa e poi il second mover fa una contro-offerta. Il processo va avanti per un orizzonte temporale infinito, sino a che un’offerta viene accettata. Insieme a queste regole, i fattori di sconto che misurano la pazienza del Maiuscolo e del Minuscolo saranno delle importanti cause determinanti del risultato: le definiamo come e . u
l
Eccezionalmente, questo gioco ha un unico risultato d’equilibrio. Vediamo come può essere determinato. Ipotizziamo, come in precedenza, che la frontiera di Pareto sia espressa da v +V =1 e semplifichiamo ulteriormente ponendo le posizioni di riserva come z = Z = 0 . Supponiamo che il Minuscolo sia il first mover e che ci sia una quantità v˜ che è il massimo che il Minuscolo può ricevere in uno dei turni del gioco, quando è nel ruolo dell’offerente. Naturalmente noi non sappiamo a quanto corrisponde questa quantità (non ancora) e nemmeno il Minuscolo. Ma sarà la stessa in ogni periodo in cui tocca al minuscolo fare un’offerta, poiché abbiamo ipotizzato
14 | MICROECONOMIA
che il gioco è stazionario (in variante rispetto al tempo), così che se prendiamo il turno t (un turno in cui il minuscolo deve fare un’offerta) il gioco non è differente in alcun modo dalla situazione che il minuscolo ha affrontato al turno t-2, t-4, etc.. Poniamo il primo turno del gioco t=0 e supponiamo che i contraenti agiscano sulla base di un’induzione a ritroso, poiché pensano in anticipo alla situazione che affronterebbero se si trovassero al tempo t=1, ovvero, se fosse il turno del Maiuscolo di fare un’offerta. A quel punto, il Maiuscolo saprebbe che, se offrisse al Minuscolo una quantità v˜ , verrebbe accettata. La motivazione è che, dato il tasso di preferenza l
temporale del Minuscolo, il Minuscolo è indifferente tra ricevere v˜ al tempo t=1 o ricevere v˜ al tempo t=2, quando il Minuscolo è l’offerente. Se questa offerta fosse fatta ed accettata il Maiuscolo prenderebbe una quantità ( 1 v˜ ). In questo caso, al l
l
tempo t=0 il Minuscolo saprebbe che offrendo (1 v) ˜ indurrebbe il Maiuscolo ad accettare, sebbene il Maiuscolo rifiuterebbe un’offerta minore (poiché sa che il Minuscolo sarebbe preparato ad accettare un’offerta uguale a v˜ nel periodo successivo). In altri termini, il Minuscolo sa che 1 (1 v) ˜ è il massimo che può u
l
l
u
l
ottenere nel periodo 0. Tuttavia, noi sappiamo già che il massimo che il Minuscolo può ottenere quando è nella posizione per fare un’offerta è v˜ , così eguagliando queste due espressioni e risolvendo, abbiamo ˜ v˜ =1 (1 v) u
oppure v˜ =
l
1 1
(5.3)
u
l
u
Il Minuscolo penserà che se questo è il massimo che può ottenere ogni qual volta faccia un’offerta, dovrebbe fare quest’offerta all’inizio, ed evitare di rinviare i payoff fino al turno successivo. Quindi, il Minuscolo farà quest’offerta, il Maiuscolo accetterà, ed il contratto sarà concluso.
Se abbandoniamo l’ipotesi che le posizioni di riserva siano entrambe uguali a zero, abbiamo un caso più generale, e che permetterà di fare un confronto tra il contratto con offerte alternative e il contratto di Nash. Reintroducendo Z e z, la quota del Minuscolo risulta uguale a: v˜ =
(1 Z)(1 ) z (1 ) + (1 ) (1 ) u
l
u
u
l
l
u
Questa sarà più chiara se si esprime come (1 ) /(1 ) , con (1 ) (1 ) /(1 ) . Allora il risultato precedente può essere scritto u
u
l
l
u
l
u
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|15
v˜ = (1 Z) + (1 )z = z + (1 z Z)
(5.4)
che ripropone la (5.3) precedente, quando z = Z = 0 , come ci saremmo aspettati.
Il modello identifica quattro determinanti del risultato: i fattori di sconto dei contraenti, altri costi del ritardo (che variano inversamente rispetto alle utilità associate alle posizioni di riserva), quale dei contraenti fa la prima mossa e il periodo di tempo che trascorre tra le offerte. Si noti che se il Minuscolo fosse stato infinitamente paziente ( =1 ), avrebbe guadagnato l’intero surplus a prescindere dal fattore di sconto del l
Maiuscolo, a meno che anche questo fosse infinitamente paziente. In questo caso, il contratto di equilibrio è indefinito, per l’evidente ragione che la pazienza infinita elimina un elemento chiave del processo di contrattazione, ossia, il costoso passare del tempo.
Per avere un’idea delle grandezze implicate, ipotizziamo che z = Z = 0 , e immaginiamo che il Maiuscolo sia povero, abbia un accesso limitato al credito, e prenda regolarmente in prestito con la sua carta di credito, pagando un tasso di interesse reale del 15 percento, mentre il minuscolo è molto ricco e può prendere in prestito e prestare quantità illimitate al tasso d’interesse primario reale, diciamo il 4 percento. Se queste cifre indicano i tassi annuali delle preferenze temporali dei due, e è un anno, allora i fattori di sconto sono = 0.96 e = 0.87 e (usando la (3)), l
u
v˜ = 0.76 , così il Minuscolo ottiene tre volte più del Maiuscolo.
Quanto dello svantaggio del Maiuscolo dipende dal fatto di essere il second mover, e quanto è dovuto alla maggiore pazienza del Maiuscolo? Risulta che il vantaggio del first mover non è molto rilevante. Vediamone il perché. Se i due hanno lo stesso tasso di preferenza temporale con un fattore di sconto , possiamo utilizzare la (3) per dimostrare che il Minuscolo avrebbe ricevuto v˜ =
(1 ) 1 1 = = (1 )(1 + ) 1 + 1 2
Ciò significa che se il Maiuscolo avesse avuto lo stesso tasso di preferenza temporale del Minuscolo (4 percento), la quota del Minuscolo si sarebbe ridotta dallo 0.76 allo 0.51; praticamente tutta la più ampia quota del Minuscolo è dovuta alla maggiore pazienza del Minuscolo, non al vantaggio d’essere il first mover. Anche se entrambi avessero avuto un tasso di preferenza temporale più alto del Maiuscolo, la quota del Minuscolo sarebbe stata comunque vicina a 1/2, ossia 0.53. Evidentemente,
16 | MICROECONOMIA
solo se i contraenti sono estremamente impazienti, il vantaggio del first mover ha importanza, anche quando il tempo trascorso tra le offerte (in questo caso si è ipotizzato che sia di un anno) sia abbastanza ampio. Poichè , il tempo tra i periodi, tende a zero, il vantaggio del first mover scompare interamente, così come ci si aspetta. Forse sorprendentemente, l’effetto considerevole dei tassi differenziali delle preferenze temporali restano anche se tende a zero; ritorneremo su questa anomalia. Com’è il contratto di equilibrio, v˜ , nel gioco con offerte alternate collegato al contratto di Nash, v ? Un confronto chiaro è possibile se ipotizziamo posizioni di n
riserva identiche Z=z, prendiamo il limite con che tende a zero e indichiamo i tassi di preferenza temporale (non i tassi di sconto) con . Allora abbiamo:
v˜ =
(1 z) z + + + l
u
l
u
u
l
che, usando ° = /( + ) come una misura del tasso di preferenza temporale del Maiuscolo relativo a quello del Minuscolo, può essere scritta come u
u
l
v˜ = (1 °)z + °(1 z)
(5.5)
Confrontando la (5) e la (2) si dimostra che il parametro del modello generalizzato di Nash, che misura il potere contrattuale del Minuscolo ( ) è identico alla misura relativa delle preferenze temporali espresse da ° (con la quota del Minuscolo che è confermata da un tasso di preferenza temporale più grande per il Maiuscolo). Laddove i due abbiano lo stesso tasso di preferenza temporale (e tenda a zero), il risultato al limite è identico al contratto di Nash sotto l’ipotesi di simmetria (poiché il vantaggio del first mover nel caso con offerte alternate è svanito a causa della nostra ipotesi di periodi di contrattazione arbitrariamente brevi.) La chiarezza di questo confronto fa affidamento sull’ipotesi che la posizione di riserva in entrambi i casi non è il payoff associato alla fine dell’interazione, ma piuttosto quella che è associata ad un’interazione non cooperativa in corso con lo stesso partner. Ciò che importa nel modello con offerte alternate è il costo di attesa di un altro periodo (che varia inversamente rispetto a z), chiamato l’opzione interna (inside option) del contraente. Il payoff associato ad un’altra interazione, che il contraente potrebbe intraprendere se quella attuale si interrompesse interamente, è inammissibile nel modello con offerte alternate (a meno che esso superi l’offerta d’equilibrio, in tal caso quest’ultimo sarà rifiutato e il rapporto terminerà). Al
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|17
contrario, un’interpretazione convenzionale del contratto di Nash definisce z come il payoff se si interagisce con il prossimo miglior partner alternativo (l’opportunità alternativa, opportunità alternativa o outside option), non come il payoff derivante dall’interagire con lo stesso partner, ma senza un accordo. L’approccio con offerte alternate non preclude la possibilità di tener conto delle opportunità alternative (outside option). Si ricordi che il risultato di un’interazione non cooperativa era l’opzione interna (inside option) nell’esempio precedente; ma questo risultato generalmente dipende dalla opportunità alternativa. Per esempio, nel modello di disciplina del lavoro del rapporto di impiego sviluppato nel capitolo 8, l’equilibrio di Nash del gioco non cooperativo tra lavoratore e datore di lavoro dipende dall’accesso del lavoratore ad un’assicurazione contro la disoccupazione e ad un lavoro alternativo, la sua occupazione potrebbe essere interrotta. In questo caso, le opportunità alternative sono la posizione di riserva per il processo di contrattazione, che è la determinante approssimativa del salario di equilibrio non competitivo. Il datore di lavoro e i lavoratori potrebbero cercare di migliorare le loro transazioni attraverso “la contrattazione” a partire da questo equilibrio non cooperativo, i cui termini costituirebbero la opzione interna per il loro processo di contrattazione. (Un modello di contrattazione inserito in un modello non cooperativo di interazione tra lavoratore e datore di lavoro è presentato nel capitolo 8.)
DIFETTI
ED ESTENSIONI EVOLUTIVE
Il modello con offerte alternate è, quindi, una base adeguata per lo studio dei contratti nel mondo reale? La sua forza è che, penetrando nella scatola nera del processo di contrattazione, il modello con offerte alternate richiede la specificazione dettagliata delle istituzioni che regolano la contrattazione. Inoltre fornisce una motivazione – in termini di preferenze temporali relative e (in misura minore) vantaggio del first mover – del parametro “potere contrattuale”, che si è ipotizzato essere esogeno nel modello di Nash. Tuttavia, l’approccio ha anche dei difetti. Primo, come la (5.5) chiarisce, ciò che importa nel determinare il risultato è il costo relativo dell’attesa (che è la ragione per cui il partner infinitamente paziente ottiene l’intero surplus, anche se l’altro è molto paziente – ma non lo è infinitamente). Il costo totale dell’attesa (o la quantità di attesa) può essere assolutamente piccolo, senza che diminuisca l’importanza delle differenze in termini di preferenza temporale, nella determinazione delle quote dei contraenti. Come rileva Kreps (1990, p.562), anche se le offerte e le contro-offerte sono proposte in pochi secondi, gli effetti delle differenze nei tassi di preferenza temporale dei contraenti non diminuiscono. Inoltre, tra i partner della contrattazione con lo stesso tasso di
18 | MICROECONOMIA
preferenza temporale, il contraente che può rispondere a un’offerta in 2 secondi, prenderà tre quarti del surplus, se è in coppia con un pigro lento, che ha bisogno di 6 secondi per rispondere. Laddove la contrattazione non richieda tempo ma sia costosa per altre ragioni, è sorprendente che siano i costi relativi della contrattazione (anche se limitati) a determinare il risultato. Così il modo in cui il risultato della contrattazione viene determinato dai costi relativi di attesa, non è plausibile. Secondo, così come nell’approccio di Nash, la contrattazione non si interrompe mai e i risultati sono Pareto efficienti. Entrambi i modelli, quindi, non riescono a cogliere i fatti salienti della contrattazione nel mondo reale, che saranno menzionati a breve. Un terzo aspetto è che non tutte le situazioni di contrattazione consentono che il ruolo delle scelte esterne sia introdotto nella struttura con offerte alternate, nel modo abbozzato in precedenza. Tuttavia ci sembra estremamente controintuitivo pensare che in questi casi le offerte esterne non facciano alcuna differenza. Per comprenderne il perché, supponiamo che A e B siano partner in un progetto e ciascuno abbia scelte esterne normalizzate a zero. Il loro contratto con offerte alternate dà a B una quantità v , che è vicina alla metà del surplus comune. Ora supponiamo che la scelta esterna di B migliori così che il payoff associato alla fine del progetto non è più zero, ma v dove è un numero positivo piccolo. Nessun altro aspetto dell’ambiente di contrattazione è cambiato. Questo cambiamento nella scelta esterna non ha effetto sull’equilibrio del gioco di contrattazione con offerte alternate, ma trasforma la situazione da una in cui A e B stanno dividendo il surplus comune quasi equamente, ad una in cui A riceve praticamente tutto il surplus. b
b
Infine, gli individui ipotizzati nell’approccio con offerte alternate sono appena riconoscibili come attori umani. Vi è considerevole evidenza sperimentale sul fatto che le persone (per lo più studenti universitari, alcuni del Cal Tech) non si impegnano nel processo di induzione a ritroso, cognitivamente impegnativo, sul quale si basa il modello (Crawford (2002)). Inoltre, sia nel modello con offerte alternate sia nell’approccio di Nash (come modello di come agiscono i reali contraenti), si è ipotizzato che i contraenti conoscano le funzioni di utilità delle loro controparti. Questo non solo è falso, ma è confuso dal fatto che nelle situazioni di contrattazione le persone solitamente tendono alla lunga a falsificare le loro preferenze. (In una situazione di contrattazione durante la Guerra Fredda, si dice che il Presidente Richard Nixon abbia cercato di convincere la sua controparte russa che egli aveva
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|19
irrazionalmente concentrato la posizione degli U.S. su una alternativa in particolare). Il fatto che le ipotesi cognitive dei modelli appena visti siano irrealistiche può non essere, tuttavia, un difetto decisivo. Ciò che è critico non è che le persone pensino in questo modo, ma piuttosto che agiscano in questo modo. Sembra probabile che gli individui reali nelle situazioni di contrattazione evitino induzioni all’indietro complesse e ragionamenti basati sulla dominanza iterata, ed invece adottano regole basate sull’esperienza, che a loro sono tornate utili in passato, o che sembra abbiano avuto buon esito, quando sono state usate da altri. Naturalmente, dire che una quota ha natura tradizionale, non serve a spiegarla. Ma bisogna dire qualcosa su come spiegarla, ossia realizzando un modello dell’evoluzione delle norme distributive e delle tradizioni sotto ipotesi plausibili sulle capacità cognitive e l’apprendimento. Potrebbe essere il caso che le regole comportamentali che emergono da questo processo di apprendimento da parte di agenti adattivi, conducano a risultati che sono approssimati dal modello con offerte alternate o dall’approccio di Nash, oppure da entrambi. Vedremo se ciò è vero.
Supponiamo che vi sia una norma che stabilisce che una frazione, x , di una torta normalizzata ad uno debba essere allocata al giocatore, chiamato Riga e che la rimanente frazione (1 x) vada ad un altro, chiamato Colonna. Riga e Colonna non ricorrono all’arbitro imparziale di Nash, né sono propensi a procedere all’induzione a ritroso richiesta dai contraenti di Rubinstein. Essi hanno ricordi limitati e una lungimiranza anche più limitata, poiché basano le loro azioni interamente sul comportamento appena precedente di coloro con cui interagiscono, e talvolta provano a migliorare il loro contratto attuale. Vedremo che sotto alcune condizioni, la soluzione alla contrattazione di Nash appare come il risultato probabile di questa interazione. Riga e Colonna sono componenti di due sotto-popolazioni (indicate rispettivamente con n e n ), che sono appaiati casualmente per giocare un Gioco della Suddivisione introdotto nel capitolo 1. Se la somma delle quote richieste dai due è pari a uno o minore di uno, essi ricevono le loro richieste, con le associate utilità R
C
u( x) e v(1 x) , entrambe funzioni crescenti e concave. Altrimenti essi ottengono
zero, la cui utilità è normalizzata a zero per entrambi. Ipotizziamo per il momento che n = n . R
C
Gli individui conoscono la distribuzione del gioco nel periodo precedente e rispondono in maniera ottimale a questa distribuzione con probabilità (1 ) , dove è una frazione positiva piccola che misura il tasso di risposta idiosincratica (idiosincratic
20 | MICROECONOMIA
non-best response). Con probabilità essi “provano” a vedere se possono ottenere un accordo migliore, aumentando la loro richiesta, le Righe richiedono x + e le Colonne richiedono 1 x + dove è un cambiamento discreto nella richiesta. Ipotizziamo che = 0.1 , in questo modo una “prova” è un tentativo per aumentare la loro richiesta di questa quantità. Sempre che sia piccolo, la norma sarà sostenuta nel lungo periodo, se sia Righe che Colonne rispondono in maniera ottimale alle distribuzioni precedenti, nelle quali praticamente tutti stanno aderendo alle norme. Ma ogni tanto l’evento casuale di un’ampia frazione di “perforatori” con una risposta idiosincratica in una sotto-popolazione, diciamo le Righe, indurrà le Colonne che adottano miglior rispostea chiedere di meno. Sapendo ciò, nel periodo successivo tutte le Righe con miglior risposta domanderanno di più, e (a meno di interferenze nella forma di ulteriori mosse casuali idiosincratiche) sarà stabilita una nuova norma. Poichè questo processo funziona attraverso gruppi di eventi casuali, è evidente che le norme evolveranno e in un periodo sufficientemente lungo tutte le norme nell’intervallo da 0.1 a 0.9 saranno osservate con probabilità positiva (ipotizzo che nessun individuo faccia mai una richiesta di zero, dal momento che una tale richiesta non può essere il risultato di una prova casuale, né può essere una miglior risposta in senso stretto). Ma alcune norme saranno più robuste di altre, persistendo nel lungo periodo e ripetendosi rapidamente quando sono rimpiazzate. Che cosa possiamo dire circa queste norme persistenti? Definiamo come la probabilità di spostarsi dalla norma x ad x + , (in un dato periodo, la conseguenza di un evento destabilizzante (tipping) come descritto in precedenza) con la probabilità μ di spostarsi da x a x . La norma tenderà ad aumentare se > μ , e viceversa. Queste probabilità dipenderanno dal numero minimo di risposte idiosincratiche necessarie ad indurre i giocatori con miglior risposta a modificare la loro richiesta. Si consideri la miglior risposta di Riga, dato che si è avuta una frazione di Colonne che non richiedono la norma (1 x) , ma invece (1 x + ) . La Riga sa che riducendo la sua richiesta a x si garantirà questo payoff
minore, mentre persistendo con la norma rischia di non ottenere nulla. La miglior risposta di Riga è di aderire alla norma, se (1 )u( x) u( x )
(5.6)
e richiedere la quantità minore diversa (ipotizzo che la norma non venga abbandonata, a meno che farlo sia la miglior risposta in senso stretto). Esprimendo la (6) come un’uguaglianza e risolvendo per , otteniamo il valore critico di , ossia
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|21
* =
u( x) u( x ) u( x)
così che se nel periodo precedente > *, la miglior risposta delle Righe in questo periodo è di ridurre la loro richiesta. Un ragionamento simile mostra che se è la frazione di risposte idiosincratiche tra le Righe, la miglior risposta per le Colonne è di aderire alla norma se v(1 x)(1 ) v(1 x )
e di richiedere la minore quantità altrimenti. Il valore critico di è, quindi * =
v(1 x) v(1 x ) v(1 x)
Un esempio chiarirà come cambia una norma. Supponiamo che la norma corrente sia x = 0.2, e = 0.1, così che quando le Righe “provano” esse domandano 0.3 e quando le Colonne provano esse domandano 0.9. Avendo osservato alcune frazioni di “coloro che provano” d’altra parte il periodo precedente, qual è il payoff atteso dal concedere ( ’) e dall’adeguarsi alla norma ( *) per il giocatore Riga? Supponiamo u = x e v = (1 - x). Allora:
*R = (1 k)x e 'R = x La frazione minima di Colonne che hanno provato l’ultimo anno che è sufficiente indurre le Righe a concedere, k*, è il valore di k che eguaglia questi due payoff attesi, o k* = /x, che in questo esempio numerico da k* =1/2. Ragionando nello stesso modo per le Colonne, la frazione minima di Colonne che ci provano nell’ultimo periodo sufficiente ad indurre le Colonne a cedere è il valore di che eguaglia
*C = (1 )(1 x) = 1 x = 'C che dà * = /(1 x) o, nel nostro esempio numerico, * = 1/8. Il risultato è che poiché * < k * , esso comporta meno Righe che provano ad indurre le Colonne a concedere, piuttosto che viceversa, così che se i tassi del provare e le dimensioni dei gruppi sono uguali, la norma è molto probabile che punti “su” a 0.3, piuttosto che giù a 0.1. Si noti che i valori critici * e * sono proprio la differenza di utilità tra il payoff determinato dalla norma e la richiesta minore, divisa per l’utilità del payoff determinato dalla norma. Scrivendo questi due valori critici come una funzione della norma, la concavità delle funzioni di utilità assicura che *( x) è crescente in x ,
22 | MICROECONOMIA
mentre *( x) è decrescente in x . La probabilità di una transizione da una norma ad un’altra varia inversamente con il numero critico di risposte idiosincratiche necessarie a rimuoverla. Quindi, definiamo una norma stazionaria una norma per la quale ( *( x)) = μ( *( x))
(5.7)
Poichè la dimensione del gruppo e i tassi di errore sono identici all’interno della sottopopolazione, la (5.7) richiede semplicemente che *( x) = *( x) o v(1 x) v(1 x ) u( x) u( x ) = v(1 x) u( x)
Se è piccolo, può essere approssimato da v'(1 x) u'( x) = v(1 x) u( x)
Si noti che, eliminando dall’equazione (5.8), otteniamo un’espressione simile all’equazione (5.1), ossia, la condizione che definisce la soluzione di Nash per il problema assiomatico di contrattazione. Questa somiglianza suggerisce che sotto alcune condizioni, il modello di evoluzione replica approssimativamente la soluzione assiomatica di Nash? Si. L’equazione 5.8 è la condizione del primo ordine che dà il massimo di = ln v(1 x) + ln u( x) = v(1 x)u( x)
Ricordando che l’utilità se non si contratta è zero, è proprio volte il “prodotto di Nash” del guadagno di utilità rispetto alla posizione di riserva, e la x che massimizza questa espressione dà la soluzione di Nash al problema di contrattazione. Quindi, un processo di evoluzione plausibile che coinvolge individui con conoscenza e capacità cognitiva limitate prevede questa soluzione alla comune contrattazione come suo risultato più probabile. Le linee continue nella figura 5.2 illustrano un caso in cui le Righe e le Colonne sono ugualmente numerose ed ugualmente aggressive, la norma stazionaria x* quindi approssima il risultato di Nash. Tuttavia, questo è un risultato piuttosto controverso, che deriva dalle ipotesi adottate. Se le dimensioni della sotto-popolazione differiscono, o se un gruppo è più aggressivo di un altro, in quanto “prova” più frequentemente, otteniamo un risultato che differisce dal risultato standard di Nash in modi che possono far luce sulle determinanti del potere contrattuale. Per vedere ciò, per prima cosa si noti che (per
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|23
valori critici, * e * che eccedono il tasso di errore) la probabilità che risposte idiosincratiche eccedano i valori critici varierà positivamente con il tasso di risposta idiosincratica e inversamente alla dimensione del gruppo. La prima è ovvia; la seconda risulta dal fatto che in gruppi molto piccoli la frazione di risposte idiosincratiche che si realizza assumerà frequentemente valori elevati, mentre questo accadrà solo molto di rado con gruppi ampi. Quindi, indicando con il pedice il tasso di errore per i due gruppi, abbiamo = ( *( x);n , ) R
e
R
μ = μ( *( x);n , ) C
C
con entrambe le funzioni decrescenti nella prima e nella seconda variabile e crescenti nella terza. Eguagliando e μ e derivando rispetto al primo per la dimensione del gruppo di Righe e per la norma, e poi rispetto al tasso di errore e alla norma, e ponendo i risultati uguali a zero, abbiamo dx * / d > 0 R
e
dx * / dn < 0 R
Possiamo concludere che più un gruppo è piccolo e aggressivo, più è ampia la sua quota nella norma stazionaria. La figura 5.2 illustra un caso in cui le Righe e le Colonne sono ugualmente numerose ed ugualmente aggressive (le curve in grassetto), la norma stazionaria x *, quindi, si approssima al risultato di Nash. Le curve tratteggiate mostrano l’effetto dell’aumento nel tasso di errore di Colonna, che sposta in alto la sua funzione μ e accresce la sua quota, e dell’aumento nella dimensione della popolazione di Colonne (che sposta μ in basso e diminuisce la sua quota)
24 | MICROECONOMIA
Figura 5.2 La determinazione di evoluzione di redditi da contrattazione. Le probabilità di una transizione ad una forma più ampia o più piccola per le Righe sono e μ, rispettivamente, ed x* è approssimativamente la soluzione di Nash quando nC = nR e C = R. Le linee tratteggiate mostrano gli effetti di giocatori Colonne che sono più aggressivi (C più grande) e più numerosi (nC più grande)
In particolare, la soluzione di Nash è stata proposta da F. Zeuthen (1930, p.1631) con un’applicazione alla contrattazione tra datore di lavoro e lavoratore. Diversamente da Nash, che derivò il suo risultato da postulati di razionalità collettiva, Zeuthen ha motivato la sua soluzione con ciò che ha chiamato il problema della “guerra economica” psicologica. L’idea chiave è che in una situazione di contrattazione la parte che subisce la minima perdita derivante da una concessione, più probabilmente la farà. La regola della concessione di Zeuthen ripete l’equazione (5.6), con x indicante la domanda che Riga ha fatto contro Colonna, x una domanda che Colonna accetterebbe sicuramente, e
la credenza di Riga circa la
probabilità che Colonna accetti. Quindi
è la stima di Riga della probabilità che non fare una concessione porterà ad una transazione a condizioni favorevoli (non concessione), cioè, la probabilità che il giocatore Colonna, con cui Riga è appaiata, aderirà alla norma, piuttosto che cercare di fare meglio della norma provando. Una limitazione dell’approccio evolutivo è che il “provare” un accordo migliore non è correlato tra gli individui, mentre in molte situazioni di contrattazione le Righe e le Colonne partecipano ad alcune organizzazioni – un’associazione d’affari o un sindacato, per esempio – ed i loro sforzi per migliorare la loro dimensione del premio sono collettivi piuttosto che individuali. Nel capitolo 12, ritorno su questo problema,
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|25
includendo un modello di azione collettiva in una dinamica d’evoluzione.
LA
R IC E R C A D I R E N D IT E O R G A N IZ Z AT IV E E L ’ I N E F F I C I E N Z A
D E L L A C O N T R AT TA Z I O N E
Tre cause di inefficienza nella contrattazione sono state individuate nell’introduzione: i fallimenti della contrattazione che conducono alla rinuncia di opportunità sicuramente reciprocamente vantaggiose, la deviazione delle risorse da un uso produttivo verso attività improduttive di ricerca delle rendite, e la distorsione nell’allocazione delle risorse produttive intraprese per accrescere le quote individuali. La distinzione tra la seconda e la terza causa non è sempre facile da individuare, come suggerisce il caso del “Cox’s capper”. La spesa per questa attrezzatura ha costituito una deviazione di risorse da usi produttivi ad un’improduttiva ricerca delle rendite? O si è trattato di una distorsione nell’allocazione delle risorse produttive? La guardia di sicurezza sul posto di lavoro, che dissuade il lavoratore dal furto, è chiaramente un esempio della prima, ma che cos’è il supervisore del lavoro, che osserva i livelli di sforzo nei lavoratori e allo stesso tempo si occupa di risolvere i problemi nella produzione? Le spese che hanno come unico scopo quello di assicurare l’enforcement di un contratto o di aumentare il potere contrattuale, sono chiamate, a volte, “costi di transazione”, diversamente dai “costi di produzione”. Ma la distinzione manca di precisione, come suggeriscono gli esempi precedenti. La vaghezza del termine è particolarmente evidente una volta che si riconosca che le tecnologie produttive in uso – come il “Cox’s capper”, o il risparmio di lavoro che si ottiene con le attrezzature – rifletterà i conflitti attuali o passati nella divisione del surplus comune. Questa è la ragione per cui generalmente evito il termine. Anche se i costi di transazione non possono essere facilmente districati dai costi di produzione, tuttavia, a volte la distinzione è abbastanza chiara da essere esplicativa. Si consideri il caso di inefficienze contrattuali che derivano dalla distorsione nell’allocazione delle risorse produttive. Si supponga che ciascuno dei due collaboratori al progetto comune possa allocare i propri sforzi in due differenti attività, che entrambi contribuiscano al surplus comune della coppia ed anche che entrambi possano influenzare la posizione di riserva individuali. In concreto, i due potrebbero impegnarsi in una produzione comune, e la scelta delle attività potrebbe consistere nello sviluppo di un’abilità generica o di un’abilità specifica a questo particolare processo di produzione che non abbia valore al di fuori di questa particolare transazione. Entrambe le attività contribuiscono ad accrescere il surplus di produzione, ma solo la prima accresce la posizione di riserva individuale (le abilità
26 | MICROECONOMIA
generali migliorano la migliore transazione alternativa di un individuo, non le abilità specifiche). Se la divisione del surplus tra i due sarà determinata dal contratto di Nash, possiamo modellare l’inefficienza che ne risulta come segue. Supponiamo che ciascun individuo (Minuscolo e Maiuscolo, nuovamente) contribuisca ad un’unità dello sforzo di produzione, dividendolo tra la prima attività e la seconda, con e ed E le quantità destinate alla seconda attività (transazione specifica) dal Minuscolo e dal Maiuscolo, rispettivamente. Poniamo il surplus comune come Q = Q(e,E) con Q (0,E) e Q (e,0) e
E
entrambi positivi e Q (1,E) e Q (e,1) entrambi negativi, in modo che vi sia una allocazione interna, e*,E * entrambi (0,1) , che massimizza Q e per la quale Q = Q = 0 . Per cogliere il fatto che investire nella prima attività migliora la posizione di riserva di ciascuno, scriviamo le posizioni di riserva individuali come z(e) e Z(E) , con z' e Z' entrambe negative: quindi investire nell’abilità generica diminuisce entrambi i payoff dei giocatori nel caso in cui il rapporto terminasse. Immaginiamo che essi non possano contrattare per l’allocazione di e ed E (essi non possono osservare o inferire le scelte fatte dall’altro). Invece essi scelgono e ed E in modo non cooperativo e, quindi, dividono l’output che ne deriva, secondo il contratto di Nash (con il potere contrattuale del Minuscolo). Quindi (utilizzando la (5.2)) il e
e
E
E
Minuscolo riceve: y = z(e) + {Q(e,E) z(e) Z(E)}
Il Minuscolo sceglierà un e che massimizza y , dando la condizione del primo ordine: z + (Q z ) = 0 e
e
e
oppure Q + (1 )z = 0 e
e
Il risultato è che il Minuscolo non implementa l’allocazione che massimizza il surplus comune (ossia, quella per cui Q = 0 ), a meno che egli abbia tutto il potere contrattuale ( =1). Ma non si avrà un’allocazione ottimale da parte del Maiuscolo. e
Se =1, allora la condizione del primo ordine del Maiuscolo ((1 )Q + Z = 0) richiederebbe di ignorare l’impatto di E su Q interamente, posizionando il Maiuscolo sul punto E = 0 , che è ovviamente sub-ottimale. E
E
Questo particolare problema dell’inefficienza nella contrattazione quindi si presenterà ogni volta che e ed E non sono contrattabili. L’esempio illustra quelli che
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|27
sono chiamati investimenti specifici alla transazione, ossia investimenti per i quali il valore dell’attività nel progetto - la “transazione” - non coincide con il valore nella posizione di riserva. Ma il problema sostanziale è più generale: l’inefficienza nella contrattazione si presenta ogni volta che alcuni aspetti dell’allocazione delle risorse produttive che influenzano il risultato della contrattazione non sono soggetti a contratto. Tornando alla deviazione delle risorse da un uso produttivo ad attività improduttive di ricerca delle rendite, consideriamo un caso in cui a uno dei due lavoratori è stata data una promozione di valore V . Entrambi comprendono che il datore di lavoro sceglierà tra i due in base alla sua stima della diligenza del lavoratore e della dedizione all’impresa, indicata dal numero di ore lavorative durante il periodo precedente alla promozione. Poniamo che c sia il costo per ciascun lavoratore di un’ora addizionale di lavoro. All’inizio del periodo, ciascuno inizia un lavoro e continua a lavorare fino a che uno di loro si interrompe e l’altro viene promosso. Quante ore dovranno lavorare? Non vi è un equilibrio simmetrico con una strategia pura, poiché la miglior risposta alle t ore di lavoro dell’altro è di lavorare t + (e vincere) o 0 (ed evitare ogni costo). Gli operai metallurgici, il cui lungo sciopero a Ravenswood, Illinois, somiglia a questo modello espressero la logica t + su di uno striscione “Per quanto lotteremo? Un giorno più a lungo della società!” Tuttavia, una strategia mista (alla fine di ciascuna ora, si smette con probabilità p ) può essere un equilibrio. Affinché la strategia mista con la probabilità p di smettere sia un equilibrio simmetrico, si dovrebbe avere che un agente che gioca contro un giocatore-p non migliora il suo risultato smettendo invece di restare, e quindi ha lo stesso p come la miglior risposta (in senso debole) al giocatore-p. Giocando contro il giocatore-p il beneficio dallo smettere è 0 ed il beneficio atteso dal restare è: p(v c) (1 p)c
Porre l’espressione uguale a zero implica che l’equilibrio con strategia mista è p* = c / v . Se ciascun giocatore si licenzia con probabilità p * , la probabilità che il
gioco termini dopo ciascun turno è 1 (1 p) = 2 p * p * e la durata attesa del gioco, t * , è proprio l’inverso di questa probabilità. Se definiamo periodi che siano sufficientemente brevi (così che p * è piccolo, o in maniera equivalente, possiamo 2
2
ignorare la possibilità di licenziamenti simultanei), allora la durata attesa è approssimata da 1/2 p * . Allora, utilizzando p* = c / v vediamo che t* = v /2c . Se il gioco dura t * ore, il costo per i due è 2ct * che (utilizzando t* = v /2c ) è uguale a v. Quindi, il costo totale speso per ottenere il premio eguagliano esattamente il premio stesso. Naturalmente, il vincitore termina con un profitto netto di v /2 , mentre il
28 | MICROECONOMIA
perdente sopporta i costi di v /2 . Questa è conosciuta come una guerra di attrito, un cugino lontano del gioco Falco-Colomba introdotto nel Capitolo 3. Può essere applicata ad un’ampia classe di comportamenti competitivi di ricerca di rendite, che portano ad una escalation delle spese improduttive. Gli esempi includono le azioni volte ad influenzare decisioni di governo o di allocazione nelle imprese, strategie di imprese in competizione per le quote di mercato, circostanze in cui ci si accalca per esami per i quali conta soltanto la qualità relativa e si acquisiscono credenziali educative superflue. La struttura di fondo è data dal fatto che gli individui intraprendono un investimento improduttivo, tentando di ottenere un premio in un ambiente simile a un torneo. Una variante di questo modello negli insiemi del problema dimostra che, a seconda del rapporto tra l’investimento individuale e la probabilità di vincere il premio, i costi totali spesi possono essere superiori, pari o inferiori al premio. Il modello precedente mostra perchè è razionale per gli individui contendersi il premio associato all’investimento, ma non spiega perché coloro che assegnano il premio dovrebbero adottare un concorso così dispendioso come modalità di assegnazione. Non potrebbero trarre profitto semplicemente promettendo di assegnare un premio di v /2 al miglior candidato, e spendendo parte dei loro risparmi per definire modi appropriati per fare questa scelta? Potrebbero farlo se fosse possibile definire modi migliori di fare la scelta. Ma questo è spesso impossibile. Ipotizziamo che un datore di lavoro desideri assumere un lavoratore diligente per compiere dei lavori manuali. Egli si scontra con l’idea ingenua di assumere coloro che sono rimasti a scuola più a lungo. Nonostante il fatto che il lavoro non faccia richieste intellettuali al lavoratore, l’idea ha senso perché giustamente il costo di continuare la scuola sarà più basso per i più diligenti, mentre i meno perseveranti smetteranno. La scolarizzazione, quindi, potrebbe essere presa dai datori di lavoro come un segnale difficilmente falsificabile di una caratteristica, la diligenza, che non è osservabile dal datore di lavoro. Utilizzare questo segnale come base per l’assunzione può essere quanto di meglio il datore di lavoro può fare. Se le spese improduttive della ricerca di rendite (gli straordinari, la scolarizzazione superflua) debbano essere considerate superflue, dipenderà allora dalla valutazione di ciascuno circa l’esistenza di mezzi alternativi per fare tali scelte. Utilizzare segnali costosi per comunicare una caratteristica basilare inosservabile è comune a molti animali - le rane gracchiano rumorosamente e i maschi dei cervi rossi gridano per mostrare la loro forza e di essere adatti per l’accoppiamento, dedicando quantità considerevoli di energia al loro annuncio
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|29
pubblicitario (Smith, Bowles, and Gintis (2002)). È sorprendente che in così tante aree della competizione umana, non si possa fare niente di meglio che allocare i premi.
C O N F L IT T I
D I IN T E R E S SE
E FA L L I M E N T I N E L L A C O N T R AT TA Z I O N E
Un comune problema di contrattazione è il gioco di divisione presentato in precedenza e nel capitolo 1, in cui i due individui fanno richieste su una quantità data, in cui entrambi non ottengono nulla se le loro richieste ammontano a più del loro premio. Ricordiamo che tutte le divisioni che esauriscono il premio sono miglior risposte reciproche; il problema della contrattazione consiste, quindi, semplicemente nel determinare quale di questi equilibri di Nash si avrà. In questo modo, la contrattazione a volte viene rappresentata come un mezzo di selezione tra equilibri di Nash Pareto efficienti. Il compito della teoria della contrattazione è semplicemente quello di spiegare perché ci dovremmo aspettare un risultato sulla frontiera della contrattazione, piuttosto che un altro. Al contrario, ho dato maggiore risalto ad aspetti del problema di contrattazione che conducono a risultati Pareto inefficienti all’interno della frontiera di contrattazione. L’economista norvegese, Leif Johansen ha riflettuto sulla tendenza della contrattazione ad assumere un ruolo anche più ampio, sia eclissando le allocazioni determinate dal mercato e dallo Stato nelle nazioni scandinave, sia eclissando completamente le economie avanzate. Egli ha raggiunto una conclusione simile: “la contrattazione ha una tendenza intrinseca ad eliminare il profitto potenziale, che è l’oggetto della contrattazione” (Johansen, 1979, p.520). Le inefficienze contrattuali sono empiricamente importanti? Vi sono delle prove che lo siano. David Card (1990) riferisce che dal dieci al quindici percento delle trattative contrattuali che coinvolgono un ampio numero di lavoratori nei settori privati del Canada e degli Stati Uniti, hanno l’effetto di condurre a sospensioni del lavoro. Salop e White (1988, p.43) riportano alti tassi di fallimento della contrattazione nelle controversie legali associate a cause antitrust negli Stati Uniti, sebbene Salop, White Kennan e Wilson (1993) osservino che i tassi di controversia spesso sottostimano l’ampiezza dei costi, osservando che, come ci si aspetterebbe in una guerra di attrito, le tariffe legali pagate dalle parti frequentemente superano le quantità assegnate alla parte vincitrice. Come suggeriscono questi studi, la maggior parte delle prove dell’ inefficienza della contrattazione sono basate su due tipi di dati: sui fallimenti e sull’allocazione
30 | MICROECONOMIA
delle risorse per fini che migliorano direttamente la ripartizione delle quote. Ma vi sono delle prove di allocazione inefficiente delle risorse che producono surplus. Un certo numero di studi indica che le allocazioni di risorse all’interno delle famiglie sono sistematicamente distorte per favorire la crescita della quota spettante ai capifamiglia maschi. Udry, Hoddinott, Alderman, e Haddad (1995) hanno stimato delle funzioni di produzione per gli appezzamenti agricoli coltivati da uomini e donne in Burkina Faso e hanno riscontrato che il valore dell’output delle famiglie potrebbe essere aumentato dal dieci al quindici percento riallocando le risorse dagli uomini alle donne che arano gli appezzamenti. Poiché i coltivatori controllano i risultati generati dai loro appezzamenti, questa riallocazione che aumenta l’efficienza avrebbe l’effetto di aumentare l’accesso delle donne al reddito rispetto a quello degli uomini. Questa è presumibilmente una delle ragioni per cui ciò non accade. Posel (2001) ha studiato gli emigranti dalle campagne nel Sud Africa ed ha trovato che il reddito delle famiglie potrebbe essere aumentato in maniera consistente, se emigrassero più donne e meno uomini. In entrambi i casi sembra probabile che la riduzione nel surplus comune di una famiglia rifletta gli sforzi di aumentare le quote effettuati dagli uomini, che hanno esercitato maggiori rivendicazioni sul reddito dai loro appezzamenti (in Burkina Faso) o sui loro salari (in Sud Africa) ed hanno di conseguenza distorto l’allocazione delle risorse familiari a loro favore. Naturalmente, gli uomini nelle famiglie studiate da Udry e altri, e da Posel hanno avuto un potere contrattuale sufficiente ad imporre le quote distributive a prescindere dal modello della allocazione delle risorse; essi avrebbero potuto ottenere risultati migliori semplicemente massimizzando il surplus comune e, poi, implementando la loro distribuzione preferita. Questi studi riaffermano un principio importante: le inefficienze nella contrattazione si presentano quando l’abilità nel fare pressione sulle richieste distributive è influenzata dalla allocazione delle risorse. Tavola 5.1. conflitto di interesse
U
D
L
a: 1,0
b: ,
R
c: ,
d: 0,1
Le lettere si riferiscono al profilo di strategia, seguito dai payoff della persona 1 (riga) e della persona 2 (colonna).
Ci si aspetta, quindi, che laddove i conflitti di interesse siano particolarmente rilevanti, l’efficienza nella contrattazione possa essere compromessa con maggiore probabilità. Ma così come il “potere contrattuale”, anche l’espressione “conflitto di
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|31
interesse” è vaga. Possiamo dire quanto conflitto di interesse vi sia in un gioco? La definizione di giochi puri con conflitto, nel capitolo 1, coglie l’idea importante che in situazioni conflittuali, il profitto di uno richiede la perdita dell’altro. Una misura del grado di conflitto di interesse dovrebbe esprimere la stessa idea. Possiamo sviluppare tale misura (basata su Axelrod (1970), come estesa da Wood (2001)), utilizzando come esempio il gioco del conflitto di interesse tra due persone nella Figura 5.3. Per prima cosa, assegniamo i livelli di utilità ai risultati, così che al risultato peggiore per ciascuno (che è il risultato a per la persona 2 e il risultato d per la persona 1) corrisponda un payoff di zero, mentre al miglior risultato per ciascuno corrisponda un payoff di 1. Vi sono due strategie pure L e R per 1, e U e D per 2, poniamo i payoff come indicato, dove , , μ e sono tutte costanti positive comprese tra zero e uno, dove + 1 e μ + 1. Se chiamiamo la differenza tra il massimo e il minimo che si può ottenere gli “stakes” del gioco, questa normalizzazione riduce proprio gli stakes per i due giocatori ad un quadrato unitario, come indicato nella Figura 5.3, dove i punti da a a d sono i payoff per i profili di strategia indicati, sopra, nella matrice dei payoff.
Figura 5.3. Il grado di conflitto di interesse. Il conflitto di interesse è misurato dalla frazione delle puntate del gioco normalizzate (il quadrato unitario) che non è fattibile (acde). I punti a, b, c, d si riferiscono ai profili di strategia nella tavola 5.1.
L’intuizione a cui vorrei giungere è che, se un risultato come c’ nella Figura 5.3 fosse possibile (al posto di c), potremmo affermare che il gioco ha manifestato un minore conflitto di interesse, per il fatto che il meglio che ciascuno potrebbe fare (a spese dell’altro), non è molto meglio di ciò che entrambi potrebbero ottenere congiuntamente. Per prima cosa, consideriamo il caso in cui combinazioni lineari di un risultato determinato dall’utilizzo di strategie pure siano possibili. Per esempio, i risultati lungo la curva ac nella Figura 5.3 si avranno se 2 gioca U mentre 1 sceglie a
32 | MICROECONOMIA
caso tra L e R, facendo variare la probabilità di scegliere L dall’unità (la strategia pura che dà il punto a) allo zero (la strategia pura che dà il punto c). È ovvio che tutti i punti al di sotto e a sinistra di acd sono possibili (quelli sul confine possono essere implementati come descritto in precedenza, e quelli all’interno dell’insieme possono essere implementati allo stesso modo, semplicemente eliminando alcuni dei payoff potenziali.) I risultati nell’insieme acde, tuttavia, non sono possibili. Una misura conveniente del grado di conflitto di interesse, , è semplicemente la dimensione di questo insieme dei risultati non possibili, relativo agli stakes del gioco (che con la normalizzazione dei payoff è unitario) + + μ
=1 max , 2 2 oppure (dato che abbiamo assunto + 1)
=1
+ 2
Se si fosse posta una struttura dei payoff tale che + <1, il confine dell’insieme possibile sarebbe stato dato dalla combinazione di risultati a e d, dividendo il quadrato unitario per metà, e ponendo = come il grado massimo di conflitto di interesse. Questo limite inferiore su , tuttavia, è il risultato della nostra ipotesi che combinazioni lineari dei risultati, basate su strategie pure, siano possibili. Ma questo può non essere il caso: a volte gli “stakes” del gioco sono definiti in un modo tale per cui essi sono indivisibili (intendendo con ciò che possedere una parte del beneficio, o possederlo parte del tempo, è impossibile). Gli esempi includono due gruppi etnici in guerra su quale sarà la religione o la lingua nazionale, o una coppia in conflitto sull’avere o meno dei figli. Prendiamo quest’ultimo caso, e ipotizziamo che il risultato ottimo per uno sia avere figli e per l’altro il risultato ottimo sia di rimanere senza figli; non avrebbe molto senso dire che poiché ognuno può conseguire un’utilità attesa di circa un mezzo risolvendo il problema con il testa o croce, se ne deduce che il grado di conflitto è = . In casi come questi, non è necessario che l’insieme possibile sia convesso, e può variare nell’intervallo intero unitario. Una prova ulteriore dell’inefficienza della contrattazione viene dagli esperimenti. Abbiamo già incontrato prove sperimentali concernente il fatto che conflitti sulla distribuzione delle rendite possano indurre fallimenti nella contrattazione che negano ad entrambe le parti una qualsiasi quota del surplus. Un
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|33
esempio è il comune rifiuto di offerte anche considerevoli, ma apparentemente ingiuste negli ultimatum game, descritti nel capitolo 3. Un primo (e trascurato) insieme di esperimenti mette in luce le cause dei fallimenti nella contrattazione, in questo caso misurate dalla frequenza di abbandoni e poi di fallimenti nella realizzazione del risultato che massimizza il surplus comune, in un gioco con dilemma del prigioniero. Rapoport e Chammah (1965) chiesero a settanta coppie, unite a caso (e composte da sconosciuti), di studenti dell’Univesità del Michigan di giocare una delle sette varianti del dilemma del prigioniero per trecento volte in successione. Benché i giocatori non fossero autorizzati a comunicare direttamente, essi apparentemente tentavano di indurre risposte cooperative nei loro partner, ed alcuni ebbero un successo abbastanza buono. Le matrici con sette payoff manifestavano un ampio insieme di strutture: alcune erano vicine ai giochi di pura coordinazione con pochi conflitti, mentre altre erano vicine a giochi di puro conflitto; cioè i giochi variavano molto nella misura μ della coordinazione e nell’aspetto conflittuale del gioco, come definito nel capitolo 2. Allo stesso modo, essi mostravano gradi differenti di conflitto di interesse . Defezione e ratio coodinamento/conflitto 0,8
0,7
0,7
Percentuale di defezione
Percentuale di defezione
Defezione e conflitto di interesse 0,8
0,6 0,5 0,4 0,3 0,2 0,1
0,6 0,5 0,4 0,3 0,2 0,1
0
0 0
0,1
0,2
0,3
Conflitto di interesse ()
0,4
0,5
0
0,1
0,2
0,3
0,4
0,5
Coordinamento/conflitto ()
Figura 5.4. Conflitto, coordinamento e defezione. Ciascun punto si riferisce ad uno dei sette giochi sperimentali realizzati da Rapoport e Chammah (1965). Il conflitto di interesse, , ed il punto in cui i payoff approssimano ad un gioco di puro coordinamento (contrapposto ad uno di puro conflitto), , sono calcolati sulla struttura di payoff di ciascun gioco. I calcoli utilizzano anche i dati di Axelrod (1970).
Mi sono chiesto se il comportamento dei giocatori nel gioco fosse correlato con il grado di conflitto di interesse nel gioco o con la misura in cui il gioco approssima un gioco di pura coordinazione. Per scoprirlo, ho calcolato le misure di e μ per ciascuno dei sette giochi, e poi ho valutato se la frequenza delle defezioni fosse associata a queste misure di conflitto. I risultati, mostrati nella Figura 5.4 dimostrano una relazione fortemente inversa tra μ e la frequenza delle defezioni (la correlazione semplice è -0.95). Laddove vi è molto da guadagnare dalla cooperazione
34 | MICROECONOMIA
e poco da guadagnare del conflitto, i soggetti trovano una maniera per cooperare. Diversamente, è molto meno strettamente associato ai rifiuti (benché la correlazione sia ancora considerevole: 0.55). La debole associazione delle mosse ad si ha perchè questa misura indica l’assenza effettiva di conflitto di interesse quando i profitti derivanti sia dalla cooperazione reciproca che dalla defezione unilaterale sono molto piccoli, ma i costi dell’effettuare una defezione unilaterale sono molto elevati. Per i payoff di questo tipo, vi sono pochi conflitti di interesse, così come è stato misurato, la scelta di rinunciare è un rischio fortemente dominante. Questo era il caso della struttura di payoff del gioco 2 ed i soggetti impegnati erano impegnati in ciò che si potrebbe chiamare una defezione preventiva. Questi risultati suggeriscono che la struttura dei payoff che gli individui fronteggiano - e specialmente i profitti associati alla cooperazione rispetto ai profitti e ai costi ottenibili attraverso un’azione unilaterale - influisce sulla probabilità di fallimenti nella contrattazione.
C O N C L U S IO N I Una teoria adeguata della contrattazione dovrebbe spiegare come viene diviso il surplus comune e come i risultati della contrattazione evolvono nel tempo. Né il modello di Nash né il modello con offerte alternate appaiono completamente adeguati da questa prospettiva. Miglioramenti nella nostra comprensione della contrattazione includeranno tre aspetti assenti dai modelli standard. Il primo è che il comportamento nella contrattazione è influenzato da preoccupazioni circa l’equità (fairness) del soggetto contrattuale e da altre norme distributive. In molti casi, i risultati contrattati sono così stabili che il termine di lunga durata per l’istituzione – mezzadria, metayage, o ardhika (in Italia, Francia e l’antico Sanscrito) per la mezzadria, per esempio – in realtà include nel nome l’indicazione della quota (metà in ogni caso.) Molte fallimenti nella contrattazione – gli scioperi nel mondo reale e i rifiuti di offerte considerevoli negli ultimatum game, per esempio – sono difficili da spiegare senza fare riferimento alle reazioni dei partecipanti a situazioni che essi considerano essere ingiuste. La contrattazione osservata empiricamente non può essere compresa attraverso modelli che escludono la giustizia, la reciprocità e altre preferenze sociali dei contraenti. Il secondo è che abbiamo bisogno di spiegare il potere contrattuale piuttosto che ipotizzarlo. Questo richiede “di andare oltre” le determinanti approssimate dei risultati della contrattazione. Le preferenze, le credenze (belief) e le istituzioni che influenzano il potere contrattuale, evolvono per effetto di molti fattori, ma tra questi fattori vi sono gli stessi risultati contrattuali. Ricordiamo che fino alla fine degli anni
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|35
’70, la quota consueta dell’affittuario coltivatore di riso nel Bengala occidentale è stata di una metà del raccolto, per secoli, e questi accordi hanno incontrato poche opposizioni efficaci negli anni. Ma un tentativo, oggi, di modificare la maggiore quota oramai consueta (tre quarti) sarebbe percepita come una madornale violazione di una norma, che sarebbe avversata energicamente (e probabilmente con efficacia). Possiamo dire, quindi, che i risultati della contrattazione, le norme di distribuzione, e il potere contrattuale coevolvono. I risultati contrattuali sono, quindi, probabilmente “dipendenti dal sentiero” (path-dependent), e possono esserci molti risultati capaci di durare nel lungo periodo. La teoria della contrattazione può studiare sempre più questi risultati persistenti di lungo termine nelle strutture di contrattazione di evoluzione, piuttosto che cercare di identificare un risultato con un unico equilibrio. Il terzo è che i contraenti tipicamente hanno un’informazione molto incompleta sulle preferenze ed altri aspetti dei loro avversari. I modelli basati sulle ipotesi di un’informazione più realistica, come quella nella sezione sulle estensioni evolutive, applicano questo risultato. Gli economisti insoddisfatti con la previsione di una contrattazione efficiente dei modelli standard in alcuni casi spiegano i fallimenti della contrattazione mediante l’esistenza di asimmetrie informative tra i contraenti. Per esempio, se i datori di lavoro e i lavoratori avessero la stessa informazione, essi potrebbero sia prevedere la stessa distribuzione dei costi probabili sia i risultati dello sciopero. Alla luce di questa comune informazione, essi potrebbero trovare un accordo in anticipo, quindi evitando i costi. Ma se l’informazione non è comune, i lavoratori possono impegnarsi in uno sciopero costoso per comunicare la loro solidarietà e decisione al datore di lavoro, o essi possono involontariamente rivendicare una quantità che viola il vincolo di partecipazione del datore di lavoro. Vi è indubbiamente qualcosa di vero in questa prospettiva, com’è testimoniato dal fatto che le parti sono a volte sorprese quando un accordo reciprocamente vantaggioso non va avanti. Ma almeno nelle situazioni sperimentali menzionate, l’informazione asimmetrica non fornisce una motivazione adeguata dei comportamenti che conducono ai fallimenti nella contrattazione. Negli ultimatum game, per esempio, i proponenti frequentemente fanno offerte abbastanza vicine alle somme che massimizzano i payoff attesi (ossia le quantità che massimizzano i payoff alla luce del comportamento di rifiuto osservato di coloro che rispondono). Questi proponenti possono essere delusi per un rifiuto, ma apparentemente non sono sorpresi. È difficile capire di quale informazione addizionale coloro che rispondono poterebbero aver bisogno per essere indotti a non rifiutare quelle che sembrano
36 | MICROECONOMIA
essere delle offerte ingiuste. In effetti, i tassi di rifiuto sono più bassi quando coloro che rispondono non conoscono la dimensione della torta che il proponente sta dividendo. Il motivo più probabile per cui le asimmetrie informative conducono a meno fallimenti nella contrattazione in questo caso, è che se non si conosce la torta, è difficile per colui che risponde formulare un concetto chiaro su ciò che sarebbe un’offerta giusta, per cui i rifiuti per le violazioni della giustizia sono di meno. Allo stesso modo, in situazioni in cui una maggiore informazione contribuisce a far sì che i contraenti adottino degli standard di giustizia idiosincratici, il risultato è che aumenta la probabilità di fallimenti. Un’informazione asimmetrica può giocare un ruolo importante nelle inefficienze nella contrattazione, ma questi casi suggeriscono che la sua importanza può aumentare spesso per ragioni tipicamente assenti nella letteratura classica sulla contrattazione, ovvero, il modo in cui la distribuzione dell’informazione influenza i concetti di giustizia dei contraenti e la loro capacità di identificare e punire coloro che sono ritenuti ingiusti (Camerer e Loewenstein (1993)). Una causa dei fallimenti nella contrattazione che può essere più importante dell’informazione asimmetrica, è data dalla corcostanza che i contraenti abbiano dei pareri differenti su quello che potrebbe essere un risultato giusto. Un aspetto che contribuisce in modo sostanziale ai fallimenti nella contrattazione e che non è stato oggetto di alcun modello formale, è il fatto che stare sulla frontiera della contrattazione può richiedere nuove istituzioni o precedenti che con un certa probabilità saranno successivamente utilizzati a svantaggio di uno dei contraenti. Se si è in questo caso, una o entrambe le parti potrebbero preferire la posizione di riserva piuttosto che tentare la sorte in una lotteria i cui payoff possibili includono non solo un movimento verso la frontiera della contrattazione, ma anche un risultato peggiore della posizione di riserva corrente. Mi vengono alla mente molti esempi. Di fronte ad un aumento della concorrenza, una riduzione della domanda di salari dei lavoratori potrebbe essere nell’interesse dei datori di lavoro e dei lavoratori. Ma mettere in pratica efficacemente questa soluzione potrebbe richiedere che l’impresa renda pubblici i suoi conti, una mossa che sebbene in questo caso sostenga un miglioramento paretiano, potrebbe avere degli svantaggi in altri ambiti. L’opposizione iniziale delle imprese all’economia keynesiana negli Stati Uniti apparentemente non discendeva tanto dal fallimento nel riconoscere i benefici che le imprese avrebbero potuto ottenere da una riduzione nella volatilità ciclica macroeconomica, quanto piuttosto dalla preoccupazione che uno stato più interventista avrebbe potuto intraprendere altre politiche di natura meno favorevole
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|37
alle imprese. Il lento sviluppo delle istituzioni rappresentative e della riforma fiscale nella Francia moderna fornisce un altro caso. Rosenthal (1998:101) scrive: Nonostante il chiaro legame tra le istituzioni fiscali e la crescita economica, l’evoluzione di queste istituzioni [era] limitata dalla preoccupazione dei governanti circa l’impatto della riforma fiscale sulla loro….autonomia in altre aree, come la politica estera. La Francia…aveva una istituzione “rappresentativa” che avrebbe potuto aumentare l’efficienza del sistema fiscale, tuttavia il Re scelse di non utilizzarla per un secolo e mezzo. Il Re, quindi, era disponibile a rinunciare ad aumenti nell’efficienza fiscale e ad aumenti nell’attività economica, pur di preservare la propria autonomia.
La riluttanza del Re a convocare gli Stati Generali non era mal riposta, come testimoniarono ampiamente gli eventi del 1789, successivi alla prima convocazione del 1614. Questo sembra essere un altro caso in cui dei conflitti irrisolti nella distribuzione del surplus comune, insieme con la natura non limitata delle istituzioni, che potrebbe risolvere i fallimenti nella contrattazione, contribuiscono ai frequenti risultati sub-ottimali della contrattazione.
38 | MICROECONOMIA
Riferimenti bibliografici Aoki, M. (1984). The Co-operative Game Theory of the Firm. London, Clarendon. Axelrod, R. (1970). Conflict of Interest: A Theory of Divergent Goals with Applications to Politics. Chicago, Markham. Bowles, S. (1989). Social Institutions and Technical Change. Technological and Social Factors in Long Term Fluctuations. M. D. Matteo, R. M. Goodwin and A. Vercelli. New York, Springer-Verlag: 67-87. Buchanan, J., R. Tollison, et al. (1980). Toward a Theory of the Rent-seeking Society. College Station, Texas A&M University Press. Camerer, C. and G. Loewenstein (1993). Information, Fairness, and Efficiency in Bargaining. Psychological Perspectives on Justice. B. A. Mellers and J. Baron. Cambridge, Cambridge University Press: 155-179. Card, D. (1990). "Strikes and Bargaining: A Survey of the Recent Empirical LIterature." American Economic Review 80(2): 410-415. Crawford, V. P. (2002). "Introduction to Experimental Game Theory." Journal of Ecomonic Theory 104(1): 1-15. Hart, O. (1995). Firms, Contracts, and Financial Structure. Oxford, Clarendon Press. Hirschleifer, J. (1991). "The Technology of Conflict as an Economic Activity." American Economic Review 81(2): 130-134. Hirshleifer, J. (1994). "The Dark Side of the Force: Western Economic Association International 1993 Presidential Address." Economic Inquiry 32(1): 1-10. Johansen, L. (1979). "The Bargaining Society and the Inefficiency of Bargaining." Kyklos 32(3): 497-522. Jones, A. H. M., Ed. (1968). A history of Rome through the fifth century: Volume I: The Republic. New York, Harper and Row. Juravich, T. and K. Bronfenbrenner (1999). Ravenswood: the steelworkers' victory and the revival of American labor. Ithaca, Cornell University Press. Kennan, J. and R. Wilson (1993). "Bargaining With Private Information." Journal of Economic Literature 31(1): 45-104. Kreps, D. M. (1990). A Course in Microeconomic Theory. Princeton, NJ, Princeton University Press. Lanjouw, P. and N. Stern, Eds. (1998). Economic Development in Palanpur Over Five Decades. Delhi, Oxford University Press. Lasswell, H. and A. Kaplan (1950). Power and Society: A Framework for Political Enquiry. New Haven, Yale University Press. Livy, T. L. (1960/27 b.C). The History of Rome from its Foundation. London, Penguin. Lundberg, S. and R. Pollak (1994). "Noncooperative Bargaining Models of Marriage." American Economic Review 84(2): 132 - 137. Milbank, D. and J. E. Rigdon (1991). Replacement Scholarships. Wall Street Journal: (January 29):1. Milgrom, P. and J. Roberts (1990). Bargainng Costs, Influence Costs, and the Organization of Economic Activity. Perspectives on Postive Political Economy. J. E. Alt and K. A. Shepsle. Cambridge, Cambridge University Press. Mill, J. S. (1867[1848]). Principles of Political Economy with Some of Their Applications. London, Longmass, Green, Reader, and Diver. Nash, J. F. (1950). "Equilibrium Points in n-Person Games." Proceedings of the
LA DIVISIONE DEI PROFITTI DELLA COOPERAZIONE|39
National Academy of Sciences 36: 48-49. Phillips, P. and M. Brown (1986). "The Historical Origin of Job Ladders oin the U.S. Canning Industry and Their Effects on the Gender Division of Labour." Cambridge Journal of Economics 10: 129-145. Posel, D. (2001). Women Wait, Men Migrate: Gender Inequality and Migration Decisions in South Africa. Women Farmers: Enhancing Rights, Recognition and Productivity. P. Webb and K. Weinberger. Frankfurt, Peter Lang: 91-117. Rapoport, A. and A. Chammah (1965). Prisoner's Dilemma. Ann Arbor, MI, University of Michigan Press. Roth, A. (1995). Bargaining Experiments. The Handbook of Experimental Economics. J. K. a. A. Roth. Princeton, NJ, Princeton University Press. Rubinstein, A. (1982). "Perfect Equilibrium in a Bargaining Model." Econometrica 50(1): 97-109. Salop, S. C. and L. J. White (1988). Private Antitrust Litigation: An Introduction and Framework. Private Antitrust Litigation. L. J. White. Cambridge, MIT Press. Shaked, A. and J. Sutton (1984). "Involuntary Unemployment as a Perfect Equilibrium in a Bargaining Model." Econometrica 52(6): 1351- 1364. Smith, E. A., S. Bowles, et al. (2002). "Costly Signalling and Cooperation." Journal of Theoretical Biology 213(1): 103-119. Stahl, I. (1971). Bargaining Theory. Stockholm, Stockholm School of Economics. Udry, C., J. Hoddinott, et al. (1995). "Gender Differentials in Farm Productivity: Implications for Household Efficiency and Agricultural Policy." Food Policy 20(5): 407-423. Williamson, O. E. (1985). The Economic Institutions of Capitalism. New York, Free Press. Wood (2001), Distributional Settlements and Civil War Resolutions. Young, H. P. (1993). "An Evolutionary Model of Bargaining." Journal of Economic Theory 59(1): 145-168.
VI L'U TOPIA DEL C APITALISMO : IL C OORDINAMENTO D ECENTRALIZZATO 1
Non è dalla benevolenza del macellaio, del birraio, o del panettiere che ci aspettiamo la nostra cena, ma dal loro riguardo per i propri interessi. Adam Smith, Wealth of Nations, (1776) Book 1, Chapter 2.
[E]gli si propone solo il suo proprio guadano, ed è nel fare questo, così come in molti altri casi, che è condotto da una mano invisibile a promuovere un fine che non è parte delle sue intenzioni. E non è sempre un male per la società che non ne sia parte. Perseguendo il proprio interesse egli spesso promuove quello della società più efficacemente che se egli coscientemente intendesse farlo. Adam Smith, Wealth of Nations, (1776) Book 4, Chapter 2.
Buoni steccati fanno buoni vicini. Robert Frost, “Mending Wall”, (Frost (1915):11-13)
I N T R O D U Z IO N E I miei vicini nella piccola città di Leverett, Massachusetts, furono sorpresi quando la commissione competente per le modifiche al piano regolatore approvò una petizione bocciata già due volte per una deroga ai regolamenti ambientali, permettendo la costruzione di una o più case in cima a Long Hill, la collina che domina il centro della città. Il nuovo proprietario della collina minacciò di ricorrere al tribunale se la petizione fosse stata rigettata per la terza volta. Gli uffici della città, spiegando il loro 1
Tutte le citazioni nel capitolo sono liberamente tradotte dalle versioni riportate in Bibliografia.
2 | MICROECONOMIA
comportamento contraddittorio, dissero che la città non aveva fondi per assumere un avvocato, così invitarono tutti quelli che si volevano opporre alla deroga ad intraprendere un'azione legale privatamente. La scoscesa collina ricoperta di boschi e l'adiacente laghetto sono stati privati da sempre, ma per generazioni sono stati aperti a chiunque per pic-nic ed escursioni, e si è sempre fortemente voluto preservare questa area come parco pubblico. Si costituì, quindi, un comitato di cittadini con questo obiettivo, ma dopo un anno di costose schermaglie legali, sembrò molto probabile che il proprietario della collina sarebbe eventualmente stato in grado di cancellare gli impedimenti legali e di averla vinta davanti ad una corte. Il gruppo di cittadini allora propose di comprare Long Hill, pensando che se la collina fosse stata più utile ai membri della comunità come area di ricreazione che al proprietario come residenza, allora si sarebbe potuto trovare un accordo. Essi affrontarono difficili ostacoli nel raccogliere la considerevole somma che l'operazione avrebbe richiesto. Il contributo per "Long Hill" (così venivano chiamate le donazioni) poneva il classico problema dei beni pubblici: nessun contributo individuale sarebbe stato sufficiente a determinare significativamente la probabilità di successo, mentre il godimento della collina, se la trattativa fosse andata in porto, non avrebbe potuto essere condizionato al contributo dato. Quindi, se le preferenze fossero state strettamente egoiste, il progetto sarebbe fallito. Quello che accadde in realtà fu una seconda sorpresa: dopo un anno di raccolta fondi - fatta anche attraverso la vendita di dolci fatti in casa e altri forme di raccolta fondi tradizionali nel New England - una parte considerevole delle famiglie della città contribuirono sufficientemente per permettere l'acquisto della collina. Long Hill fu comprata dal comitato e donata alla città; ora è un parco pubblico. Una lunga tradizione in Economia, che risale agli scritti di Alfred Marshall e A.C. Pigou (1877-1959) all'inizio del ventesimo secolo, ha identificato situazioni come la costruzione di case su Long Hill come fallimenti del mercato. La pianificazione territoriale e altre forme di regolamentazione pubblica sono state invocate come appropriate risposte istituzionali. Un esempio familiare è l'implementazione di una allocazione ottima del diritto di pesca attraverso le così dette "tasse verdi" (capitolo 4). Robert Sudgen (1986:3) descrive questo approccio senza troppi panegirici: [C]ome un Calvario U.S.A. in un buon Western, il governo è sempre pronto a correre in aiuto quando il mercato "fallisce" e il lavoro degli economisti è quello di consigliarlo sul come e quando farlo. Ai privati, al contrario, si attribuisce poca capacità, se non nessuna, di risolvere problemi
L’UTOPIA DEL CAPITALISMO |3
collettivi o tra loro stessi.
I cittadini di Laverett hanno fatto esattamente quello che, secondo Sudgen, gli economisti sbagliano nel non considerare: attraverso uno scambio volontario hanno privatamente risolto un problema di azione collettiva e rimediato a un fallimento del mercato. In realtà essi hanno risolto due problemi di azione collettiva. Il primo riguardava l'uso della collina, la cui soluzione ha implicato l'acquisizione della proprietà da parte dei cittadini e la donazione al comune. Il secondo problema era raccogliere i fondi per l'esborso, la cui soluzione implicava un appello alle preferenze altruistiche come motivazione al contributo volontario per il bene pubblico. Come i pescatori del capitolo 1 e 4, essi hanno risolto sia il problema di allocazione (la collina dovrebbe essere aperta al pubblico) sia il problema distributivo (i cittadini avrebbero dovuto contribuire volontariamente la somma necessaria all'acquisto del terreno). Quella dozzina di persone impegnata in modo più attivo nella raccolta fondi, trascorse collettivamente migliaia di ore per la sua buona riuscita, spese prevalentemente in riunioni (e altre attività, incluso piantare – illegalmente – una fila di alberi di traverso alla nuova strada (anch'essa illegale) per la collina e organizzare una colazione a base di frittelle invitando l'intera città quando ancora la collina era di proprietà privata). In questo capitolo, considereremo due importanti meccanismi di allocazione decentralizzata, il mercato competitivo e la contrattazione privata sui diritti di proprietà, attraverso l'analisi di due importanti risultati teorici, Il Teorema Fondamentale dell'Economia del Benessere e il teorema di Coase (Il "teorema" di Coase non necessita della lettera maiuscola T perché non è un teorema). Un meccanismo di allocazione decentralizzata ha due caratteristiche. Primo, un tale meccanismo preserva l'autonomia privata nel senso che le azioni individuali sono basate unicamente sulle preferenze, credenze (belief) e vincoli individuali2. Nel caso dei pescatori studiato nel capitolo 4, sia l'allocazione con ore in eccesso, sia l'ottimo sociale risultante dall'applicazione di tasse ambientali preservano l'autonomia privata. La determinazione coercitiva dei livelli ottimali di ore di pesca da parte dell'autorità, al contrario, non preserva l'autonomia privata sebbene implementi la stessa allocazione delle tasse ambientali. Secondo, una allocazione decentrata è poliarchica, cioè è determinata dall'interazione di molti individui e nessuna preferenza individuale è decisiva sul risultato aggregato. Una istituzione può preservare l'autonomia privata senza essere poliarchica: alcuni modelli di socialismo di mercato, per esempio, si basano sui mercati competitivi al fine di implementare 2
Parlando in senso stretto, virtualmente ogni istituzione preserva l'autodeterminazione nel senso che rimane sempre spazio per attuare una risposta ottima perfino se la scelta è molto ristretta.
4 | MICROECONOMIA
un'allocazione determinata ex-ante da pianificatori sociali. Esempi di meccanismi di allocazione decentralizzata includono il modello di segregazione residenziale del capitolo 2, la tragedia dei pescatori del capitolo 4 e lo scambio di diritti di proprietà ben definiti che sarà studiato in questo capitolo. Saremo particolarmente interessati a rispondere alla domanda: quando meccanismi di allocazione decentralizzata implementano un ottimo Paretiano? Come vedremo, le condizioni sotto le quali questo avviene sono piuttosto restrittive. Differentemente dalla generica classe di interazioni studiata nei precedenti capitoli, che trovano una diffusa applicazione nelle economie reali, i modelli introdotti in questo capitolo possono essere considerati casi limite abbastanza astratti. Mentre è difficile che siano di diretta rilevanza empirica, essi sono interessanti per quattro ragioni. Primo, il Teorema Fondamentale e il teorema di Coase interpretano tendenze fondamentali al lavoro nei processi competitivi e le idee che catturano saranno essenziali nel considerare casi meno restrittivi. Secondo, è difficile spiegare molti recenti sviluppi della teoria economica (inclusi quelli presentati qui) senza considerare questi ingredienti di base della teoria microeconomica. In particolare, il Teorema Fondamentale (con le sue ipotesi sottostanti e apparenti implicazioni di politica economica) è stato l'animatore degli stimoli allo sviluppo del paradigma post-Walrasiano in economia. Terzo, il Teorema Fondamentale e il teorema di Coase sono usati in economia non come esempi chiarificatori di casi limite, ma come il caso generale di riferimento e il punto di partenza dell'analisi delle reali economie capitaliste. E' importante capire abbastanza bene questi teoremi al fine di scorgerne i limiti. Infine, le migliori menti della teoria economica degli ultimi due secoli sono state impegnate nel tentativo di chiarire le condizioni sotto le quali il netto proclama della mano invisibile fatto da Adam Smith potrebbe essere vero. Quello che hanno scoperto sarebbe di qualche interesse anche per questo unico motivo. Kennet Arrow e Frank Hahn (1971:vi-vii) lo descrivono così: Si è creata a questo punto una lunga e...grandiosa schiera di economisti da Adam Smith ad oggi che hanno cercato di mostrare che un'economia decentralizzata mossa dall'interesse privato e guidata dai segnali dei prezzi sarebbe stata compatibile con una disposizione coerente delle risorse economiche che potrebbe essere considerata, in un senso ben definito, superiore a una ampia classe di disposizioni alternative...E' importante capire quanto sorprendente possa essere questa affermazione per chiunque non conosca questa letteratura...Che [questa affermazione] abbia pervaso il pensiero economico di un grande numero di persone che non sono in nessun modo economisti è da solo una ragione sufficiente per studiare il problema seriamente. E' importante sapere non solo se sia vero, ma anche se possa essere vero. (enfasi nell’originale)
Una cosa è chiara: gli autori principali di questa letteratura, tra i quali Arrow e
L’UTOPIA DEL CAPITALISMO |5
Coase, non condividono il punto di vista, ancora difeso da qualche economista, secondo il quale le ipotesi dei loro teoremi sono approssimativamente verificate nelle economie reali. Di conseguenza, i risultati presentati di seguito sono visti piuttosto come dei modelli di capitalismo utopico che, come il socialismo utopico, possono chiarire aspetti ideali di un sistema irrealizzabile nella realtà. In ogni caso, anche questi modelli idealizzati di capitalismo sono una strana utopia dato che, come vedremo, non considerano problemi di giustizia distributiva.
A L L O C A Z I O N E D E C E N T R A L I Z Z ATA IL T E O R E M A F O N D A M E N TA L E
E
Ipotizziamo che due individui, io (indicato con la lettera minuscola) e TU (indicato con la lettera maiuscola), debbano determinare l'allocazione di due beni, per ciascuno dei quali è disponibile una singola unità, in modo tale che tu ottenga X e Y ed io ottenga x e y (con x + X =1 and y + Y =1; cioè allochiamo tutti i beni). La nostra funzione di utilità riflette il nostro interesse individuale: u = u( x, y) U = U( X,Y )
in cui ciascuna funzione è crescente e concava in entrambi gli argomenti. Un modo per effettuare l'allocazione è dire che io posso allocare i beni come voglio a patto che tu riceva un dato livello di utilità indicato con U . Ipotizzando che io conosca la tua funzione di utilità e sostituendo 1 x ad X e 1 y a Y nella tua funzione di utilità, risolverei il seguente problema: scegliere x e y per massimizzare u = u( x, y) con il vincolo U(1 x,1 y) U U(1-x,1-y) U Il risultato di questo processo di ottimizzazione deve indurmi ad allocare i due beni in modo tale che: u U = u U x
x
y
Y
detto in altri termini, i nostri saggi marginali di sostituzione nel consumo coincidono, o, in modo equivalente, le nostre curve di indifferenza sono fra loro tangenti. Allocazioni in grado di soddisfare questa condizione sono punti sulla curva dei contratti efficienti3.
3
Questa condizione (insieme alla condizione di secondo ordine per la determinazione di un massimo ad essa associata) definisce la curva dei contratti efficienti per allocazioni in cui x (0,1) e y (0,1). Una più completa esposizione del problema dovrebbe considerare in modo esplicito il fatto che le allocazioni non possano assumere valori negativi. Per valori di x e y tali che entrambi gli agenti allochino
6 | MICROECONOMIA
Tornando al problema iniziale è possibile vedere come il problema di ottimizzazione così risolto assicuri il raggiungimento di un ottimo Paretiano. Cosa ha in comune questo fatto con i fallimenti del coordinamento? Tutto. I fallimenti del coordinamento, come abbiamo visto, si verificano in interazioni non cooperative nel momento in cui gli agenti non prendono adeguatamente in considerazione gli effetti delle loro azioni sul benessere degli altri. Prendere "adeguatamente in considerazione" gli effetti delle azioni di qualcuno sugli altri significa valutare le proprie azioni in termini di saggio marginale di sostituzione degli altri, così come indicato dalla condizione di primo ordine sopra mostrata. Dunque, se gli agenti ottimizzassero tenendo conto nella propria funzione di utilità delle funzioni di coloro con cui interagiscono come vincolo effettivo, il loro processo di ottimizzazione sarebbe in grado di considerare in modo appropriato gli effetti delle loro azioni sugli altri. Nel capitolo 4, ho chiamato questo tipo di soluzione la "soluzione con vincolo di partecipazione obbligatorio" a problemi di coordinamento (in questo caso, il vincolo di partecipazione è U U ). Ovviamente nessuno effettua questo tipo di ottimizzazione in modo esplicito. Per comprendere il perché supponiamo che un pianificatore sociale benevolente cerchi di implementare un'allocazione Pareto-ottimale. Egli incontrerebbe degli ostacoli a causa delle difficoltà nell'ottenimento di informazioni sulle funzioni di utilità dei partecipanti. Tuttavia, idealmente, mercati competitivi raggiungerebbero lo stesso risultato senza che nessuno debba conoscere la funzione di utilità degli altri. Per vedere come un sistema di prezzi decentralizzato riesca a raggiungere questo risultato, consideriamo il semplice caso sopra presentato come descritto nella cosiddetta scatola di Edgeworth riportata nella figura 6.1., dove il quadrato unitario rappresenta la disponibilità (normalizzata) dei due beni ed ogni punto nel quadrato rappresenta le allocazioni possibili (ossia quelle allocazioni che esauriscono l'offerta di entrambi i beni). Le mie curve di indifferenza sono convesse rispetto all'origine in basso a sinistra mentre le tue curve di indifferenza sono convesse rispetto all'origine in alto a destra. In questo modo ogni punto del quadrato è associato ad un dato livello di utilità per i due partecipanti, per ognuno dei quali è indicato dalla curva di indifferenza alla quale il punto appartiene.
completamente o affatto ciascuno dei due beni ("soluzioni d'angolo"), la condizione di tangenza sopra presentata è sostituita da un'appropriata disuguaglianza.
L’UTOPIA DEL CAPITALISMO |7
1-X
Tu
1-Y Io
Figura 6.1. Equilibrio competitivo (n) con dotazioni iniziali z. La curva dei contratti efficienti (che include le allocazioni non interne per le quali le condizioni di Pareto-ottimalità sono espresse come disuguaglianza) è disegnata in grassetto.
Assumiamo che inizialmente entrambi possediamo dotazioni iniziali positive dei due beni pari a (x,y) e ( X,Y ) . Con il termine dotazione intendiamo suggerire l'idea di una distribuzione di ricchezza esogena, la cui determinazione avviene al di fuori del modello. Consideriamo una dotazione iniziale interna rappresentata in figura 6.1. dal punto z , ossia un'allocazione caratterizzata da u / u < U /U che violi la condizione per il raggiungimento di un'allocazione Pareto-ottimale (la tua valutazione relativa del bene x sul bene y eccede la mia). Come risultato io desidererei scambiare una parte dei miei x con una parte dei tuoi Y ed allo stesso tempo tu desidereresti scambiare una parte dei tuoi Y con una parte dei miei x , in questo modo lo scambio avrebbe luogo. Ma a quale prezzo? Qualunque scambio che determini allocazioni situate nella regione interna circoscritta dalle due curve di indifferenza, U e u , è possibile ed, allo stesso tempo, rappresenta un miglioramento Paretiano rispetto alla dotazione iniziale. Appare plausibile limitare gli scambi in questa regione, ma per poter essere più precisi circa il prezzo x
y
x
z
y
z
8 | MICROECONOMIA
possibile e l'allocazione risultante dobbiamo specificare le istituzioni che governano la nostra interazione. Se conosci la mia funzione di utilità ed io ho il potere da fare offerte del tipo prendere o lasciare (specificando l'ammontare dei due beni che deve essere scambiato) tu determineresti l'allocazione che massimizza U sotto il vincolo u u , ossia il punto a sulla curva dei contratti efficienti riportato in figura 6.1., proponendomi così lo scambio che implementa tale allocazione. Nel caso in cui io conosca la tua funzione di utilità e sia in grado di fissare il prezzo al quale avverrà lo scambio ma non il suo ammontare, dovrò prima determinare la tua risposta ottima ad ogni prezzo relativo da me proposto (chiamata la tua curva di offerta, non mostrata in figura) e successivamente massimizzare la mia utilità soggetta a tale vincolo. In questo secondo caso, poiché io sto considerando la tua funzione di risposta ottima come vincolo nel mio processo di ottimizzazione e non un dato livello di utilità (come è stato fatto nella derivazione della curva dei contratti efficienti e nel caso di offerte del tipo prendere o lasciare), l'allocazione risultante non apparterrà alla curva dei contratti efficienti. Nessuno di questi due casi tiene compiutamente conto del processo di scambio, per il quale sarebbe prima necessario conoscere chi dei due sia il primo giocatore e l'offerta alla quale l'impegno risulterebbe credibile. Inoltre negli esempi assumiamo in modo non realistico che entrambe le funzioni di utilità siano conoscenza comune. z
In alternativa potremmo interagire in modo simmetrico (senza il vantaggio della prima mossa) e, senza conoscere la funzione di utilità degli altri agenti, potremmo semplicemente trovare accordi su scambi che incrementino la nostra utilità. Come risultato ci impegneremmo in una serie di scambi che implementano sempre miglioramenti Paretiani. In questo caso il processo continuerebbe fino a quando non fosse raggiunto qualche punto sulla curva dei contratti efficienti (sul segmento ab); ma, senza conoscere in maggior dettaglio il nostro processo di scambio, non potremmo dire esattamente dove. Potrebbero essere realizzati diversi processi di scambio, ma come abbiamo già evidenziato l'esito di tali scambi può essere solo confinato alla regione circoscritta dalle curve di indifferenza come allocazione Pareto superiore, non è possibile dire molto sull'esito della contrattazione a meno che non siano fornite specificazioni circa la istituzione che governa il processo di scambio. Il processo di scambio Walrasiano è una di queste specificazioni istituzionali. Il processo di scambio Walrasiano è "competitivo" (a volte "puramente competitivo") nel senso che il prezzo è unico sia per i produttori sia per i consumatori (la legge del prezzo
L’UTOPIA DEL CAPITALISMO |9
unico) ed essi lo considerano come dato (prezzi parametrici). Il processo di scambio Walrasiano non è competitivo solo in questo senso, esso infatti risulta essere competitivo anche in quanto preclude scambi che non avvengano a prezzi di equilibrio (assenza di scambi di disequilibrio). La più comune definizione di scambio competitivo – caratterizzata dalla presenza di un grande numero di consumatori e venditori individuali con costi all'entrata ed all'uscita non significativi – né richiede né implica la legge del prezzo unico, prezzi parametrici o l'assenza di scambi di disequilibrio. Per cogliere la logica delle assunzioni Walrasiane, immaginiamo una terza parte -- chiamata Banditore -il cui lavoro consiste nel proporre il rapporto dei prezzi al quale avverrà il nostro scambio ed assicurare che non si verifichi nessuno scambio fino a quando non sia raggiunto un prezzo che renda il mercato in equilibrio. Il banditore semplicemente annuncia prezzi diversi, per ognuno dei quali indichiamo la quantità di un bene che siamo disposti a scambiare con l'altro. Questo ipotetico processo continua fino a che il prezzo market-clearing non sia stato raggiunto (cioè, finché non venga trovato un prezzo tale che, per ogni bene sul mercato, o la mia richiesta del tuo bene Y sia soddisfatta in modo esatto dalla quantità di Y da te offerta e valga la relazione speculare). Sotto assunzioni ragionevoli, esiste almeno un prezzo relativo che realizza tale condizione, quando lo abbiamo trovato è possibile dar luogo a scambi market-clearing e l'allocazione che otteniamo - detta equilibrio competitivo - risulterà Pareto-efficiente. La ragione di quest’ultimo importante risultato deriva dal fatto che in un equilibrio competitivo ogni agente ottimizza rispetto ad un dato insieme di prezzi relativi. Il primo agente, eguagliando il proprio saggio marginale di sostituzione al rapporto fra i prezzi, e supponendo che anche l'altro faccia la medesima cosa, eguaglia inconsapevolmente il proprio saggio marginale di sostituzione al saggio marginale di sostituzione dell'altro. In altre parole, u p U = = u p U x
x
x
y
y
y
E' possibile introdurre considerazioni relative alla produzione dei due beni. Indichiamo con c ,c ,C e C i costi marginali di produzione dei due beni per ciascun individuo; poiché la massimizzazione dei profitti in condizioni di mercato competitivo richiede che i prezzi eguaglino i costi marginali, avremo che x
y
x
y
u p U c C = = = = u p U c C x
x
x
x
x
y
y
y
y
y
Dato che entrambi gli agenti ottimizzano con riferimento allo stesso vettore dei
10 | MICROECONOMIA
prezzi, essi eguagliano il loro saggio marginale di sostituzione nel consumo ed il loro saggio marginale di trasformazione nella produzione (il rapporto dei costi marginali) al saggio marginale di sostituzione e trasformazione dell'altro individuo, implementando conseguentemente un Pareto ottimo. Questo processo raggiunge in tal modo un risultato veramente importante: senza conoscere le preferenze degli altri agenti i prezzi implementano un'allocazione Paretoottimale. Se ciò non ti sorprende, prova ad immaginare un centinaio di persone al posto delle due nel nostro esempio e considera il problema di un pianificatore centrale benevolente incaricato di allocare in modo efficiente i beni fra gli individui. Il nostro pianificatore benevolente dovrebbe conoscere (il che significa trovare modi per ottenere tali informazioni) le funzioni di utilità di ciascun membro della popolazione. Il risultato è espresso formalmente nel Primo Teorema Fondamentale dell'Economia del Benessere, dimostrato separatamente da Arrow e Debreu (1954), il quale mostra che se gli scambi di beni e servizi sono soggetti a contratti completi (detta assunzione di completezza dei mercati), tutti gli equilibri supportati dallo scambio competitivo (ossia il processo sopra descritto) sono Pareto-ottimali. Di conseguenza l'insieme delle allocazioni che sono equilibri competitivi sono anche Pareto ottimi. Nell'esempio presentato sopra la completezza del mercato è ottenuta in quanto l'utilità di ciascun agente dipendeva dalle azioni degli altri agenti solo attraverso i beni acquistati nello scambio; in questo modo interazioni fuori dal mercato o non regolate da contratto risultavano assenti. Come si può vedere dalla figura 6.1, il primo Teorema Fondamentale non dice niente circa la distribuzione del benessere: equilibri competitivi possono provocare povertà per alcuni individui e ricchezza per altri; ciò che è precluso sono esiti nei quali eventuali guadagni reciproci rimangono non sfruttati. Il Secondo Teorema del Benessere riguarda questioni di distribuzione. E' necessario ipotizzare che una condizione aggiuntiva sia soddisfatta (l'assunzione di convessità), ossia che le curve di indifferenza dei consumatori e gli insiemi di possibilità produttive delle imprese siano convessi, escludendo la possibilità di rendimenti crescenti4. Il Secondo Teorema Fondamentale mostra quindi che, date le assunzioni di convessità e di completezza dei mercati, qualunque allocazione Pareto ottima può essere supportata da un equilibrio competitivo per qualche assegnazione di dotazioni iniziali. Per comprendere la sua importanza, supponiamo che i cittadini di una economia desiderino ridistribuire le 4
Dove tale assunzione risulta violata, è possibile che non esista un equilibrio competitivo.
L’UTOPIA DEL CAPITALISMO |11
ricchezze ai meno abbienti e selezionino una particolare allocazione Pareto-ottimale come loro risultato preferito; il Secondo Teorema afferma che tale esito può essere implementato tramite una qualche riassegnazione dei diritti di proprietà (modificando l'assegnazione delle dotazioni iniziali) seguita da un processo di scambio Walrasiano. Così, sotto le assunzioni del secondo teorema, la redistribuzione di ricchezza associata allo scambio rappresenta un meccanismo capace di implementare qualunque Pareto ottimo possibile. In figura 6.2 è illustrato il secondo teorema, riportando le stesse informazioni della figura 6.1 ma trasformando lo spazio delle allocazioni dei beni della figura 6.1 in spazio delle utilità (i punti a, b, z, z', n ed n' rappresentano le medesime allocazioni nelle due figure).
Figura 6.2. Scambi competitivi conducono ad un esito sulla frontiera delle utilità possibili (curva dei contratti efficienti)
Ipotizziamo che i membri di una società decidano che la distribuzione di utilità in n (l'equilibrio competitivo derivante da una dotazione iniziale z ) non rispetti l'etica di quella società e che l'esito n' sia preferibile. Allora il teorema mostra come una redistribuzione delle dotazioni iniziali (diciamo da z a z' ) seguita da un processo di scambio Walrasiano permetterebbe di ottenere l'allocazione preferita. Il secondo teorema sembra suggerire un modo per implementare risultati equi combinando interventi governativi (la redistribuzione delle dotazioni) con scambi di mercato. Ma, come vedremo, ciò non è propriamente vero. Il risultato del primo teorema, ossia che (sotto appropriate assunzioni) gli equilibri
12 | MICROECONOMIA
competitivi sono efficienti, è stato ampliamente discusso ed in seguito ritorneremo su questo punto. Una implicazione non immediatamente evidente riguarda il fatto che i due teoremi, se considerati insieme, lasciano poco spazio a considerazioni etiche circa il funzionamento di un sistema di mercato competitivo che non riguardino la distribuzione del benessere. Questo non è determinato dal mercato in sé ma piuttosto dalla distribuzione delle dotazioni iniziali. In altre parole, ai prezzi di equilibrio, la distribuzione della ricchezza è la stessa sia al punto z (le dotazioni di partenza) che al punto n (allocazione competitiva); questo è vero perché il vettore dei prezzi di equilibrio è una curva di iso-ricchezza che passa attraverso entrambi i punti. Kennet Arrow (1971:6) osservò che sotto le condizioni specificate dai teoremi: Ogni rimostranza sull'operato [del sistema di mercato] può essere ridotta ad una rimostranza sulla distribuzione del reddito…[ma] il sistema dei prezzi determina esso stesso la distribuzione del reddito solo nel senso di preservare lo status quo.
L'approccio di John Roemer della teoria Marxista dello sfruttamento è basato sulla stessa corrispondenza tra ricchezza iniziale e accesso potenziale al consumo: Se lo sfruttamento del lavoratore sembra non essere giustificato, è perché si pensa che la distribuzione iniziale della quantità di capitale, che lo origina, non è giusta. (Roemer, 1988:54).
Le osservazioni di Arrow e Roemer sono state anticipate dalla Suprema Corte degli Stati Uniti nella sentenza "Coppage v. State of Kansas" (1915:17): [O]gni qualvolta il diritto di proprietà privata esiste deve esserci e ci sarà disuguaglianza di ricchezza; …è impossibile mantenere la libertà di contratto ed il diritto alla proprietà privata senza al tempo stesso riconoscere come legittime queste disuguaglianze di ricchezza che sono il risultato necessario dell'esercizio di questi diritti.
Qualcuno, come il filosofo David Gauthier (1986:93), ha dedotto conclusioni di più ampia portata: L'operare del mercato in sé non può sollevare nessuna questione valutativa. Gli esiti del mercato sono giusti se, ma ovviamente solo se, sono il risultato di una giusta distribuzione iniziale… [L]a presunzione di libera attività assicura che nessuno sia soggetto ad alcuna forma di costrizione o a nessun tipo di limitazione che non già influenzi la sua azione come individuo solitario…[Di conseguenza] la morale non si applica alle iterazioni di mercato che soddisfano le condizioni di competizione perfetta.
L'E Q U I L I B R I O C O M P E T I T I V O G E N E R A L E A prima vista il Teorema Fondamentale sembra essere una straordinaria convalida della congettura di Adam Smith sulla capacità degli scambi competitivi di rivendicazioni sulla proprietà di condurre "come una mano invisibile, verso fini che non facevano
L’UTOPIA DEL CAPITALISMO |13
parte" delle intenzioni dei partecipanti. Tuttavia, pochi economisti considerano il Primo Teorema Fondamentale come una giustificazione dell'esclusione di qualunque istituzione dal mercato reale. In pochi considerano ancora il secondo teorema come una prescrizione per la redistribuzione di ricchezza allo scopo di implementare un Pareto ottimo giusto dal punto di vista distributivo. Amartya Sen (1985:11) scrisse che il secondo teorema "faceva parte dei manuali rivoluzionari." Ci sono quattro limiti all'applicabilità del Teorema Fondamentale. I primi tre riguardano i limiti del modello sottostante piuttosto che il teorema in sé. In primo luogo, il processo di scambio Walrasiano non riguarda esattamente il capitalismo, nè nessun altro meccanismo di mercato. Franklin Fisher (1972:1) commentò come esso "non descrive il comportamento effettivo di alcuno nella maggior parte dei mercati". Esso non cattura neppure la logica idealizzata di un sistema di allocazione decentralizzato fra agenti con informazioni limitate. Il processo di scambio Walrasiano è altamente centralizzato, in quanto richiede l'assistenza di un Banditore onnisciente ed onnipotente che impedisca scambi che non siano di equilibrio. Forse sorprendentemente, il mercato non gioca nessun ruolo in questo modello, né il modello è consistente con un qualsiasi processo di raggiungimento dell'equilibrio. Il motivo di ciò è da ricondursi al fatto che consumatori e venditori non stabiliscono i prezzi (non possono influenzare il prezzo). Arrow e Hahn (1971:325) posero la loro attenzione su questa lacuna: "Se non assumessimo...un Banditore, dovremmo descrivere come può verificarsi che ad ogni momento nel tempo due beni vengano scambiati allo stesso rapporto ogni volta che lo scambio avviene e come questi rapporti cambino sotto la pressione del mercato."
Tramite il Banditore ovviamo alla necessità di stabilire una teoria della dinamica del mercato. Dal punto di vista empirico tutti sappiamo che il Banditore è una invenzione, tuttavia nei manuali di economia generalmente si presume che la perdita in astrazione sia limitata rispetto alle modalità effettive di interazione degli agenti sui mercati, di determinazione dei prezzi e così via. Nonostante non sia irragionevole, questa visione è una rinuncia radicale al progetto Walrasiano, il quale cerca di derivare proposizioni riguardanti il comportamento economico aggregato partendo esclusivamente dalle azioni individuali in un ambiente istituzionale che preservi l’autonomia e che sia poliarchico - ossia decentralizzato. La classica spiegazione, che ogni insegnante racconta per colmare l'evidente incongruenza logica, in fondo, è plausibile: la domanda in eccesso (cioè la domanda che eccede l'offerta ad un dato prezzo) provoca l'aumento dei prezzi che a sua volta elimina l'eccesso di domanda. Ma gli studenti dopo aver appreso che gli agenti non stabiliscono i prezzi potrebbero domandarsi chi modifica
14 | MICROECONOMIA
i prezzi. La confusione degli studenti evidenzia un limite serio. Supponiamo di voler modellare il funzionamento di una economia di mercato astratta. Qual’è l'oggetto della teoria che vogliamo costruire? Potremmo partire da fatti basilari: gli individui sono eterogenei nelle preferenze e nelle dotazioni, effettuano scambi in modo volontario e dunque rifiutano scambi che peggiorino la loro situazione, lo scambio è perpetuo e prezzi e quantità sono abbastanza persistenti nel lungo periodo. Gli agenti conoscono le proprie preferenze ma non quelle degli altri agenti. Aggiungiamo a tutto ciò una condizione di decentralizzazione: le allocazioni devono preservare l'autonomia privata ed essere poliarchiche. Dunque, non deve esserci alcun meccanismo di coordinamento (lo scambio ha luogo se genera benefici per entrambe le parti, mentre non avviene in caso contrario, e questo è tutto quello che possiamo affermare). Che cosa richiede un'adeguata spiegazione di tutto ciò?. La questione ci conduce al secondo problema. E' necessaria una teoria che sia in grado di spiegare come un processo di scambio trasformi una dotazione iniziale arbitraria ( z nella figura 6.1.) in un'allocazione ed un vettore dei prezzi che siano stazionari (in assenza di shock esogeni). Ciò richiede una proprietà detta di stabilità quasi globale, in base alla quale, partendo da uno stato iniziale arbitrario, l'economia converge ad un qualche equilibrio5. Ma perfino questa debole condizione non è soddisfatta. Il motivo è istruttivo. Nel modello Walrasiano di equilibrio economico generale, la stabilità globale (la quasi-stabilità o la non stabilità) dipende dalla forma della funzione di eccesso di domanda dei beni costituenti l'economia. Hugo Sonnenschein (1973a e b) ha mostrato come le usuali assunzioni sul comportamento e le preferenze dei consumatori non impongono virtualmente restrizioni sulla funzione di eccesso di domanda. A causa della loro natura essenzialmente arbitraria, sistemi di funzioni di eccesso di domanda possono essere costruiti tramite arbitrarie derivate parziali seconde. Ma ciò determina le proprietà di stabilità del sistema. Perciò, sotto le usuali assunzioni comportamentali dei consumatori perfino la stabilità quasi globale non può essere assicurata6. 5
Potremmo voler restringere l'insieme dei possibili equilibri ad un numero limitato di equilibri discreti. La stabilità globale - senza il quasi - richiede che l'economia converga ad un equilibrio unico. Per il momento rimandiamo ad una trattazione successiva la questione degli equilibri multipli. 6 Più recentemente Scarf (1960) ha fornito una serie di esempi di processi di scambi plausibili che non esibiscono stabilità globale. L'articolo di Sonnenschein (1973) è stato generalizzato da Mantel (1974), Debreu (1974) e Kirman e Koch (1986). La letteratura sulla natura aperta della dinamica dell'equilibrio generale Walrasiano è commentata in Mas-Colell, Whinston e Green (1995) che candidamente osservano: "[G]li economisti sono capaci...di riconoscere uno stato di equilibrio ma sono scarsamente in grado di predire precisamente come evolverà un'economia in disequilibrio".
L’UTOPIA DEL CAPITALISMO |15
Il risultato negativo di Sonnenschein è risultato essere molto importante: lavori successivi hanno dimostrato che non esiste alcuna plausibile restrizione aggiuntiva sulle preferenze o sulle dotazioni di partenza sufficiente a determinare restrizioni aggiuntive sulla forma della funzione di eccesso di domanda. Quindi, il Banditore è una finzione necessaria. Non è un'innocente scorciatoia per esprimere un coerente ma più complicato resoconto di come, fuori dall'equilibrio, il comportamento degli agenti porti i prezzi a convergere ai loro valori di equilibrio. La dinamica virtualmente incondizionata del sistema dell'equilibrio generale Walrasiano mette in crisi una comune interpretazione del secondo teorema fondamentale, cioè che una redistribuzione seguita dallo scambio di mercato può implementare ogni Pareto ottimo. Senza una spiegazione di come fuori dall'equilibrio i comportamenti dei partecipanti al mercato muovano il sistema verso un equilibrio competitivo, il modello Walrasiano non dimostra questo. Tutto ciò che Arrow and Hahn dicono sull'argomento è che: "in un certo senso ogni allocazione efficiente desiderata può essere ottenuta attraverso una redistribuzione dei beni iniziali seguita dal raggiungimento di un equilibrio" (Arrow e Hahn 1971:95). I due autori sono cauti nel non suggerire che l'equilibrio possa essere raggiunto senza l'assistenza di un Banditore fittizio o qualche altro ingegnere sociale. Essi illustrano il secondo teorema con l'esempio di uno "stato onnisciente" che "calcola un vettore dei prezzi...che soddisfi le ipotesi del teorema".
Terzo, il modello Walrasiano di equilibrio generale è incompleto. Otterremmo un risultato sorprendente se il modello ci permettesse di affermare che, dato un insieme di preferenze, di dotazioni iniziali e di tecnologie, il processo di scambio concorrenziale determina una precisa allocazione ed un dato vettore di prezzi. Avremmo in tal modo una parsimoniosa lista di fattori che determinano lo stato dell'economia sotto particolari istituzioni e condizioni iniziali. Tuttavia il modello Walrasiano di equilibrio generale non è in grado di fornire questo tipo di risposte. In generale, eccetto sotto assunzioni estremamente limitate, non è possibile dimostrare l'esistenza di un unico equilibrio competitivo7.
7
Ad esempio l'unicità può essere dimostrata in presenza di insiemi produttivi convessi ed in assenza di effetti di prezzo sul benessere individuale (i beni che costituiscono la ricchezza individuale sono detenuti da ciascun soggetto nelle stesse proporzioni; i soggetti più ricchi semplicemente detengono quantità di ciascun bene in proporzione maggiori), o nel caso di beni sostituti lordi (che richiedono che l'incremento di prezzo di un bene determini l'incremento della domanda di tutti gli altri beni). Sull'ultimo punto vedi Katzner (2003). Economie caratterizzate da molti beni chiaramente non soddisfano queste assunzioni neppure in modo approssimativo.
16 | MICROECONOMIA
Perciò, anche senza prendere in considerazione il problema dinamico del perché i prezzi convergano al loro valore di equilibrio, la conoscenza delle dotazioni iniziali, delle preferenze e delle tecnologie non è sufficiente a determinare un esito stazionario unico. In un sistema caratterizzato da molteplici equilibri la determinazione dell'esito finale richiede informazioni che si trovano al di fuori del modello Walrasiano, richiede cioè un'analisi esplicita del processo dinamico fuori dall'equilibrio, così come la conoscenza della storia recente del sistema. Quarto, è ampliamente riconosciuto nei maggiori contributi di questo filone di letteratura che l'assunzione di completezza dei mercati è in genere falsa. Mentre prima l'incompletezza dei mercati era considerata un fenomeno eccezionale, riguardante casi come i guardiani del faro (beni pubblici) o le api di un agricoltore che impollinano gli alberi di mele del vicino (un'esternalità economica), essa non è ora più considerata un'ipotesi esotica o bucolica. I giochi del Dilemma del Prigioniero, di Assicurazione, del Falco e della Colomba, introdotti nel capitolo 1, illustrano casi di fallimento del coordinamento che emergono in quanto non tutto ciò che viene scambiato nelle interazioni sociali è regolato da contratti completi. I possibili esempi vanno considerevolmente oltre l'ovvio esempio delle esternalità ambientali. Come vedremo, molte interazioni, centrali nel funzionamento di una qualunque economia moderna - fra le quali, ad esempio, l'impiego del lavoro, il prestito di denaro e la produzione e distribuzione di informazione - sono caratterizzate da fallimenti di mercato. Il motivo di tali fallimenti deriva dal fatto che, laddove - come in questi esempi - l'assunzione sulla completezza del mercato fallisce, il processo di ottimizzazione individuale non è in genere vincolato dalle curve di indifferenza degli altri agenti o dai prezzi relativi ad esse tangenti. Ne risulta il mancato raggiungimento della critica uguaglianza dei saggi marginali di sostituzione. (Ritorneremo su questo punto nei prossimi quattro capitoli.). Non è necessario che le violazioni delle ipotesi del Teorema Fondamentale siano talmente gravi da limitarne drasticamente la rilevanza nelle questioni di disegno politico ed istituzionale del mondo reale. Ipotizziamo che debbano essere realizzate n condizioni sui margini (i saggi marginali di sostituzione uguagliano i saggi marginali di trasformazione, come sopra esposto) per definire un Pareto ottimo in una data economia concorrenziale del tipo rappresentato dai teoremi fondamentali del benessere. Supponiamo che la violazione di alcune ipotesi (ad esempio l'esistenza del monopolio in un settore che determina prezzi superiori al costo marginale) impedisca il raggiungimento proprio di una delle condizioni marginali. Quello che è stato chiamato il
L’UTOPIA DEL CAPITALISMO |17
teorema fondamentale del second best, proposto da Lipsey e Lancaster (1956-1957), mostra che, in questo caso, il secondo esito ottimale in termini di benessere (considerando la violazione delle condizioni come data) possa richiedere che una o più delle altre n 1 condizioni marginali sia violata. Perciò una singola violazione delle condizioni di efficienza rilevanti significa che l'adempimento delle condizioni marginali rimanenti può determinare un'allocazione che è Pareto inferiore rispetto ad allocazioni implementabili con più ampie violazioni delle condizioni di efficienza. L'intuizione che sta dietro a questo risultato deriva dal fatto che le distorsioni allocative causate dalla violazione di una delle condizioni di efficienza possono essere in genere attenuate da distorsioni di segno opposto indotte da altre violazioni. Un esempio: se un produttore generasse diseconomie esterne ambientali (producendo più del livello Pareto-ottimale di prodotto), questa distorsione potrebbe essere controbilanciata nel caso in cui l'impresa fosse anche monopolista (e quindi scegliesse un livello di produzione al quale il prezzo eccede il costo marginale del bene, restringendo conseguentemente la produzione). Una politica concorrenziale che inducesse l'impresa a scegliere un livello di produzione concorrenziale tale che p = mc potrebbe ridurre il benessere piuttosto che incrementarlo. Quanto sono decisive queste quattro limitazioni del modello Walrasiano di equilibrio generale e del suo più famoso teorema? Nel modello, la non unicità degli equilibri ha importanti implicazioni sia a livello di politica sia a livello di analisi economica. Ad esempio, politiche atte ad allontanarsi da un equilibrio unico allo scopo di migliorare il benessere sociale differiscono notevolmente da quelle volte a spostare un'economia da un determinato equilibrio ad uno superiore. Un singolo intervento (persino di dimensioni limitate) può realizzare quest'ultimo obiettivo, mentre il primo può richiedere interventi continuativi. Ugualmente importante è il fatto che la pervasività dell'incompletezza contrattuale ha stimolato lo sviluppo di un approccio alternativo a quello Walrasiano che, fondamentalmente, fornisce predizioni empiriche diverse (come ad esempio il mancato raggiungimento di equilibri di mercato) e risultati normativi diversi (ad esempio equilibri Pareto inefficienti). Joseph Stiglitz (1987) è andato oltre suggerendo "l'abrogazione della legge dell'offerta e della domanda". Il ragionamento di Stiglitz sul modello Walrasiano è corretto, ma gran parte della teoria convenzionale dei mercati rimane rilevante. La mancanza di un’adeguata teoria del raggiungimento dell'equilibrio di mercato è certamente una evidente lacuna cui, tuttavia, è possibile ovviare. Per esempio, Stephen Smale (1976) ha introdotto un elemento di realismo dei mercati abbandonando il Banditore e permettendo che le transazioni
18 | MICROECONOMIA
avvengano a prezzi non di equilibrio. Nel suo modello, partendo da una dotazione iniziale, gli individui partecipano ad una serie di scambi consistenti unicamente nella richiesta che le transazioni accrescano la soddisfazione delle parti nello scambio e che nessuno di questi scambi rimanga non sfruttato. Così viene raggiunta la convergenza ad un vettore dei prezzi di equilibrio e ad un'allocazione Pareto-efficiente. Duncan Foley (1994) ha adattato un modello di meccanica statistica dalla fisica per raffinare i risultati di Smale, identificando alcune sequenze di scambi, sempre vantaggiosi rispetto al livello individuale di utilità di partenza, come più probabili di altri. La descrizione di Foley di questo modello di economia è un'espressione esemplare di un sistema di mercato astratto non Walrasiano: [G]li agenti entrano nel mercato conoscendo solo le transazioni che a loro sembrano migliorare la loro condizione date le loro dotazioni, preferenze, tecnologia e aspettative; incontrano altri agenti; e fanno scambi mutualmente vantaggiosi in modo disordinato e casuale. (p.322)
L'allocazione di equilibrio di Foley è approssimativamente Pareto-ottimale. Da un punto di vista metodologico la svolta interessante nel lavoro di Foley è che la stabilità del vettore dei prezzi è raggiunta in presenza di scambio continuo. Il vettore dei prezzi è stazionario, non perchè tutti gli individui hanno soddisfatto le loro condizioni del primo ordine per la massimizzazione del profitto o dell'utilità, ma perché le attività di scambio di un numero molto grande di agenti si controbilanciano. Di conseguenza, gli individui che compongono questo sistema sono in movimento, ma una delle sue proprietà aggregate (il vettore dei prezzi) è stazionaria. Foley scrive: La teoria Walrasiana cerca di predire l'esito del mercato reale per ogni singolo agente, mentre l'approccio statistico cerca solo di caratterizzare le distribuzioni di equilibrio degli agenti sugli esiti possibili, senza predire il destino di ogni specifico agente. (p.343)
Il concetto di equilibrio di Foley, preso in prestito dalla fisica, è in contrasto con il concetto economico comune che richiede che la stazionarietà aggregata sia costruita dalla stazionarietà di tutte le unità di livello più basso che formano l'aggregato. Questo può essere considerato il vantaggio del suo approccio, perchè permette che lo scambio avvenga a prezzi stazionari, qualcosa che noi comunemente osserviamo nelle economie reali. Il lavoro di Foley e Smale sottolinea il concetto che la stabilità quasi-globale può essere dimostrata da ipotesi plausibili in un modello di scambio competitivo. Il risulato di Sonnenschein era più un risultato negativo riguardante l'approccio Walrasiano, che non circa l'idea di un equilibrio competitivo generale. Esso ebbe l'effetto di una “bomba”
L’UTOPIA DEL CAPITALISMO |19
solo a causa dell'allora attuale stato egemonico del paradigma Walrasiano. La sensazione diffusa che la teoria economica astratta delle interazioni competitive in più mercati di un gran numero di agenti avesse raggiunto un vicolo cieco è del tutto fuori luogo. In verità, il lavoro di Foley e Smale mostra che un modello, che rappresenti il modo in cui un gran numero di agenti con informazione limitata che interagiscono in maniera decentralizzata per produrre risultati aggregati, possa mantenere molte caratteristiche dei modelli convenzionali. Tra queste caratteristiche ricordiamo: i prezzi che si aggiustano in modo ragionevole alla domanda in eccesso, la convergenza ad un equilibrio e la natura (approssimativamente) Pareto-ottimale dell'allocazione quando gli impedimenti allo scambio e le interazioni non mediate dal mercato siano assenti. Ci sono, comunque, due importanti implicazioni del modellare in modo esplicito il processo di scambio e del permettere scambi a prezzi non di equilibrio. Primo, non è possibile associare una particolare dotazione iniziale ( z in figura 6.1) ad un qualsiasi esito di equilibrio ( n ). Individui che partono da una dotazione z possono, attraverso una serie di scambi, giungere (o avvicinarsi molto) a qualsiasi punto sulla curva dei contratti efficienti tra a e b (estremi compresi). Smale commenta: "L'esatto equilibrio dipende da fattori come chi incontra prima chi" (p.212). Secondo, agenti identici con dotazioni identiche possono ritrovarsi con diversi panieri di consumo finale. La distribuzione del surplus raggiunta tramite lo scambio a prezzi non di equilibrio favorirà tipicamente una delle parti (quella che vende prezzi superiori a quelli di equilibrio o quella che compra a prezzi inferiori a quelli di equilibrio). Il risultato di una serie di tali scambi sarà abbastanza diseguale (cioè, l'equilibrio risultante sarà vicino ad a o b ) con un'elevata probabilità. Questo avverrebbe perfino se gli individui avessero preferenze identiche, mentre, al contrario, nel caso Walrasiano agenti identici otterrebbero in equilibrio gli stessi panieri di consumo. Di conseguenza, quando avvengono scambi in disequilibrio, il vettore dei prezzi di equilibrio (tangente alle curve di indifferenza degli agenti in qualche punto sulla curva dei contratti) generalmente non passa attraverso il punto che rappresenta le dotazioni iniziali. Questa caratteristica dei modelli di scambio in disequilibrio può sembrare insignificante e dal punto di vista dell'adeguatezza descrittiva certamente lo è. Ma nei modelli nei quali non esiste una singola mappa dal punto delle dotazioni all'esito competitivo, l'affermazione di Gauthier che "l'operato del mercato in sé non può far sollevare alcun giudizio di valore" non è più valida, né lo è l'osservazione di Arrow che i mercati meramente preservano lo status quo. Se la misura delle ineguaglianze che emergono nel
20 | MICROECONOMIA
processo di scambio tra individui identici sia significativa rimane una domanda ancora senza risposta.
IL TEOREMA
DI
COASE
L'approccio canonico dell'economia del benessere ai fallimenti del coordinamento prevede che il governo imponga tasse o sussidi calibrati in modo da implementare l'ottimo sociale. Questo viene realizzato trasformando ogni funzione obiettivo individuale, e di conseguenza le relative condizioni del primo ordine, in modo tale che ciascuno – che operi in risposta agli incentivi addizionali forniti dalle tasse o dai sussidi – agisca come se stesse tenendo conto degli effetti delle sue azioni sugli altri. Argomenti molto convincenti in favore delle "tasse verdi" e del sussidio all’educazione sono usualmente proposti su queste basi, invocando idee proposte inizialmente da Alfred Marshall e A.C.Pigou all'inizio del secolo scorso. Ronald Coase (1960) sfidò questa visione. Egli riformulò l'esempio di Pigou delle locomotive elettriche che, passando per i campi, originavano incendi che provocavano seri danni. Pigou asseriva, in linea con le convinzioni dell'epoca, che dal punto di vista dell'efficenza la compagnia ferroviaria avrebbe dovuto essere responsabile per i danni originati così che, anticipando i costi derivanti dagli incendi, essa sarebbe stata indotta a preoccuparsi dell'effetto delle proprie azioni sugli altri. (L'esempio ora potrebbe sembrare bizzarro: le leggi in materia che sostengono la posizione di Pigou furono emanate esattamente un secolo prima che Coase scrivesse.) Coase replicò affermando che "se la compagnia ferroviaria potesse negoziare con chiunque possiede i terreni adiacenti alla linea ferroviaria e non ci fossero costi associati alla contrattazione, non sarebbe rilevante che la compagnia fosse responsabile per i danni o no" (p.31). Questa sorprendente conclusione è motivata dall'osservazione che, se i costi degli incendi fossero maggiori del costo di fare a meno delle locomotive (o, meglio, del costo di riprogettarle), allora i danneggiati potrebbero semplicemente offrire alla compagnia una somma sufficiente ad indurla a farne a meno. La condizione identificata da Coase - che la contrattazione sia senza costi - è importante, come lo stesso Coase sottolineò, al contrario di molti che lo hanno invocato contro l'intervento regolatore del governo :
L’UTOPIA DEL CAPITALISMO |21
[S]e le transazioni di mercato non avessero costi, la sola cosa rilevante (questioni di equità a parte) sarebbe che i diritti delle varie parti siano ben definiti e il risultato dell'azione legale facile da predire. Ma...la situazione è abbastanza differente quando le transazioni di mercato sono così costose da impedire il cambiamento dell'allocazione dei diritti stabilita dalla legge. (p.19)
In parole povere: buoni steccati fanno buoni vicini. Quello che viene chiamato il teorema di Coase costituisce, quindi, un'apparente estensione del Teorema fondamentale dell'Economia del Benessere: anche quando i mercati sono incompleti e quindi esistono interazioni non di mercato, allocazioni efficienti potranno essere raggiunte fintantochè la parte danneggiata è in grado di negoziare efficentemente sui diritti che regolano le azioni che danno origine alle interazioni non di mercato. Dato che esiste qualche controversia sul significato del teorema, può essere utile consultare il suo autore. Nella sua lezione per il Nobel, Coase (1992) scrisse: Quello che ho dimostrato...è che in un regime di costi di transazione nulli, come nelle ipotesi della teoria economica standard, la contrattazione tra le parti porterebbe a concludere accordi che massimizzano la ricchezza indipendentemente dall' iniziale assegnazione delle dotazioni. (p. 717).
Quella che segue è la spiegazione di come il teorema funziona (quando funziona). A e B sono due vicini di casa; B è un animale notturno a cui piace suonare Greateful Dead a notte fonda, mentre A ama il sorgere del sole e quindi vuole andare a dormire presto la sera8. Il problema è determinare un orario di coprifuoco che specifichi l'ora, x , dopo la quale non è più consentito suonare. Se A potesse scegliere indipendentemente il coprifuoco sceglierebbe x = a , mentre B sceglierebbe x = b , dove b > a . Il teorema di Coase dice che non importa ai fini dell'efficienza quale dei due soggetti sia autorizzato a scegliere l'orario di coprifuoco, o addirittura se questo venga fissato da una terza parte, se i due possono efficientemente negoziare per ripartire i diritti di proprietà rilevanti, che in questo caso sono rappresentati dall'orario di coprifuoco in sé. La contrattazione è efficiente se l'esito è sulla frontiera della contrattazione (e quindi è Pareto-efficiente). Supponi che la contrattazione prenda la forma di un pagamento da B a A di una somma y in cambio dell'assenso di A ad un coprifuoco più tardo di quello inizialmente annunciato ( y < 0 rappresenta un pagamento da A a B per un coprifuoco anticipato). Ipotizziamo che le funzioni di utilità di A e B siano rappresentate rispettivamente da: u = y (a x) v = y (b x) 2
8
Questo esempio è inspirato da Farrell (1987)
2
(6.1)
22 | MICROECONOMIA
dove e sono costanti positive che indicano l'importanza dell'orario di coprifuoco in relazione al reddito in termini di benessere di ognuno dei due. Per semplicità, sia + =1. E' importante per quello che segue che le due funzioni di utilità siano confrontabili ed esibiscano un' utilità marginale del reddito costante.
ore di coprifuoco, x Figura 6.3. Il coprifuoco socialmente ottimo. Sull'asse orizzontale è rappresentato l'orario del coprifuoco, che varia dal crepuscolare (a) al tardo (b). L'area sotto le curve della disutilità marginale è la somma delle disutilità; questa è minimizzata da un coprifuoco stabilito a x*, l'ottimo sociale.
Supponi di essere il sindaco della città e, conoscendo le funzioni di cui sopra, di voler fissare x in modo da massimizzare l'utilità sociale, W = u + v . Differenziando W rispetto a x e ponendo il risultato uguale a zero, abbiamo che x* = a + b
(6.2)
L'ottimo sociale è semplicemente una somma ponderata dei due tempi di coprifuoco ottimali. Chiameremo questo l'esito socialmente efficiente e lo confronteremo più avanti con la classe di esiti Pareto efficienti. Se = , il coprifuoco socialmente ottimale è a metà strada tra i due orari ottimali. Questo è quello che ci si aspetterebbe dato che entrambi hanno disutilità marginali crescenti al crescere della distanza tra il coprifuoco effettivo e quello preferito e che la somma delle disutilità è minimizzata uguagliando le disutilità marginali. Questo implica la scelta del punto centrale se i due hanno funzioni di utilità identiche. La figura 6.3 illustra questo: l'area
L’UTOPIA DEL CAPITALISMO |23
sotto le due funzioni è la disutilità sociale totale, che è minimizzata fissando x = x *, se x = x > x * il beneficio marginale di A di un coprifuoco anticipato ( y ) eccede il costo marginale di B( y ) . +
+
La contrattazione privata raggiungerebbe lo stesso risultato? Consideriamo come si presenterebbe quello che sembra essere il caso peggiore, nessun coprifuoco, il che significa, in assenza di contrattazione tra i due, che B imporrebbe Jerry Garcia ad A fino alle b in punto, ogni notte. Per vedere se una contrattazione è possibile, considera l'interazione tra i due come illustrata in figura 6.4. L'orario del coprifuoco è sull'asse orizzontale e il pagamento da B ad A è misurato verticalmente. Le curve u e v sono combinazioni di orari di coprifuoco e pagamenti che sono tutte valutate almeno quanto i coprifuochi preferiti in assenza di alcun pagamento; combinazioni preferite o inferiori sono indicate dalle altre curve. L'ottimo sociale di cui sopra si trova a metà strada tra a e b in corrispondenza del punto sull'asse orizzontale nel quale le due curve di indifferenza sono tangenti, cioè, dove 2( x a) = 2 (b x)
(6.3)
Dato che l'utilità marginale del reddito è costante per entrambi, le curve di indifferenza sono semplicemente una classe di traslazioni verticali rispettivamente di u e v (nota che y non appare nelle precedenti espressioni della pendenza delle due curve). Quindi, gli altri punti di tangenza si trovano lungo una retta verticale che passa per x *, che rappresenta la curva dei contratti efficienti, chiamata ecl. Esiti efficienti saranno quelli che fissano l'orario di coprifuoco a x* pur differendo nel pagamento tra i due vicini. Supponi che B già ascoltasse musica fino alle ore b . In questa situazione B otterrebbe un’utilità pari a v mentre A otterrebbe u' ; entrambi preferirebbero un punto qualsiasi nella regione racchiusa tra le due curve di indifferenza per i suddetti livelli di utilità. Tale regione sicuramente esiste perché in b, dv / dx = 0 ( b è l'orario preferito da B) mentre du / dx < 0 (questo vale per ogni orario successivo a quello al quale A va a dormire) e quindi deve esistere qualche dx < 0 e qualche pagamento da A a B che fa stare entrambi meglio. Questa regione nel piano ( y, x) rappresenta lo spazio di contrattazione bz t nel piano (u,v) (figura 6.5).
24 | MICROECONOMIA
Pagamento da B a A
y˜
Pagamento da A a B
Figura 6.4. Contrattazione ottima à la Coase. Nota che x* è l'ottimo sociale indipendentemente dall'allocazione iniziale dei diritti. Sull'asse orizzontale sono indicati gli orari di coprifuoco, con a e b che indicano gli ottimi rispettivamente di A e B. Le curve di indifferenza di A sono così ordinate: u+ > u > u* > u , mentre per B abbiamo v* < v.
Non sappiamo quale contrattazione metteranno in atto i due. Sappiamo dal capitolo 5 che questo dipenderà dalle istituzioni e norme che governano la contrattazione. Ipotizziamo che ogni esito debba scaturire da un accordo e che perciò non possa essere peggiore dell'esito b senza alcun pagamento tra i due. Se B potesse fare un'offerta prendere o lasciare ad A , per esempio, l'esito sarebbe t ( A paga a B la somma y' , e il coprifuoco è fissato alle ore x *), con A che guadagna un'utilità maggiore rispetto ad u' di un incremento piccolo a piacere. Se l'esito fosse determinato da un Banditore che segue gli assiomi della contrattazione di Nash, l'esito sarebbe un punto come r. Se i due facessero offerte alternate e se B fosse il primo giocatore o avesse un basso tasso di preferenza intertemporale, l'esito sarebbe qualche punto tra t e r. E così via.
L’UTOPIA DEL CAPITALISMO |25
Figura 6.5. Lo spazio di contrattazione è troncato dalla limitata ricchezza di A.
Quello che sappiamo è che - questa è la condizione di Coase - se le istituzioni e norme che regolano la contrattazione permettono una efficiente contrattazione, l' esito sarà Pareto-efficiente, cioè sarà rappresentato da un punto lungo la curva dei contratti efficienti nello spazio di contrattazione (o equivalentemente, lungo la curva dei contratti efficienti nella regione dei miglioramenti Paretiani). Gli esiti possibili compatibili con la contrattazione efficiente à la Coase sono diversi dal punto di vista della distribuzione, ma sono tutti efficienti. In questo senso Coase ha ragione: non importa chi detenga i diritti di proprietà ("questioni di equità a parte"). Ovviamente potrebbe succedere che A non sia sufficientemente ricco (e non abbia accesso al credito) per disporre dei fondi necessari per compensare B. Ipotizziamo, per concretezza, che A abbia accesso solo a y˜ il che, di conseguenza, limita la regione dei miglioramenti Paretiani a bqs in figura 6.4 e lo spazio di contrattazione a bqs in figura 6.5. L'esito della contrattazione, vincolato dalla mancanza di disponibilità finanziaria di A , non sarà socialmente efficiente. Naturalmente, se l'allocazione dei diritti iniziale fosse rappresentata da un x sufficientemente vicino a x *, allora la contrattazione à la Coase avrebbe raggiunto un risultato socialmente efficiente nonostante i vincoli finanziari di A . Ma i problemi sorgono in casi generali, perfino quando la possibilità di prendere in prestito denaro è illimitata. Un'ipotesi speciale, certamente falsa, riguardante le funzioni delle equazioni (6.1) è che l'utilità marginale del reddito sia indipendente dal livello di reddito. Riscriviamo le funzioni di utilità nelle equazioni (6.1) come
26 | MICROECONOMIA
u = u( y + y) (a x) v = v(Y y) (b x)
2
2
(6.1’)
dove Y e y sono rispettivamente la ricchezza di B e A derivante da fonti diverse che la contrattazione in esame e le funzioni u e v sono crescenti e strettamente concave nei loro argomenti. Le espressioni che eguagliano le pendenze delle curve di indifferenza e che quindi definiscono la curva dei contratti è ora 2 ( x a) 2 (b x) (6.3') = u' v' Se assumiamo che Y = y e che le due funzioni u() e v() siano identiche, le curve
di indifferenza sarebbero ancora tangenti in x * (che sotto queste ipotesi rappresenta ancora l'ottimo sociale), ma la curva dei contratti efficienti non è più verticale. La ragione è che il costo marginale soggettivo di compiere un trasferimento in denaro all'altra parte è crescente rispetto all'ammontare dello stesso, mentre il beneficio marginale soggettivo di riceverlo è decrescente, rendendo di conseguenza il pagamento meno attraente per entrambi. Figura 6.6 illustra la nuova curva dei contratti efficiente.
Figura 6.6. La contrattazione à la Coase con utilità marginale del reddito decrescente. Nota: una contrattazione efficiente determinerebbe un punto sulla curva dei contratti efficienti, ma questo non sarebbe socialmente efficiente a meno che l'allocazione iniziale dei diritti sia x*.
Ora torniamo al caso in cui B detiene di fatto i diritti di proprietà. Una contrattazione efficiente produrrebbe, come prima, un esito sulla curva dei contratti efficienti, così che il risultato sarebbe Pareto-efficiente. Ma questa non sarebbe socialmente efficiente, dato che la sola distribuzione dei diritti di proprietà che raggiungerebbe l'esito x * sarebbe l'imposizione autoritativa di un coprifuoco ( x = x*)
L’UTOPIA DEL CAPITALISMO |27
(che implicherebbe l'assenza di contrattazione). In questo caso, la distribuzione iniziale dei diritti di proprietà conta dal punto di vista dell'efficienza sociale ma non della Pareto efficienza (almeno fintanto che la condizione di Coase resta valida). La differenza risiede nel fatto che, differentemente dall'efficienza Paretiana, l'efficienza sociale introduce "questioni di equità" che Coase non considera; nell'accezione sociale, l'equità entra implicitamente attraverso l'esplicito (uguale) peso attribuito alle utilità dei due. Se le condizioni iniziali fossero altamente impari (per esempio, x = b ), l'efficienza sociale potrebbe essere impossibile da implementare senza peggiorare la situazione di B. In questo caso, l'esito socialmente ottimo non sarebbe raggiunto attraverso la contrattazione privata.
DUE PUNTI
E
MEZZO
A FAV O R E D E L
TEOREMA
DI
COASE
Il contributo di Coase è stato controverso perchè sembrava ampliare radicalmente la classe di situazioni nelle quali i meccanismi di allocazione decentralizzata implementerebbero soluzioni efficienti, limitando l'intervento competente dello stato. Così scrivevano Buchanan e Tullock (1962:47-48): Se il costo di organizzare decisioni fosse zero, tutte le esternalità sarebbero eliminate dal volontario comportamento privato indipendentemente l'allocazione iniziale dei diritti di proprietà. In questo caso, non ci sarebbero basi razionali per lo Stato o per l'azione collettiva oltre l'iniziale minima delineazione del potere che gli individui dispongono sulle risorse.
Tra le affermazioni più sorprendenti, di cui si è detto che sono basate sull'idea di Coase, vi è quella che l'assegnazione dei diritti di proprietà nelle economie reali è efficiente e che la transizione da un sistema economico ad un altro potrebbe essere vista come il risultato di un incremento di efficienza frutto di una contrattazione à la Coase. Nell'opera di Harold Demsetz (1966:348) si legge: "[S]i potrebbe pensare che un'impresa che usa schiavi non sia in grado di riconoscere tutti i costi delle proprie attività, dato che può avere la sua forza lavoro al prezzo del solo salario di sussistenza. Questo non sarebbe vero se fosse permessa una contrattazione nella quale gli schiavi potessero offrire all'impresa un pagamento per la loro libertà basato sul loro beneficio atteso dall’essere liberi. Il costo della schiavitù può essere quindi internalizzato nei calcoli dell'impresa. Il passaggio da servo a uomo libero nell'Europa feudale è un esempio di questo processo."
Quando il teorema di Coase è presentato con sufficiente precisione da essere corretto, comunque, tutto ciò che dice è che se non ci sono impedimenti alla contrattazione efficiente l' esito è efficiente. Questo sembra, purtroppo, simile allo stesso Teorema Fondamentale, nel senso che lascia poco spazio all'indebolimento delle stringenti ipotesi richieste dal teorema. Come ha sottolineato Farrell (1987), le condizioni
28 | MICROECONOMIA
riguardanti l'informazione richiesta per la validità del teorema di Coase - nessun impedimento a una contrattazione efficiente - sono esattamente le stesse che permetterebbero anche una contrattazione completa. Quando il teorema di Coase funziona anche il Teorema Fondamentale è valido, e quindi il teorema di Coase risulta non essere necessario. Mentre quando il Teorema Fondamentale non può essere applicato (a causa di incompletezza dei mercati), l'ipotesi di contrattazione a costo zero necessaria per il teorema di Coase risulta difficilmente soddisfatta. Alcuni hanno concluso su queste basi che quando il teorema di Coase è necessario, esso non è valido e per questo è di scarsa rilevanza. Ma questa interpretazione non coglie il vero significato del contributo di Coase. Quello che egli mise in luce è che partendo da una distribuzione iniziale inefficiente (come un'allocazione z in figura 6.1), lo scambio di mercato di tipo Walrasiano non è il solo modo di arrivare, o almeno di avvicinarsi, ad un punto della curva dei contratti efficiente (nel senso Paretiano). Questo risultato è nello spirito del contributo posteriore di Smale e Foley sopra citato. Inoltre, mentre il Teorema Fondamentale sembra non avere implicazioni di politica economica, il contributo di Coase mostra come diritti di proprietà più precisamente definiti e più facilmente scambiabili, insieme a contesti di contrattazione più efficienti, possano sensibilmente contribuire ad attenuare fallimenti del coordinamento in situazioni di second best nelle quali le ipotesi di entrambi i teoremi non sono soddisfatte. Il teorema può essere letto non tanto come una confutazione della tradizione Pigouviana dell'economia del benessere basata su tasse e sussidi, ma piuttosto come una specificazione delle condizioni sotto le quali riallocazioni private dei diritti di proprietà possono attenuare i fallimenti del coordinamento che né i mercati né gli stati riescono a risolvere. Interpretato in questo modo, il teorema dà due importanti contributi. Primo, identificando una condizione necessaria - una efficiente contrattazione - il teorema di Coase sottolinea quanto sia improbabile che l'allocazione privata decentralizzata sia Pareto-efficiente. In questo, si avvicina molto al Teorema Fondamentale nel senso che né sostiene nè si oppone a soluzioni decentralizzate, ma piuttosto chiarisce quali sono le condizioni alle quali il risultato è Pareto-efficiente. Secondo, il teorema correttamente indica nella rimozione di impedimenti ad una contrattazione efficiente per la riallocazione dei diritti di proprietà, un modo di affrontare il fallimento del coordinamento. Come parte di un pacchetto di diverse politiche economiche, questo approccio può essere complementare (non antitetico) a soluzioni centralizzate come l'allocazione di fatto dei diritti di proprietà o l'approccio
L’UTOPIA DEL CAPITALISMO |29
tasse-sussidi à la Pigou-Marshall. Concludere che creare diritti di proprietà meglio definiti migliora l'efficienza allocativa (attraverso la rimozione di impedimenti ad una contrattazione efficiente), comunque, non è sempre esatto. Questo dipende dal fatto che (come vedremo nel capitolo 14) diritti di proprietà meglio definiti o più facilmente trasferibili possono indebolire altri metodi per attenuare i fallimenti del coordinamento. Questa è una estensione della logica del Teorema del second-best che sarà più chiara dopo aver modellato più precisamente il processo di enforcement contrattuale informale da parte di comunità e altri piccoli gruppi. Infine, il teorema sottolinea l'importanza di distinguere tra questioni di efficienza e questioni di giustizia distributiva riguardanti le politiche per far fronte ai fallimenti del coordinamento. Molti attuali difensori della posizione Pigouviana - per esempio, quelli che sostengono che gli inquinatori devono pagare per il danno che provocano - sono tutt'altro che chiari circa le ragioni, allocative e/o distributive, sottostanti a questa politica. Questo argomento vale solo "mezzo punto" dato che la più comune inferenza dedotta dal teorema, che la distribuzione dei diritti di proprietà non conta per l'efficienza allocativa, è in generale sbagliata. Questo avviene perchè impedimenti ad una contrattazione efficiente sono comuni nelle economie reali (capitolo 5), vincoli finanziari che limitano le risorse individuali possono essere presenti anche se una contrattazione à la Coase fosse possibile (capitolo 9) ed, infine, la distribuzione della ricchezza influenza sia gli impedimenti alla contrattazione sia i vincoli finanziari.
C O N C L U S IO N E Visto che i fallimenti del coordinamento, più o meno importanti, sono endemici alla maggior parte delle interazioni non di mercato, ci si potrebbe sorprendere del perché il Teorema Fondamentale e il teorema di Coase abbiano attratto tutta questa attenzione. Senza dubbio, parte dell'interesse per i teoremi è dovuto alla credenza sbagliata che essi dimostrerebbero i vantaggi di limitare l'intervento del governo nell'economia a favore di una migliore definizione ed enforcement dei diritti di proprietà. Ma la questione dell'ottimalità degli esiti dell'equilibrio competitivo non gioca alcun ruolo nella discussione accademica attuale sulle politiche economiche e sulle istituzioni. L'attenzione è tornata sulle questioni più rilevanti della scelta tra possibili istituzioni e politiche che possano supportare esiti di second best, un tema sul quale tornerò nel prossimo capitolo. Limitatamente a questo obiettivo pratico, il teorema Fondamentale e il teorema di
30 | MICROECONOMIA
Coase rimangono importanti. Sotto opportune condizioni, individui che agiscono autonomamente perseguendo il proprio interesse possono implementare esiti socialmente desiderabili. Promuovere la capacità dell'azione privata di raggiungere questi fini sociali è un'importante obiettivo nel progettare politiche economiche e scrivere costituzioni. Ragioni di giustizia distributiva sono talvolta contrapposte al concetto di mano invisibile. La redistribuzione a favore dei poveri può essere raggiunta superando il problema dei prezzi generati dalla contrattazione privata, cioè, imponendo prezzi di disequilibrio che favoriscano i poveri nello scambio di mercato condotto con individui più ricchi (come quando il povero scambia lavoro per beni-salario). Ma, come suggerisce il Secondo Teorema del Benessere, esiste un altro modo per redistribuire benessere materiale, attraverso la riallocazione di beni o l'opportunità di acquisire beni. Se governanti illuminati dovessero scegliere tra politiche che alterano i prezzi ai quali vengono scambiati i beni e interventi di redistribuzione delle dotazioni iniziali, probabilmente riterrebbero, in alcuni casi, che la seconda opzione debba essere preferita sul piano dell'efficienza. Questo dovrebbe avvenire specialmente quando la scarsità dei beni tra i poveri è spiegata dalla mancanza di mercati e l'esistenza di contratti incompleti nelle transazioni rilevanti riguardanti credito, scolarità, previdenza, informazione e così via. L'interesse persistente nel Teorema Fondamentale e nel teorema di Coase, comunque, non trae origine dal loro contributo al chiarimento di questi ed altri problemi concreti. Piuttosto questo interesse è dovuto al fatto che essi dimostrano come meccanismi di allocazione come mercati competitivi e contrattazione possano sostenere sorprendentemente un ordine economico, cioè, una continua e regolare struttura di interazioni. L'idea più radicale di Adam Smith non fu che il "laissez faire" porterebbe ad un ordine ottimale (di fatto egli non fece mai una tale affermazione), ma piuttosto che lo scambio di diritti di proprietà su mercati competitivi costituisca un tipo di costituzione economica, ovvero, una regola che trasforma azioni individuali in esiti sociali aggregati. Che un ordine economico coerente possa essere basato interamente su attori egoisti, ognuno dei quali fa uso solo di informazione locale, è un'affermazione forte. Il fatto che la teoria dell'equilibrio generale Walrasiano non rappresenti adeguatamente un processo di concorrenza decentralizzata non inficia il suo messaggio principale, che consiste nel chiarire le condizioni sotto le quali la mano invisibile di Smith possa essere almeno approssimativamente corretta. Inoltre, teorie dell'equilibrio generale non Walrasiane
L’UTOPIA DEL CAPITALISMO |31
come quella proposta da Smale e Foley forniscono un modello di allocazione delle risorse, che preserva l'autonomia privata, è poliarchica e che produce esiti approssimativamente Pareto-ottimali alla stessa condizione di completezza dei mercati richiesta dal Teorema Fondamentale. Il Contributo di Coase vuole sottolineare che partendo da una distribuzione delle dotazioni iniziali arbitraria, la contrattazione tra agenti egoisti e che usano solo informazione locale può produrre esiti Pareto efficienti senza l'assistenza del fittizio Banditore Walrasiano. In un certo senso, la dimostrazione formale di Smale e Foley è pienamente nello spirito di Coase. Sia Smith che Coase cercarono di delineare più chiaramente il ruolo appropriato dello stato negli affari economici, non di denigrare l'importanza di un ruolo per lo stato. Lascerò che sia lo stesso Coase ad avere l'ultima parola sul suo teorema. Ovviamente questo non implica, quando i costi di transazioni non sono nulli, che le azioni del governo...non produrrebbero un risultato migliore di quello ottenibile affidandosi alle negoziazioni degli individui nel mercato. Se fosse così questo potrebbe essere appurato non studiando governi immaginari, ma quello che i governi reali fanno effettivamente. La mia conclusione è: studiamo il mondo dei costi di transazione positivi.
Come chi ha passato molti pomeriggi per diversi anni lavorando per restituire Long Hill all'uso pubblico, io sono d'accordo con Coase. Questo è il mondo al quale ci rivolgeremo.
32 | MICROECONOMIA
Riferimenti bibliografici 1915. "Coppage v. State of Kansas, 236 U.S.1 (1915)." U.S. Supreme Court. Arrow, K. J. (1971). Political and Economic Evaluation of Social Effects and Externalities. Frontiers of Quantitative Economics. M. D. Intriligator. Amsterdam, North Holland: 3-23. Arrow, K. J. and G. Debreu (1954). "Existence of an Equilibrium for a Competitive Economy." Econometrica 22(3): 265-290. Arrow, K. J. and F. H. Hahn (1971). General Competitive Analysis. San Francisco, Holden-Day. Buchanan, J. and G. Tullock (1962). The calculus of consent: logical foundations of constitutional democracy. Ann Arbor, University of Michigan Press. Coase, R. H. (1960). "The Problem of Social Cost." Journal of Law and Economics 3(1): 1-44. Coase, R. H. (1992). "The Institutional Structure of Production." American Economic Review 82(4): 713-719. Debreu, G. (1974). "Excess Demand Functions." Journal of Mathematical Economics 1(1): 15-23. Demsetz, H. (1966). "Toward a Theory of Property Rights." American Economic Review 57(2): 347-359. Farrell, J. (1987). "Information and the Coase Theorem." Journal of Economic Perspectives 1(2): 112-129. Foley, D. (1994). "A statistical equilibrium theory of markets." Journal of Ecomonic Theory 62(2): 321-345. Frost, R. (1915). North of Boston. New York, Henry Holt. Gauthier, D. (1986). Morals by Agreement. Oxford, Clarendon Press. Kirman, A. and K. J. Koch (1986). "Market excess demand in exchange economies with identical preferences and collinear endowments." Review of Economic Studies 53(3): 457-463. Lipsey, R. and K. Lancaster (1956-1957). "The General Theory of the Second Best." Review of Economic Studies 24(1): 11-32. Mantel, R. (1974). "On the characterization of aggregate excess demand." Journal of Economic Theory 7(3): 348-353. Mas-Colell, A., M. D. Whinston, et al. (1995). Microeconomic Theory. New York, Oxford University Press. Roemer, J. (1988). Free to Lose: An Introduction to Marxist Economic Philosophy. London, Radius. Scarf, H. (1960). "Some examples of global instability of competitive equilibrium." International Economic Review 1(3): 157-172. Sen, A. K. (1985). The Moral Standing of the Market. Ethics and Economics. E. F. Paul and J. Jeffrey Paul and Fred D. Miller. London, Basil Blackwell: 1-19. Smith, A. (1937). The Wealth of Nations. New York, Modern Library (originally published in 1776). Sonnenschein, H. (1973). "Do Walras' Identity and Continuity Characterize the Class of Community Excess Demand Functions?" Journal of Ecomonic Theory 6: 345-
L’UTOPIA DEL CAPITALISMO |33
354. Stiglitz, J. (1987). "The Causes and Consequences of the Dependence of Quality on Price." Journal of Economic Literature 25(1): 1-48. Sugden, R. (1986). The Economics of Rights, Co-operation and Welfare. Oxford, Basil Blackwell.
VII
S CAMBIO : C ONTRATTI , N ORME E P OTERE
Dove non c’è fiducia, non ci può essere contratto. Thomas Hobbes, De Cive (1651).
“Il gioco va meglio, ora”, disse per alimentare un po’ la conversazione. “Eh, sì” rispose la Duchessa, “e questa è la morale: ‘ E’ l’amore, è l’amore che fa girare il mondo”. “Ma qualcuno ha detto invece,” bisbigliò Alice, “se ognuno badasse a sé, il mondo andrebbe meglio”. Lewis Carroll, Alice’s Adventures in Wonderland (1865).
In una teoria economica che ipotizza che i costi di transazione non esistono, i mercati non hanno alcuna funzione da svolgere e sembra perfettamente ragionevole sviluppare una teoria dello scambio con un’accurata descrizione di individui che scambiano noci per mele al margine della foresta o con qualche altro esempio altrettanto fantasioso… Ronald Coase, The Firm, The Market, and The Law (1988).
IBN BATTUTA, cartografo arabo del quattordicesimo secolo, scrisse che sulle sponde del fiume Volga il commercio di lunga distanza aveva la forma seguente: Ogni viaggiatore... lascia le merci che ha portato... e si ritira nel suo accampamento. Il giorno successivo ritorna alle... sue merci e trova di fronte a sè pelli di zibellino, martora ed ermellino. Se il mercante è soddisfatto della merce che gli è proposta per lo scambio se la prende, altrimenti la lascia. Gli abitanti del luogo allora aggiungono altre pelli, ma talvolta si riprendono le merci e lasciano quelle del mercante. Questo è il loro modo di fare commercio. Coloro che vi partecipano non sanno con chi stanno commerciando o se sono jinn1 o uomini, dato che non hanno mai visto nessuno. (Battuta 1929: 151).
Erodoto (1998) descrive un modo simile di effettuare gli scambi tra cartaginesi e libici nel V secolo a.C. Dopo aver lasciato le loro merci, racconta Erodoto, i cartaginesi si ritirano e i libici "mettono dell'oro ai piedi delle merci e dopo se ne vanno. A questo punto i cartaginesi...danno un'occhiata e se pensano che ci sia abbastanza oro come pagamento per il carico lo prendono e se ne vanno". Erodoto descrive come il processo continua fino a quando è raggiunto un prezzo accettabile, rimarcando con sorpresa che "nessuna delle parti imbroglia l'altra... [i cartaginesi] non
2 | MICROECONOMIA
toccano l'oro fino a quando questo non sia pari in valore al carico, e gli indigeni non toccano le merci fino a quando i cartaginesi abbiano preso l'oro" (pp. 300-301). Alvise da Ca' da Mosto, un veneziano che nel XV secolo lavorava per la corona portoghese, riportò di una pratica simile in Mali osservando che è "un antico costume che sembra strano e difficile da credere" (Giri 1983:23). Ma il cosiddetto commercio silenzioso è davvero così strano?1 Il trasferimento di merci tra sconosciuti può essere pericoloso, prendendo la forma del dono ad un estremo, tramite rispettivi scambi vantaggiosi, o di quello che può essere definito saccheggio, all'altro estremo. I guadagni potenziali dal commercio sono spesso maggiori quanto più distanti geograficamente e socialmente sono le parti coinvolte nello scambio: il sale portato dai Tuareg dalle montagne dell'Atlante attraverso il Sahara fino al regno del Ghana non era disponibile sul luogo, e l'oro e le noci tropicali che i Tuareg ottenevano dal commercio silenzioso con i ghanesi non erano disponibili nel Nord Africa. Il commercio silenzioso forniva un ambiente di contrattazione (apparentemente un gioco di offerte alternate con opzione di uscita, dalla descrizione di Ibn Battuta) capace di sfruttare i guadagni dal commercio nei casi in cui tanto i guadagni potenziali quanto i pericoli erano sostanziali. Il fatto che le parti coinvolte nel commercio silenzioso non si incontrassero aiutava a ridurre le possibilità di liti tra commercianti spesso armati pesantemente. Ma ciò non spiega quello che sorprendeva Erodoto, ossia perché i cartaginesi non prendessero l'oro e se ne scappassero. Il commercio silenzioso è uno dei tantissimi modi che le persone hanno escogitato per assicurare il processo di scambio. Tra questi si può annoverare il "sistema di responsabilità della comunità" in uso nel Tardo Medioevo europeo dove i commercianti di una comunità applicavano provvedimenti disciplinari nei confronti dei propri membri che imbrogliavano coloro che non facevano parte della comunità stessa, in modo tale da aumentare la propria reputazione e le proprie opportunità di commercio (Greif 2002). Vi si può includere anche l'antico documento di tutela chiamato "porto di commercio" che assicurava ai commercianti l'incolumità nel passaggio nella 'terra di nessuno' tra imperi o stati reciprocamente ostili. Ma molti dei sistemi inventati per facilitare lo scambio sono tutto tranne che esotici. Lisa Bernstein scrive, riguardo alla industria dei diamanti contemporanea: Le dispute non sono risolte ricorrendo alle corti e non con l'applicazione delle regole legali annunciate e fatte osservare dallo stato...[ma piuttosto da] un elaborato insieme interno di 1
Alcune delle evidenze empiriche riguardanti il commercio silenzioso non sono attendibili, ma è certo che la pratica è stata piuttosto diffusa in Africa e nel sudest asiatico e che se ne possono trovare esempi anche in Europa ed in altre parti dell’Asia. Resoconti scettici ed informativi sono offerti da Price (1980) e de Moraes Farias (1979).
SCAMBIO: CONTRATTI,NORME E POTERE
|3
regole accompagnate da istituzioni e sanzioni distintive (Bernstein 1992:115).
Una forte preferenza per lo scambio all'interno del proprio gruppo - sia esso linguistico, razziale, o di quartiere - evitando coloro che non vi appartengono così come la tendenza ad aver a che fare solo con persone di sicura reputazione sono pratiche comuni nel commercio. I benefici delle pratiche di commercio intra-gruppo nel facilitare lo scambio devono compensare i costi dei mancati guadagni ed economie di scala che sicuramente si otterrebbero dal commercio con partner non ammessi. Esempi includono comunità con un'alta distinzione tra appartenenti e non appartenenti quali la comunità Amish in Pennsylvania e molte reti etniche di affari. Pratiche simili, incluso l'ostracismo di coloro che violano le regole, sono comuni tra i negoziatori di stock option nelle sale negoziazioni dei maggiori mercati di scambio di titoli negli Stati Uniti, laddove piccole "folle" di negoziatori si riuniscono in un unico luogo per scambiare un particolare titolo (o un piccolo insieme di titoli) in un modo tale da richiamare alla mente più un mercato all'aperto di contadini che un'anonima interazione sui mercati come descritta nei libri di testo (Baker 1984). Tra queste soluzioni atte a promuovere gli scambi ci sono i contratti completi che possono essere fatti osservare da una terza parte (un tribunale), a costo zero, alle parti contraenti. Ma molti, forse la maggior parte degli scambi più importanti nei quali siamo coinvolti, non sono coperti da contratti completi. I soldi sono prestati in cambio di una promessa di restituzione che non sempre si può far adempiere. I proprietari delle imprese vorrebbero vincolare i manager a massimizzare il valore attuale dei ricavi futuri dei proprietari stessi, ma i contratti manageriali vanno ben lontano da questo obiettivo. Altri impiegati lavorano sotto contratti che non si prendono la seccatura di menzionare il fatto che il lavoratore deve lavorare sodo e bene. I contratti firmati dagli inquilini residenti possono includere delle clausole che richiedono di mantenere il valore della proprietà residenziale, ma a parte i casi di enorme negligenza, tale responsabilità non è enforceable. I contratti d'assicurazione prescrivono (ma in genere non possono rendere enforceable) un comportamento prudente dell'assicurato. Negli Stati Uniti, le famiglie destinano una frazione considerevole del loro bilancio per acquistare servizi educativi e sanitari, la qualità dei quali è raramente specificata in un contratto (e impossibile da far rispettare, se tale contratto esistesse). I genitori si prendono cura dei propri figli con la speranza - ma senza alcuna assicurazione contrattuale - che i figli si prendano cura di loro nella vecchiaia. Nelle famiglie, le coppie spesso implementano molti scambi e una divisione del lavoro abbastanza specializzata senza essere forniti di alcun contratto. Sembra che Emile Durkheim avesse ragione quando osservava, non solo a
4 | MICROECONOMIA
riguardo del contratto matrimoniale, ma anche a riguardo della grande maggioranza dei rapporti di scambio, che “Non tutto in un contratto è contrattuale… il contratto di per sé non è sufficiente ma è possibile solo grazie alla regolamentazione del contatto, che in origine è sociale” (Durkheim 1967 [1902]:189,193). Questa intuizione è un elemento essenziale della teoria dello scambio sociale sviluppata successivamente da Peter Blau (1964). L’idea chiave è che una parte offre un pagamento mentre l’altra incorre in “diffuse obbligazioni future, non precisamente specificate e la natura del ricavo derivante non può essere contrattata ma deve essere lasciata alla discrezione di uno dei contraenti” (p. 93). Questi sono tutti casi di scambi con contratti incompleti, cioè scambi in cui qualche aspetto della transazione non è specificato in un contratto di cui è possibile assicurare l’enforcement a costo zero per le parti coinvolte. (Il contratto di prestito, per esempio, fornisce una completa specificazione dei termini di restituzione, ma questi termini non sono enforceable ex-post, mentre il contratto di lavoro non specifica tutte le mansioni che il datore di lavoro può far svolgere ad un suo dipendente). Ci sono molte ragioni per le quali l’incompletezza contrattuale è la regola piuttosto che l’eccezione. Primo, far osservare i contratti da una terza parte richiede informazioni che siano disponibili per entrambi le parti e che siano riconosciute come valide in un tribunale. Secondo, i contratti sono generalmente eseguiti dopo un certo periodo di tempo e un contratto completo deve quindi specificare i risultati per ogni possibile stato futuro. Una completa specificazione di questi stati futuri in genere non può essere fatta e ad ogni modo non si può specificare cosa fare in ogni stato senza sostenere un costo, anche se tali stati possono essere anticipati. Terzo, molti dei servizi e delle merci coinvolti nel processo di scambio sono difficili da misurare o da descrivere in modo abbastanza preciso da poter essere specificati in un contratto. Quarto, per alcune transazioni non esiste un apparato giudiziario capace di far osservare i contratti; molte transazioni internazionali sono di questo tipo. Un’ultima, sorprendente ragione, che esplorerò nella penultima sezione di questo capitolo, è che anche quando la natura delle merci o dei servizi da scambiare sia tale da permettere un contratto più completo, un contratto meno completo potrebbe essere favorito per ragioni motivazionali. Come l’ultima ragione suggerisce, il grado di incompletezza contrattuale non è esogeno e può rispondere ai livelli di fiducia e reciprocità presentati dalla popolazione dei commercianti alla quale ci si riferisce. Per esempio, se la qualità di una merce è velocemente determinata e specificata contrattualmente, ciò è per molti versi una
SCAMBIO: CONTRATTI,NORME E POTERE
|5
scelta, non un qualcosa di dato. Il gallo nero sull’etichetta del vino assicura il compratore che questo è davvero ottenuto da viti coltivate nella regione del Chianti in Italia; l’adesivo Chiquita su ogni banana colloca la reputazione del dipartimento di controllo della compagnia nella linea. Alcune sigle quali Sugar Number 11, Corn Number 2 Yellow, o Light LA Sweet (petrolio) non sono regali originali della natura. Esse sono state create da un processo di standardizzazione che è stato deliberatamente pensato per eliminare difficoltà nel monitorare le differenze in qualità. Un esempio è quello della trasformazione del grano del Mid-West statunitense nella metà del XIX secolo (Cronon 1991). Dopo essere stata un’eterogenea amalgama con innumerevoli differenze in taglia, genere e qualità differenti da sacco a sacco, il grano venne trasformato in un numero ridotto di merci omogenee. I nuovi prodotti creati e classificati come white winter (bianco invernale), red winter (rosso invernale) e spring wheat (frumento primaverile) divenne di una qualità uniforme tale che i proprietari del grano, all’atto dell’acquisto, non si riferivano più ad un tipo di sacco o ad un particolare lotto di grano ma semplicemente ad un ammontare specifico. Il grano divenne una merce astratta e subito si poterono scrivere in modo semplice contratti enforceable che specificavano un ammontare di merce piuttosto che una specifica qualità, come un kw/h di energia elettrica. Notevole è il fatto che la standardizzazione del grano fu compiuta da un ente completamente privato, il Chicago Board of Trade, la cui appartenenza come membro divenne essa stessa un bene scambiabile sul mercato prima della fine del XIX secolo. Ma a differenza del Red Winter #2 e dell’esser membro del Chicago Board of Trade, molto di ciò che è soggetto a transazione in una economia moderna non è soggetta a contrattazione completa. In questo capitolo saranno approfondite tre importanti conseguenze delle natura incompleta dei contratti. Primo, relazioni di scambio di lungo periodo sono comuni anche quando i mercati sono molto competitivi. Come risultato si ha che il numero di coloro che sono coinvolti in una interazione è in genere minore di quello delle persone che operano nei mercati interessati. Secondo, in parte perché le relazioni di scambio sono durevoli e personali piuttosto che brevi e anonime, i motivi attinenti il processo di scambio vanno oltre il semplice interesse personale, e includono anche la fiducia e la preoccupazione per la correttezza. E, terzo, una o più parti di uno scambio possono essere capaci di portare avanti i propri interessi esercitando la propria autorità sugli altri. Il fatto che il potere possa essere esercitato in un equilibrio competitivo e che il suo esercizio possa essere profittevole può sembrare sorprendente dato che tutte le parti che partecipano ad uno scambio sono libere di interrompere la transazione.
6 | MICROECONOMIA
Inizierò con una transazione bilaterale simmetrica (come nel commercio silenzioso) e mostrerò come norme facilitanti lo scambio possano proliferare in una popolazione. Questi modelli mostreranno perché una stretta di mano è molto più di una semplice stretta di mano e può spiegare il comportamento fiducioso che sorprese Erodoto e che non trova luogo in molte transazioni moderne. Cioè, norme di fiducia o correttezza possono attenuare le inefficienze allocative che sorgono dall’incompletezza dei contratti. Ma non eliminano del tutto il problema. Per questa ragione, nella terza sezione, usando un modello standard principale-agente, considererò come nelle interazioni asimmetriche – compratore/venditore, o prenditore di fondi a prestito/prestatore, per esempio – l’esercizio del potere possa colmare il problema dei contratti incompleti in assenza di preferenze eterointeressate. Il risultato chiave è che quando i contratti sono incompleti, la ripetizione delle interazioni può permettere l’esercizio di potere (del principale nei confronti dell’agente) in modi tali che facilitano gli scambi e che riducono le inefficienze allocative che ne risultano. La quarta sezione esplora i modi in cui preferenze che prendano in considerazione gli altri e struttura contrattuale interagiscono, ognuna influenzando l’evoluzione dell’altra. La conclusione è che i mercati funzionano per effetto dell’interazione di contratti, norme e potere. Una cautela è necessaria. I modelli che descrivono il modo in cui le parti di una transazione fronteggiano l’incompletezza contrattuale talvolta presuppongono che gli individui siano in grado e predisposti ad avere accesso ad una grande quantità di informazioni e di elaborare queste informazioni in modi abbastanza complicati. Ma la natura limitata delle informazioni e la capacità del processo di elaborazione delle informazioni è comunemente la ragione dell’incompletezza contrattuale che i contraenti affrontano. E’ ovviamente inconsistente basare una teoria dell’incompletezza contrattuale sui limiti cognitivi e informativi e quindi procedere con il modellare il processo di scambio in condizioni di incompletezza contrattuale come se le capacità cognitive e le informazioni a disposizione degli individui fossero in effetti illimitate. Per questa ragione, è utile controllare che gli individui con tratti cognitivi e comportamentali empiricamente realistici possano agire nei modi descritti nei modelli. Farò questo nella prossima sezione modellando il comportamento di mercato in modo che questo comportamento sia regolato da una semplicissima regola d’apprendimento: copia coloro che stanno facendo meglio.
NORME
D I M E R C ATO
Considerate una popolazione composta da un gran numero di persone che interagiscono in coppia impegnandosi ad effettuare uno scambio durante il quale esse
SCAMBIO: CONTRATTI,NORME E POTERE
|7
possono sia comportarsi in modo opportunistico (per esempio, rubandosi a vicenda le merci oggetto dello scambio) o scambiarsi le merci ad un prezzo dato. Chiamiamo queste strategie “defezione” e “cooperazione” con payoff che descrivono un dilemma del prigioniero, così come indicato nella tabella 7.1, con i consueti payoff a > b > c > d e a + d < 2b . Questo è un gioco con diritti di proprietà incompleti dato
che ognuno può intraprendere azioni che infliggono costi all’altro senza dover affrontare alcuna responsabilità. Come abbiamo visto nel capitolo 1, diritti di proprietà completi dovrebbero specificare che una parte che sottrae le merci ad un partner che vuole effettuare un mutuo scambio cooperativo dovrebbe pagare i danni b d , nel qual caso la struttura dei payoff non descriverebbe più un dilemma del
prigioniero. Dati diritti di proprietà incompleti, comunque, noi sappiamo che DD è l’equilibrio in strategia dominante di questo gioco. Il problema, quindi, è capire perché spesso osserviamo mutua cooperazione in scambi che sembrano avere questa struttura. Inoltre, in contrasto con la previsione di questo gioco (defezione universale), le popolazioni sono tipicamente eterogenee, con alcuni che in un certo istante giocano C e altri che giocano D . La spiegazione deve essere che la matrice dei payoff del dilemma del prigioniero sembra descrivere le informazioni a riguardo, ma in realtà non le descrive. Vedremo che introducendo l’idea delle norme di mercato e aggiungendo pochi importanti dettagli circa le istituzioni che governano il modo in cui le persone interagiscono, potremo davvero spiegare perché la cooperazione non è niente affatto un evento raro in situazioni come queste. Ricordate che le norme sociali sono prescrizioni etiche che governano le azioni che si compiono nei confronti degli altri. E’ facile vedere che una norma – che prescrive, ad esempio, l’onestà o il duro lavoro – può costituire la base per transazioni mutuamente benefiche anche laddove una completa contrattazione è impossibile. Se l’etica di lavoro di un dipendente gli preclude di sottrarsi al proprio dovere sul posto di lavoro, il fatto che il livello di impegno profuso non possa essere specificato in un contratto non dissuaderà il datore di lavoro dall’assumere il dipendente. Se il venditore è obbligato da una norma d’onestà a comunicare al compratore esattamente la qualità del prodotto che è oggetto della transazione, il fatto che la qualità non possa essere determinata contrattualmente non impedirà lo scambio. Quello che non è così facile da comprendere è perché queste norme possano diventare comuni, dato che violare la norma può offrire opportunità per guadagni individuali. Se comportamenti individuali sono adottati sia coscientemente che non intenzionalmente come risposta ai payoff attesi associati a tali comportamenti,
8 | MICROECONOMIA
l’esistenza di queste e di altre norme etiche alla base delle transazioni di mercato è qualcosa che assomiglia ad un puzzle. Il giornalista del primo XX secolo H. L. Mencken fornì una spiegazione che anticipava il modo di pensare di molti contemporanei teorici della teoria dei giochi e biologi: la “coscienza è la voce interiore la quale ti avverte che qualcuno ti può star guardando” (Mencken 1949:617). Comunque, la stanca valutazione di Mencken è corretta solo per metà in quanto, spesso, le persone incorrono in costi per approvare una norma anche quando nessuno sta guardando. In questi casi, la norma è stata internalizzata: aderirvi è un obiettivo dell’individuo, e l’attenersi può essere giustificato dal fatto di incorrere altrimenti in payoff minori. Il puzzle è nel capire come le persone si ritrovino queste norme. Una plausibile risposta (analizzata nei capitoli 11 e 13) è che il sistema di socializzazione favorisce l’internalizzazione delle norme sociali che sono prevalenti in un gruppo e quei gruppi che internalizzano le norme che facilitano scambi mutuamente benefici hanno una maggior probabilità di diffondere le loro norme in una popolazione più grande. Ciò può succedere attraverso processi di emulazione, emigrazione, conquista o sopravvivenza a fronte di crisi ecologiche o di altra natura. In questo caso, coloro che adottano le norme possono avere materialmente meno successo nei confronti degli appartenenti ai loro gruppi che evitano le norme; la proliferazione delle norme è dovuta al successo dei gruppi nei quali l’osservanza della norma è comune. Questo processo è chiamato selezione di gruppo. Tabella 7.1. Payoff del gioco di scambio a turno unico
C D
C b,b a,d
D d,a c,c
Ma c’è un altro modo con il quale norme quali onestà ed impegno sul lavoro possono proliferare: coloro che aderiscono a queste norme in media possono ottenere payoff materiali maggiori rispetto agli appartenenti del gruppo che non le rispettano. Se il processo di trasmissione culturale favorisce coloro con payoff più alti (come nel modello introdotto nel capitolo 2), queste norme saranno copiate e quindi prolifereranno. In questo caso l’immediata ragione per avere dei comportamenti onesti e di impegno sul lavoro è il valore che l’individuo assegna alla norma stessa, non l’anticipazione del guadagno che se ne trarrà. Il fatto che si ottenga un più alto payoff spiega perché gli individui hanno abbracciato la norma. Può sembrare strano suggerire che payoff materiali più alti spieghino il successo di prescrizioni etiche che portano gli individui a rinunziare ad opportunità
SCAMBIO: CONTRATTI,NORME E POTERE
|9
di guadagni materiali. Ma la teoria (e gli studi empirici) della dissonanza cognitiva fornisce alcune ragioni per attendersi che le norme che hanno successo saranno copiate. Le dissonanze sorgono quando i valori di un individuo rendono impossibili azioni che altrimenti sarebbero ricompensate. Uno dei modi per far fronte alla dissonanza è quello di modificare la propria regola di comportamento per renderla consistente con l’imperativo percepito di raggiungere altri fini. Dato che il successo materiale è ampiamente ricercato, la riduzione della dissonanza favorirà la copia delle norme di chi ha successo. Ma ci sono altre ragioni, più strutturali che psicologiche, del perché le norme di coloro che hanno successo possono essere favorite nel processo di replica. Coloro che hanno successo possono ottenere posizioni – come leader politici, personaggi dei media e insegnanti, per esempio – in cui hanno un accesso privilegiato nei confronti della popolazione quale modello culturale e, così, possono essere copiati in modo sproporzionato per ragioni associate più alla loro posizione nella struttura sociale che al loro successo. Altri giudicano che coloro che hanno lo stesso successo (per esempio, stessa ricchezza) ma che hanno minori possibilità di presentarsi come modello culturale saranno meno emulati. Il processo di trasmissione culturale è fortemente influenzato dalla struttura delle interazioni sociali, e la tendenza a copiare chi ha successo può essere una probabile conseguenza del modo in cui molte società – ma certamente non tutte – sono organizzate. Poiché le norme che regolano la nostra vita sono prescrizioni generali e tipicamente sono acquisite prima di divenire adulti, esercitano un’influenza persistente sui propri comportamenti in una varietà di ambienti. John Stuart Mill (1998 [1861]:71) commentava che le persone “attraversano mare della vita con le loro opinioni costituite sulle comuni domande di ciò che è giusto e ciò che è sbagliato”. Di conseguenza, vivere con norme acquisite tramite un processo di copia di ciò che dà successo materiale non è la stessa cosa che massimizzare il successo materiale. Le nostre norme spesso ci portano a lavorare sodo ed essere onesti anche quando qualcuno non sta guardando. Supponete che un individuo che osserva una norma adotti una particolare strategia nel gioco precedente e continui a farlo fin quando avrà occasione di potersi aggiornare e, a quel punto, che l’individuo cambi norma se i payoff attesi di qualche altra norma sono più alti. Usando il modello dinamico di replica sviluppato nel capitolo 2, userò tre modelli per mostrare come comportamenti cooperativi – tali da evitare l’opzione della mutua defezione nel gioco precedentemente descritto – possano diventare comuni. Questi modelli mostreranno che le istituzioni del mercato che permettono interazioni ripetute, associazione non casuale dei contraenti nello scambio e l’emergere della reputazione possono supportare norme che sostengono
10 | MICROECONOMIA
alti livelli di cooperazione e quindi facilitare l’ottenimento dei guadagni derivanti dal commercio. Questi modelli descrivono diversi modi attraverso i quali la struttura delle interazioni sociali può indurre gli individui a prendere in considerazione le conseguenze delle proprie azioni: (1) a causa della ripetizione dell’interazione con un dato partner nello scambio, (2) attraverso l’associazione con persone che condividono lo stesso modo di pensare e (3) attraverso i benefici di cui si gode giocando in futuro un gioco a turno unico con altri partner. Modello 1: Ripetizione e Ritorsione. Interazioni a turno unico descrivono alcuni scambi economici – l’acquisto e la vendita in un mercato a pronti, alcuni mercati del lavoro giornalieri non strutturati, per esempio – ma non altri – come le relazioni di credito o di lavoro di lungo periodo descritte nei capitoli 8 e 9. Alcune interazioni durano per molte generazioni, come nelle piccole comunità dove i figli dei mezzadri e dei proprietari rinnovano le relazioni dei loro genitori e dei loro nonni o in un condominio molto stabile (dove negli appartamenti ai genitori succedono i figli). Spesso le relazioni non sono solo continuative ma si sovrappongono, con i datori di lavoro che non forniscono solo un lavoro, ma anche credito e assicurazione. Se l’interazione ha un’alta probabilità di ripetersi, la cooperazione può essere supportata dalla minaccia di punizione contro coloro che defezionano - con la minaccia che è più efficace quanto più è probabile la ripetizione. Se la ripetizione è sufficientemente probabile e se il tempo che intercorre tra le ripetizioni è sufficientemente breve (o i corrispondenti tassi di preferenza temporale sufficientemente bassi), il dilemma del prigioniero è trasformato in un gioco d’assicurazione con due equilibri: mutua defezione (come prima) e mutua cooperazione. La ripetizione cambia l’interazione in due modi. Permette di adottare strategie più complicate che tengano in conto delle azioni precedenti dei propri partner e richiede che i payoff vengano calcolati prendendo in considerazione i guadagni attesi durante tutta l’interazione. I giocatori potrebbero ora voler adottare la cosiddetta strategia “occhio per occhio benevolo” (nice tit-for-tat): cooperare nel primo turno e nei turni successivi fare ciò che il partner ha fatto nel turno precedente. Per rendere le cose semplici limitiamo la scelta delle strategie solo alla “occhio per occhio benevolo” (T) e alla defezione incondizionata (D).2 Supponiamo che gli individui siano accoppiati in modo casuale per giocare, che 2
Una volta che viene introdotta la ripetizione, l’insieme delle strategie diventa immenso. Assumere (come faccio) che il giocatore ha solo un periodo di memoria elimina un grande numero di strategie (e.g. defeziona se l’altro ha defezionato nei due turni precedenti altrimenti no). Ma le strategie occhio per occhio benevolo e defezione incondizionata non esauriscono le strategie disponibili anche con un solo periodo di memoria: cooperazione incondizionata e occhio per occhio cattivo (nasty tit-for-tat) sono entrambe possibili, per esempio.
SCAMBIO: CONTRATTI,NORME E POTERE
|11
dopo ogni turno di gioco la suddetta interazione finisca con probabilità e che la ripetizione avvenga in un periodo sufficientemente breve da giustificare il fatto di ignorare il tasso di preferenza temporale dei giocatori (un’ipotesi che non porta alcuna conseguenza in ciò che segue). Quando due individui che giocano la strategia T si incontrano, per esempio, entrambi cooperano nel primo turno e dopo continuano a farlo fin quando l’interazione finisce (i.e. per una durata attesa totale di 1/ turni) ottenendo in tal modo un beneficio atteso Tabella 7.2. Payoff del gioco di scambio iterato Tit for Tat
Defezione
Tit for Tat Defezione
di b / .3 Quando un giocatore che gioca T incontra uno che gioca la strategia D, il primo riceve d nel primo round e dopo entrambi continuano a defezionare fino a quando il gioco finisce. Il numero atteso di turni dopo il primo turno è la probabilità che ci sia un secondo turno (1 ) per il numero atteso di turni all’inizio di ogni periodo, cioè 1/ . I risultanti payoff attesi sono quindi d + c(1 ) / . La matrice dei payoff per il gioco ripetuto appare nella tabella 7.2. Sia la frazione della popolazione che adotta la strategia T (i restanti adottano la strategia di defezione incondizionata), ( ) e ( ) rispettivamente il payoff T
D
atteso di un giocatore che adotta T e di un giocatore che adotta D in una popolazione in cui componenti giocano T . Abbiamo quindi b + (1 ){d + [(1 )c / ]} c ( ) = {a + [(1 )c / ]} + (1 )
( ) = T
D
dal quale, uguagliando per determinare la frazione della popolazione di equilibrio *, si ottiene * =
c d 2c a d + (b c) /
Le equazioni 7.1 e 7.2 sono rappresentate nella figura 7.1. 3
Il numero atteso dei turni è: 1 + (1 ) + (1 ) + ... =1/{1 (1 )} =1/ 2
(7.2)
12 | MICROECONOMIA
Per payoff e probabilità di termine tali che b c > (7.3) a c
e per c d > 0 si avrà che *(0,1) darà un equilibrio interno. (Se l’espressione (7.3) fosse stata un’uguaglianza, * sarebbe uguale ad uno. La condizione (7.3) assicura anche che il denominatore dell’equazione (7.2) è positivo). La seconda condizione ( c d > 0) deve essere vera perché i payoff del gioco a turno unico descrivono un dilemma del prigioniero. La condizione (7.3) sarà vera quando il rapporto fra i guadagni della mutua cooperazione ( b c ) e i guadagni di un singolo periodo di defezione ( a c ) è maggiore rispetto alla probabilità di termine. Ma * è instabile, piccole deviazioni da * non ritornano
Figura 7.1. L’effetto rappresaglia. è la frazione che gioca la strategia “occhio per occhio” (tit-for-tat); ( *,1] è il bacino d’attrazione dell’equilibrio cooperativo. Nota che un incremento nella probabilità di termine (linee tratteggiate) riduce il costo atteso delle punizione futura per un individuo che defeziona e diminuisce il bacino d’attrazione dell’equilibrio cooperativo =1, spostando l’equilibrio instabile da * a +.
indietro a *. Questo perché d { ( ) ( )} <0 d D
T
(7.4)
violando la condizione di stabilità: un incremento in riduce il payoff atteso di D rispetto a T . Ma dato che i payoff sono uguali in *, questo significa che il payoff
SCAMBIO: CONTRATTI,NORME E POTERE
|13
atteso di D deve essere inferiore a T per > *, e ciò, per il processo dinamico descritto nel capitolo 2, porterà ad un incremento di piuttosto che ad un ritorno a *. Come risultato ci sono tre frequenze di popolazione d’equilibrio, ossia 0, * e 1,
e di queste la prima e la terza sono stabili. L’equilibrio instabile * definisce il confine tra il bacino d’attrazione dei due equilibri stabili. E’ facilmente confermato che la condizione (7.3) implica che il payoff della strategia T in una popolazione con nessuno che defeziona eccede il payoff dal defezionare in quella stessa popolazione, ovvero b / > a + (1 )c / , rendendo la strategia T una migliore risposta a se stessa. Ricordate che la strategia “occhio per occhio ” è una strategia stabile dal punto di vista evolutivo contro la defezione incondizionata se esiste una qualche frazione positiva di D in questa popolazione, μ , tale che se la parte della popolazione che gioca D è al di sotto di μ , il processo differenziale di replica dei tratti porterà alla sua eliminazione e, quindi, un’invasione effettuata da un gruppo di persone che defeziona costituito da una frazione inferiore a μ della popolazione fallirà. Laddove la (7.3) è valida, “occhio per occhio” è una strategia stabile dal punto di vista evolutivo e il valore critico di μ nella definizione precedente è pari a 1 * . Ne derivano due risultati. Primo, l’interazione avrà un equilibrio di cooperazione universale se la probabilità di termine è sufficientemente bassa (anche defezione universale rimane un equilibrio). Questo deriva direttamente dalla condizione (7.3). Secondo, un incremento nella probabilità di termine incrementerà *, diminuendo la grandezza del bacino d’attrazione dell’equilibrio cooperativo.
Questo perché (dall’equazione (7.2)), d * (b c) * = d (c d)
2
2
(7.5)
che deve essere positivo se i payoff iniziali sono un dilemma del prigioniero e se * > 0 .
Modello 2: Segmentazione. L’equilibrio di mutua defezione nel semplice gioco di scambio a turno unico descritto all’inizio era basato sull’ipotesi che i membri della popolazione fossero accoppiati casualmente per interagire. Ma l’accoppiamento non casuale è una caratteristica frequente di molte strutture d’interazione. Alcuni esempi sono rappresentati dai membri di una popolazione che risiedono in un villaggio, che sono impegnati in frequenti scambi con gli altri residenti e che solo occasionalmente scambiano beni in un unico mercato che serve tutta la popolazione. La probabilità di essere associato ad un cooperatore allora dipenderà dal proprio tipo e sarà legata alla
14 | MICROECONOMIA
diversa frequenza dei cooperatori nei villaggi. I gruppi etnici possono differire nella frequenza dei cooperatori e membri di tutti i gruppi possono interagire più frequentemente con gli “insiders” piuttosto che con gli “outsiders”. I cooperatori possono cercare di evitare coloro che defezionano e usare un segnale rumoroso del tipo per selezionare il proprio partner. Quando l’accoppiamento è non casuale, la probabilità di incontrare qualcuno che corrisponde al proprio tipo (un individuo che adotta la stessa strategia) è in genere maggiore della stessa frazione della popolazione – un fenomeno chiamato assortimento positivo. Quando questo succede, la cooperazione può essere stabile dal punto di vista evolutivo anche in interazioni a turno unico. Assumiamo che gli individui in una popolazione numerosa possano essere o persone che defezionano o cooperatori in un dilemma del prigioniero della durata di un periodo e, come prima, periodicamente aggiornino il loro tipo come risposta al successo relativo delle due strategie. Le comunità nelle quali coloro che effettuano scambi sono segmentati sono più omogenee riguardo al tipo rispetto alla popolazione nel suo complesso, con i simili che tendono a raggrupparsi con i propri simili. Il raggruppamento dei simili con i propri simili attenua il problema dell’opportunismo quando i contratti sono incompleti poiché cooperare in un dilemma del prigioniero conferisce vantaggi a quelli con i quali uno interagisce, mentre defezionare infligge dei costi. In questo modo, poiché l’assortimento positivo accoppia i simili con i propri simili, ciò aumenta i payoff dei cooperatori e diminuisce quello di coloro che defezionano. La segmentazione cioè ha l’effetto di internalizzare sia il beneficio non contrattabile della mutua cooperazione sia della defezione. Colui che defeziona non sostiene il costo della propria defezione, ma qualche altro che defeziona lo fa e questo riduce la probabilità che i cooperatori cambieranno la strategia in quella della defezione quando si aggiorneranno. Un argomento simile è valido per i benefici che i cooperatori conferiscono: con la segmentazione questi benefici sono internalizzati all’interno del gruppo dei cooperatori. La segmentazione cioè supporta una maggiore frequenza di tratti pro-sociali in una popolazione. Ovviamente, sarà nell’interesse di coloro che defezionano cercare di disturbare i sistemi che portano all’assortimento positivo, evitando la rilevazione, commerciando in preferenza in comunità dove le frequenze dei cooperatori sono superiori alla media e così via. Supponiamo che le persone vivano in villaggi che sono omogenei per tipo e una frazione s delle loro interazioni abbia luogo nel loro villaggio, e che il resto avvenga nella città dove i tipi sono misti. Definiamo nel seguente modo il grado di segmentazione: se la frazione della popolazione che è costituita da cooperatori è , la probabilità che un cooperatore sia in coppia
SCAMBIO: CONTRATTI,NORME E POTERE
|15
Figura 7.2. Un incremento nella segmentazione aumenta la frequenza dei cooperatori. I payoff mostrati permettono un equilibrio interno stabile. Ma in assenza di segmentazione (linee continue) il risultato che si ottiene è la defezione universale. Con la segmentazione, la frazione di cooperatori è *.
con un tipo che è cooperatore non è più ma s + (1 s) , dove s è il grado di segmentazione della popolazione.4 In modo corrispondente, la probabilità che uno che defeziona incontri un suo simile è ora s + (1 s)(1 ) . Se s =1, i simili sono accoppiati con i propri simili qualunque sia la composizione della popolazione e, se s = 0 , l’accoppiamento è casuale
e i sotto-gruppi omogenei non sono necessari affinché avvenga la segmentazione; l’esempio del “villaggio” e della “città” è solo un caso particolarmente ovvio. Prendiamo la regola di formazione delle coppie derivante dal grado di segmentazione come una caratteristica data in modo esogeno del raggruppamento dei tipi supportata dai recinti delle residenze, confini etnici o qualsiasi altra caratteristica strutturale che fa sorgere un abbinamento non casuale. Siano ( ,s) e ( ,s) relativamente i payoff attesi dei cooperatori e di coloro che defezionano in una popolazione, dei quali sono cooperatori, i cui membri C
D
sono accoppiati in modo non casuale secondo il grado di segmentazione s . Allora si ha, ( ,s) = sb + (1 s){b + (1 )d } ( ,s) = sc + (1 s){a + (1 )c} C
D
4
Il grado di segmentazione è quindi simile al grado di parentela nei modelli genetici.
(7.6) (7.7)
16 | MICROECONOMIA
Il livello di equilibrio della cooperazione nella popolazione è dato dal valore di che eguaglia i precedenti payoff attesi, ossia
* =
s(d b) + c d (1 s)(b d a + c)
(7.8)
Tabella 7.3. Payoff per la variante Ispettiva del gioco di scambio
Ispeziona
Defeziona
Ispeziona
b , b
c , c
Defeziona
c, c
c, c
A seconda della matrice dei payoff, questo equilibrio può essere stabile o instabile; in quest’ultimo caso, * segna il confine tra il bacino d’attrazione degli equilibri stabili ad =1 e = 0 . La figura 7.2 illustra il caso in cui * è un equilibrio interno stabile. La condizione per la stabilità nella dinamica di replica richiede che il denominatore della precedente espressione per * sia negativo, richiedendo per > 0 che anche il numeratore sia negativo. L’intuizione dietro questo risultato è
chiara dalla figura: l’inclinazione della funzione del payoff atteso dal Defezionare, cioè (1 s)(a c) deve eccedere quella di Cooperare, (1 s)(b d) . La stabilità quindi si ha quando il vantaggio della defezione unilaterale nei confronti di un cooperatore (a b) è maggiore della penalità di cooperare contro un individuo che defeziona (c d) .
Quattro risultati ne conseguono. Primo, esiste qualche valore s <1tale che la cooperazione universale è un equilibrio. E’ semplicemente il valore di s per il quale * =1 o (a b) / a c) , che è minore di 1 in quanto i payoff del dilemma del
prigioniero sono tali che b > c . Secondo, esiste un qualche valore s <1 tale che per s maggiore di questo valore un qualche livello di cooperazione può essere sostenuto come equilibrio. Questo è il valore di s per il quale * = 0 o (c d) /(b d) , che è minore di 1 in quanto c < b . Terzo, se * è stabile, un incremento nella segmentazione incrementerà la frequenza della cooperazione nella popolazione. Questo perché d * / ds ha il segno di (c b)(b d a + c) , che è positivo per un equilibrio stabile. Quarto, se * è instabile, un incremento nella segmentazione allargherà il bacino di attrazione dell’equilibrio di cooperazione universale (le ragioni sono analoghe a quelle fornite in precedenza). Modello 3: Reputazione. Alcune interazioni sono anonime, ma in molti casi sappiamo qualcosa della persona con la quale abbiamo a che fare e, in molti casi, ciò fa la differenza. Se è così, stabilire una reputazione di soggetto che coopera in modo condizionale sarà spesso una strategia d’equilibrio. Supponiamo che un individuo
SCAMBIO: CONTRATTI,NORME E POTERE
|17
possa determinare se un partner è un cooperatore condizionale pagando un “costo d’ispezione” > 0 . Un cooperatore condizionale è uno che ispeziona e risponde ad un partner che coopera cooperando e ad uno che defeziona defezionando; chiamiamo questi individui Ispettori. Il solo altro tipo è Defezione incondizionata (tabella 7.3). Tabella 7.4. come l’aggiornamento dei payoff basati su scambi all’interno del gruppo può supportare la cooperazione Modello
Effetto che favorisce la cooperazione
Minaccia
Struttura necessaria dell’ interazione
Esempi
Ritiro dalla successiva cooperazione
Interazioni frequenti o di Taylor (1987) lunga durata (basso) Fudenberg and Maskin (1986) Reputazione Reputazioni cooperative Basso costo Kreps (1990), Shapiro (1983) sono ricompensate d’informazione circa gli Nowak and Sigmund (1998) altri (basso) Segmentazione Accoppiamenti Accoppiamenti non Hamilton (1975), Axelrod vantaggiosi per i casuali degli agenti (alto) and Hamilton (1981),Grafen cooperatori (1979)
Sia [0,1] la frequenza degli Ispettori nella popolazione. Fin quando esiste un costo d’ispezione ci sarà un equilibrio di defezione universale in cui = 0 . E se b c > , ci sarà un altro equilibrio =1 con solo Ispettori presenti. Se entrambe le strategie sono presenti in equilibrio, esse devono avere gli stessi payoff attesi ossia ( ) = ( ) . Questi payoff sono: I
D
( ) = (b ) + (1 )(c ) ( ) = c I
D
(7.9)
e uguagliando queste espressioni si ottiene * =
b c
(7.10)
Ma in questo equilibrio d { ( ) ( )} / d > 0 , così * è instabile e rappresenta il confine tra il bacino d’attrazione dei due equilibri =1 e = 0 . Poiché I
D
d * / d > 0 , un incremento nel costo del determinare il tipo del proprio partner
ridurrà il bacino d’attrazione dell’equilibrio in cui tutti sono Ispettori. Così, un minor costo sostenuto per conoscere il tipo di coloro con i quali un individuo interagisce può rendere possibile un equilibrio nella popolazione in cui costruirsi una reputazione di cooperatore condizionale paga come strategia. Nei modelli presentati sopra, la cooperazione è sostenuta tra soggetti individualisti che effettuano scambi e i cui comportamenti evolvono secondo un processo di aggiornamento monotonico nei payoff. “Se ognuno badasse a sé”, come
18 | MICROECONOMIA
ha detto Alice, “il mondo andrebbe meglio”. I modelli hanno mostrato come strutture d’interazione che permettono ritorsione, segmentazione e reputazione possano favorire l’evoluzione di comportamenti apparentemente altruistici per convertire la cooperazione da un comportamento individualmente costoso in uno che conferisce benefici non solo agli altri ma anche all’individuo stesso (rendendo la cooperazione un comportamento mutualistico nei termini del capitolo 3). La tabella 7.4 riassume questi modelli. Le norme che permettono scambi di mercato mutuamente vantaggiosi non sono le restanti vestigia di un ordine sociale pre-mercato, e neanche sono una semplice espressione di una qualche innata predisposizione alla cooperazione o qualche altro inspiegabile deus ex machina. Le norme di mercato sono sostenute dalle strutture di mercato e da altre interazioni sociali nelle quali coloro che effettuano degli scambi sono coinvolti abitualmente. Bronislaw Malinowski (1926:40), scrivendo a riguardo degli schemi di scambio tra gli abitanti delle Isole Trobriand, concludeva: La vera ragione perché tutte…le obbligazioni economiche sono normalmente mantenute, e mantenute molto scrupolosamente, è che fallire nella loro osservanza mette un uomo in una posizione intollerabile…Il cittadino onorabile è obbligato ad affrontare i suoi doveri, sebbene la sua sottomissione non sia dovuta a un qualche istinto o impulso intuitivo o misterioso “sentimento di gruppo”, ma al dettagliato ed elaborato funzionamento di un sistema in cui ogni azione ha il suo proprio posto e deve essere eseguita senza fallire…Ognuno è ben consapevole della sua esistenza e in ogni caso concreto può prevedere le conseguenze.
Lo stesso si potrebbe dire degli odierni mercati assicurativi, degli affari con i diamanti o del funzionamento interno della maggior parte delle imprese moderne.
I N F O R M A Z IO N E
A S IM M E T R IC A
E
RELAZIONI
P R I N C I PA L E -
AGENTE
Il precedente processo di scambio è stato modellato come un gioco simmetrico ma spesso si ha il caso in cui le parti coinvolte nello scambio sanno cose diverse e possono fare cose diverse. Quello che le persone conoscono e il tipo di azioni che possono intraprendere sono spesso determinati dalla loro locazione strutturale nel processo di scambio. Un lavoratore, per esempio, conoscerà certamente con quanto impegno ha lavorato nell’ultima ora o se non ha lavorato per niente, mentre il suo datore di lavoro può non saperlo. Il datore di lavoro, invece, può essere capace di andare oltre nei suoi obiettivi impegnando se stesso in un’offerta salariale del tipo “prendere o lasciare”, mentre il lavoratore può non essere capace di beneficiare della stessa proposta per fornire un certo ammontare di servizi lavorativi per un salario dato. Queste asimmetrie sorgono perché il datore di lavoro ha un vantaggio da first
SCAMBIO: CONTRATTI,NORME E POTERE
|19
mover e il lavoratore ha informazione privata (i.e. conosce qualcosa in merito ad un vantaggio potenziale che l’altro non conosce). La prima è un’asimmetria strategica: l’insieme delle azioni del datore di lavoro include azioni potenzialmente vantaggiose non possibili per il lavoratore – in questo caso impegnarsi preventivamente. Il secondo è un esempio di informazione asimmetrica. Non sorprendentemente, il datore di lavoro userà l’asimmetria strategica per tentare di superare i problemi della disciplina sul lavoro che sorgono dalle asimmetrie informative. Quando una parte coinvolta in una interazione ha informazioni non conosciute dagli altri, diciamo che l’informazione è asimmetrica (altrimenti, l’informazione è simmetrica). L’informazione è incerta se l’informazione rilevante è rivelata (“mossa della natura”) dopo che almeno una parte nella interazione ha effettuato la sua scelta (altrimenti l’informazione è certa). Si ha informazione incompleta quando all’inizio dell’interazione ad almeno una parte alcune informazioni rilevanti non sono rivelate. Qualche volta si propone l’informazione asimmetrica quale fonte dell’incompletezza contrattuale. Ma questo non è del tutto corretto. Ciò che importa per la realizzabilità di un contratto completo e per far sì che possa esserne assicurato l’enforcement da una terza parte non è solo che l’informazione rilevante sia conosciuta, ma anche che l’informazione sia verificabile, cioè ammissibile in un tribunale o in qualche altro ente che sia capace di farne rispettare i termini. Il problema dell’enforcement dei contratti dipende dalle istituzioni anche in altri modi. L’abilità di un prestatore di fondi di far osservare un contratto di debito nei confronti di un prenditore di fondi può essere enormemente influenzata dal fatto che la società in questione mandi in prigione coloro che non sono capaci di pagare i propri debiti. Il Monte dei Paschi di Siena, forse la più vecchia banca del mondo (fondata nel 1472), per circa un secolo ha avuto il diritto di giustiziare i debitori inadempienti e, senza dubbio, ha beneficiato di questa opzione in più nel suo insieme di strategia (a meno che, ovviamente, gli inadempienti avessero studiato teoria dei giochi e capito che dar vita alla minaccia non avrebbe potuto essere il modo più efficace per la banca di raccogliere denaro). Le transazioni tra prestatori e prenditori di fondi o datori di lavoro e lavoratori fanno parte di una larga classe di scambi che può essere modellata come relazioni tra principale e agente. Queste sono chiamate problemi di agenzia; sorgono quando o le azioni o gli attributi dell’agente (o un progetto dell’agente) riguardano il beneficio netto usufruito dal principale ma non sono noti al principale o non sono verificabili. (Il prestatore e il datore di lavoro sono il principale; il prenditore e il lavoratore, l’agente). Il problema degli attributi nascosti è talvolta chiamato selezione avversa (e.g.
20 | MICROECONOMIA
coloro che sanno di essere malati compreranno più assicurazioni sulla salute di coloro che sanno di stare bene). Il problema delle azioni nascoste è chiamato azzardo morale, termine che prende la sua origine dal settore assicurativo ed esprime la preoccupazione che l’assicurato possa prendere più rischi di quello che farebbe in assenza di una copertura assicurativa. La forma canonica di un problema di azzardo morale è la seguente: quando una parte, il principale (P) trae benefici da un’azione ( a ) che viene effettuata da un’altra parte (A), l’agente, che è costosa da eseguire per A e che non è soggetta ad una contrattazione che possa essere fatta rispettare senza costi, chiamiamo P il principale e A l’agente. Un’implicazione cruciale di questa definizione è che P è il titolare del diritto al residuo (residual claimant)5 di qualche conseguenza non contrattabile delle azioni di A, cioè che quello che A fa influenza il benessere di P dopo che tutte le obbligazioni contrattuali di P sono state rispettate. Il risultato influenzato dalle azioni dell’agente, q , è osservabile: q = (a) + μ
(7.11)
dove μ è un’influenza stocastica non osservata su q con media zero. Ma a non è osservabile da P o è osservabile ad un costo sufficientemente alto da rendere non realizzabile la contrattazione di a . Se non fosse per il fatto che μ è inosservabile, il principale potrebbe dedurre qualcosa a riguardo di a osservando q e conoscendo la funzione () e μ . La funzione obiettivo di P è (q(a),...) ; quella di A è u(a,...) , con q' e u di segno opposto (cosicché c’è un conflitto d’interesse tra P ed A sul livello di a ). Per far sì che sorga un problema principale-agente sono q
a
necessarie e sufficienti due caratteristiche di una interazione: deve esistere un conflitto d’interessi su qualche aspetto dello scambio che non è soggetto ad una contrattazione che può essere fatta rispettare (enforced) senza costi. Una seconda comune forma del problema tra principale e agente sorge quando l’agente A fa parte di una squadra di n agenti ingaggiati dal (singolo) P, come nel i
caso del lavoro di squadra studiato nel capitolo 4. Nel caso precedente, (data l’equazione 7.11), l’influenza stocastica su q rende impossibile per P determinare le azioni di A; nel secondo caso, la natura di lavoro di squadra dell’attività degli agenti rende impossibile trarre delle conclusioni da una qualsiasi data azione dell’agente, anche se l’output è conosciuto ed è una funzione deterministica delle azioni degli agenti. 5
Per titolare del diritto al residuo (residual claimant) si intende colui che vanta per ultimo i diritti su una determinata azione o bene dopo che sono state adempiute tutte le obbligazioni direttamente collegate all’azione o al bene stesso.
SCAMBIO: CONTRATTI,NORME E POTERE
|21
Quando i diritti che sorgono da uno scambio non possono essere fatti osservare da una parte terza (i tribunali), una o entrambe le parti coinvolte nello scambio adotteranno strategie per assicurarsi vantaggi nella transazione. Bowles e Gintis (1993) chiamano questo comportamento enforcement endogeno perché le parti coinvolte nello scambio impegnano se stesse in attività contrattuali volte a far rispettare l’accordo piuttosto che lasciare questo compito a soggetti esterni al processo di scambio che sono specializzati nell’attività di enforcement degli accordi (ancora una volta, i tribunali). Tabella 7.5. Esempi di relazioni principale-agente
Bene o servizio
Aspetto non contrattabile
servizi lavorativi
impegno lavorativo, attenzione
Osservanza endogena
Principale/agente
rinnovo contingente datore di lavoro/lavoratore
servizi manageriali impegno, Suddivisione dei massimizzazione dei profitti, rinnovo profitti dei proprietari contingente
proprietario/ manager
debito
livello di rischio preso
collaterali, suddivisione del controllo
prestatore di fondi/ prenditore di fondi
debito pubblico
probabilità di insolvenza
sanzioni commerciali, governo creditore/ altri interventi governo debitore
beni
qualità del prodotto
rinnovo contingente compratore/venditore da parte del compratore
Politiche pubbliche scelta e implementazione
rinnovo contingente, cittadino/governo referendum ufficiale
contratto di locazione residenziale
cauzione, rinnovo contingente
cura della residenza, pertinenze
proprietario/inquilino
contratto di impegno lavorativo e suddivisione dei diritti proprietario/mezzadro locazione agricolo qualità, cura del rimanenti terreno noleggio di equipaggiamento
Cura dell’ equipaggiamento
deposito, comproprietà dell’ equipaggiamento
proprietario/ noleggiante
L’enforcement endogeno può essere perseguito trasferendo il controllo su alcune azioni che non sono contrattabili dall’agente al principale (come nel caso in cui un banchiere diventa membro del consiglio direttivo di una impresa alla quale la banca
22 | MICROECONOMIA
ha prestato fondi), o richiedendo cauzioni (up-front fees), obbligazioni o garanzie collaterali o dando all’agente una parte dei guadagni che derivano dal progetto, ognuna delle quali rivolta a ridurre il grado di conflitto d’interesse tra il principale e l’agente. Un’altra comune strategia di enforcement endogeno di un contratto è quella, per P, di offrire ad A una transazione di maggior valore rispetto alla prossima miglior alternativa di A e quindi monitorare le azioni di A, promettendo di rinnovare ad A il contratto condizionatamente ad un livello di a rivelato dal monitoraggio, e di terminare la relazione altrimenti. Questa strategia è chiamata enforcement endogeno con rinnovo contingente; è efficace perché A riceve una rendita incentivante (enforcement rent)6 uguale alla differenza tra la valutazione di A di questa transazione e la sua prossima miglior alternativa. A è disposto a prendere in considerazione gli obiettivi di P che riguardano il livello di a , sapendo che il fallire nel far questo avrà come risultato (con qualche probabilità) la perdita della rendita (cioè del rinnovo del contratto contingente alla prestazione dell’agente). La tabella 7.5 elenca alcune delle più importanti relazioni principale-agente. Notate che queste comprendono alcuni dei più importanti mercati di una moderna economia capitalistica: lavoro, credito e management. I modelli di rinnovo contingente si applicano anche a relazioni non di mercato quale l’esempio delle politiche pubbliche riportato nella tabella. Altre applicazioni non trattate qui sono le “relazioni patrono cliente” (Fafchamps 1992, Platteau 1995) e le relazioni tra uomini e donne nelle coppie. Il cliente e la donna forniscono servizi difficili da monitorare (e.g. lealtà durante i conflitti politici e cura dei bambini, rispettivamente) in contropartita di una quantità ben definita (posto di lavoro assegnato dal patron, una parte del salario). Alcuni dei problemi principale-agente nella tabella 7.5 sorgono perché una delle parti non è sufficientemente benestante. Per esempio, se il mezzadro fosse abbastanza benestante, sicuramente comprerebbe la terra che lavora piuttosto che lavorare sotto un contratto di suddivisione. In altri casi, la ricchezza delle parti coinvolte nello scambio ha una influenza maggiore sulla natura del sottostante problema di incentivo. Un finanziatore che ha investito sostanziali somme della propria ricchezza in un progetto sarà creduto da colui che prende in prestito quando afferma con convinzione che se finanzia il progetto questo avrà successo. Poiché molte persone hanno un livello abbastanza limitato di ricchezza, i diritti di proprietà che detengono – se posseggono la terra o la affittano, per esempio – e, pertanto, se essi sono i titolari del diritto al residuo dei risultati delle loro azioni non contrattabili, 6
Cioè una rendita collegata a quei comportamenti, a quelle strategie in relazione al contratto stesso che fanno sì che si abbia “enforcement endogeno”.
SCAMBIO: CONTRATTI,NORME E POTERE
|23
dipenderanno da come funziona il mercato del credito. I mercati del credito sono così sia un esempio importante delle relazioni principale-agente, sia un punto chiave per capire le istituzioni che governano altri problemi di contrattazione incompleta. Ritorneremo sul mercato del credito nel capitolo 9. Mentre i dettagli differiranno da un problema principale-agente all’altro, qualche volta in modi essenziali, la struttura sottostante del problema può essere chiarita da un semplice modello di un problema che può sorgere in quanto la qualità di un bene non è soggetta al contratto. Offro una rapida visione d’insieme del modello qui come anticipazione delle importanti applicazioni dell’incompletezza contrattuale; modelli simili saranno sviluppati in modo più completo nei capitoli 8 e 9. Svolgete il problema 17 se siete curiosi di sapere come funziona il modello. Consideriamo il fornitore di un bene la cui qualità può essere variabile. L’utilità del fornitore per periodo dipenderà esclusivamente dal prezzo pagato dal compratore (di cui solo un’unità, al più, sarà fornita), e dalla qualità del bene fornito ( q [0,1] ). Così possiamo esprimere l’utilità del fornitore come u = u( p,q) . Fornire qualità richiede impegno, e quindi è oneroso, così u è crescente e concava nei confronti del primo argomento e decrescente e convessa nei confronti del secondo. Il compratore compra questi beni da n fornitori identici, li trasforma in un qualche modo (forse mettendoci semplicemente un’etichetta) e quindi li vende ai consumatori. La qualità del bene non è soggetta ad una contrattazione enforceable senza costi. Forse il bene, come una bottiglia di vino o un complicato pezzo di un software personalizzato, deve essere usato prima che la sua qualità venga determinata. Per semplicità assumo che la qualità del bene è conosciuta al compratore a seguito dell’acquisto, ma questa informazione non è verificabile e, quindi, la qualità non può essere specificata nel contratto. Gli identici fornitori forniscono tutti la stessa qualità q così che i ricavi che derivano dalla vendita del prodotto ai consumatori siano esattamente r(qn) , che è crescente e concava nel suo argomento. Dato che affronta l’incompletezza contrattuale, il compratore offre al fornitore il seguente contratto con rinnovo contingente: il compratore annuncia un prezzo p con la promessa di continuare la transazione nei periodi successivi a meno che il compratore trovi che la qualità dei beni forniti sia inadeguata, nel qual caso la transazione sarà interrotta, e ciò può accadere con probabilità t(q) dove t' < 0 (fornire più qualità diminuisce la probabilità di interruzione). Il compratore determinerà per primo le funzione di miglior risposta del fornitore (sono identiche), esprimendo la qualità fornita come funzione del prezzo offerto. Il fornitore varierà q per massimizzare il valore attuale dell’utilità attesa v ,
24 | MICROECONOMIA
dove v dipende dalla funzione di interruzione t(q) , dalla posizione di riserva dei fornitori (anch’essa un valore attuale) qualora la transazione sia interrotta z , e dal prezzo offerto dal fornitore p , ossia v = v(q; p,z) . Fissando v = 0 si ottiene la funzione di miglior risposta del fornitore q( p) . (Questa funzione è derivata nel q
capitolo 8 per un problema simile; vedete le equazioni dalla 8.2 alla 8.5). La funzione di miglior risposta che ne deriva può essere scritta u = t'(v z)
(7.12)
q
richiedendo che il fornitore uguagli il costo marginale di fornire qualità (lato sinistro dell’equazione (7.12)) al beneficio marginale di fornire qualità (il lato destro). In altre parole, scegliere q in modo che la disutilità marginale di fornire maggiore qualità sia uguale alla riduzione nella probabilità d’interruzione generata dal fatto di fornire maggiore qualità (t') , moltiplicata per il vantaggio netto della transazione rispetto alla posizione di fallback (v z) . Il compratore pertanto saprà che (nei valori economicamente rilevanti delle variabili) q'( p) > 0 . La ragione è che maggiore è il prezzo offerto, maggiore è il valore della transazione per il fornitore e maggiore la qualità che egli fornirà per evitare l’interruzione della transazione. La funzione di miglior risposta q( p) , mostrata nella figura 7.3, è anche definita vincolo di compatibilità dell’incentivo fronteggiato dal compratore. Notate che, se il compratore offrisse un prezzo tale che il vincolo di partecipazione del fornitore fosse soddisfatto come uguaglianza, ossia v(q( p); p,z) = z , il lato destro dell’equazione (7.12) sarebbe uguale a zero e, quindi, il
fornitore non affronterebbe alcuna disutilità marginale positiva nel fornire qualità poiché non ci sarebbe alcun costo d’interruzione. Come risultato il fornitore avrebbe semplicemente fissato q = 0 . Assumo che questo non massimizzi il profitto per il compratore. Il profitto del compratore è dato dai ricavi meno il costo di acquistare i beni, così egli varia p e n , il numero dei fornitori con i quali contrattare, per massimizzare = r(nq( p)) pn . Fissando le derivate parziali e uguali a zero si hanno le n
p
condizioni del primo ordine del compratore: qr' = p q = q' p
(7.13)
Queste condizioni portano il compratore a fissare n (il numero di unità comprate) in modo che il ricavo marginale sia uguale al prezzo e a fissare il prezzo in modo che l’effetto marginale del prezzo sulla qualità ( q' ) sia uguale alla qualità media
SCAMBIO: CONTRATTI,NORME E POTERE
|25
per dollaro (o euro) di spesa ( q / p ). Il massimo profitto che ne risulta è illustrato nella figura 7.3, dalla quale si vede chiaramente che q' è l’inclinazione della funzione di miglior risposta (l’effetto marginale del prezzo sulla qualità) e q / p è il rapporto medio qualità/prezzo dato dalla retta uscente dall’origine. Poiché v(q*; p*,z) > z , fornitori identici a quelli qui modellati ma non coinvolti in alcuna transazione (e riceventi il fallback z ) preferirebbero effettuare transazioni col compratore. Essi possono cercare di disturbare la transazione precedente offrendo un prezzo più basso e promettendo una maggior qualità. Ma ricordate che siccome tutti gli agenti sono identici, il fornitore riconoscerebbe la promessa di comportarsi in un modo diverso dalla funzione
Figura 7.3. Prezzo d’equilibrio e qualità. Il compratore massimizza i profitti selezionando un prezzo tale che q' = q / p.
di miglior risposta come falso e rifiuterebbe l’offerta. In un equilibrio competitivo, il fornitore riceve in tal modo una rendita al di sopra della sua miglior prossima alternativa. Sette caratteristiche dell’equilibrio appena descritto sono di notevole interesse. Esse non sono specifiche di questo esempio, ma si presentano in modo abbastanza
26 | MICROECONOMIA
generale nei modelli di rinnovo contingente delle relazioni tra principale-agente. Tutte saranno ulteriormente sviluppate nei capitoli successivi. Un equilibrio Pareto-Inefficiente. Dato che il problema di ottimizzazione del compratore prende come vincolo la funzione di miglior risposta del fornitore (vincolo di compatibilità dell’incentivo) anziché il vincolo di partecipazione del fornitore (ossia, v z ) e dato che i due differiscono, l’equilibrio competitivo p * , q * non può essere un ottimo Paretiano. Questo perché in equilibrio v = 0 = . Il fornitore e il compratore hanno fissato queste derivate uguali a zero nel risolvere i loro rispettivi problemi di massimizzazione. Come risultato, in equilibrio, essi sono indifferenti a variazioni sufficientemente piccole rispettivamente in qualità e in prezzo. Ma in equilibrio è anche vero che > 0 e v > 0 , cioè, il compratore p
p
p
p
beneficia da una maggiore qualità e il venditore beneficia da un prezzo più alto. Se questo è il caso, esiste un qualche incremento sia in p che in q che porrebbe sia il venditore che il compratore in una situazione migliore. Un caso correlato sarà esaminato nel prossimo capitolo. Rendite d’equilibrio. Il fornitore riceve una rendita al di sopra della sua prossima migliore alternativa (v > z) . Questo succede malgrado il fatto che agenti esclusi dalla transazione sono liberi di tentare di abbassare l’offerta di coloro che stanno effettuando transazioni. La differenza v z è chiamata “rendita” perché è l’ammontare che eccede il valore della prossima migliore alternativa del lavoro del fornitore. Questa rendita incentivante (enforcement rent) insieme alla minaccia d’interruzione induce il fornitore ad offrire un livello più alto di qualità. Equilibrio senza mercati in bilancio (Market Clearing).7 L’esistenza di una enforcement rent del fornitore implica che in equilibrio i mercati non sono in bilancio, dato che una condizione a ciò necessaria è che tutti coloro che scambiano devono essere indifferenti tra la loro transazione corrente e la loro prossima migliore alternativa. I compratori si trovano sul lato corto del mercato (il lato in cui il numero desiderato di transazioni è minimo), mentre i fornitori si trovano sul lato lungo del mercato. In equilibrio, alcuni dei fornitori proferirebbero effettuare transazioni al prezzo d’equilibrio ma non vi riescono (sono vincolati in quantità). Transazioni diadiche durevoli. Il compratore e il venditore interagiranno per molti periodi, anche se ci sono molti compratori e venditori identici; l’equilibrio competitivo sarà caratterizzato più da una serie di durevoli isole di scambio bilaterali che da un mare di anonimi scambiatori impegnati in interazioni a turno unico in un
7
Si ha “market clearing” quando al prezzo di equilibrio, quantità domandata e offerta sono uguali.
SCAMBIO: CONTRATTI,NORME E POTERE
|27
mercato a pronti. “Price Making”. Il compratore è un “price maker”, cioè uno che “fa’” il prezzo, non un “price taker” cioè uno che prende il prezzo come dato come nel modello competitivo standard con contratti completi. La ragione per la quale il compratore non tratta il prezzo come parametrico è l’incompletezza contrattuale concernente la qualità del bene. Il “price making” non deriva da alcun aspetto non competitivo della ipotizzata struttura di mercato. “Endogenous Claim Enforcement” attraverso l’esercizio del potere. Il compratore massimizza i profitti minacciando di sanzionare il fornitore con l’interruzione della transazione e il ritiro della enforcement rent. A causa di questa minaccia sanzionatoria, il fornitore agisce in un modo nel quale non si sarebbe comportato in assenza della minaccia. Cioè, il compratore beneficia dell’abilità di esercitare potere sul fornitore. Quando una o più parti in uno scambio usano sanzioni effettive o minacciate per far pressione sui diritti abbiamo un caso di enforcement endogeno. Preferenze endogene. Il compratore è interessato al processo psicologico di decisione del fornitore, ossia alla disutilità dell’impegno, alla valutazione soggettiva della transazione, al fallback e così via. Inoltre, il compratore ha un mezzo per apportare cambi nelle preferenze del fornitore. La ragione è che il compratore ha offerto e assicurato dall’inizio una relazione con il fornitore in termini che danno al compratore autorità. Cioè, il compratore ha anche un’opportunità di influenzare l’evoluzione psicologica del fornitore strutturando le loro interazioni in un modo che riduce la disutilità dell’impegno, se questo può essere trovato. Quello che differenzia questo dal caso della contrattazione completa non è il fatto che il compratore si interessa delle preferenze del fornitore. Piuttosto, è che il compratore interagisce per un periodo esteso di tempo con lo stesso fornitore, e così entrambi si interessano delle rispettive preferenze, e il compratore ha l’opportunità di influenzare le preferenze di questo particolare fornitore. Al contrario, il mercato a pronti associato alla contrattazione completa presenterebbe il compratore come un soggetto che affronta un problema di fornitura di bene pubblico. Tutti i compratori avrebbero interesse nell’influenzare le preferenze di tutti i fornitori, riducendo la disutilità dell’impegno, dato che questo ridurrà il prezzo d’offerta per la qualità. Ma assenti alcune forme di azioni collettive (socializzazione obbligatoria per un’etica di lavoro per tutti i fornitori, ad esempio), nessuno investirebbe nella trasformazione delle preferenze dei fornitori perché i guadagni di questo investimento andrebbero divisi tra tutti i compratori e non potrebbero essere appropriati esclusivamente dell’investitore.
28 | MICROECONOMIA
C O N T R AT T I
E C O M P O RTA M E N TO N E I M E R C AT I
Così, quando i mercati sono completi, non vi è alcuna ragione economica di preoccuparsi della psicologia del processo decisionale del proprio partner di scambio o di impegni morali. Inoltre, anche se uno fosse interessato, non c’è modo che questi tratti personali possano essere influenzati. Al contrario, il precedente modello principale-agente, i modelli presentati prima di ritorsione, segmentazione e reputazione e il modello di produzione di squadra con preferenze sociali nel capitolo 4, suggeriscono tutti un diverso punto di vista – che dove i contratti sono incompleti, le reti di scambio, le imprese e altre istituzioni che si sono evolute per far fronte ai problemi di incentivazione favoriranno interazioni che sono personali, strategiche, durevoli e nelle quali sia le norme che l’esercizio del potere giocano dei ruoli importanti. Il risultato è una corrispondenza tra il grado di incompletezza contrattuale e la struttura del mercato. Questo è chiarito dalle contrastanti strutture di commercio del riso e della gomma grezza in Tailandia. Ammar Siamwalla (1978) ha notato la struttura impersonale del mercato all’ingrosso del riso – nel quale la qualità del prodotto è rapidamente testata dal compratore. Egli ha confrontato questo mercato con lo scambio personalizzato basato sulla fiducia nel mercato della gomma grezza – nel quale la qualità è impossibile da determinare al momento dell’acquisto. In modo simile, in Palanpur, India, grano e riso, così come le sementi e i fertilizzanti, sono standardizzati, prodotti facilmente valutabili, e quindi sono soggetti a contratti relativamente completi. Essi sono comprati e venduti in mercati regionali in cui le transazioni sono governate da poco più che il prezzo corrente e il vincolo di bilancio dei partecipanti. Al contrario, scambi che riguardano il lavoro, il credito, l’uso della terra e i dei servizi connessi ad una fattoria quali le mandrie, hanno luogo quasi interamente all’interno del villaggio e spesso all’interno della stessa casta. I mezzadri di Palanpur esprimono forti preferenze per contrattare con proprietari “onesti” o “franchi” i quali reciprocano questa attitudine; i contratti di mezzadria si concludono in misura sproporzionata all’interno di caste. I prestatori di denaro in un villaggio raramente estendono i prestiti a coloro che essi non conoscono o che non vivono a Palanpur.8 Lasciandosi alle spalle l’immaginario mondo degli “individui che scambiano noci per mele al margine della foresta”, del quale parla Coase, il processo di scambio non è né anonimo né momentaneo. Un’interessante implicazione è che coloro che scambiano nei mercati con contratti incompleti esibiranno comportamenti diversi rispetto a quelli che operano 8
Vedi Lanjouw e Stern (1998), in particolar modo 84-85 e 486-8.
SCAMBIO: CONTRATTI,NORME E POTERE
|29
in mercati con contrattazione completa. La ragione è che i tipi di contratto in uso influenzano la struttura economica delle interazioni e queste, a loro volta, influenzano la distribuzione d’equilibrio dei comportamenti. Questa è una delle lezioni che si ricava dai modelli in rassegna nella tabella 7.4. Ricordate che le condizioni per supportare alti livelli di cooperazione nei modelli di ritorsione, segmentazione e reputazione sono interazioni ripetute, accoppiamenti condizionati al tipo e bassi costi d’informazione per determinare il tipo degli altri individui. Questi si possono trovare in modo probabile in situazioni che si ripetono frequentemente, dove gli individui hanno contatti multilaterali o faccia a faccia quali stabili rapporti residenziali di vicinato, imprese con limitato ricambio di lavoro e simili gruppi ai quali talvolta ci si riferisce con il termine di comunità (Bowles e Gintis 2002, Ostrom, 1990) o clan (Ouchi 1980). Questo modo di pensare può aiutare a risolvere un puzzle sollevato da recenti ricerche sperimentali. In mercati sperimentali per beni coperti da contratti completi, i soggetti rapidamente raggiungono i prezzi d'equilibrio competitivo e si ha market clearing come previsto dal modello con preferenze individualistiche basate sul raggiungimento del proprio risultato. Smith e Williams (1992:121) hanno osservato che “la ricerca sperimentale sul mercato ha fornito un fondamento empirico per il sistema di convinzioni della teoria economica che era stato già ben stabilito…sotto molte condizioni i mercati sono estremamente efficienti nel facilitare il movimento dei beni”. Vernon Smith, il cui lavoro pionieristico ha aperto il campo negli anni ’70, ha concluso che l’economia sperimentale ha fornito forte supporto al convenzionale modello Walrasiano. Tuttavia, gli scienziati sociali, che avevano familiarità con le ricerche sperimentali condotte dagli psicologi, hanno trovato questa affermazione sorprendente; per quello che abbiamo visto nel capitolo 3, infatti, è stata accumulata una considerabile evidenza che fa sorgere dubbi sulle ipotesi comportamentali del modello standard. Se gli psicologi avevano ragione a riguardo dei difetti empirici delle ipotesi convenzionali riguardo i comportamenti individuali, perché i mercati sperimentali studiati da Smith e dai suoi colleghi all’Università dell’Arizona confermavano le attese degli economisti riguardo i risultati aggregati delle interazioni di mercato? Il puzzle è diventato più profondo negli anni ’90 con nuovi esperimenti di mercato effettuati da Smith e altri in cui le previsioni standard sull’equilibrio non si sono verificate. In una serie di esperimenti che simulavano mercati con beni di qualità variabile e mercati del lavoro, Ernst Fehr e i suoi co-autori all’Università di Zurigo hanno trovato che i soggetti sperimentali spesso ricevono una rendita al di sopra della loro prossima migliore alternativa e queste rendite non vengono eliminate neanche in
30 | MICROECONOMIA
ambienti molto competitivi. Coloro che offrono rendite ai loro partner di scambio in genere ottengono risultati migliori di quelli che non ne offrono. Che cosa ha contato per il successo del paradigma Walrasiano nella predizione dei risultati nei primi esperimenti in Arizona e nei successivi fallimenti nel predire i risultati ottenuti a Zurigo? Si è rapidamente stabilito che la risposta non era che gli svizzeri sono diversi dagli americani; e nemmeno che il risultato potrebbe essere dovuto a differenze nel grado di competizione nei mercati sperimentali. (Fehr e il suo gruppo spesso hanno indotto una intensa competizione in uno o nell’altro lato del mercato lasciando i compratori essere in soprannumero rispetto ai venditori e viceversa). Quando i soggetti di Zurigo erano coinvolti in esperimenti di mercato con contrattazione completa, essi replicavano i risultati ottenuti in Arizona. Invece, la differenza nei comportamenti dei soggetti in Arizona e a Zurigo è spiegata dal fatto che gli esperimenti iniziali di Smith assumevano contratti completi mentre quelli di Fehr erano basati sull’incompletezza contrattuale. Fehr e i suoi co-autori (per una rassegna, si veda Fehr e Gaechter 2000) hanno trovato che l’incompletezza contrattuale induce comportamenti reciproci tra soggetti e che questo ha effetti durevoli sull’equilibrio competitivo. Un esempio dell’importanza dell’incompletezza contrattuale è un esperimento di mercato del lavoro in cui l’impegno è selezionato dal “lavoratore” dopo che l’“impresa” ha fatto un’offerta salariale. L’equilibrio predetto da un modello con preferenze individualistiche in una interazione unica non si ottiene (ossia, offrire il salario più basso, fornire il più basso livello di impegno). Piuttosto, le “imprese” offrono salari più alti del necessario e i “lavoratori” si comportano reciprocamente lavorando più intensamente del minimo. Questo non accade quando l’esperimento è alterato in modo tale che l’impegno non è soggetto alla scelta dei “lavoratori” (completando effettivamente il contratto eliminando il suo elemento non contrattuale). In modo correlato, Peter Kollock (1992:341) ha investigato “le origini strutturali della fiducia in un sistema di scambio, piuttosto che trattare la fiducia come una variabile della personalità individuale” con risultati simili. Usando un progetto sperimentale basato sullo scambio di beni di diversa qualità, Kollock ha trovato che la fiducia e l’impegno nei confronti dei partner di scambio così come la preoccupazione per la propria e altrui reputazione emerge quando la qualità del prodotto è variabile e non contrattabile ma non quando la qualità è contrattabile. Brown, Falk e Fehr (2002) hanno progettato un esperimento di mercato per esplorare gli effetti dell’incompletezza contrattuale sugli schemi di scambio. Come nel precedente modello, il bene scambiato varia in qualità, con qualità più alta più costosa
SCAMBIO: CONTRATTI,NORME E POTERE
|31
da fornire. Nella condizione di contrattazione completa il livello di qualità promesso dal fornitore era fatto osservare dallo sperimentatore, mentre in condizione di contrattazione incompleta il fornitore poteva provvedere qualsiasi livello di qualità (a prescindere da ogni promessa o accordo con il compratore). I compratori e i venditori conoscevano il numero di identificazione di coloro con i quali stavano interagendo, così essi potevano usare le informazioni che avevano acquisito nei turni precedenti come una guida per scegliere coloro con i quali essi avrebbero voluto interagire, i prezzi e la qualità da offrire e così via. Tabella 7.6. Incompletezza contrattuale e struttura sociale del mercato: evidenza sperimentale
Struttura dell’interazione
Contratti completi
Contratti incompleti
Durata
turno unico
rinnovo contingente
Offerta
pubblica
privata
Determinazione del prezzo
contrattazione, offerte rifiutate
prezzo fissato da chi si trova sul lato corto del mercato
Relazioni tra partecipanti allo anonime scambio
fiducia, rappresaglia per imbrogli
Network di mercato
isole di scambio bilaterali
molti deboli legami
Fonte: Brown, Falk e Fehr (2002)
I compratori avevano l’opportunità di effettuare una offerta privata (piuttosto che la diffusione di una offerta pubblica) allo stesso venditore nel periodo successivo, così da tentare di avviare una relazione bilaterale con il venditore. Schemi di scambio molto diversi sono emersi sotto condizioni di contrattazione completa e incompleta. Nei primi, il 90 per cento delle relazioni di scambio sono durate meno di tre periodi (e molte di loro erano a turno unico (single shot)). Al contrario, solo il 40 per cento delle relazioni sono state di breve durata sotto condizioni di contrattazione incompleta e molti di coloro che effettuavano scambi hanno costruito relazioni di fiducia con i loro partner. I compratori in condizione di incompletezza contrattuale hanno offerto prezzi considerevolmente superiori rispetto al costo del fornitore di provvedere qualità (proprio come nel modello principale-agente della sezione precedente). Quando i compratori hanno disapprovato la qualità fornita, hanno interrotto la relazione, ritirando così la rendita che ne risultava per il fornitore. Altre differenze sono riassunte nella tabella 7.6. Le differenze erano particolarmente pronunciate negli ultimi turni del gioco, suggerendo che coloro che partecipavano allo scambio imparavano dalla loro esperienza e aggiornavano di conseguenza i loro comportamenti.
32 | MICROECONOMIA
Questi risultati sperimentali suggeriscono che la fiducia o la reciprocità possono dipendere dalla forma del contratto, con l’incompletezza contrattuale che qualche volta supporta la fiducia e i comportamenti reciproci. Anche il contrario è vero: più bassi livelli di fiducia e reciprocità potrebbero aver condotto coloro che ideavano i contratti e progettavano i pertinenti ambienti di enforcement ad essere disponibili a pagare per contratti più completi. Avner Greif (1994) ha analizzato da questa prospettiva le divergenti traiettorie culturali e istituzionali dei commercianti genovesi e maghrebini Nordafricani nel periodo del tardo medioevo. L’individualismo dei commerciati genovesi ha precluso le tecniche di enforcement contrattuale collettivo dei commercianti maghrebini, ma ha anche fornito uno stimolo per lo sviluppo e il perfezionamento da parte dei genovesi di uno stato e di altre istituzioni che coinvolgono terze parti per l’osservanza dei diritti nei contratti che hanno avuto nel tempo maggior successo (vedi box). Il processo sottostante determina congiuntamente la distribuzione di contratti e la distribuzione di norme comportamentali nella popolazione, una dinamica che spesso viene definita co-evoluzione delle istituzioni e delle preferenze. Per studiare questo processo, considerate una popolazione di compratori e venditori che sono accoppiati casualmente per una singola interazione.9 Essi scambiano un bene la cui qualità (alta (H) o bassa (L)) è determinata dal venditore ed è costosa da valutare ex-ante per il compratore. Il compratore può offrire uno tra due contratti. Se è offerto il contratto completo (C), il venditore riceve un
Le diverse traiettorie di sviluppo dei Genovesi e dei Maghrebini nel Medio Evo Può la cultura spiegare strutture istituzionali diverse, ognuna delle quali dipendente dal proprio passato? Questa è la domanda alla quale Avner Greif (1994) rivolge la sua attenzione nell’esaminare le diverse traiettorie di sviluppo delle moderne organizzazioni sociali, individualiste nell’Occidente e collettiviste nei Paesi in via di sviluppo. Secondo Greif, le convinzioni culturali (cultural beliefs), ossia quelle idee e modi di pensare comuni a molti individui che regolano i rapporti tra di essi e le relazioni con altri gruppi – e che differiscono dalla conoscenza in quanto non sono empiricamente e analiticamente provate – sono elementi fondamentali della cultura. Tra le convinzioni culturali, quelle cristallizzate rispetto ad un gioco specifico influenzano le decisioni nelle situazioni strategiche successive, fornendo dei punti di riferimento e coordinando le aspettative e, di conseguenza, influenzando la selezione degli equilibri e delle istituzioni sociali predisposte a far osservare leggi e accordi. Greif svolge un’analisi storica per vedere come diversi “cultural beliefs” portano a diverse strutture sociali: riferendosi all’XI secolo, paragona la società genovese alle società individualistiche occidentali e la società dei commercianti maghrebini alle società collettivistiche in via di sviluppo. Entrambe le società agiscono in un ambiente simile (il 9
Peter Skott ha suggerito questo modello.
SCAMBIO: CONTRATTI,NORME E POTERE
|33
Mediterraneo), hanno una simile tecnologia navale, commerciano gli stessi beni e hanno uno stesso problema da affrontare, ossia quello di stabilire relazioni di agenzia con membri esterni alla famiglia per la distribuzione delle merci destinate al commercio. Ma su questo punto, le strategie adottate dalle due società differiscono: i genovesi “individualisti” assumono un agente dal pool degli agenti disoccupati indipendentemente dal fatto che in passato essi siano stati onesti o disonesti, mentre i maghrebini “collettivisti” assumono esclusivamente dal pool degli agenti disoccupati onesti, in quanto, se disonesti in passato, vengono immediatamente segnalati e non hanno più alcuna possibilità di essere nuovamente assunti. Tuttavia, nel tardo Medio Evo, ottenere informazioni sul comportamento passato degli agenti era costoso. Ma se per i genovesi la storia passata degli agenti non contava, e quindi i mercanti trovavano ottimale impiegare solo agenti (cioè ogni individuo agiva o da mercante o da agente, ma non ricopriva entrambe le mansioni), i mercanti maghrebini, per i quali la storia era importante, partecipavano ad un network di mercanti che scambiava informazioni e quindi impiegavano altri mercanti come agenti (ossia ogni individuo poteva agire sia da mercante che fornire servizi di agenzia). Questo comportava nella società genovese che venisse pagata agli agenti una rendita affinché si comportassero in modo onesto, e ciò, dal punto di vista della distribuzione della ricchezza, permetteva una maggiore mobilità verso l’alto (verticalismo). Ciò non avveniva nella società maghrebina: il proprio impegno, sotto “cultural beliefs” collettivisti, era collegato alla propria ricchezza in modo positivo; un mercante che si comportava disonestamente non poteva più assumere agenti sotto la minaccia di punizione collettiva e quindi doveva pagare salari più alti, con saggi di guadagno più bassi sul proprio capitale. Il capitale agiva quindi come limite che segnalava onestà e che riduceva il salario ottimo richiesto per rendere un mercante onesto. Quindi i mercanti erano motivati ad assumere altri mercanti (orizzontalismo). Ma queste non sono le uniche differenze alle quali i diversi “cultural beliefs” hanno portato: nel processo di espansione dei propri commerci, i genovesi hanno assunto anche agenti sul luogo, dando vita ad un processo maggiormente integrato; i maghrebini invece, nel loro processo di espansione dei commerci, preferivano assumere esclusivamente propri agenti dando vita ad un processo di segregazione; i genovesi hanno sviluppato affari familiari senza divisione della ricchezza per ridurre le probabilità di bancarotta, aumentando sicurezza nell’occupazione, codici legali formali e organizzazione politica per facilitare lo scambio e il rispetto dei contratti; i maghrebini invece hanno sviluppato affari familiari con suddivisione della ricchezza e codici informali di condotta per la risoluzione delle dispute e punizioni collettive.
Tabella 7.7. Payoff tra venditori reciproci e individualisti scambianti un bene di qualità variabile con compratori offrenti contratti completi o incompleti. Venditore Compratore
Reciproco
Contratto incompleto (I)
/2, /2
Contratto completo (C)
,
H
Individualista
H
L
/2, /2 L
H
L
,0 L
C
compenso fisso esattamente sufficiente a coprire il costo di fornire bassa qualità. Questi sono compratori di tipo C. Nel contratto incompleto (I), il compratore paga il costo di produrre con qualità bassa più metà dei profitti netti che risultano dalla transazione. Questi sono compratori tipo I. Anche i venditori sono di due tipi. I venditori tipo R interpretano il contratto I come un segno di fiducia da parte del compratore e si comportano in modo reciproco fornendo alta qualità, affrontando un costo addizionale . Quando è offerto loro un contratto H
C pur essendo venditori di tipo R , sentono di esser diventati oggetto di diffidenza,
34 | MICROECONOMIA
subendo un costo soggettivo pari a , e si vendicano fornendo bassa qualità. venditori di tipo S sono del tutto individualisti e forniscono bassa qualità prescindere dal contratto. I profitti del compratore (al netto del compenso per venditore sufficiente a coprire il costo della bassa qualità) sono rispettivamente
I a il
C
e
H
per alta e bassa qualità. Per rendere meno pesante la notazione, sia = = e L
H
L
per rendere il problema interessante, si assuma ulteriormente che > 2 e > 2 . I payoff (compratori per primi, venditori secondi) appaiono nella tabella 7.7. Indicando la frazione dei venditori che sono reciproci con , i payoff attesi dei H
H
L
L
compratori che offrono contratti di tipo I e C sono: + (1 ) 2 2 v = + (1 ) = H
L
v = I
C
L
L
L
(7.14)
Allo stesso modo, indicando la frazione dei compratori che offrono contratti incompleti come , i payoff attesi dei venditori di tipo R e S sono v = + (1 )( ) 2
v = + (1 )0 = 2 2 H
R
L
L
S
(7.15)
I payoff attesi dati dalle equazioni (7.14) e (7.15) appaiono nella figura 7.4, con * e * che rappresentano le frequenze dei compratori tipo I e dei venditori tipo R
che uguagliano i payoff attesi. Quale tipo di contratti e di comportamenti ci dovremmo aspettare di osservare in questa popolazione? L’intuizione è che i probabili risultati includeranno o un’alta frequenza sia di contratti incompleti che di venditori che reciprocano o il risultato opposto: una predominanza sia di contratti completi che di venditori individualisti. Queste corrette intuizioni sono facilmente formalizzate. Il sistema dinamico che vogliamo studiare riguarda lo spazio degli stati definito da tutte le possibili combinazioni di contratti e strategie comportamentali, cioè [0,1] e [0,1] . Vogliamo esaminare il movimento sia di che di nel tempo.
SCAMBIO: CONTRATTI,NORME E POTERE
|35
Figura 7.4. Payoff dei comportamenti reciproci e individualisti (panel sinistro) e dei contratti completi e incompleti. è la frazione dei compratori che offrono contratti incompleti, è la frazione dei fornitori che sono reciproci.
Supponiamo che sia i fornitori che i compratori periodicamente aggiornino le loro strategie passando alle strategie con payoff più alti secondo le familiari equazioni dinamiche di replica d / dt = (1 )(v v ) d / d = (1 )(v v ) I
R
C
S
(7.16)
I valori stazionari di e in questo sistema dinamico sono d / dt = 0 per = 0 , =1 e = * = /( ) , e d / dt = 0 per = 0 , =1 e = * = 2 /( ) . Il sistema dinamico che ne risulta è illustrato nella figura 7.5, con le frecce che indicano gli aggiustamenti al di fuori dell’equilibrio dati dalle equazioni (7.16). Il punto ( *, *) è stazionario ma è un punto di sella, come confermato facendo riferimento alla figura 7.4 e alle equazioni (7.16): piccoli movimenti al di fuori di * o * non si auto-correggono. Per stati iniziali scelti L
H
H
L
L
casualmente, la popolazione si muoverà verso ( *, *) con probabilità zero. Gli stati asintoticamente stabili sono ( = 0, = 0) e ( =1, =1) , confermando la precedente intuizione. Quale dei due stati si otterrà dipende dallo stato iniziale.
36 | MICROECONOMIA
Figura 7.5. Co-evoluzione dei contratti e dei comportamenti. Le frecce indicano la direzione dei cambiamenti che sono associati alla dinamica ipotizzata. Gli stati a, b e c sono stazionari; c è un punto di sella.
Notate che nello stato in cui si ha reciprocità universale e contrattazione incompleta, i contratti incompleti sono offerti come miglior risposta alla presenza di individui che si comportano in modo reciproco nella popolazione. I contratti completi sono tecnicamente fattibili ma, fin quando la frazione di coloro che si comportano in modo reciproco eccede *, i contratti completi sono meno profittevoli. Il grado di completezza contrattuale è quindi influenzato dalla tecnologia (il costo di monitorare un contratto completo, per esempio, spesso dipende dalla natura del bene o del servizio scambiato), ma l’estensione della completezza contrattuale sarà anche influenzata dalla distribuzione delle norme comportamentali.
C O N C L U S IO N I Ci sono dunque sia ragioni analitiche che empiriche per credere che le preferenze sociali non convenzionali presentate nel capitolo 3 assumano un’importanza speciale nelle interazioni non di mercato e negli scambi di mercato governati dall’incompletezza contrattuale. Kenneth Arrow (1971:22) ha scritto “In
SCAMBIO: CONTRATTI,NORME E POTERE
|37
assenza di fiducia… le opportunità per una cooperazione mutuamente benefica dovrebbero essere perdute… le norme di comportamento sociale, inclusi i codici etici e morali, (possono essere)… reazioni della società per compensare i fallimenti del mercato”. Ovviamente, le norme raramente forniscono un perfetto sostituto per i contratti completi, così i fallimenti di mercato derivanti dall’incompletezza contrattuale sono comuni. I numerosi e diversi modi con i quali le persone hanno tentato di fronteggiare i problemi d’incentivo e i fallimenti della contrattazione che ne risultano e i modi in cui questi tentativi hanno interagito e hanno preso forma da eventi casuali, spiegano alcune diversità istituzionali che si scoprono quando vengono studiati gli scambi nel mondo reale. I modelli qui introdotti suggeriscono quattro conclusioni. Primo, quando i contratti sono incompleti, lo scambio è spesso facilitato quando coloro che vi partecipano discriminano a favore degli interni (“insiders”) e adottano pratiche campanilistiche; quando impegni di lungo periodo con un partner di scambio sono comuni; nei casi in cui lo scambio è personalizzato e così via. Nel paradigma Walrasiano, queste strutture d’interazione che supportano lo scambio sono definite “imperfezioni del mercato” e sono avversate come impedimenti alla “flessibilità”. Secondo, proprio come le norme che concernono lo scambio evolvono sotto l’influenza della distribuzione dei contratti esistente e di altri aspetti dell’ambiente istituzionale, le istituzioni che governano il processo di scambio evolvono in risposta alla distribuzione delle norme nella popolazione. Un risultato di questo processo coevolutivo è che un equilibrio deve tener conto congiuntamente della stazionarietà sia dell’ambiente istituzionale, sia delle norme e di altri aspetti delle preferenze degli attori rilevanti. Il fatto che ci possono essere molti di questi equilibri, alcuni dei quali instabili, ha importanti implicazioni per il problema della determinazione delle norme di governo e delle politiche da adottare che discuterò nel capitolo finale. Terzo, nei casi in cui l’enforcement esogeno (assicurato da un terzo) è assente, lo scambio è spesso facilitato dall’esercizio del potere di una delle parti della transazione. Ciò suggerisce che lo scambio è, in molti casi, un processo politico, e mette così in dubbio il punto di vista convenzionale che la politica è assente quando le persone scambiano in modo volontario in mercati competitivi. Quarto, l’esercizio di potere nel processo di scambio, insieme con l’effetto delle strutture di mercato sull’evoluzione delle norme, suggerisce che la politica e la cultura non possono essere escluse dalla teoria economica. La ragione non è semplicemente che l’economia è inserita in un più ampio sistema sociale, ma anche che capire il funzionamento dell’economia in se stessa richiede attenzione ai suoi aspetti politici e culturali. Se i modelli presentati qui e nei capitoli 8 e 9 catturino gli aspetti essenziali
38 | MICROECONOMIA
degli scambi nel mondo reale in presenza di incompletezza contrattuale, rimane materia di dibattito. Per questa ragione fornirò evidenza empirica a sostegno dell’adeguatezza dei modelli che verranno presentati. Ma l’importanza dell’incompletezza contrattuale è fuori questione. Herbert Simon (1951) è stato il pioniere degli studi sugli scambi in presenza di incompletezza contrattuale. Quaranta anni dopo, immaginava “un mitico visitatore da Marte” che si avvicinava alla Terra su una nave spaziale equipaggiata di un telescopio che rivela le strutture sociali. Le imprese rivelano se stesse, diciamo, come dense aree verdi…Le transazioni di mercato si vedono come linee rosse che connettono le imprese formando un network negli spazi tra di loro…Non importa se il nostro visitatore si trovi ad avvicinarsi agli Stati Uniti o all’Unione Sovietica, alla Cina urbana o alla Comunità Europea, la maggior parte dello spazio al di sotto di lui sarebbe compreso dentro le aree verdi, dato che quasi tutti gli abitanti sarebbero lavoratori, e quindi all’interno dei confini dell’impresa. Le organizzazioni sarebbero il tratto dominante del paesaggio. Spedendo un messaggio a casa, descrivendo la scena parlerebbe di “grandi aree verdi interconnesse da linee rosse”. Probabilmente non parlerebbe di “un network di linee rosse che connettono macchioline verdi” (Simon 1991:27).
Le più importanti organizzazioni che governano gli scambi nelle economie moderne sono le imprese, i cui dirigenti combinano il lavoro e il denaro di altre persone (nessuno dei due soggetto a contrattazione completa) per produrre e vendere beni e servizi. I mercati del lavoro e del credito costituiscono esempi paradigmatici di scambi molto importanti che non prendono la forma canonica in cui merci ben definite sono scambiate, come le noci e le mele nell’esempio di Coase. Invece, ciò che è scambiato sono più complessi panieri di obbligazioni e diritti che riguardano chi deve fare cosa e sotto quali condizioni. Coase (1992:717) la mette in questi termini: “Quelle che sono scambiate sul mercato non sono, come spesso viene supposto dagli economisti, entità fisiche, ma i diritti di eseguire certe azioni”. Nei capitoli 8 e 9 studieremo come le imprese, il mercato del lavoro e del credito strutturano i diritti di eseguire le azioni che riguardano il lavoro e i soldi di altre persone.
SCAMBIO: CONTRATTI,NORME E POTERE
|39
Riferimenti bibliografici Arrow, K. J. (1971). Political and Economic Evaluation of Social Effects and Externalities. Frontiers of Quantitative Economics. M. D. Intriligator. Amsterdam, North Holland: 3-23. Axelrod, R. and W. D. Hamilton (1981). "The Evolution of Cooperation." Science 211: 1390-1396. Baker, W. E. (1984). "The Social Structure of a National Securities Market." American Journal of Sociology 89(4): 775-811. Battuta, I. (1929). Travels in Asia and Africa: 1325-1354. London, Routledge and Kegan Paul, Ltd. Blau, P. (1964). Exchange and Power in Social Life. New York, John Wiley. Bernstein, L. (1992). "Opting Out of the Legal System: Extralegal Contractual Relations in the Diamond Industry." Journal of Legal Studies 21(1): 115-158. Bowles, S. and H. Gintis (1993). "The Revenge of Homo Economicus: Contested Exchange and the Revival of Political Economy." Journal of Economic Perspectives 7(1): 83-102. Bowles, S. and H. Gintis (2002). "'Social Capital' and Community Governance." Economic Journal 112(483): F419-436. Brown, Martin, Armin Falk, and Ernst Fehr. 2002. “Contractual Incompleteness and the Nature of Market Interactions”. CEPR discussion paper no. 3272. Caroll, L. (1982). Alice's Adventures in Wonderland. New York, Harcourt Brace Janovich. Coase, R. H. (1988). The Firm, the Market and the Law. Chicago and London, University of Chicago Press. Coase, R. H. (1992). "The Institutional Structure of Production." American Economic Review 82(4): 713-719. Cronon, W. (1991). Nature's Metropolis: Chicago and the Great West. New York, W.W. Norton & Company. Durkheim, E. (1967). De la division du travail social. Paris, Presses universitaires de France (first published in 1902). Erodoto. 1998. The Histories. New York: Oxford University Press. Fafchamps, M. (1992). "Solidarity Networks in Preindustrial Societies: Rational Peasants with a Moral Economy." Economic Development and Cultural Change 41(1): 147-74. Fehr, E. and S. Gaechter (2000). "Fairness and Retaliation: The Economics of Reciprocity." Journal of Economic Perspectives 14(3): 159-181. Fudenberg, D. and E. Maskin (1986). "The Folk Theorem in Repeated Games with Discounting or with Incomplete Information." Econometrica 54(3): 533-554. Giri, J. (1983). Le Sahel Demain. Paris, Editions Karthala. Grafen, A. (1979). "The Hawk-Dove Game Played between Relatives." Animal Behavior 27(3): 905-907. Greif, A. (1994). "Cultural Beliefs and the Organization of Society: An Historical and Theoretical Reflection on Collectivist and Individualist Societies." Journal of Political Economy 102(5): 912-950. Greif, A. (2002). "Institutions & Impersonal Exchange: From Communal to Individual Responsibility." Journal of Institutional and Theoretical Economics 158(1): 168-204. Hamilton, W. D. (1975). Innate Social Aptitudes of Man: an Approach from
40 | MICROECONOMIA
Evolutionary Genetics. Biosocial Anthropology. R. Fox. New York, John Wiley and Sons: 133-155. Hobbes, T. (1949). De Cive or The Citizen. New York, Appleton-Century-Crofts. Kollock, P. (1992). "The Social Construction of Exchange." Advances in Group Processes 9: 89-112. Kreps, D. M. (1990a). Corporate Culture and Economic Theory. Perspectives on Positive Political Economy. J. A. a. K. Shepsle. Cambridge, UK, Cambridge University Press: 90-143. Lanjouw, P. and N. Stern, Eds. (1998). Economic Development in Palanpur Over Five Decades. Delhi, Oxford University Press. Malinowski, B. (1926). Crime and Custom in Savage Society. London, Routledge & Kegan Paul. Mencken, H. L. (1949). A Mencken Chrestomathy. New York, Alfred A. Knopf. Mill, J. S. (1998). Utilitarianism. New York, Oxford University Press (originally published in 1861). Nowak, M. and K. Sigmund (1998). "Evolution of indirect reciprocity by image scoring." Nature 393: 573-577. Platteau, J. P. (1995). "A framework for the analysis of evolving patron-client ties in agrarian economies." World Development 23(5): 767-786. Ostrom, E. (1990). Governing the Commons: The Evolution of Institutions for Collective Action. Cambridge, UK, Cambridge University Press. Ouchi, W. (1980). "Markets Bureaucracies and Clans." Administrative Science Quarterly 25: 129-141. Price, J. A. (1980). "On Silent Trade." Research in Economic Anthropology 3: 75-96. Shapiro, C. (1983). "Premiums for High Quality Products as Returns to Reputations." Quarterly Journal of Economics 98(4): 659- 679. Smith, V. and A. W. Williams (1992). "Experimental Market Economics." Scientific American 267(6): 116-121. Siamwalla, A. (1978). "Farmers and Middlemen: Aspects of Agricultural Marketing in Thailand." Economic Bulletin for Asia and the Pacific 39(1): 38-50. Simon, H. (1951). "A Formal Theory of the Employment Relation." Econometrica 19(3): 293-305. Simon, H. A. (1991). "Organizations and Markets." Journal of Economic Perspectives 5(2): 25-44. Taylor, M. (1987). The possibility of cooperation. New York, Cambridge University Press.
VIII
O CCUPAZIONE , D ISOCCUPAZIONE E S ALARI
Assumendo l'equilibrio, possiamo perfino spingerci così lontano da astrarre completamente dagli imprenditori e semplicemente considerare i servizi di produzione come se, in un certo senso, questi venissero scambiati direttamente l’uno in cambio dell’altro. Leon Walras, Elements of Pure Economics (1874) (Walras (1954):225)
E' assodato che i beni non possono andare al mercato e fare gli scambi per proprio conto. Per questo dobbiamo ricorrere ai loro...proprietari…che non possono che...appropriarsi di un altro bene e separarsi dal proprio se non con mezzi di mutuo consenso. Karl Marx, Capital, I (1867):84
I N T R O D U Z IO N E La mattina del 5 Gennaio 1914, un meccanico ancora sconosciuto e diventato produttore di automobili, chiamato Henry Ford, scioccò i suoi colleghi annunciando che avrebbe pagato alla sua forza lavoro un minimo di cinque dollari per un giorno lavorativo di otto ore, facendo in un colpo solo diminuire l'orario di lavoro e più che raddoppiare il saggio di salario orario della stragrande maggioranza dei suoi lavoratori1. Ford non stava rispondendo ad un'insufficiente offerta di lavoro. Un giornalista arrivato quella mattina per la conferenza stampa nella quale fu diffuso l'annuncio, riportò la presenza di una coda di diverse centinaia di lavoratori in cerca di lavoro. Nelle settimane che seguirono, la coda fuori dai cancelli si allungò fino a comprendere dodicimila persone, quasi tante quante quelle che già lavoravano per l’impresa. Ciò che più rileva è che i profitti crebbero, supportati da un aumento della produzione per ora di lavoro produttivo più che doppia. Ford stava diventando una parola conosciuta in tutto il mondo, e Fordismo un peculiare approccio americano 1
Questo racconto è basato su Raff (1988).
2 | MICROECONOMIA
alle relazioni di lavoro. Per i fortunati lavoratori che si trovarono al posto giusto al momento giusto, la vita quotidiana nella fabbrica cambiò inverosimilmente. L'anno precedente la forza lavoro di Ford contava in media 13.623 unità. Durante quell'anno, dei 50.448 lavoratori che lasciarono l'azienda, la maggior parte se ne andò spontaneamente, mentre solo 8.490 furono licenziati. Nell'anno che seguì l'annuncio l'occupazione crebbe di un terzo, ma il numero di abbandoni diminuì fino a raggiungere un decimo del livello precedente e solo ventisette lavoratori furono licenziati. Cambiamenti di questa portata chiaramente non possono essere spiegati da variazioni cicliche dell'offerta e della domanda nel mercato del lavoro locale. Sembra improbabile che Ford abbia raddoppiato il salario per attrarre lavoratori migliori o per trattenere quelli nei quali la compagnia aveva investito in un costoso addestramento. Un sovraintendente Ford si vantava così: "due giorni è...un tempo più che sufficiente a rendere un uomo che non ha mai visto in vita sua un banco per modellare il nucleo un modellatore di nuclei di prima classe". Il motivo esatto per il quale Ford lo fece rimane un mistero. Ma, soprattutto, il successo di questa scommessa rimane un problema irrisolto visto che l'accaduto è inconsistente con l'approccio Walrasiano che implica che, per la massimizzazione dei profitti, il salario debba corrispondere al prezzo di offerta (cioè debba essere pari al valore della migliore alternativa del lavoratore). Nell'approccio Neoclassico, i servizi di produzione non si scambiano direttamente l’uno con l’altro come Walras dice letteralmente nei suoi Elementi. Ma la sua fantasia non è lontana dalla verità: un'impresa è semplicemente un insieme di produzioni possibili date le tecnologie disponibili, che è presieduta da un amministratore. L'amministratore seleziona il mix di fattori produttivi e le quantità da produrre che massimizzano la ricchezza del proprietario, comprando i fattori e vendendo la produzione nei mercati con prezzi dati esogenamente. E' facile capire perché i cinque dollari di Ford non hanno senso in questo modello. Ci sono tre elementi base per un modello più soddisfacente. Il primo è l'intuizione di Ronald Coase (1992:717), citata alla fine del capitolo 7, che dice che "quello che è scambiato nel mercato non sono, come spesso gli economisti suppongono, entità fisiche, ma il diritto di fare una certa azione". Il secondo è il luogo comune messo in luce da Marx secondo il quale lo scambio richiede che i proprietari dei servizi produttivi interagiscano faccia a faccia. Il terzo è la scoperta di Henry Ford che i lavoratori possono ricompensare una buona paga con un lavoro migliore.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|3
Marx fu il primo a sottolineare il fatto che il contratto di lavoro non concerne cose come la quantità di lavoro svolto; ma piuttosto specifica il numero di ore durante le quali il lavoratore si impegna a sottomettersi all'autorità del datore di lavoro. Secondo Marx (1973:275), l'offerta di impegno dei lavoratori nel processo di produzione non è assicurata dal contratto, ma è piuttosto "un'appropriazione di lavoro da parte del capitale" che " solo con un abuso potrebbe...essere chiamata un qualsiasi scambio". Anticipando Ford (per non dire gli sviluppi della teoria economica alla fine del ventesimo secolo), Marx (1967:544) osservò che un aumento del salario può ridurre il costo del lavoro. Come Marx, Coase sottolineò il ruolo centrale dell'autorità nelle relazioni contrattuali di impresa: "[n]ota il carattere del contratto nel quale un fattore subentra al fine di essere impiegato in un' impresa...[I]l fattore...per una certa remunerazione accetta di obbedire alle direttive dell'imprenditore". Differentemente, Coase (1937:387,389) definì l'impresa in base alla sua struttura politica: Se un lavoratore si sposta dal dipartimento X al dipartimento Y, non ci va per un cambio dei prezzi ma perché gli è stato ordinato di fare così...il carattere distintivo dell'impresa è la soppressione del meccanismo dei prezzi.
Coase cercò di capire perché le imprese esistono, e che cosa determina l'estensione di quelle che lui chiamò (prendendo a prestito una frase di Dennis Robertson) "isole di potere conscio in questo oceano di inconscia cooperazione" Herbert Simon (1951) fornì il primo modello dell'impresa lungo queste linee. Egli rappresentò il contratto di impiego come uno scambio nel quale il lavoratore trasferisce l'autorità sui suoi compiti al datore di lavoro in cambio di un salario. Simon mise in luce il vantaggio dell'imprenditore dato, in questo sistema, dall'inevitabile incertezza sui compiti che sarebbero stati richiesti durante il periodo di validità del contratto da cui l'elevato costo di accordarsi su una completa e dettagliata specifica nelle attività da compiere. Chiameremo l'approccio promosso da questi diversi autori come il modello Marx-Coase-Simon delle relazioni del lavoro. Una caratteristica dell'interazione dipendente-datore di lavoro in questo approccio è che le preferenze sociali - specialmente motivi di reciprocità e correttezza (fairness) - giocano un ruolo importante nel determinarne gli esiti.
I L R A P P O RTO
DI
L AV O R O
Il modello del mercato e del rapporto di lavoro che seguirà è una variante di quello che può essere chiamato regolamentazione dell'impegno o modello della disciplina del lavoro basato sul rinnovo condizionato. (Spiegherò dopo perché trovo fuorviante il più usuale termine "modello del salario di efficienza").
4 | MICROECONOMIA
Il problema. L'impegno lavorativo non può essere stabilito per contratto perché l'informazione concernente il livello dell'impegno di un lavoratore è conosciuta imperfettamente, nel migliore dei casi, dal datore di lavoro e non è verificabile (cioè non è dimostrabile davanti ad una corte). Anche se l'informazione fosse verificabile, un contratto in base al quale un lavoratore fosse pagato secondo un segnale imperfetto del suo impegno, esporrebbe il lavoratore ad un livello di rischio soggettivamente costoso. Eppure l'impegno lavorativo è un argomento della funzione di produzione dell'imprenditore. Il problema potrebbe essere risolto se la persona che compie il lavoro fosse, come Robinson Crusoe, anche l'avente diritto al residuo (residual claimant) sulla risultante produzione, oppure se fosse possibile implementare dei contratti ottimali per la produzione collettiva come discusso nel capitolo 4. Per le ragioni che abbiamo visto, un tale contratto esporrebbe il lavoratore ad un livello di rischio inaccettabile. Una produzione individuale renderebbe il lavoratore l' unico avente diritto sul prodotto al netto dei suoi sforzi (il residuo), ma in genere la presenza di economie di scala renderebbe comunque la produzione collettiva necessaria. (Per cogliere il fenomeno delle economie di scala ipotizziamo che produrre ad ogni livello richieda un'unità di capitale e che questo renda non profittevole produrre individualmente.) Sia e [0,1] l'impegno per ora lavorata (potrebbe essere semplicemente la frazione delle ore nelle quali il lavoratore sta effettivamente lavorando rispetto alle ore in cui non sta lavorando). La produzione in ogni periodo è data da: y = y(he) + with y' > 0 and y'' < 0
(8.1)
dove h è il numero di lavoratori in termini di ore acquistate (si può assumere che ogni lavoratore lavori un'ora, così che h sia il numero di lavoratori omogenei assunti). Il livello di produzione è contrattabile, ma il livello dell'impegno di ogni lavoratore non può essere dedotto dal livello della produzione a causa della natura collettiva e stocastica della produzione.
Quel che segue sintetizza il rapporto tra lavoratore e l'imprenditore. Il principale (il datore di lavoro) conosce la funzione di risposta ottima dell'agente (il lavoratore) e(w,m;z) , dato qualunque salario w ed il livello di supervisione m , con una rendita di riserva z determinata esogenamente (gli argomenti sulla destra del punto e virgola sono esogeni). All'inizio di ogni periodo il datore di lavoro sceglie (in modo da massimizzare i profitti) e annuncia: una probabilità di licenziamento t(e,m) [0,1] con t < 0 e t > 0 per ogni livello economicamente rilevante; un livello e
m
di salario, w ; e un livello di supervisione per ora di lavoro pagata m . Sia il salario che
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|5
la supervisione sono misurati nella stessa unità come produzione per periodo. In seguito all'annuncio del datore di lavoro della sua strategia "incentivo-supervisione", e conoscendo quanto detto sopra, il lavoratore sceglie e in modo da massimizzare il valore attuale della sua utilità intertemporale. Alla fine del periodo, il lavoratore è pagato e gode dell'utilità determinata dal suo impegno e dal suo salario, il suo rapporto di lavoro viene rescisso con probabilità t(e,m) o altrimenti prolungato. Se il lavoratore è licenziato, egli è sostituito da un lavoratore identico prima disoccupato e il valore attuale della sua utilità intertemporale è z . Se il lavoratore conserva il suo lavoro, il rapporto si rinnova con lo stesso meccanismo; di conseguenza l'interazione lavoratore-datore è stazionaria (o invariante nel tempo).
La funzione della probabilità di licenziamento t(e,m) è cruciale per il funzionamento del modello. Una tale semplice funzione potrebbe essere basata sull'idea che durante ogni periodo c'è una probabilità (m) , che il datore "veda" il lavoratore e che quindi, in quel caso, sappia esattamente se il lavoratore sta lavorando o no. Supponiamo che in assenza di supervisione il datore non "veda" il lavoratore, nel qual caso (0) = 0 e ' > 0 . Questo darebbe luogo ad una funzione di probabilità di licenziamento t = (m)(1 e) , dalla quale si può dedurre che t(0, (m)) = (m) e t(e, (m)) = 0 . Quello che è essenziale per il modello è che per livelli positivi di supervisione, un maggiore impegno riduce la probabilità di licenziamento, cioè t = (m) . Allo stesso modo, livelli maggiori di supervisione accrescono l'effetto marginale del lavorare con più impegno sulla probabilità di licenziamento: t = '(m) . e
em
La scelta ottimale del lavoratore. La funzione di utilità del lavoratore per periodo è u = u(w,e)
(8.2)
con u 0 e u 0 per ogni livello economicamente rilevante. Questo non significa che il lavoratore preferirebbe non impegnarsi affatto, ma piuttosto che ogni situazione in cui u > 0 non può essere una allocazione di equilibrio, dato che in questo caso il lavoratore potrebbe unilateralmente implementare un livello di impegno più alto, facendo aumentare i profitti del datore e la sua stessa utilità. Il lavoratore sceglie e in modo da massimizzare il valore attuale dell'utilità attesa su un w
e
e
orizzonte infinito, dato un certo tasso di preferenza intertemporale i : v=
u(w,e) + (1 t(e))v + t(e)z 1+i
(8.3a)
6 | MICROECONOMIA
o usando l'ipotesi di stazionarietà e dopo qualche manipolazione v=
u(w,e) iz +z i + t(e)
(8.3b)
dove il primo termine sul lato destro dell'equazione riformulata è la renditaincentivo introdotta nel precedente capitolo; in questo caso è anche chiamata la rendita da occupazione. Quindi abbiamo che: valore attuale del lavoro = rendita da occupazione + rendita di riserva. Data questa funzione-obiettivo, il lavoratore sceglie e così da rendere v =0
(8.4)
e
che implica: u = t (v z) e
(8.5)
e
Di conseguenza, il lavoratore sceglierà il livello di impegno che eguaglia il costo marginale dell'impegno al beneficio marginale dell'impegno. Cominciando da bassi livelli di e , il lavoratore dovrebbe aumentare l'impegno fino a che la disutilità marginale dell'impegno compensi il guadagno marginale in termini di valore attuale dell'utilità risultante dalla corrispondente riduzione della probabilità di licenziamento. Le precedenti condizioni del primo ordine (8.4 o 8.5) definiscono la risposta ottimale del lavoratore così come mostrato in figura 8.1.
Impegno
Salario Figura 8.1. Funzione di risposta ottima del lavoratore e offerta ottima dell'imprenditore. Il punto a, cioè, un'offerta di salario w* e un impegno di risposta e*, insieme soddisfano le condizioni del primo ordine del problema di ottimizzazione del lavoratore e del datore di lavoro. Il livello ottimale di supervisione è m*, la cui determinazione non è mostrata qui (vedi figura 8.3). Il punto b è uno degli ottimi Paretiani che sostituiscono la curva dei contratti efficienti (non mostrata). L'area ombreggiata indica gli esiti che sono Pareto superiori al punto a. L'inclinazione della retta ab è e* / (w*+m*).
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|7
Un esempio può chiarire la funzione di risposta ottima. Consideriamo un individuo per il quale il salario è un "bene" e il lavoro è un "male" la cui disutilità dipenda non solo dal livello di impegno, ma anche da quanto equamente sia ricompensato. Supponiamo che la funzione di utilità del lavoratore sia f
u=w
(aw / w) 1e
f
dove a è una costante positiva e w è un norma di salario esogena chiamata il "giusto salario". La disutilità dell'impegno rappresentata dal secondo termine è crescente nell'impegno (ad un tasso crescente). Nota che questo secondo termine è anche decrescente nel salario a parità di giusto salario, indicando che un alto livello di impegno equamente pagato è meno oneroso che un minor livello di impegno pagato ad un livello considerato non equo. La motivazione sottostante può riflettere una variante della funzione di preferenza reciproca introdotta nel capitolo 3: il lavoratore può interpretare l'offerta di lavoro come un indice del tipo di datore di lavoro e potrebbe avere una minore disutilità da impegno lavorando duramente per un capo più generoso e giusto. Supponiamo che il datore di lavoro possa osservare senza costi il lavoratore, ma che l'informazione non sia verificabile, come prima, e non contrattabile, la supervisione sia assente e la probabilità di licenziamento sia t =1 e . La precedente funzione di utilità ci dice che per un salario non infinito la disutilità dell'impegno diventa infinita appena e si avvicina a 1, così che il lavoratore non sceglierà e =1 e di conseguenza t sarà maggiore di 0 . Ipotizziamo che la rendita di riserva del lavoratore sia normalizzata a zero e che il tasso di preferenza intertemporale sia anch'esso 0 (questa semplificazione ci dà una espressione in forma chiusa per la funzione di risposta ottima, ma è ovviamente non realistica). Quindi riscrivendo 8.3b abbiamo u(w,e) w (aw / w)(1 e) = t(e) 1e f
v=
1
e dato che t = 1 possiamo scrivere l'equazione (8.5) per questo caso come e
aw / w w (aw / w)(1 e) = (1 e) 1e f
f
1
2
Questa funzione di risposta ottima può essere scritta come una funzione esplicita dell'impegno del lavoratore (semplicemente manipolando un pò i termini) come e =1
2aw w 2
f
(8.6)
8 | MICROECONOMIA
Come ci si potrebbe aspettare, il livello di impegno è crescente e concavo rispetto al salario e decrescente nel livello di giusto salario. Sarebbe istruttivo derivare la stessa funzione di risposta ottima ipotizzando preferenze convenzionali (senza motivi di equità) semplicemente eliminando il termine ( w / w ) dalla funzione di f
utilità. Un confronto delle due funzioni di risposta ottima mostra l'importanza delle preferenze sociali. Prima di andare avanti è necessario fare quattro osservazioni. Primo, abbiamo bisogno di verificare che la minaccia di licenziamento implicata dall'annuncio ex-ante dalla funzione della probabilità di licenziamento t(e,m) sia credibile (cioè sia nell'interesse del datore dare seguito ex-post alla minaccia, una volta che sia stato individuato un lavoratore che non si impegna). Perché un datore di lavoro licenzierebbe un lavoratore per assumerne uno identico? Ipotizzando che i lavoratori possano osservare il livello di impegno di ognuno, e che ogni licenziamento sia conoscenza comune, se l'atto di non impegnarsi non fosse punito con il licenziamento, i lavoratori smetterebbero di ritenere credibile l'annuncio di t(e,m) . Di conseguenza, il licenziamento di dipendenti fannulloni è necessario per sostenere la credenza che la funzione della probabilità di licenziamento sia effettivamente in vigore2. Secondo, in un'analisi più completa la funzione t(e,m) (non solo m ) sarebbe disegnata dal datore di lavoro (se un lavoratore è licenziato dipende, per esempio, dal costo di reperire e formare un sostituto), ma facendo così il modello si complicherebbe senza guadagnarne in capacità esplicativa. Terzo, l'ottimizzazione su un orizzonte infinito è solo un modo di derivare la funzione di risposta ottima che descrive il comportamento del lavoratore; non descrive in ogni caso il processo cognitivo del lavoratore. Il lavoratore potrebbe seguire una norma (che determina un certo livello di impegno) che evolve attraverso il processo di apprendimento basato sull'aggiornamento dei pay-off descritto nei capitoli 2 e 7. L'equazione 8.5 (la funzione di risposta ottima) descrive la norma nel mercato del lavoro che massimizza i pay-off e quindi tende ad essere adottata. Quarto, qualcuno potrebbe chiedersi, come fa il datore di lavoro a conoscere le funzioni di risposta ottima dei lavoratori? Così come un lavoratore può trovare la funzione di risposta ottima attraverso un metodo basato su tentativi ed errori (con 2
L’ipotesi che il gioco sia conoscenza comune e che sia stazionario significa che i lavoratori crederanno che t(e,m) sia in vigore in ogni caso. Comunque, modellare un processo dinamico attraverso il quale i lavoratori apprendano ex-post la funzione di probabilità di licenziamento come risultato dei licenziamenti effettivamente osservati, aggiungerebbe complicazioni sostanziali senza grandi vantaggi.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|9
aggiornamento dei pay-off), il datore di lavoro può arrivare ad una stima di tale funzione variando la sua strategia di disciplina del lavoro ed osservando gli effetti sulla produzione totale. Ovviamente ci sono molte circostanze nelle quali questo processo di apprendimento sarebbe inefficiente o distorto, ma ipotizzerò che il datore arrivi ad una stima accurata. (si ricordi: conoscere la funzione di risposta ottima non è la stessa cosa di riuscire a scrivere un contratto in e , perché e è non verificabile.) Massimizzazione del profitto. Il datore di lavoro, che fronteggia un mercato competitivo per il prodotto il cui prezzo è 1, varia m,w e h per massimizzare i profitti attesi (egli è neutrale al rischio). = y(he(w,m;z)) (w + m)h
(8.7)
Le condizioni del primo ordine per un massimo sono: = y'e (w + m) = 0 = y' he h = 0 = y' he h = 0 h
w
m
w
m
(8.7a) (8.7b) (8.7c)
dalle quali possiamo vedere che il massimo profitto richiede che, e =e w +m w +m y' = e
e = w
m
(8.8a) (8.8b)
La prima condizione implica che il livello medio di impegno per dollaro di spesa per il lavoro sia uguale all'impatto marginale di variazioni in salario e spese per supervisione. Questa è la cosiddetta condizione di Solow (dal nome di Robert Solow che per primo la derivò) generalizzata per includere i fattori di produzione della supervisione. L'altra condizione del primo ordine è analoga alla ben nota condizione per la massimizzazione del profitto: salario uguale al prodotto marginale del lavoro. Con impegno endogeno, questa condizione richiede che la produzione marginale dell'impegno sia uguale al costo di una unità di impegno (includendo il costo della supervisione). Espresse in modo equivalente come y'e* = w * +m * , le condizioni del primo ordine implicano che la produttività marginale del tempo lavorativo (valutata ai livelli determinati dalla condizione di Solow) sia uguale al costo orario di un’ora di lavoro come mostrato in figura 8.2.
10 | MICROECONOMIA
$
Ore di lavoro, h Figura 8.2. Il livello ottimale di ore di lavoro comprate dall'impresa. Nota: w*,m*,h*, ed e* sono le soluzioni delle condizioni del primo ordine nel testo.
Dato che h non compare nella funzione di risposta ottima, il processo di massimizzazione del profitto può essere descritto sequenzialmente: il datore di lavoro prima risolve il problema della disciplina del lavoro selezionando m e w per soddisfare eq. (8.8a). Poi, sostituendo e * e w * dall'equazione (8.8a) nell'equazione (8.8b), determina quante ore di lavoro comprare. Infine sostituendo e*,w*,m * e h * nell'equazione (8.7) determina se il suo piano di produzione è sufficientemente rimunerativo da essere intrapreso, dati gli usi alternativi del capitale necessario. Per illustrare il contratto di equilibrio, ritorniamo al precedente esempio. Si ricordi che m = 0 . Usando la funzione di risposta ottima (8.6), il salario sarà determinato in modo da soddisfare eq. (8.8a) o e 1 2aw / w 4aw = = w w w =e f
2
f
3
w
dove il salario ottimale w * è dato da w* = (6aw ) f
1/ 2
Se a =1 e w = 6 allora sarà ottimale per il datore di lavoro offrire il giusto salario. La risposta ottima del lavoratore in termini di impegno all'offerta di un salario ottimale da parte del datore di lavoro si ottiene sostituendo il valore di w * nell'eq. (8.6), dato che e* = 2 / 3. Se w = 24 , comunque, il salario ottimale sarà la metà del f
f
giusto salario. Per un giusto salario minore di 6, sarà ottimale per il datore di lavoro offrire qualcosa in più del salario equo. Scelta della Tecnologia. Ora si consideri una funzione di produzione più generale con un fattore di produzione che non sia lavoro, y(k,E) , dove k rappresenta il flusso del fattore diverso dal lavoro ad ogni periodo, E = he è la quantità totale di impegno
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|11
e come prima la funzione è crescente e concava nei suoi argomenti. Si supponga che variazioni in k siano associate a differenti spazi di lavoro o ad altri aspetti del processo produttivo che condizionano la capacità di monitorare più o meno facilmente il lavoro. Per esempio, processi altamente capitalizzati, come le catene di montaggio inventate da Henry Ford, hanno tempi scanditi dal funzionamento delle macchine che rendono l'identificazione di lavoratori che si impegnano poco enormemente più facile. Per catturare questa idea, la funzione di licenziamento ora è t = (m,k)(1 e) dove (m,k) è la probabilità di scoprire un lavoratore che non si
impegna. Come prima è crescente in m . Se è crescente in k (come suggerisce l'esempio delle catene di montaggio), allora t < 0 ; che tecnologie a più alto tasso di capitalizzazione facilitino la supervisione vuol dire che di fatto aumentano l'effetto (negativo) dell'impegno sulla probabilità di licenziamento. In questo caso potremmo dire che processi produttivi che usano in modo più intensivo il fattore k sono più ek
"trasparenti" dal punto di vista della supervisione mentre processi che lo usano meno intensivamente sono più "opachi". Casi opposti possono ugualmente esistere. La caratteristica importante non è il segno di t ma il fatto che la scelta della tecnologia ek
generalmente condizioni la facilità della supervisione in un senso o nell'altro, cioè che sia t = 0 . ek
Quale sarà l'effetto delle variazioni in k sulla funzione di risposta ottima del lavoratore? Usando la nuova funzione di licenziamento e calcolando il differenziale totale dell'eq.(8.5) rispetto a k ed e , troviamo de (v z)t = dk u (v z)t ek
ee
ee
che, usando la condizione del secondo ordine per il problema di massimizzazione del lavoratore, mostra che de / dk ha lo stesso segno di t . Di conseguenza, se tecnologie che usano in modo intensivo il fattore k sono meno trasparenti, aumenti di k spostano verso l'alto la funzione di risposta ottima (attraverso l'innalzamento del beneficio marginale derivante da un maggior impegno). La scelta del livello di k che massimizza i profitti rifletterà questo effetto. Sia il ek
prezzo per periodo di affitto di un'unità di k , differenziando parzialmente la funzione di profitto (usando la funzione di produzione estesa a k ) rispetto a k , otteniamo un'ulteriore condizione del primo ordine: = y + e hy = 0 k
k
k
E
(8.7d)
La scelta della quantità del fattore k uguaglierà quindi il prezzo di affitto del fattore k , non alla sua produttività marginale, ma alla sua produttività marginale più il
12 | MICROECONOMIA
suo effetto sull'offerta di impegno moltiplicato per la produttività marginale dell'impegno. La presenza di questo "effetto da disciplina del lavoro" sulla scelta della tecnologia significa che non varrà generalmente che y = μ y k
E
dove μ = (w + m) /e è il costo di una unità di impegno. Come conseguenza, il saggio marginale di sostituzione nella produzione (l'inclinazione dell'isoquanto di produzione) non sarà uguale al rapporto tra i prezzi dei fattori in equilibrio competitivo. La ragione sta nel fatto che i fattori produttivi sono valutati non solo per il loro contributo alla produzione, ma anche per i loro effetti sulla disciplina del lavoro. (La supervisione è un esempio puro di un tale fattore, dato che non compare affatto nella funzione di produzione.) Per tutto il resto del capitolo ignoreremo il fattore di produzione diverso dal lavoro k per favorire la semplicità di presentazione.
L E C A R AT T E R I S T I C H E
D E L L A T R A N S A Z I O N E D I E Q U IL I B R I O
I valori e,h,w ed m che soddisfano le eq. (8.5) e (8.8) determinano la transazione di equilibrio, ovvero una mutua risposta ottima da parte del lavoratore e del datore di lavoro. Seguono cinque osservazioni sull'equilibrio. Primo, i lavoratori generalmente subiscono vincoli di quantità. In generale, il vincolo di partecipazione non è effettivo, cioè v* > z . Questo implica che il mercato del lavoro non è in equilibrio: lavoratori identici che ricevono z preferirebbero essere impiegati ricevendo v , ma non possono effettuare la transazione. Questi lavoratori sono vincolati nella quantità, dato che non possono comprare o vendere tanto quanto vorrebbero ai termini correnti di scambio. Secondo, il risultante scambio (e*,w*) è Pareto inefficiente. Questo avviene perché a questi valori le condizioni del primo ordine del datore di lavoro e del lavoratore richiedono che: v =0
ma
>0
v >0
ma
=0
e
e
e w
w
(8.9)
e quindi esisteranno alcuni (sufficientemente piccoli) valori ( e,w ) tali che v(e * +e,w * +w) > v(e*,w*)
e
(e * +e,w * +w,...) > (e*,w*)
Di conseguenza esiste un piccolo incremento di impegno accompagnato da un
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|13
piccolo incremento di salario che costituirebbe un miglioramento Paretiano. Dato che il datore di lavoro ha selezionato non solo w ma anche m al fine di massimizzare i profitti, un’analoga dimostrazione mostra che un piccolo decremento in supervisione e un piccolo incremento in impegno costituiscono un miglioramento Paretiano3. Terzo, lavoro non produttivo e altri fattori non produttivi saranno impiegati in equilibrio competitivo. Un esempio di fattori assolutamente non produttivi sono i lavoratori usati nella supervisione. Questi non appaiono nella funzione di produzione, ma sono assunti da un'impresa massimizzante perché contribuiscono agli obiettivi dell'impresa in altro modo. Sappiamo che fattori assolutamente non produttivi saranno impiegati perché per m = 0, t = 0 (senza supervisione, lavorare più duramente non cambia la probabilità di licenziamento) così che e(w,0;z) = e (sarà e
scelto il livello di impegno di riserva). Se si assume che e = e non massimizza il profitto, ne segue che m* > 0 . Quarto, l'equilibrio competitivo è tecnicamente inefficiente: esiste una allocazione alternativa tale che la stessa produzione possa essere effettuata impiegando una minore quantità di un certo fattore e una quantità non maggiore degli altri (questa è la definizione di inefficienza tecnica). Si supponga che a un datore di lavoro sia richiesto (da un essere onnisciente) di alzare il salario di w e di abbassare il livello di supervisione di m , in modo appena sufficiente a riportare il livello di impegno al livello di equilibrio, così che e(w*,m*;z) = e(w * +w,m * m;z)
(8.10)
Se l'essere onnisciente decidesse anche che le ore di lavoro impiegate rimanessero come prima, la quantità di prodotto non cambierebbe, ma uno dei fattori, la supervisione, sarebbe stato ridotto: le risorse rappresentate da m sono così liberate per usi produttivi. Dunque l'equilibrio competitivo (e*,w*,m*,h*) è tecnicamente inefficiente nel senso classico come sopra definito. Questo è illustrato in figura 8.3.
3
L’approccio basato sulla disciplina del lavoro qualche volta è chiamato modello del “salario di efficienza” perché Leibenstein (1957) e altri successivi autori di questa letteratura hanno suggerito che per tener conto degli effetti dell’alimentazione, della variabilità dell’impegno e simili, il lavoro dovrebbe essere misurato in “unità di efficienza” piuttosto che in ore. L’uso è rimasto, ma è una definizione non appropriata, perché (in contrasto al modello Walrasiano) gli equilibri descritti dal modello sono sia tecnicamente inefficienti (vedi in seguito) sia Pareto inefficienti.
14 | MICROECONOMIA
Figura 8.3. Il livello di supervisione che massimizza il profitto è tecnicamente inefficiente.
Le ragioni dell'inefficienza sono istruttive. Strategie di incentivo generalmente combinano sia supervisione (che ha un costo opportunità sociale, dato che impiega risorse in usi alternativi a quello puramente produttivo come lo sono il lavoro del supervisore o le risorse richieste per equipaggiare la sorveglianza) e una rendita incentivante, in questo caso, v z (che è un puro trasferimento e quindi non implica nessun costo opportunità per la società). Di conseguenza, dato che sia la supervisione che il salario sono costosi per l'imprenditore, ma solo la supervisione è socialmente costosa, siamo in presenza del classico caso in cui i costi marginali privati sono differenti dai costi marginali sociali. Come ci si può aspettare, questo implica un fallimento del mercato. Dal punto di vista dell'efficenza sociale, quindi, discipline del lavoro determinate in modo competitivo generalmente usano troppo la supervisione e troppo poco rendite incentivanti. Più carota e meno bastone costituirebbero un miglioramento di efficienza tecnica. Nota che se tecnologie con un uso intensivo di capitale sono associate a processi di produzione più trasparenti (come nel precedente esempio), la stessa dimostrazione vale per i beni capitali: miglioramenti di efficenza tecnica potrebbero essere ottenuti (rispetto alla transazione di equilibrio competitivo) innalzando il salario e riducendo il capitale impiegato. Quinto, la transazione di equilibrio sarà anche caratterizzata da un livello Pareto subottimale di benefici sul posto di lavoro come ore di lavoro flessibile, un ambiente di lavoro rispettoso e salubre e simili. Nel classico modello Walrasiano il datore di lavoro è vincolato dalla decisione di offerta di lavoro del lavoratore (vincolo di partecipazione), e per questa ragione il datore è indotto a fornire benefici sul posto di lavoro come un mezzo per abbassare il costo del lavoro: un posto di lavoro più piacevole attrarrebbe futuri lavoratori ad un salario più basso. Dato che il vincolo di partecipazione del lavoratore è dato dal livello di utilità raggiungibile nella sua prossima migliore alternativa al lavoro, il datore massimizzerà i profitti valutando
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|15
l'importanza dei benefici sul posto di lavoro (rispetto ad altre specificazioni della funzione di utilità del lavoratore) esattamente come farebbe il lavoratore. Questo risultato vale ancora se il livello di impegno non è più contrattabile? Vedremo che la risposta è negativa. Si supponga che l'utilità del lavoratore sia generalizzata per includere una misura dei benefici sul posto di lavoro forniti dal datore (per ore di lavoro), u = (w, ,e)
con u > 0 nel dominio economicamente rilevante, e che fornire una unità di benefici costi al datore p per ora di lavoro impiegata Allora avremo una nuova espressione per il valore attualizzato dell'utilità v(e,w, ,z) del lavoro, una nuova
funzione di risposta ottima e(w,m, ,z) e una ulteriore condizione del primo ordine per il datore di lavoro = y' he hp = 0
(8.7e)
Questa condizione implica che il prodotto marginale dei benefici (il primo termine) sia uguale al costo marginale (e medio) del fornire benefici sul posto di lavoro. E' chiaro che il datore di lavoro terrà conto in qualche modo delle preferenze del lavoratore per i benefici dato che e > 0 ; avere un lavoro più piacevole indurrebbe
il lavoratore a impegnarsi di più (essendo così accresciuto il valore del lavoro). Ma il datore terrà sufficientemente conto delle preferenze del lavoratore? La risposta è no. I benefici sul posto di lavoro non sono diversi dal salario in questo modello; questi sono di valore per il lavoratore, ma costosi da fornire per il datore di lavoro. Abbiamo già visto che l'offerta da parte del datore di lavoro che massimizza i profitti, (w*,e*) sarebbe Pareto inferiore rispetto qualche altra combinazione di e e w caratterizzata da piccoli incrementi in entrambi i termini. Lo stesso ragionamento
vale alle condizioni di lavoro: dato che in equilibrio competitivo (e*,w*, *,m*) =0 e v >0
(8.11)
v =0 e >0
(8.12)
mentre e
e
così che piccoli miglioramenti nelle condizioni di lavoro accompagnati da piccoli incrementi di impegno sarebbero miglioramenti Paretiani. Cosa determina la differenza tra l'approccio Walrasiano e post-Walrasiano a questo problema? Nel primo, il vincolo di partecipazione è effettivo e quindi la curva di isocosto dell'impresa è tangente a quella di indifferenza del lavoratore, implicando
16 | MICROECONOMIA
un mercato del lavoro Pareto-ottimale. Nel secondo, invece, il vincolo di partecipazione non è effettivo e l'impresa è vincolata, in questo caso, dalla funzione di risposta ottima del lavoratore. Dato che la funzione di risposta ottima non coincide con il vincolo di partecipazione, l'equilibrio post-Walrasiano non è Paretoottimo.
IL
M E R C ATO D E L L AV O R O IN E Q U IL IB R IO G E N E R A L E
Il rapporto di lavoro in ciascuna impresa è ovviamente inserito in un sistema di mercato con molte imprese uguali ed altri attori. Per studiare questo aspetto, supponiamo che esista un numero molto grande di imprese identiche che impiegano lavoro come descritto precedentemente e che i mercati in questione siano perfettamente competitivi nel senso che non ci siano barriere all'entrata o all'uscita. Se i profitti delle imprese (ricavi netti meno il costo opportunità del capitale) sono positivi allora le imprese entrano nel mercato, mentre escono se sono negativi. Quindi il numero di imprese di equilibrio è determinato dalle precedenti condizioni del primo ordine e dalla condizione di profitto nullo: = y(he(w,m,z)) (w + m)h = 0
(8.13)
dove è un dato costo per periodo di fattori di produzione fissi (unità di capitale) e h,e,m,w soddisfano le condizioni del primo ordine di cui sopra. Osserva che z (la sola variabile insieme a in eq. (8.13) che non è determinata dalle precedenti condizioni del primo ordine), è ora rappresentata come endogena. Ma com'è determinata z ? La posizione di riserva del lavoratore. Per alcuni valori di e e w , abbiamo v(e,w) = z , così che il lavoratore è indifferente tra il suo lavoro - che implica fornire
impegno e e ricevere un salario w - e la migliore delle sue alternative, cioè z . In questo modo il vincolo di partecipazione del lavoratore è soddisfatto come un’uguaglianza. Possiamo vedere dall'equazione (8.5) che in questo caso deve valere u = 0 (il livello di impegno scelto quando la rendita da lavoro è zero è quello per il e
quale la la disutilità del lavoro è zero). Di conseguenza l'utilità della transazione (e,w) è l'equivalente z espresso in termini di flusso per periodo, cioè u(e,w) = iz . Il livello di impegno e è quindi l'ammontare di lavoro per ora che il lavoratore avrebbe scelto di fare in assenza di qualsiasi strategia di incentivo messa in atto dal datore di lavoro. Ma cosa è z ? Se si assume il lavoro come omogeneo, il salario atteso del lavoratore in lavori alternativi dovrebbe essere lo stesso dell'occupazione corrente, quindi il costo di essere licenziato è la riduzione in benessere provocata da un
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|17
periodo di inattività. Un lavoratore licenziato trascorrerà il periodo successivo disoccupato, ricevendo un sussidio di disoccupazione (o altri trasferimenti di sostituzione del reddito da lavoro) uguale a b senza lavorare (e presumibilmente impegnandosi nella ricerca di occupazione). Il disoccupato di conseguenza matura un 'utilità per periodo uguale a u(b,0) che può riflettere l'utilità del tempo libero, lo stigma sociale dell'essere senza lavoro e via dicendo. Alla fine di ogni periodo esiste una probabilità che un lavoratore disoccupato trovi lavoro e così esca dal gruppo dei disoccupati; quindi la durata del periodo di disoccupazione è 1/ . Quindi, u(b,0) + v + (1 )z 1+i u(b,0) + v = i +
z=
Questa rappresenta la rendita di riserva definita nello stesso modo che il valore attualizzato del lavoro. Notiamo che dz / d > 0 se v z > 0 , che a sua volta richiede che iv u(b,0) > 0 . Questo significa che un incremento nella probabilità di essere assunto accresce la posizione di rendita del lavoratore nella misura in cui il beneficio per periodo di avere un lavoro (iv) sia maggiore del beneficio per periodo di non averne (u(b,0)) . Statica Comparata. Ricorda che (w + m) /e = μ è il costo di una unità di impegno. Dato che un incremento nella posizione di rendita del lavoratore sposta la sua funzione di risposta ottima sulla destra, si può facilmente dimostrare che d/dz>0, che vuol dire che il costo unitario dell'impegno varia con z, cioè, d/dz<0. In equilibrio competitivo generale la posizione di riserva del lavoratore (z) deve essere tale che i livelli e,m,h e w scelti dall'impresa e dal lavoratore e che massimizzano il profitto e l'utilità soddisfano la condizione di profitto nullo. Sono l'entrata e l'uscita delle imprese indotta da profitti positivi o negativi ed i risultanti effetti sul livello di occupazione aggregato che determinano il livello di equilibrio di z. Il processo è spiegato in quanto segue. Con n imprese in attività, ognuna che impiega un livello h di lavoro come definito dalle condizioni del primo ordine (8.7), l'occupazione totale risulta essere uguale a nh=H, dove l'offerta di lavoro è normalizzata all'unità, così che H rappresenta il tasso di occupazione aggregato. La probabilità di uscire dalla riserva di lavoro varia con il livello di occupazione, cioè = (H, ...) con ’>0
dal quale sappiamo, essendo (dz/d>0), che z = z(H, ..) with z’ > 0
18 | MICROECONOMIA
così che, come ci si poteva aspettare, la posizione di riserva del lavoratore migliora quando il tasso di occupazione sale. Ora supponiamo che il numero delle imprese sia tale che > 0 , così che nuove imprese sono indotte ad entrare nel mercato. La nuova occupazione accrescerà z, che a sua volta farà innalzare il costo unitario dell'impegno. L'entrata delle imprese continua finché eq. (8.13) non sia soddisfatta, determinando in questo modo, il livello di occupazione aggregata di equilibrio H così come z(H).4
M I G L I O R A M E N T I PA R E T IA N I N E G O Z IAT I Se miglioramenti paretiani rispetto all'equilibrio competitivo (i punti nella regione ombreggiata in figura 8.1) sono tecnicamente possibili, perché non sono implementati? Perché il lavoratore e il datore di lavoro non si accordano su un livello leggermente superiore di salario e impegno? O su un beneficio come più ore flessibili e più impegno ? La risposta è che un tale accordo non potrebbe essere vincolante. Il salario e le ore di lavoro sono contrattabili, ma l'impegno non lo è. Un tale accordo sarebbe possibile tecnicamente ma non sarebbe incentivante rispetto ai singoli comportamenti individuali data la struttura informativa del problema e le istituzioni che ne definiscono l'interazione. Quindi il fatto che e*, w*, m*, h* siano Pareto inefficienti non implica che l'inefficienza possa essere eliminata o attenuata attraverso possibili alternative contrattuali o altre disposizioni istituzionali. Se il lavoratore fosse l'unico, allora la proprietà dei beni aziendali potrebbe essere trasferita a lui che, diventando lavoratore auto-assunto e allo stesso tempo titolare del residuo sul flusso di reddito derivante dalla produzione, non avrebbe bisogno di supervisione. Come vedremo nel capitolo 9, i benefici dalla scelta ottima di impegno del lavoratoreproprietario, in assenza di supervisione, potrebbero essere sufficienti a pagare al precedente datore di lavoro un rendimento fisso sui beni capitali per compensarlo della perdita dell'uso dei beni. Perfino se l'assenza di economie di scala permettesse questa soluzione alla Robinson Crusoe, la stessa potrebbe non essere possibile se il lavoratore fosse avverso al rischio o fosse vincolato nel credito. In questi casi il lavoratore potrebbe preferire continuare a lavorare secondo i contratti descritti sopra piuttosto che essere un lavoratore-proprietario perfino se i beni capitali gli fossero dati. Consideriamo un altro possibile rimedio istituzionale. Supponiamo che la forza lavoro sia organizzata in un sindacato che può negoziare con il datore di lavoro. 4
L’equilibrio esiste se i profitti sono positivi quando H=0, o i profitti sono negativi se la domanda di lavoro uguaglia l’offerta (una condizione sufficiente è z(1) > y(h) . Inoltre dato che (H) è monotona l’equilibrio è unico.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|19
Supponiamo che i lavoratori membri siano identici, così che il sindacato semplicemente implementa l'unanime decisione dei suoi associati. Inoltre, ipotizziamo che l'informazione dei membri sull'operato di ciascuno permetta di usare una supervisione reciproca per implementare un livello comune di impegno. Questo significa che la transazione non è più vincolata dalle funzioni di risposta ottima dei lavoratori e quindi i risultati di equilibrio possono includere coppie {w,e} al di sopra della funzione di risposta ottima a condizione che il sindacato e il datore di lavoro riescano a raggiungere un accordo. Il resto della transazione come descritta in precedenza resta inalterata. In particolare, la funzione di licenziamento rimane in vigore e l'imprenditore determina il livello di occupazione nel modo già visto, cioè, uguagliando il prodotto marginale dell'impegno al suo costo effettivo. Ovviamente, il sindacato può negoziare sul tipo di supervisione, la funzione di licenziamento e il livello di occupazione, ma introdurre queste complicazioni non chiarirebbe il punto centrale di quello che segue. Riconoscendo la possibilità di un miglioramento Paretiano rispetto all'equilibrio competitivo {w*,e*}, il datore di lavoro e il lavoratore promettono di offrire rispettivamente { w > w *} e { e > e *} dove { w ,e } è un miglioramento Paretiano rispetto all'equilibrio di Nash non cooperativo {w*,e*}. Ogni coppia +
+
+
+
+
+
{ w ,e } nella regione dei miglioramenti Paretiani in figura 8.1 può rappresentare una
transazione come quella appena illustrata. Le due parti sono impegnate in una negoziazione nella quale i possibili esiti sono rappresentati dalla regione dei miglioramenti Paretiani e la cui frontiera è il luogo dei contratti efficienti. Il punto di partenza della negoziazione non è rappresentato dal risultato del rifiuto della transazione da parte delle due parti, ma piuttosto dal livello di transazione non cooperativo e Pareto inferiore costituito da {w*,e*}. Il problema della negoziazione, con i rispettivi guadagni per periodo, è illustrato in figura 8.4. Se fosse possibile ideare un accordo vincolante per implementare le due offerte +
+
+
+
w e e ci aspetteremmo che un risultato del tipo { w ,e } fosse abbastanza comune
almeno là dove i lavoratori fossero in grado di rendere effettiva la supervisione reciproca e a negoziare collettivamente con i datori di lavoro. In ogni caso, potrebbe essere impossibile rendere vincolante un tale accordo. Come spesso avviene, il datore di lavoro potrebbe non essere capace di identificare violazioni del livello di impegno contrattato solo osservando il livello aggregato di produzione se, ad esempio, fossero presenti altri fattori non osservabili che influenzano la produzione. Se non fosse possibile scrivere un contratto che vincoli le parti all'accordo, il datore di lavoro e il sindacato potrebbero essere capaci di implementare un miglioramento Paretiano adottando strategie di cooperazione condizionale: in ogni periodo ognuno mette in
20 | MICROECONOMIA
+
+
atto la propria parte della transazione Pareto superiore { w ,e } a condizione che l'altro abbia fatto lo stesso e devia sull'equilibrio Pareto inferiore { w*,e * } solo se l'altro ha deviato ( un "occhio per occhio" benevolo). Anche se queste strategie possono sembrare astratte, varianti di esse sono spesso osservate. Non è affatto raro per i sindacati minacciare lo "sciopero bianco" - cioè l'esecuzione solo delle mansioni esplicitamente menzionate nel contratto - mentre, d'altro canto, gli imprenditori spesso condizionano maggiori retribuzioni a cambi di regole che garantiscano livelli di impegno più alti. Si supponga che l'insieme delle azioni possibili siano ristrette rispettivamente a +
+
{ e*,e } per il sindacato e { w*,w } per il datore di lavoro e che le strategie a loro
disposizione siano di non cooperare senza condizioni o di cooperare condizionatamente (occhio per occhio benevolo) così come appena descritto. In realtà, sarebbero possibili molte altre strategie, ma questo insieme ridotto è sufficiente ai nostri fini. Usando la notazione di cui sopra, i valori attualizzati degli esiti attesi per i due negoziatori sono indicati nella tabella 8.1. Considera l'esito atteso del sindacato che adotti incondizionatamente e* se l'impresa offre condizionatamente w . Nel primo periodo ogni lavoratore riceve +
l'utilità per periodo corrispondente a ricevere un alta paga avendo lavorato poco +
u(e*,w ) e di essere poi licenziato con probabilità t(e*) , ricevendo la rendita di
riserva z come risultato, o di non esserlo con probabilità 1 t(e*) . Tuttavia nei periodi successivi il lavoratore riceverebbe gli esiti corrispondenti all'equilibrio non cooperativo (dato che l'impresa devia in risposta all' azione del sindacato e*). Gli altri esiti in tabella 8.1 possono essere interpretati in modo simile. Profitto del Datore di lavoro
Curva contratto efficiente
(e,w)
Utilità del Lavoratore,
u(e,w)
Figura 8.4. Il problema di negoziazione di impresa e sindacato: i rispettivi guadagni per periodo. Nota: l'area di negoziazione è la regione
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|21
delimitata dagli esiti nella interazione non cooperativa e dal luogo dei contratti efficienti. Se le strategie disponibili fossero {w+,w*} senza condizioni da parte del datore di lavoro e {e+,e*} senza condizioni per il lavoratore, il gioco sarebbe un dilemma del prigioniero. Il punto a è l'equilibrio del gioco non cooperativo (indicato dal punto a in figura 8.1) mentre il punto b è un punto sulla curva dei contratti efficienti (indicato dal punto b nella figura 8.1). Tavola 8.1. I Valori attualizzati degli esiti attesi nel gioco di negoziazione ripetuta. Datore di Lavoro Sindacato Condizionale
Condizionale
Non condizionale
u(e ,w ) iz v = +z i + t(e ) (w ,e ) = i u(e*,w ) + (1 t(e*))v * +t(e*)z 1+i (e*,w ) + * 1+i
u(e ,w ) + (1 t(e ))v * +t(e )z 1+i (e ,w*) + * 1+i v* = (e*,w*,z) (w*,e*) * = i
+
+
+
+
+
+
+
+
Non condizionale
+
+
+
+
+
+
Dato che v > v *, per un i sufficientemente piccolo può essere dimostrato che la strategia condizionale e è la risposta ottima alla strategia condizionale w . Il guadagno di un periodo per il lavoratore costituito da una paga alta per un livello basso di lavoro { e*,w } è più che compensato dalla differenza tra v e v * (e dalla più +
+
+
+
+
grande probabilità che il membro del sindacato che attua e * sia licenziato al termine del periodo e che quindi riceva z ). Allo stesso modo, per un livello sufficientemente basso di i, la strategia condizionale w sarebbe la risposta ottima alla strategia condizionale e . Quindi, l'esito { w ,e } è implementabile sotto certe condizioni. +
+
+
+
Naturalmente se il guadagno di un singolo periodo ottenuto interrompendo la cooperazione fosse grande abbastanza, o la probabilità di non essere licenziato piccolo a sufficienza, l'equilibrio cooperativo non sarebbe implementabile come equilibrio di Nash. Questa interazione stilizzata - la negoziazione di un esito cooperativo Pareto superiore rispetto all'equilibrio non cooperativo di partenza - cattura importanti evidenze empiriche delle relazioni nel mercato del lavoro. Spesso si possono osservare ambienti di lavoro sia cooperativi che non cooperativi (a volte anche altamente conflittuali) non solo nella stessa industria ma addirittura in differenti unità produttive della stessa impresa5. Tipicamente, la soluzione cooperativa è più probabile in grandi imprese che 5
Lo stesso modello ha una generale valenza in altri tipi di collaborazioni come ad esempio i matrimoni (Lundberg e Pollak 1993), nei quali sono spesso osservati sia esiti cooperativi che non cooperativi.
22 | MICROECONOMIA
dispongono di forza lavoro sindacalizzata. Il mercato del lavoro in queste imprese è chiamato talvolta mercato del lavoro primario, caratterizzato da occupazione stabile, percorsi di avanzamento di carriera ben definiti, rari licenziamenti per giusta causa e una divisione dei guadagni derivanti dalla cooperazione tra lavoratori e datori di lavoro. Negli altri settori dell'economia (spesso caratterizzati da occupazione precaria, contenute aspettative di carriera e bassi salari) dove è più facile osservare l'esito non cooperativo costituiscono il mercato del lavoro secondario. Queste differenze sono evidenti nell'esempio di negoziazione precedente dal fatto che t(e ) < t(e*) e dai +
maggiori guadagni distribuiti derivanti dalla cooperazione > * e v > v *. Seguendo questa interpretazione, una pura disciplina del lavoro si applicherebbe al mercato del lavoro secondario, mentre un modello ibrido costituito da una negoziazione rispetto all'esito di partenza non cooperativo e inefficiente, meglio descriverebbe il mercato del lavoro primario6. +
+
Come può la struttura di un'economia incentivare la cooperazione? Nota che la probabilità di essere licenziato ha lo stesso effetto del tasso di preferenza temporale. Se il licenziamento fosse probabile ( t è alto) l'esito cooperativo sarebbe difficile da sostenere. Consideriamo una funzione di licenziamento più realistica nella quale considereremo sia la probabilità di essere licenziato per giusta causa, t(e) , sia la probabilità di licenziamento per altre ragioni (per esempio, fluttuazioni della domanda o il riposizionamento dell'impresa). La tabella dei valori degli esiti, modificata per tener conto di licenziamenti che non dipendono da cause legate direttamente alla scelta del livello di impegno dei lavoratori, semplicemente mostra un aggiunto alla funzione t(e) lì dove quest'ultima appare nella tabella 8.1. Diventa così chiaro che alti livelli di licenziamenti non dipendenti dal livello di impegno rendono più difficile sostenere l'esito cooperativo. Di conseguenza, miglioramenti Paretiani basati su scambi "salario-per-impegno" sono più probabili laddove coesistano due tipi di istituzioni: sindacati con la capacità di negoziare con i datori di lavoro e di implementare supervisione reciproca, da un lato, e politiche macroeconomiche che attenuino la volatilità della domanda aggregata dall'altro. Questo è un esempio di complementarietà istituzionale, una situazione nella quale i benefici di una istituzione sono accresciuti dalla presenza dell'altra. (Ritorneremo sulle complementarietà istituzionali nel capitolo finale.) Dove le complementarietà istituzionali sono forti ci aspetteremo di vedere o la coesistenza di un’efficace 6
Un’interpretazione alternativa offerta da Bulow e Summers (1986) spiegherebbe i salari alti del mercato del lavoro primario derivanti da un’applicazione del “salario di efficienza” solo in quel mercato e non in quello secondario che risulterebbe caratterizzato da un equilibrio in corrispondenza di salari bassi. Comunque, in presenza di alti livelli di disoccupazione involontaria tra gruppi demografici in cerca di lavoro nel mercato secondario, la loro interpretazione sembra quantomeno dubbia.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|23
negoziazione collettiva e un'efficace stabilizzazione macroeconomica o l'assenza di entrambe.
PERCHÉ
L E I M P R E S E N O N V E N D O N O L AV O R O ?
Potrebbe esistere un modo molto più semplice non solo per raggiungere un miglioramento Paretiano rispetto all'esito non cooperativo, ma anche per implementare un esito Pareto-efficiente. Il risultato chiave nella precedente dimostrazione della Pareto inefficienza è nel fatto che il vincolo di partecipazione del lavoratore non è soddisfatto come un'uguaglianza e per questo egli riceve quello che abbiamo chiamato una rendita incentivante. Perché dovrebbe essere così? Il datore di lavoro potrebbe non aver visto un'occasione per accrescere i profitti? L'impresa, sapendo che il lavoratore riceverebbe un sostanziale aumento nel valore attuale dell'essere occupato, non potrebbe richiedere semplicemente un pagamento per la garanzia del posto di lavoro (Carmicheal 1985)? Se l'impresa sfruttasse questa opportunità, il lavoratore potrebbe ripagare un’ammontare pari a v*-z* e di conseguenza, avendo pagato questa "tassa" sul lavoro, sarebbe indifferente tra accettare il lavoro o meno, ma, soprattutto, non sarebbe indifferente a perderlo. Vediamo come questo avviene. La tassa per il lavoro da considerare è un trasferimento eseguito in un unico periodo, non rimborsabile, richiesto dal datore di lavoro come condizione per l’offerta di un posto (a volte questo trasferimento è stato erroneamente chiamato obbligazione). Ipotizziamo che la ricchezza totale di un lavoratore sia v+k dove, come prima, v è il valore del posto di lavoro e k è costituito da altra ricchezza e che la tassa non abbia alcun effetto marginale sul comportamento del lavoratore. Dato che il lavoratore finanzia la tasse sul lavoro dall'ammontare di ricchezza k, il pagamento ne riduce semplicemente l'ammontare. Inoltre, la funzione di risposta ottima del lavoratore rimane inalterata a causa dell'assenza di effetti di sostituzione. Ipotizziamo ancora che il datore di lavoro incontri effettivamente dei vincoli (per ragioni legate alla reputazione) nell’adottare strategie opportunistiche, come ad esempio licenziare i lavoratori per trarre vantaggio dal pagamento della tassa proveniente dai nuovi assunti. Il costo per il lavoratore di ridurre la propria ricchezza di un euro è equivalente alla riduzione di un euro di ricchezza v. Dato che h è il numero di lavoratori assunti, questo rappresenta anche il numero di pagamenti raccolti. Per semplificare l'esposizione astrarremo interamente dagli effetti e dai costi della supervisione (e è conosciuto dal datore di lavoro ma l'informazione non è verificabile).
24 | MICROECONOMIA
Il datore varia h,w e B per massimizzare = y(he(w)) hw + iBh
(8.14)
soggetta al vincolo v(e(w),w iB) z
dove i è il tasso di rendimento, B è l'ammontare del pagamento richiesto e v(.) è il valore attualizzato ex ante del posto di lavoro tenendo conto della tassa da pagare B. Il termine w-iB è il salario netto, tenendo conto del costo opportunità dei
rendimenti iB sostenuto dal lavoratore sulla sua ricchezza. La Lagrangiana associata al problema di massimizzazione è data da r = y(he(w))-hw + iBh - {v(e(w), w-iB) - z}
dalla quale si ottengono le seguenti condizioni del primo ordine: r r r r
w
h
B
= y' he' h + (v + v e') = 0 = y'e w + iB = 0 = ih iv = 0 =v z =0 w
e
w
(8.15a) (8.15b) (8.15c) (8.15d)
Dalla (8.15b) possiamo determinare il livello di occupazione che uguaglia il prodotto marginale dell'impegno y con il costo di un'ora di lavoro (w-iB) per unità di impegno oraria, o il costo di un'unità di impegno, cioè (8.16)
y' = (w-iB)/e
Il coefficiente Lagrangiano è interpretato come il prezzo ombra del vincolo di partecipazione e dall'equazione 8.15 possiamo scriverlo come: (8.17)
= -dr/dz = h/vw
L'equazione (8.17) rappresenta l'effetto sui profitti di una variazione della posizione di riserva del lavoratore, cioè l'incremento in salario necessario a soddisfare il vincolo di partecipazione del lavoratore ( 1/ v ) volte il livello di occupazione. w
Inoltre, possiamo vedere che per livelli di occupazione positivi e valendo l'ipotesi di non sazietà ( v > 0 ) >0, il vincolo di partecipazione risulta effettivo. w
Eliminando h dalla (8.15a) e sostituendo nella precedente espressione per abbiamo y'e' 1 = 1
e' v v w
e
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|25
che dopo qualche semplice passaggio diventa y' =
v v
(8.18)
e
w
Combinando le equazioni (8.16) e (8.18) abbiamo (w iB) v = e v
e
(8.19)
w
che implica l'uguaglianza tra il costo di una unità di impegno sopportato dall'impresa (il lato sinistro dell'uguaglianza) e (l'opposto) del tasso di sostituzione tra salario ed impegno sulla curva "iso-valore-attuale" del lavoratore (il lato destro). Il problema e la sua soluzione possono essere interpretati come segue. In figura 8.5, l'asse orizzontale rappresenta sia il salario ricevuto dal lavoratore, w, che il costo del salario pagato dal datore di lavoro, w-iB. L'imprenditore identifica la iso-v curva per la quale v=z (dato che lui sa che il vincolo di partecipazione sarà effettivo). Lungo questa curva c'è qualche punto (a) che massimizza la pendenza di una semiretta che parte dall'origine, misurata da e/(w-iB) che di conseguenza soddisfa l'equazione (8.19). Questo punto non essendo sulla curva della funzione di risposta ottima, è ovviamente non ottenibile direttamente: offrire il salario w*-iB* non indurrebbe il lavoratore a fornire l'impegno e*. Il salario è determinato per questo al livello sufficiente ad indurre il lavoratore ad impegnarsi al livello e*. E il livello del pagamento richiesto fissato è quello che implementa il punto a, soddisfacendo il vincolo di partecipazione come un'uguaglianza. Con w,B e e determinate, h* è determinato dall'equazione (8.15b). Il datore di lavoro a questo punto verifica se in equilibrio sarebbe più remunerativo non assumere nessuno e/o se il lavoratore sia soddisfatto. Se non si verifica nessuno dei due casi allora l'ipotesi che il vincolo di partecipazione sia effettivo è positivamente è dimostrata. L'equilibrio in presenza della tassa sul lavoro è sorprendentemente diverso dal caso precedente. Primo, dato che il vincolo di partecipazione è effettivo, il lavoratore è indifferente tra accettare il lavoro o meno. Il mercato del lavoro è così in equilibrio; non ci sono lavoratori involontariamente disoccupati. Questo risultato sottolinea un'importante limitazione dell'equilibrio sul mercato del lavoro come obiettivo della politica economica: se i lavori fossero resi sufficientemente sgradevoli potrebbe non esserci eccesso di domanda. Secondo, mentre le rendite ex ante (prima di accettare il lavoro) sono zero, le rendite ex post sono effettivamente più grandi che in assenza di tassa sul lavoro (per un dato z, il salario ottimale è più alto, come se fosse fissato non solo per indurre l'impegno ma anche per accrescere il valore del pagamento che può essere richiesto al futuro lavoratore). Terzo, la ricchezza del lavoratore è ridotta e i
26 | MICROECONOMIA
profitti del datore sono accresciuti. In equilibrio generale l'effetto sarebbe stato quello di accrescere il numero delle imprese e il livello di occupazione (fino a che z non fosse salito abbastanza da ristabilire la condizione di profitto nullo). Questo modello sembra predire che un pagamento a fronte di un posto di lavoro sarebbe un' istituzione comune (l'ammontare non sarebbe trascurabile) e che la disoccupazione involontaria sarebbe rara. Ma poche imprese chiedono un tale pagamento, mentre surrogati di questo come un salario di prova inizialmente molto basso, raramente sono della grandezza che renderebbe il lavoratore indifferente tra accettare il lavoro o meno7.
Impegno
Salario Figura 8.5. Pagamenti ottimali per il posto di lavoro garantiscono il raggiungimento dell'equilibrio sul mercato del lavoro e implementano un ottimo Paretiano. Il datore di Lavoro identifica il punto a come soluzione che massimizza e/w, l'impegno ottenuto dal lavoratore per unità di costo. Per implementare questo risultato il datore di lavoro offre il salario w* (al quale il lavoratore risponde con e*) con un pagamento pari a B*.
Questo significa che gli imprenditori semplicemente non approfittano di un'opportunità vantaggiosa? Perché questo non accade? Dire che i futuri lavoratori non hanno sufficienti risorse per pagare per un posto di lavoro non è una risposta soddisfacente. La ricchezza limitata del lavoratore semplicemente restringe le somme che possono essere chieste ma non confuta la logica dell'argomento, che ugualmente predirebbe pagamenti ottimali e quindi equilibrio nel mercato del lavoro. Una 7
Negli Stati Uniti, lavori che garantiscono rendite alte, tipicamente sono offerti sia a principianti che a lavoratori esperti, il che fa sorgere dubbi sull'interpretazione dei salari inizialmente bassi come costo del lavoro implicito per il lavoratore. Questi pagamenti possono assumere forme non monetarie, come ad esempio nel caso che un datore di lavoro si assicuri il supporto politico del futuro lavoratore o usi la sua posizione di potere per estorcere favori sessuali.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|27
spiegazione più convincente è che motivazioni positive del lavoratore nei confronti del datore di lavoro sono importanti nell'indurre lavoro di alta qualità e alti livelli di impegno. Queste motivazioni sono indebolite da un imprenditore che mette in atto la più dura negoziazione possibile. Due tipi di evidenza supportano questa interpretazione. Primo, gli imprenditori sono riluttanti a tagliare i salari durante i periodi di alta disoccupazione, apparentemente per ragioni legate alla morale e alle motivazioni del lavoratore. Truman Bewley (1999) cercò di capire la riluttanza dei datori di lavoro ad approfittare attraverso un taglio dei salari del declino della rendita di riserva dei lavoratori durante le recessioni. Le sue numerose interviste hanno mostrato che gli imprenditori temono l'effetto dei tagli dei salari sull'opinione dei lavoratori. La ragione per la quale i datori di lavoro si astengono dall'abbassare i salari durante le recessioni potrebbero valere con almeno altrettanta forza per il fatto che la maggior parte di loro non chiede pagamenti in cambio di posti di lavoro, anche se le rendite associate ad un tale comportamento fossero alte. Secondo, come abbiamo visto nel precedente capitolo, soggetti in mercati del lavoro sperimentali tipicamente esibiscono preferenze fortemente reciproche, fornendo alti livelli di impegno in risposta alle offerte dell'imprenditore che sembrano essere generose (Fehr, Kirchsteiger, and Riedl 1998). Quando posti di lavoro a pagamento erano tra le possibili strategie che sono state adottate dal datore di lavoro, queste sono state abbandonate dai soggetti partecipanti agli esperimenti perché i profitti sono scesi come risultato della risposta negativa dei lavoratori. Un'ulteriore ragione per la quale posti di lavoro a pagamento sono rari può essere che i futuri lavoratori non credano che effetti di reputazione o diritti fondamentali bastino ad evitare che gli imprenditori licenzino i lavoratori senza giusta causa per accrescere il numero di pagamenti riscossi. Il fatto che posti di lavoro a pagamento siano rari è qualche volta preso come indicazione che il modello di disciplina del lavoro sopra esposto sia di poca rilevanza empirica, ma, come sopra argomentato, quando si estende il modello per includere i tipi di preferenze sociali descritti nel terzo capitolo, questo risulta consistente con il fatto che posti di lavoro a pagamento siano effettivamente rari. L'interpretazione più plausibile è che un'offerta di salario che produce una rendita da lavoro ex-post può essere vista dal lavoratore sia come un segnale della generosità del datore di lavoro sia semplicemente come una strategia di massimizzazione del profitto (la prima se non è accompagnata da una richiesta di pagamento a fronte dell'offerta, mentre la secondo se lo è). Di conseguenza, richiedere un pagamento a fronte di un posto di lavoro
28 | MICROECONOMIA
influenza l'opinione del lavoratore circa le intenzioni (o il tipo) dell'imprenditore ed a quest’ultima egli adatta il proprio comportamento. Quest’interpretazione sottolinea l'importanza di considerazioni circa l'onestà e la morale nella fissazione dei salari e identifica l'occupazione come una sorta di scambio di doni (Akerlof 1982).
DISCIPLINA E M P IR IC A
DEL
L AV O R O
ED INCENTIVI:
E V ID E N Z A
Ci sono molti plausibili modelli del mercato del lavoro che hanno migliorato le assunzioni fatte nei classici modelli Walrasiani, dunque perché concentrarsi su questa classe particolare di modelli? La ragione più importante è che il modello della disciplina del lavoro basato su rinnovo condizionale è consistente con diverse evidenze indiscusse del funzionamento dell'economia (mentre il modello convenzionale non lo è). La prima è l'esistenza di sostanziali rendite da occupazione in molti lavori. Non si può pensare di tener conto di tutti gli aspetti connessi con la percezione di reddito semplicemente valutando i livelli di reddito degli occupati e dei non occupati, dato che i due gruppi differiscono per molti altri aspetti e non per il solo status. La misura teoricamente più appropriata è la tipica perdita da parte del lavoratore di benefici e altri proventi derivanti da un periodo di disoccupazione involontaria come nel caso della chiusura di una fabbrica. Henry Farber (2003:2), passando in rassegna l'abbondante letteratura sul tema, ha concluso che "i lavoratori licenziati soffrono di significativi periodi di disoccupazione e che i proventi da lavoro dopo il licenziamento sono sostanzialmente più bassi di quelli prima del licenziamento". Questa conclusione rimane valida anche durante il periodo di forte domanda di lavoro degli anni ‘90. Negli Stati Uniti, il costo della perdita del lavoro (una stima del valore attuale di (v-z) usando un tasso di preferenza intertemporale del 10 percento) può oscillare tra una metà e una volta e mezza l'ammontare annuale dei guadagni, in funzione del periodo durante il quale il lavoro è stato mantenuto prima del licenziamento8. In termini soggettivi, le rendite possono essere considerevolmente più grandi a causa dello stigma sociale e di altri disagi riconducibili all'essere senza lavoro. Numerosi studi hanno documentato la perdita di benessere soggettivo (misurato da una serie di domande) associata con la perdita del lavoro o con l'essere senza lavoro. Uno studio (Winkelmann e Winkelmann 1998), usando dati panel che permettessero un confronto dello stesso individuo in differenti stati di occupazione, ha evidenziato 8
Questa approssimazione è basata su un calcolo che usa le stime di Faber. Vedi anche Burda e Mertens (2001).
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|29
che l'effetto soggettivo dell'assenza di lavoro in sè era molto più grande che il costo oggettivo associato alla perdita di reddito9. Ci possono essere lavori per i quali i lavoratori sono indifferenti tra continuare a lavorare o essere licenziati, come prevede il modello Walrasiano, ma l'evidenza empirica dimostra in modo schiacciante che la maggior parte dei lavoratori ha una forte preferenza per rimanere occupati. Secondo, i salari reali tendono a variare con il livello di occupazione (Bowles 1991, Blanchflower and Oswald 1994), come prevede il modello di regolamentazione dell'impegno. (Nel modello Walrasiano standard, per un dato stock di capitale, più occupazione dovrebbe abbassare il prodotto marginale del lavoro e quindi il salario.) Terzo, i datori di lavoro impiegano molto personale e altre risorse per monitorare il livello di impegno dei loro lavoratori, spese che sarebbero incompatibili con la massimizzazione dei profitti se il livello di impegno fosse invariante o soggetto a contratti enforceable senza costi. Quarto, l'impegno nel lavoro sembra essere abbastanza variabile ed è raramente soggetto a contratto. Mentre pagamenti collettivi sono una pratica comune, quelli al pezzo sono estremamente rari al di fuori dell'industria dell'abbigliamento e calzature (Petersen 1992). Quando, per esempio, un sistema di pagamento per installatori di vetri per auto negli Stati Uniti fu cambiato da salari orari a quote al pezzo, la produzione per lavoratore aumentò di quindici volte (Lazear 1996). Allo stesso modo, piantatori di alberi nella British Columbia assegnati casualmente al pagamento al pezzo hanno avuto una prestazione migliore del 20 percento dei piantatori casualmente assegnati al salario fisso (Shearer 2001). Queste risposte più generose a incentivi più alti suggeriscono che i lavoratori esercitano un controllo sostanziale sul loro impegno lavorativo. Perfino effetti più evidenti dell'incidenza degli incentivi all'impegno sulla produttività sono stati trovati in uno studio rigurdante contadini che lavoravano sotto contratti differenti. Laffont e Matoussi (1995) hanno rilevato che la produttività dei tunisini che lavoravano come dipendenti era la metà di quella che essi avevano quando lavoravano avendo pieno diritto al residuo (lavoro familiare). Gli individui erano il 50 percento più produttivi quando lavoravano sotto contratti a rendita fissa (e quindi avevano pieno diritto residuale sul risultato del prodotto del 9
Blanchflower and Oswald (1994) hanno stimato che il reddito addizionale richiesto per compensare il fatto di essere senza lavoro è di 60000 dollari, ma se questo viene basato su un confronto tra occupati e non rispetto a un grande numero di misure demografiche e non solo, può sovrastimare il costo soggettivo della perdita del lavoro (l'assenza del lavoro può essere una delle tante ragioni che rendono le persone infelici o persone geneticamente infelici possono essere disoccupate con più probabilità.)
30 | MICROECONOMIA
loro impegno) che quando lavoravano nel contesto dei più blandi incentivi all'impegno del contratto di mezzadria. Un inusuale studio longitudinale delle Filippine ha evidenziato che: I lavoratori evidentemente si impegnano maggiormente in presenza di uno schema di pagamento al pezzo o in un lavoro autonomo rispetto ad un lavoro con salario orario come dimostrato dal fatto che essi perdono più del 10 percento di massa corporea al netto del consumo di calorie quando lavorano sotto lo schema di pagamento al pezzo piuttosto che sugli appezzamenti di loro proprietà...Lo stesso lavoratore consuma il 23 percento (16 percento) di calorie in più per giorno quando è impiegato sotto uno schema di pagamento al pezzo (occupazione nella propria fattoria) che quando è impiegato a salario orario. (Foster e Rosenzweig 1994: 214)
Uno studio nel Regno Unito, usando osservazioni su attività di lavoro individuali, ha trovato che l'impegno lavorativo risponde fortemente a condizioni macroeconomiche come ci si aspetterebbe dal modello di regolamentazione dell'impegno e, in particolare, che più alti livelli di disoccupazione inducono più alte intensità di lavoro (Schor 1988). Uno studio di serie storiche negli Stati Uniti ha dimostrato che la produttività del lavoro varia fortemente con la grandezza delle rendite da occupazione, condizionatamente a movimenti del rapporto capitale lavoro, del livello di capacità di utilizzazione e altre variabili usuali nell'econometria della produttività (Bowles, Gordon e Weisskopf 1983). Ulteriore evidenza empirica suggerisce che questi effetti della disciplina del lavoro sono più forti nel mercato del lavoro secondario che nel mercato primario sindacalizzato e più forti nei paesi con sindacati più deboli. La rarità di licenziamenti per giusta causa non è un'evidenza contro i modelli di disciplina del lavoro: un’efficace strategia di disciplina potrebbe risultare in assenza di licenziamenti (come in Shapiro e Stiglitz 1984). Inoltre, anche se il licenziamento per giusta causa non è esplicitamente parte della strategia di displina del lavoro dell'imprenditore - come nei mercati di lavoro primario di molte economie europee i giudizi del datore di lavoro sull'impegno del lavoratore sono generalmente usati nella selezione per la promozione o sospensione, riproducendo efficacemente gli effetti del licenziamento per giusta causa come un incentivo per lavorare sodo. Alcuni di questi fatti possono essere spiegati dalla divisione della rendita, beni specifici rispetto ad una determinata transazione e altri modelli delle relazioni di lavoro introdotti nel capitolo 10. E' plausibile che un'adeguata comprensione dei mercati del lavoro e delle relazioni che in essi avvengono possa richiedere approcci ibridi che includono altri modelli non Walrasiani non sviluppati qui. Molte delle evidenze empiriche appena presentate sono consistenti con più di uno di questi modelli.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|31
C O N C L U S IO N E Lo stimolo per la maggior parte del nuovo lavoro teorico sui mercati del lavoro nasce da una disaffezione verso gli aspetti microeconomici dei modelli macroeconomici di occupazione aggregata e disoccupazione. I macroeconomisti sono stati tra i più prominenti recenti innovatori. Modelli basati sulla contrattazione incompleta dell'impegno o di altri aspetti dello scambio di lavoro hanno spiegato come un equilibrio competitivo potrebbe esibire disoccupazione involontaria, restringendo così il divario tra la teoria standard e l'osservazione empirica. In questo processo le teorie standard del mercato del lavoro e delle imprese sono state sostanzialmente trasformate. Robert Solow (1990) ha sintetizzato la direzione del cambiamento nel titolo del suo libro The Labor Market as a Social Institution e Arthur Okun (1981) ha catturato il nuovo ruolo chiave della fiducia e di altre preferenze sociali nel suo termine “the invisible handshake". L'importanza dei motivi di reciprocità e di altre preferenze sociali nello spiegare perchè le imprese non vendano posti di lavoro sottolinea la futilità del semplice introdurre contrattazione incompleta in uno schema Walrasiano altrimenti invariato. Gli esperimenti a cui abbiamo accennato nella penultima sezione del precedente capitolo suggeriscono che l'imcompletezza contrattuale amplifica il ruolo delle preferenze sociali nel determinare gli esiti di equilibrio. Tre implicazioni delle nuove teorie hanno destato meno attenzione. La prima è stata già menzionata nella discussione sulla scelta da parte dell’impresa dei fattori capitale quando l'impegno lavorativo non è oggetto di contratto. Se le difficoltà della supervisione dell'impegno differiscono rispetto a diverse tecnologie, la scelta della tecnologia sarà influenzata dalla natura del problema di disciplina del lavoro. Di conseguenza, aspetti della disciplina del lavoro come le norme prevalenti, la possibilità di accedere all'assicurazione da disoccupazione e altri fattori che determinano la scelta dell'impegno dei lavoratori, influenzano la profittabilità delle tecnologie alternative. Questo punto di vista contrasta con il modello standard nel quale la scelta delle tecnologie risponde alla scarsità dei fattori indicata dai prezzi corrispondenti. Oltretutto, pensare che istituzioni - l'impresa convenzionale, per esempio - possano essere spiegate da condizioni tecnologiche date esogenamente, è perlomeno dubbio. Una interpretazione più plausibile è che le tecnologie e le istituzioni coevolvano ed ognuna influenzi lo sviluppo dell'altra. Per esempio, quando negli anni 80, negli Stati Uniti, le compagnie di trasporti installarono computer a bordo dei propri camion, esse furono capaci di monitorare i loro autisti molto più efficacemente (Baker e Hubbard 2000). Registratori di percorso
32 | MICROECONOMIA
fornirono alle compagnie informazioni certe circa la velocità, i tempi di sosta e altri dettagli sull'impiego del camion che costituivano una fonte di conflitto di interessi tra l'autista e la compagnia. Succedeva che il costo di funzionamento del mezzo (pagato dalla compagnia) era crescente e convesso rispetto alla velocità di crociera: i camionisti preferivano andare ad una velocità maggiore di quella che minimizzava i consumi per permettersi soste più lunghe. Gli autisti che possedevano il camion, avendo il diritto al residuo ottenuto dai ricavi meno questi ed altri costi, internalizzavano di conseguenza la spesa per il carburante e il deprezzamento del bene, realizzando significativi risparmi. Per questa ragione, prima che fossero introdotti i registratori di percorso, i camionisti che operavano in proprio riuscivano a competere con successo con compagnie di trasporto su quelle tratte per le quali il conflitto di interesse tra autisti e compagnie era particolarmente forte. Usando i registratori di percorso, le compagnie furono in grado di scrivere contratti basati sulla velocità alla quale il camion doveva essere guidato e di dare agli autisti ulteriori incentivi a operare nell'interesse della compagnia. Diversamente da altri computer di bordo (come gli EVMSs, i sistemi di gestione elettronici del veicolo), i registratori di percorso non fornirono nessun miglioramento nel coordinamento tra vettori e mittenti, dato che l'informazione era disponibile solo dopo il completamento del viaggio. La sola funzione dei registratori è stata quella di rendere contrattabili aspetti del comportamento del guidatore che entravano in conflitto con gli interessi dell'imprenditore. Migliorando le opportunità contrattuali delle compagnie i registratori di percorso hanno avuto due effetti. Primo, essi hanno portato ad un significativo decremento della quota di mercato detenuta dai camionisti in proprio. Secondo, i camionisti che avevano a bordo i registratori guidavano più piano. Al contrario, la capacità degli EVMSs di garantire un migliore coordinamento tra vettore e mittente ha fatto abbassare i costi ma non ha avuto effetti particolari sulla distribuzione dei contratti o della proprietà nell'industria dei trasporti. In questo caso, una tecnologia è stata scelta perché ampliava l'insieme dei contratti possibili in modo da aumentare i profitti. Se le tecnologie sono endogene in questo senso, diventa difficile dare una definizione precisa del termine costi di transazione. Nel modello sopra sviluppato è chiaro che i costi di supervisione sono costi di transazione. Comunque l'equazione (8.7d) mostra che la volontà delle imprese di pagare per usare il fattore k è spiegata dal contributo che il fattore dà non solo alla produzione, ma anche alla disciplina del lavoro. I costi per usare il bene k sono costi di transazione? Se così fosse, quale frazione del costo del fattore k dovrebbe essere contata tra i costi di transazione invece che tra quelli di produzione? I costi dei registratori di percorso istallati sui camion erano costi di transazioni quasi
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|33
puri. Ma cosa dire degli EVMSs che come i registratori di percorso permettono contratti con incentivi più forti per i guidatori e migliorano anche enormemente la coordinazione tra cliente e impresa? La stessa ambiguità sorge rispetto il salario. Abbiamo visto che un aumento di salario accompagnato da una diminuzione nella supervisione potrebbe sostenere lo stesso livello di impegno lavorativo. Sembrerebbe strano chiamare la riduzione della supervisione una diminuzione dei costi di transazione e contemporaneamente registrare la crescita della spesa totale per il lavoro. Allora sono anche i salari dei costi di transazione? Queste ambiguità circa il significato del termine sembrano inevitabili e spiegano perché qui non abbiamo fatto uso dell'approccio dei costi di transazione. Una seconda implicazione dei nuovi modelli del lavoro è che, data la durata pluriennale del rapporto lavorativo, l'ambiente di lavoro è un luogo culturale nel quale il lavoratore forma le proprie preferenze e convinzioni. In questo i luoghi di lavoro non sono diversi da scuole e quartieri, visto che determinano chi incontra chi, cosa fare e con quale ricompensa associata a quale comportamento. Un esempio empirico suggerisce l'importanza di questi effetti. Per trenta anni, Melvin Kohn e i suoi collaboratori hanno studiato la relazione tra la posizione di un individuo nella struttura di comando sul posto di lavoro - rispetto al fatto di prendere ordini - e la valutazione individuale dell'autodeterminazione e indipendenza nei loro figli, così come la loro stessa flessibilità intellettuale e personale autodeterminazione. Essi hanno concluso che "l'esperienza di autonomia sul lavoro ha un profondo effetto sui valori, orientamenti e funzionamenti cognitivi di una persona".10 Il suo studio d'equipe di Giappone, Stati Uniti e Polonia (Kohn, Naoi, Schoenbach, Schooler and Slomczynsky 1990) ha portato a risultati che sono consistenti tra paesi: le persone che esercitano autonomia nel lavorare attribuiscono un alto valore all'autodeterminazione anche in altri campi della loro vita (inclusi l'educazione dei figli e il tempo libero) e sono meno propensi a credere nel fatalismo e a mostrarsi sfiduciati o privi di autostima. Kohn e i suoi coautori (1983:142) argomentano che "la struttura della società influenza il funzionamento psicologico individuale prevalentemente influenzando le condizioni della propria vita." Kohn conclude che "la semplice spiegazione che effettivamente rende conto di tutto quello che è conosciuto circa gli effetti del lavoro sulla personalità...è che i processi sono diretti: si apprendere dalle esperienze di lavoro e si estendono queste lezioni al di fuori della realtà lavorativa" (Kohn 1990:59). 10
Vedi Kohn (1969), Kohn, Naoi, Schoenbach, Schooler and Slomczynski (1990), Kohn and Schooler (1983) e Kohn (1990). La citazione è da pag.967 del lavoro coautorato del 1990. Questi studi tengono conto della possibilità che la personalità influenzi l'organizazzione del lavoro, piuttosto che il contrario.
34 | MICROECONOMIA
Dato che le dimensioni della personalità prese in considerazione da Kohn sono parte delle preferenze individuali che spiegano come le persone scelgano di crescere i loro figli, in che modo impieghino il tempo libero e simili decisioni, questa risulta essere una forte evidenza empirica sul fatto che le preferenze siano endogene rispetto all'organizzazione del lavoro. Una terza implicazione è che le norme che stabiliscono un salario giusto, l’etica del lavoro e le altre preferenze sociali non sono esogene, ma piuttosto evolvono in funzione del livello dei salari correnti, dell’impegno sul lavoro, e delle condizioni lavorative esattamente al pari delle influenze fuori dall'ambiente lavorativo. Una sostanziale discrepanza tra la norma sociale che prescrive il giusto salario e il salario di equilibrio, per esempio, può essere il frutto di un'erosione della norma o del buon esito di una azione collettiva dei lavoratori per migliorare la loro situazione. Non sappiamo cosa avesse in mente Henry Ford quando annunciò il giorno dei cinque dollari. Il fatto che, in seguito all'aumento, la produzione per ora lavorata crebbe più del doppio suggerisce che l'impegno dei lavoratori crebbe anch'esso in modo sostanziale. (Ford aumentò il livello di supervisione insieme al salario, così che la probabilità che il lavoro fiacco fosse tollerato scese senza dubbio.) Se l'accresciuto impegno dei lavoratori avesse costituito una risposta alla carota dell'apparente generosità di Ford (per esempio riducendo la disutilità dell'impegno nell'eq. (8.5)) o al bastone di una più stretta sorveglianza e rendite da lavoro più alte (facendo crescere il lato destro dell'eq. (8.5)), non lo possiamo dire.11
11
Raff (1988) pensa che il rafforzamento della sorveglianza è consistente con il modello della disciplina del lavoro, ma sembra che egli ipotizzi (implausibilmente) che la sorveglianza e il salario siano sostituti piuttosto che complementi nella strategia della disciplina del lavoro, contrariamente al ragionamento fin qui condotto.
OCCUPAZIONE, DISOCCUPAZIONE E SALARI
|35
Riferimenti bibliografici Akerlof, G. A. (1982). "Labor Contracts as Partial Gift Exchange." Quarterly Journal of Economics 97(4): 543-569. Baker, G. and T. Hubbard (2000). Contractibility and Asset Ownership: On-Board Computers and Governance in U. S. Trucking. Cambridge, MA, National Bureau of Economic Research, W7634. Bewley, T. F. (1999). Why wages don't fall during a recession. Cambridge, Harvard University Press. Blanchflower, D. G. and A. J. Oswald (1994). The Wage Curve. Cambridge, MA, MIT Press. Bowles, S. (1991). The Reserve Army Effect on Wages in a Labour Discipline Model: U.S., 1954-1987. Making Economies More Efficient and More Equitable: Factors Determining Income Distribution. T. Mizoguchi. Oxford, Oxford University Press: 385-406. Bowles, S., D. Gordon, et al. (1983). "Hearts and Minds: A Social Model of U.S. Productivity Growth." Brookings Papers on Economic Activity(2): 381-450. Bulow, J. I. and L. H. Summers (1986). "A Theory of Dual Labor Markets with Application to Industrial Policy, Discrimination, and Keynesian Unemployment." Journal of Labor Economics 4(3): 376-414. Burda, M. and A. Mertens (2001). "Estimating Wage Losses of Displaced Workers in Germany." Labour Economics 8(1): 15-41. Carmichael, H. L. (1985). "Can Unemployment be Involuntary? The Supervision Perspective." American Economic Review 75(5): 1213-14. Coase, R. H. (1937). "The Nature of the Firm." Economica 4: 386-405. Coase, R. H. (1992). "The Institutional Structure of Production." American Economic Review 82(4): 713-719. Farber, H. (2001). Job loss in the United States, 1981-1999. Princeton University Industrial Relations Section. Fehr, E., G. Kirchsteiger, et al. (1998). "Gift Exchange and Reciprocity in Competitive Experimental Markets." European Economic Review 42(1): 134. Foster, A. and M. Rosenzweig (1994). "A test for moral hazard in the labor market: contractual arrangements, effort, and health." Review of Economics and Statisitcs LXXVI(2): 213-227. Kohn, M. (1969). Class and Conformity. Homewood, IL, Dorsey Press. Kohn, M. L. (1990). Unresolved Issues in the Relationship Between Work and Personality. The Nature of Work:Sociological Perspectives. K. Erikson and S. P. Vallas. New Haven, Yale University Press: 36-68. Kohn, M. L. and C. S. e. al. (1983). Work and Personality: An inquiry Into the Impact of Social Stratification. New Jersey, Ablex Publishing Corporation. Kohn, M., A. Naoi, et al. (1990). "Position in the Class Structure and Psychological Functioning in the U.S., Japan, and Poland." American Journal of Sociology 95(4): 964-1008. Laffont, J. J. and M. S. Matoussi (1995). "Moral Hazard, Financial Constraints, and Share Cropping in El Oulja." Review of Economic Studies 62(3): 381-399. Lazear, E. (2000). "Performance Pay and Productivity." American Economic Review 90(5): 1346 - 1361. Leibenstein, H. (1957). Economic Backwardness and Economic Growth. New York,
36 | MICROECONOMIA
Wiley. Lundberg, S. and R. Pollak (1994). "Noncooperative Bargaining Models of Marriage." American Economic Review 84(2): 132 - 137. Marx, K. (1973). Grundrisse: Foundations of the Critique of Political Economy. New York, Vintage. Okun, A. (1981). Prices and Quantities: A Macroeconomic Analysis. Washington, DC, The Brookings Institution. Petersen, T. (1992). "Payment Systems and the Structure of Inequality: Conceptual Issues and an Analysis of Salespersons in Department Stores." American Journal of Sociology 98(1): 67-104. Raff, D. M. G. (1988). "Wage Determination Theory and the Five-Dollar Day at Ford." The Journal of Economic History 48(2): 387-399. Schor, J. B. (1988). Does Work Intensity Respond to Macroeconomic Variables? Evidence from British Manufacturing, 1970-1986. Harvard Institute of Economic Research Working Paper. Shapiro, C. and J. Stiglitz (1984). "Unemployment as a Worker Discipline Device." American Economic Review 74(3): 433-444. Shearer, B. (2001). Piece Rates, fixed Wages, and Incentives: Evidence From a Field Experiment. Quebec, Universite Laval. Simon, H. (1951). "A Formal Theory of the Employment Relation." Econometrica 19(3): 293-305. Solow, R. (1990). The Labor Market as a Social Institution. Cambridge, UK, Basil Blackwell. Walras, L. (1954). Elements of Pure Economics. London, George Allen and Unwin (original publication date, 1874). Winkelmann, L. and R. Winkelmann (1998). "Why Are the Unemployed So Unhappy? Evidence From Panel Data." Economica 65(257): 1-15.
IX M ERCATI C REDITIZI , V INCOLI PATRIMONIALI , ED I NEFFICIENZA A LLOCATIVA
Gli Inglesi sono ancora imbevuti di tale dottrina, che è almeno discutibile, secondo la quale le grandi proprietà sono necessarie per il miglioramento dell’agricoltura, e sembrano ancora convinti che l’estrema ineguaglianza della ricchezza sia l’ordine naturale delle cose. Alexis de Tocqueville, Journeys to England and Ireland (1833-1835) Carichi sedici tonnellate e cosa ottieni? Sei di un giorno più vecchio e i debiti sono aumentati. San Pietro non chiamarmi [in cielo] perché non posso andarmene, Devo la mia anima al deposito dell'azienda. Merle Travis, “Sixteen Tons” (1947)
[Prestare denaro] è vantaggioso per coloro che fanno rispettare la propria autorità con il bastone. Harpal, un creditore a Palanpur
Nel sud degli Stati Uniti prima dell’Emancipation Act (1863) si riteneva che il cotone fosse il re. Ma non lo fu davvero fin dopo la Guerra Civile, quando il cotone ascese al trono tra le coltivazioni: in un quarto di secolo, successivo alla fine della schiavitù, la produzione del cotone aumentò del 50 per cento rispetto al grano (la principale coltura alimentare)1. Questa intensificazione della monocoltura del cotone fu sbalorditiva per gli osservatori del tempo poiché essa coincise con un leggero trend discendente del prezzo relativo del cotone rispetto a quello del grano. Inoltre, non ci furono cambiamenti nelle condizioni tecniche di produzione che avrebbero potuto compensare il movimento contrario del prezzo; infatti, durante questo periodo, la crescita dei raccolti di grano sembrava avere superato quella dei raccolti di cotone. Il passaggio dal grano al cotone non può essere nemmeno spiegato dai cambiamenti nell’offerta dei fattori: il Cotton South subì una seria penuria di lavoro a seguito della La prima epigrafe è tratta da Tocqueville (1958:72), la terza da Lanjouw e Stern (1998:552). 1 Questo resoconto è basato su Ransom e Sutch (1977).
2 | MICROECONOMIA
guerra, cosa che avrebbe dovuto spingere alcuni agricoltori ad abbandonare il cotone a favore del grano, una coltivazione a più bassa intensità di lavoro. Che cosa spiega, quindi, la crescente dominanza del cotone? Per dare risposta a questo interrogativo abbiamo bisogno di esaminare la struttura dei mercati creditizi locali. Per finanziare il ciclo di coltivazione, molti agricoltori – poveri mezzadri e locatari, per la maggior parte, molti di loro in precedenza schiavi – acquistavano cibo (incluso il grano), ed altre necessità, a credito, durante la stagione di crescita. Essendoci tipicamente un solo mercante in ogni località, il cibo e gli altri prezzi tramite cui gli agricoltori accumulavano debiti venivano gonfiati dal potere di monopolio del mercante-creditore. I prestiti erano ripagati alla fine della stagione, quando la coltivazione veniva venduta. La maggior parte degli agricoltori era troppo povera per precostituire una garanzia, così i mercanti-creditori assicuravano i loro prestiti per mezzo di una rivendicazione (diritto di ritenzione), in caso d’inadempimento, sulla coltivazione futura dell’agricoltore. Questo sistema di pegno sul raccolto secondo i suoi più importanti studiosi, Roger Ransom e Richard Sutch, favorì il cotone: Dal punto di vista del mercante, il cotone offriva maggiore sicurezza per questi prestiti rispetto alle colture alimentari. Il cotone era una coltivazione commerciale, che poteva essere venduta velocemente in un mercato ben organizzato; esso non era deperibile; era facilmente immagazzinato […] Per queste ragioni il mercante regolarmente esigeva che fosse piantata una certa quantità di cotone […] fu per la protesta globale degli agricoltori che i mercanti rurali proclamarono la loro disponibilità a negoziare il credito con la condizione che fosse piantato sufficiente cotone come garanzia. (Ransom e Sutch, 1977, p.160)
Il sistema di pegno sul raccolto, che divenne importante nel Sud della post emancipazione, fu una soluzione ingegnosa al problema di fornire credito ai soggetti poveri di beni beneficiari del prestito. Esso sostituì la promessa dell’agricoltore, non avente efficacia esecutiva, di ripagare il prestito nel futuro, con un’azione osservabile dal creditore prima della concessione del prestito, vale a dire, il fatto che il mezzadro avrebbe dovuto già piantare il cotone sul quale il mercante avrebbe avuto per primo una rivendicazione. Tenendo conto dei costi e dei prezzi relativi delle risorse delle due coltivazioni, Ransom e Sutch stimano che i produttori di cotone, che acquistavano grano a credito, avrebbero potuto vedere accresciuto il loro reddito del 29 per cento, spostando le risorse dal cotone al grano. Ma questo era impedito dal fatto che, poiché l’agricoltore aveva un piccolo patrimonio, avrebbe avuto bisogno di credito e, per la stessa ragione, il credito era condizionato al piantare cotone. Il risultato fu, secondo Ransom e Sutch che:
MERCATI CREDITIZI
|3
L’affittuario del sud non era né proprietario della sua terra né responsabile dei suoi affari […] le sue decisioni indipendenti erano limitate agli aspetti prosaici e umili dell’attività agricola. Le più grandi decisioni riguardo l’uso della terra, gli investimenti nella produttività dell’azienda agricola, la scelta della tecnologia, e la scala di produzione erano tutte prese da altri. (p.170)
Le peculiarità dei mercati creditizi aiutano anche a spiegare un enigma contemporaneo. La locazione abitativa incorre in inefficienze tipiche della relazione principaleagente studiata nei capitoli 7 e 8. Oltre un terzo delle famiglie statunitensi affitta la propria abitazione invece di acquistarne una (Savage, 1995). La manutenzione della proprietà e le azioni civili per accrescere la qualità dell’ambiente del quartiere, eseguite dal locatario, contribuiscono al valore della proprietà, per il proprietario, ma non possono essere specificate in un contratto esecutivo. Di conseguenza, gli affittuari hanno incentivo ad offrire troppo poca manutenzione ed a partecipare troppo poco al miglioramento dei servizi accessori. Le abitazioni occupate dai proprietari non risentono di questo problema di incentivi poiché la persona che esegue la manutenzione o le azioni civiche e il detentore del diritto sui benefici di queste azioni sono la stessa persona, ovverosia, il proprietario. Come fatto empirico, la proprietà dell’abitazione induce maggior cura della residenza e anche più alti livelli di partecipazione nelle attività di amministrazione locale (Glaeser e Di Pasquale, 1999; Verba, Scholzman, e Brady, 1995). Perché, allora, invece di acquistare la propria abitazione, più comunemente la si affitta, specialmente tra coloro con il reddito più basso2? La risposta è che i locatari non hanno accesso al credito ipotecario: nel 1993, solo il 13 per cento delle famiglie affittuarie potevano assicurarsi un prestito per comprare una casa a basso prezzo (una al decimo percentile, delle case ordinate per prezzo, nel quartiere di famiglia; Savage 1995). Il rimanente 87 per cento di locatari aveva troppo poche risorse, al netto del debito in sospeso, e troppo poco reddito per assicurarsi un mutuo convenzionale. La mancanza di patrimonio può impedire ai poveri di acquisire i beni che permetterebbero loro soluzioni più efficienti in presenza di problemi di incentivo, come nei precedenti casi agrario e locativo. In molti casi, inoltre, anche se fosse dato ai poveri il possesso delle risorse 2
Nel 1990, nella decima area urbana più grande degli Stati Uniti, tra le famiglie con bambini e con reddito annuale minore di $15,000, 82 per cento non era proprietario delle proprie case, mentre oltre 85 per cento delle famiglie con bambini e con reddito superiore a $50,000 erano proprietari (U.S. Census). Complessivamente, il 64 per cento delle famiglie americane nel 1993 risultavano essere proprietari della propria casa (Savage 1995).
4 | MICROECONOMIA
rilevanti, loro potrebbero decidere di non ritenerle. Un esempio ci chiarirà meglio questo punto. La redistribuzione della terra a piccoli conduttori, in Cile durante i primi anni ’70, ebbe l’intento di beneficiare i poveri, assegnando in parte la detenzione del diritto nelle mani dell’agricoltore e, di conseguenza, fornendo incentivi per un maggior investimento e impegno, inducendo livelli più elevati di produttività3. I trasferimenti di terra coincisero con una esplosione nel mercato della frutta esportata. Ma pochi dei beneficiari della riforma sulla terra ebbero il capitale per finanziare il lungo periodo di gestazione degli alberi da frutto, e il credito generalmente non era disponibile per i piccoli conduttori. Come risultato, solo pochi passarono dalla produzione alimentare a quella di frutta. Nello stesso tempo, il valore delle loro terre salì enormemente, come risultato dell’esplosione della frutta. Incapaci di trarre vantaggio dal prezzo favorevole, dai primi anni ’90 il 57 per cento degli originari 48,000 beneficiari vendette la propria terra. Il trasferimento di ricchezza ai poveri era stato compiuto, ma il riallineamento degli incentivi, predisposto dalla riforma sulla terra, era fallito a causa dei limiti di credito a cui erano sottoposti i poveri agricoltori (e molto probabilmente anche a causa della loro avversione al rischio nei confronti dei prezzi della frutta, altamente variabili). I tre esempi contrastano fortemente con l’idea di un mondo di contratti completi ed eseguibili senza costo. Nell’ambientazione Walrasiana, la ricchezza porta vantaggi quantitativi – determina la posizione del proprio vincolo di bilancio – ma tutti i partecipanti nell’economia sono esposti alle stesse opportunità contrattuali (e quindi agli stessi prezzi) indipendentemente dai loro possessi. I poveri sono vincolati a comprare meno dei ricchi, ma contrattano alle stesse condizioni. Al contrario, laddove i contratti nei mercati finanziari sono incompleti e non esecutivi, gli individui con poco reddito spesso non hanno accesso ad una classe di contratti che sono disponibili per i più abbienti oppure stipulano contratti sotto condizioni sfavorevoli. Le differenze di reddito, quindi, hanno effetti qualitativi, escludendo alcuni e rafforzando altri. La ragione più ovvia per cui la ricchezza influenza la forma contrattuale è spiegata dal fatto che solo gli individui con sufficiente reddito possono portare avanti progetti per proprio conto. 3
Questa relazione è basata su Carter, Barham, e Mesbah (1996) e Jarvis (1989).
MERCATI CREDITIZI
|5
Coloro che hanno un reddito sufficiente possono assegnare la detenzione del diritto ed il controllo sulle risorse a loro stessi, eliminano i costosi problemi di incentivo. Una seconda ragione, quindi, risiede nel fatto che la proprietà della ricchezza attenua i problemi di incentivo sollevati dall’incompletezza dei contratti nelle relazioni principale-agente. Gli agenti più ricchi hanno generalmente accesso a contratti superiori poiché la ricchezza dell’agente permette contratti che allineano più strettamente gli obiettivi dell’agente e del principale. L’agente che fornisce una garanzia o il capitale al suo progetto ha incentivi maggiori ad impegnarsi, ad adottare i livelli di rischio preferiti dal principale, a rivelare informazioni al principale, e ad agire in altri modi che accrescono gli interessi del principale ma che non possono essere assicurati in un contratto. Gli individui a basso reddito, per esempio, possono acquisire istruzione e altre forme di capitale umano a condizioni meno favorevoli dei ricchi e, come risultato, possono rinunciare a investimenti nell’acquisizione di conoscenza i cui i rendimenti privati e sociali superano i costi. Allo stesso modo, come abbiamo visto nel mercato immobiliare, chi detiene un patrimonio sufficiente risulta essere più spesso proprietario e quindi direttamente responsabile delle conseguenze delle azioni atte a migliorare la proprietà e il quartiere, mentre i meno abbienti sono, con maggiore probabilità, affittuari. Le differenze nel reddito si riflettono in opportunità contrattuali differenti; quelle disponibili ai più abbienti, con maggiore probabilità, includono incentivi che sostengono risultati efficienti, mentre non è così per i meno abbienti, inducendo di conseguenza svantaggi addizionali ai poveri. Come risultato, agli individui a basso reddito non è consentito portare avanti progetti che sono benefici da un punto di vista dell’efficienza sociale. Essi saranno vincolati a conseguire questi progetti su scala sub-ottimale, oppure saranno coinvolti in accordi contrattuali con strutture di incentivo sub-ottimali come per la locazione, la mezzadria, o il lavoro salariale. Nonostante siano coinvolti altri mercati finanziari, le principali problematiche analitiche sono meglio illustrate mediante il mercato del credito, l’argomento di questo capitolo. Cominceremo illustrando, tramite testimonianze, fino a che punto le persone sono vincolate dal credito. In secondo luogo, introdurremo il problema base degli incentivi sollevato dall’incompletezza del contratto tra il debitore e il creditore. Allora studieremo come la fornitura di capitale o garanzie da parte del debitore oppure la ripetizione dell’interazione su molti periodi può attenuare questi problemi di incentivo. La prossima sezione introduce la relazione debitore-creditore in un
6 | MICROECONOMIA
modello di equilibrio economico generale per mostrare perché potenziali debitori con poco reddito possano fallire nell’assicurarsi il finanziamento (o siano vincolati a finanziare solo piccoli progetti o a pagare alti tassi di interesse). Come i potenziali lavoratori nel mercato del lavoro nel capitolo 8, gli individui con basso reddito saranno limitati quantitativamente. Come risultato, i ricchi saranno capaci di finanziare (e così di eseguire) progetti più grandi e di qualità inferiore rispetto a progetti che i poveri sono capaci di finanziare, e per progetti identici i ricchi pagheranno un tasso di interesse minore. Un’importante conseguenza si basa sul fatto che i vincoli di ricchezza possono impedire l’esecuzione di progetti di qualità elevata, per cui, la distribuzione della ricchezza diventa rilevante per l’efficienza allocativa, contrariamente alla logica del Teorema Fondamentale e del teorema di Coase. Nella penultima sezione, studieremo le condizioni sotto le quali una distribuzione efficiente dei diritti di proprietà avviene attraverso uno scambio privato, e forniremo un esempio in cui una redistribuzione delle risorse “imposta” può generare effetti positivi sulla produttività che (a differenza dei trasferimenti di terra in Cile) sono sostenibili in un equilibrio competitivo.
V IN C O LI
DI
C R E D ITO : E V ID E N Z A E M P IR IC A
I vincoli di credito sono empiricamente importanti. Molta dell’evidenza empirica (esaminata in Jappelli 1990) è basata sulle fluttuazioni cicliche del consumo: l’opinione generale su queste stime afferma che circa un quinto delle famiglie statunitensi ha un vincolo di liquidità. Questo tende ad essere vero per le famiglie più giovani con livelli di ricchezza più bassi. Questi studi non considerano le attività di prestito degli individui e quindi sono in qualche modo indiretti. Testimonianze dirette si basano su storie vere di credito. Jappelli (1990) ha trovato che il 19 per cento delle famiglie statunitensi si è visto rifiutare richieste di credito da parte di istituzioni finanziarie; le risorse finanziarie di queste famiglie con limiti al credito erano il 63 per cento più basse delle famiglie non limitate. “I debitori scoraggiati” (coloro i quali non chiedono un prestito poichè si aspettano che venga rifiutato) hanno anche una minore ricchezza di coloro a cui il prestito viene effettivamente rifiutato. Un altro studio delle famiglie negli Stati Uniti (Gross e Souleles 2002) si basa sul fatto che i limiti della carta di credito sono spesso accresciuti automaticamente. Se il prestito aumenta in risposta a questi cambiamenti esogeni del limite del prestito, possiamo concludere che l’individuo sia
MERCATI CREDITIZI
|7
vincolato nel credito. Gli autori trovano che “l’aumento del limite del credito genera un aumento significativo ed immediato del debito” (p.181). Gross e Souleles valutano i limiti al credito in questo modo: E’ plausibile che la maggior parte del terzo delle famiglie senza carta di credito bancaria abbiano un vincolo di liquidità […]. Dei due terzi possessori di carta, oltre il 56 per cento che sta prendendo a prestito e paga alti tassi di interesse (in media il 16 per cento) può dirsi avere anche un vincolo di liquidità, poiché non ha accesso ad un credito meno costoso. Combinati con le famiglie senza carta di credito, la frazione di famiglie potenzialmente vincolate diventa pari a due terzi. (pp.152-3)
Altri studi sono basati sul modo in cui gli aumenti esogeni di ricchezza influenzano il comportamento economico. Blanchflower e Oswald (1998) scoprirono che un’eredità di $10,000 raddoppia la probabilità che un giovane britannico tipo crei una attività. In un altro studio britannico, Holtz-Eakin, Joulfaian, e Rosen (1994), trovarono che l’elasticità dell’attività professionale autonoma rispetto alle risorse ereditate era pari a 0.52, e che un’eredità induce l’attività autonoma ad accrescere considerevolmente la scala delle sue operazioni. Un altro studio (Black, Meza e Jeffreys (1996)) trovò che un aumento del 10 per cento nel valore del patrimonio immobiliare garantibile nel Regno Unito aumentò del 5 per cento il numero di avviamenti di nuove attività. Evans e Jovanovic (1989) notarono che tra i maschi bianchi negli Stati Uniti, i livelli di reddito sono una barriera al diventare imprenditori e i vincoli al credito limitano coloro che iniziano nuove attività alla capitalizzazione di solo 1.5 volte le loro risorse iniziali: “molti individui che iniziano un’attività autonoma devono fare i conti con un ostacolante vincolo di liquidità e di conseguenza usare un ammontare di capitale sub-ottimale per avviare le loro attività” (p.180). Uno studio sulle famiglie italiane afferma che coloro che non hanno preso a prestito poiché gli è stato negato o credevano gli sarebbe stato negato erano più probabilmente famiglie numerose e più povere con un capo famiglia disoccupato, di sesso femminile, scarsamente istruito e più giovane (Guiso, Jappelli, e Terlizzese 1996). Inoltre, paragonandole alle famiglie con minore probabilità di affrontare un vincolo al credito, le famiglie più povere, più giovani e con maggiore incertezza di fonti di reddito (per esempio, attività autonome piuttosto che pensioni) tendevano ad evitare la detenzione di attività rischiose in modo consistente il che è coerente, quindi, con la visione che gli individui con vincoli al credito godono di rendimenti attesi dagli investimenti più bassi. La gente povera di mezzi negli Stati Uniti ottiene spesso “prestiti giornalieri” a breve termine contro assegni a pagare. In Illinois, il tipico debitore a breve termine è una donna a basso reddito verso la metà dei trent’anni ($24,104 di reddito annuale),
8 | MICROECONOMIA
vive in una casa in affitto, prende a prestito tra i $100 e i $200 pagando un tasso di interesse medio annuale del 486 per cento (Vega 1999). Molti studi hanno mostrato che i produttori meno abbienti, nei paesi in via di sviluppo, posso essere completamente tagliati fuori dai mercati creditizi, dai contratti di lavoro oppure dai contratti di affitto della terra che impongono un impegno elevato. Come abbiamo visto nel capitolo 8, Laffont e Matoussi (1995), per esempio, mostrano che i vincoli finanziari limitano i tipi di contratti che i poveri Tunisini potrebbero intraprendere, riducendo sostanzialmente la loro produttività e quindi i loro redditi. Altri studi nei paesi a basso reddito mostrano che il valore netto influisce fortemente sull’investimento di una azienda agricola, e un basso reddito implica un più basso rendimento per la produzione agricola indipendente (Rosenzweig e Binswanger (1993)). Per esempio, Rosenzweig e Wolpin (1993) mostrano che gli agricoltori indiani poveri e a medio reddito avrebbero potuto accrescere in maniera sostanziale i propri redditi se essi non avessero avuto limiti al credito: non solo essi generalmente “sottoinvestivano” in beni produttivi, ma i beni che detenevano tendevano ad essere quelli che essi potevano vendere in tempi di bisogno (vitelli) invece che verso attrezzature altamente vantaggiose (pompe di irrigazione) che avevano uno scarso valore di rivendita. Allo stesso modo, Rosenzweig e Binswanger (1993) notano che una riduzione della deviazione standard nel rischio meteorologico (il tempo di arrivo della pioggia) aumenta i profitti medi di circa un terzo tra gli agricoltori indiani nel quartile del reddito più basso, cosa che non avviene di fatto per i più abbienti. Questa evidenza ci suggerisce che gli agricoltori più ricchi portano avanti strategie più rischiose con rendimenti attesi più elevati. La mancanza di assicurazione e l’accesso ristretto al credito per i poveri non solo riduce i redditi, ma accresce anche il livello di disuguaglianza tra i redditi associato ad un dato livello di disuguaglianza della ricchezza. Inoltre, la forte relazione inversa tra redditi individuali e tassi di preferenza temporale risulta consistente con l’ipotesi che i poveri sono vincolati al credito. Hausman (1979) stimò i tassi di preferenza temporale (U.S.) usando il trade-off implicito tra una spesa iniziale e i susseguenti costi di gestione in una gamma di modelli di condizionatori riferito ad un gruppo di acquirenti. (Per legge, i costi di funzionamento devono essere elencati assieme al prezzo). Egli trovò che, mentre gli acquirenti con reddito elevato mostravano tassi impliciti di preferenza temporale nell’intorno del tasso di base, gli acquirenti con
MERCATI CREDITIZI
|9
reddito inferiore alla media mostravano tassi cinque volte maggiori di questo (essi compravano i meno costosi ma con il più costoso dispositivo di gestione). Green, Myerson, Lichtman, Rosen e Fry (1996), utilizzando il metodo del questionario, stimarono i tassi di sconto (iperbolici) tramite rilevazioni su soggetti ad alto e basso reddito negli Stati Uniti. I tassi stimati per il gruppo a basso reddito risultavano quattro volte maggiori di quelli del gruppo con reddito superiore. Sia nello studio di Green (e altri) che in quello di Hausman, l’elasticità del tasso di preferenza temporale rispetto al reddito era approssimativamente pari a -1. Quindi, esistono considerevoli testimonianze che ci spingono a ritenere che chi detiene scarsa ricchezza sia vincolato nel credito e affronti opportunità sfavorevoli nei mercati finanziari e altre restrizioni riguardanti il tipo di contratti in cui è coinvolto. Le risultanti inefficienze allocative sembrano essere notevoli.
D E B I TO R I
E
C R E D ITO R I
La promessa di ripagare un prestito non è soggetta ad esecuzione forzata per due ragioni: il debitore può non disporre di fondi sufficienti per restituire quando il pagamento è dovuto, e la scelta del debitore di un livello di rischio per un progetto non è generalmente soggetta a contratti esecutivi. Un problema standard principaleagente sorge nel caso in cui un agente con insufficiente ricchezza abbia un progetto per il quale il livello di rischio viene scelto dall’agente stesso. Tratteremo adesso un esempio. Inizieremo con un caso (Robinson Crusoe) in cui non compare nessun fallimento di coordinamento poiché l’esecutore del progetto è ricco abbastanza per auto-finanziarsi. A questo esempio farà seguito un caso in cui il coordinamento avviene per ragioni differenti: assumiamo contrattazione completa. Questi due casi, come nell’esempio nel capitolo 4 dello sforzo lavorativo di Robinson, stabiliscono la base di riferimento per il raffronto con casi più realistici in cui gli esecutori dei progetti non siano sufficientemente ricchi da finanziarsi da soli e devono quindi chiedere a prestito, oppure casi in cui i contratti di prestito siano incompleti. Si assuma che tutti gli attori siano neutrali al rischio. Un progetto richiede $1 per essere completato e fallisce con probabilità f . Si immagini che il progetto sia una macchina, la quale, se non “fallisce” vive per un periodo (diventa senza valore alla fine del periodo) e produce beni in proporzione alla “velocità” alla quale opera. Per semplicità, assumiamo che la velocità sia pari alla probabilità che la macchina si guasti (cioè fallisca) ossia f .
10 | MICROECONOMIA
I beni prodotti sono disponibili solo alla fine del periodo sotto condizione che la macchina non si danneggi. (La macchina non varrà nulla alla fine del periodo sia che si rompa o meno, ma se si guasta essa distrugge anche ogni bene prodotto). I rendimenti del progetto sono pari a μf se essa funziona e 0 altrimenti ( μ è una costante positiva che misura la qualità del progetto), e i rendimenti attesi al netto di tutti i costi sono r = μ f (1 f )
Mentre l’ammontare prodotto (se la macchina non fallisce) aumenta di f , i rendimenti attesi raggiungono un massimo oltre il quale l’output più elevato, nello stato di funzionamento (non fallimento), è compensato dalla più elevata probabilità di fallimento e rendimenti pari a zero. Quindi, la funzione dei rendimenti netti ha la forma di inversa. La funzione dei rendimenti attesi non considera il costo opportunità dell’investimento, rappresentato da 1 + ( se il proprietario non avesse acquistato la macchina ma avesse investito il dollaro al tasso privo di rischio , egli avrebbe avuto 1 + alla fine del periodo) .
Il caso di Robinson Crusoe . Si assuma che l’unico proprietario del progetto (auto finanziato) vari f per massimizzare i rendimenti attesi. Egli porrà dr / df = μ /1 2 f ) = 0 , la cui soluzione è f * =1/2 . Per essere fattibile, il progetto deve
rendere almeno 1 + , e quindi la qualità del progetto deve essere tale che μ 4(1 + ) ( il rendimento atteso del progetto quando f è ottimizzato è pari a μ(1/2)(1/2) ). Il caso di contrattazione completa. Assumiamo adesso che il progetto debba essere eseguito da un individuo senza ricchezza, e che non possa essere venduto o altrimenti trasferito. Questo individuo, chiamato agente (A), prende a prestito i fondi ($1) da un creditore, il principale (P), al tasso di interesse 1 . Alla fine del periodo, egli restituisce un ammontare pari al “coefficiente di interesse” ($1 più l’interesse) con probabilità (1 f ) e 0 altrimenti. L’assunzione che il debitore non restituisca il prestito, nel caso in cui il progetto fallisce, è decisiva per le ragioni che seguono. Questa evenienza riflette l’istituzione comune della responsabilità limitata; se il progetto fallisce, il creditore non può impossessarsi dell’abitazione del debitore. Il rendimento atteso dell’agente per un periodo è
MERCATI CREDITIZI
y(f,) = μf(1-f) -(1-f) = (μf-)(1-f )
|11
(9.1)
Assumiamo che la prossima migliore alternativa dell’agente è ricevere zero. Se f è conosciuto da P ed è soggetto a contrattazione completa, allora P può offrire ad A un contratto tale che y = 0 così da soddisfare con uguaglianza il vincolo di partecipazione di A. Usando y = 0 come vincolo di partecipazione stringente, il “prezzo di offerta di f ” da parte di A (assumendo che f > 0 ) è appena pari a / μ = f , un tasso di interesse più basso per una probabilità di fallimento ridotta.
Si noti che se fosse offerto questo prezzo (cioè se P contrattasse per un f tale che = fμ ), l’agente sarebbe indifferente ad ogni particolare livello di f , poiché per ognuno di essi i rendimenti attesi sarebbero pari a zero. Il principale varierà allora f per massimizzare i suoi guadagni attesi = (1-f )
(9.2)
Sostituendo nella 9.2 il prezzo di f , diventa = fμ(1-f )
Quando il principale sceglie f per massimizzare la sua funzione di profitto atteso, egli porrà f * =1/2 . La figura 9.1 illustra questo caso. L’inclinazione della funzione delle curve isoprofitto del Principale (una delle quali è raffigurata) è (1 f ) / . Nel punto in cui il problema del Principale è ottimizzato, una curva di isoprofitto sarà tangente al vincolo di partecipazione dell’Agente (la cui inclinazione è 1/ μ ). Una volta determinato il tasso di fallimento ottimo, il principale fa uso del prezzo offerto di f per determinare il tasso di interesse ottimo da offrire all’agente, cioè * = μ /2 . Il principale quindi offrirà ad A il seguente contratto: A accetta f * =1/2 ed accetta di pagare a P un ammontare pari a * = μ /2 ( che si verificherà se la macchina non fallisce con probabilità ) in modo da soddisfare così il vincolo di partecipazione di A e trasferire a P un guadagno atteso di (1 f ) o μ / 4 .
12 | MICROECONOMIA
Figura 9.1. il mercato del credito: il caso Negoziabile Probabilità di Fallimento: f Vincolo di partecipazione di A:
Iso-profitto del Principale Tasso d’interesse:
Si noti che il livello di rischio è esattamente equivalente al caso di Robinson Crusoe. La ragione risiede nel fatto che le funzioni obiettivo del principale, nel caso di contrattazione completa e nel caso di Robinson Crusoe4, sono identiche. Poiché il vincolo di partecipazione è stringente il creditore, di fatto, sta massimizzando la sua funzione, soggetto ad un vincolo dato dal livello di utilità del debitore (il suo vincolo di partecipazione) e quindi ha conseguito un ottimo Paretiano. La contrattazione completa elimina la distinzione tra principale ed agente, e riporta al mondo di Crusoe. Il risultato cambia, una volta che si ritorna al mondo reale dei contratti di credito. Rischio non negoziabile, nessuna garanzia: In questo caso f non è negoziabile. L’agente sceglierà f allo scopo di massimizzare il suo rendimento atteso (che resta come prima rappresentato dall’equazione (9.1)), cioè fissando dy = μ (1 2 f ) + = 0 df
La funzione di risposta ottima dell’agente sarà quindi: f ( ) =
+μ 1 = + 2μ 2 2μ
(9.3)
I profitti attesi del principale sono, come prima, rappresentati dall’equazione (9.2), ma f ora dipenderà da . La funzione di profitto atteso sarà quindi:
4
Avremmo ottenuto lo stesso risultato se avessimo reso esecutiva la promessa di pagare non sottoponendo a contrattazione f .
MERCATI CREDITIZI
= (1 f ( ))
|13
(9.2’)
Massimizzando questa funzione rispetto a otteniamo la condizione di primo ordine del principale: 1 f = f'
(9.4)
Facendo uso dell’equazione (9.3) avremo come soluzione * =
μ 2
(9.5)
Sostituendo poi l’equazione (9.5) nell’equazione (9.3) otteniamo il livello ottimo di f , vale a dire, f * = 3/ 4 . L’agente applica un livello di rischio superiore a quello implementato nella contrattazione completa e nel caso di Robinson Crusoe. La figura (9.2) ne illustra la ragione. Si noti la differenza tra il vincolo di partecipazione di A (VP) e la funzione di risposta ottima di A (BRF) (questo spiega la discrepanza tra i diversi livelli di rischio scelti da A). Come risultato, il reddito atteso del debitore è positivo (poiché la funzione di risposta ottima è al di sopra del vincolo di partecipazione). Questo significa che il debitore sta ricevendo una rendita. Il rendimento di P è ovviamente minore: sostituendo f * e * nell’espressione che rappresenta produce = μ /8 (piuttosto che i profitti attesi pari a μ / 4 nel caso di contrattazione completa). Orizzonte infinito con rinnovo contingente: il fatto che il principale conferisca una rendita all’agente nel caso in cui il contratto venga svolto in un solo periodo fa sorgere un interrogativo. Il principale potrebbe ricavare un profitto da questo fatto, promettendo di continuare a dare a prestito ad A fin quando la macchina non fallisca? I problemi di incentivo verrebbero mitigati se il creditore offrisse all’agente un rinnovo del contratto contingente, in un orizzonte di tempo infinito (come il datore di lavoro nei confronti del dipendente, nel modello sul mercato del lavoro)? Si supponga che il principale usi il fallimento del progetto come (inaccurato) segnale dell’azione dell’agente. Allora P offre un prestito (per un singolo periodo) con la promessa di rinnovarlo se il progetto non fallisce, e nulla altrimenti.
14 | MICROECONOMIA
Probabilità di Fallimento: f BRF di A
PC di A
Tasso d’interesse: Figura 9.2. Livello di rischio non soggetoo a contrattazione. La funzione di iso-reddito del debitore è y = y *
Assumiamo che il valore attuale della posizione di riserva sia z , il tasso di preferenza temporale (il tasso di sconto) sia rappresentato da i . Trattando l’interazione come stazionaria (invariante al tempo), il valore attuale per gli agenti, v , è dato da v=
y ( , f ) + (1 f )v + fz 1+ i
Dopo alcuni passaggi algebrici diventa v=
y iz +z i+ f
(9.6)
Come nel caso del mercato del lavoro, il valore attuale della transazione dell’agente è la somma dell’alternativa e della rendita. La funzione di risposta ottima per questo caso è alquanto complicata: per permettere un raffronto con i casi precedenti semplificheremo assumendo i = 0 in modo da permettere all’espressione di assumere una forma simile (e z = 0 come prima). Il valore attuale atteso della transazione v è uguale al valore atteso del reddito per ciascun periodo valutato come un bene e diviso per la probabilità di cessazione, ossia v=
y μ f (1 f ) (1 f ) = f f
Massimizzando v rispetto ad f otteniamo la funzione di risposta ottima dell’agente vf =
μ f 2 + =0 f2
(9.7)
essa richiede al debitore di selezionare f in modo tale che f = / μ ossia 2
MERCATI CREDITIZI
12
f*= μ
|15
(9.8)
Come possiamo paragonare questa situazione con il caso precedente in un singolo periodo? Per f <1 , dobbiamo avere < μ ed in questo caso la funzione di risposta ottima con orizzonte infinito produce valori di f inferiori per tutti i valori rilevanti di . Vale a dire, 12
μ
<
1 + 2 2μ
Ciò può essere semplicemente dedotto dal fatto che 2( / μ) <1 + / μ . I profitti attesi del principale e la condizione del primo ordine sono immutati. 1/ 2
L’equazione (9.4) con la nuova funzione di risposta ottima dell’agente (9.8) produce il valore ottimo del tasso di interesse * = 4 μ /9 . La risposta ottima dell’agente è: 12
f*= μ
=2 3
Questi risultati possono essere confrontati con i casi precedenti riassunti nella tabella 9.1. I benefici attesi dell’agente per periodo nel caso (3), in un singolo periodo, sono .0625 μ , mentre nel caso multi periodale (4) essi sono .074 μ . I benefici attesi per periodo del principale sono .125 μ
e .148 μ , rispettivamente, in questi due casi. L’uso di un contratto con rinnovo condizionato nel caso multi periodale permette un miglioramento Paretiano rispetto al caso (3). La ragione dipende dal fatto che gli incentivi superiori permessi dalla ripetizione dell’interazione riducono il livello di rischio scelto dall’agente, permettendo così un surplus atteso complessivo maggiore rispetto a quello che si otterrebbe in un solo periodo (0.22 μ verso 0.19 μ ).
16 | MICROECONOMIA
Tabella 9.1. Risultati del mercato del Credito per il caso in cui il debitore non possiede ricchezza Risposta ottima dell’agente Caso 1.Robinson Crusoe 2.Rischio Contrattabile 3.Rischio N-Contrattabile Periodo singolo 4.Rischio N-Contrattabile multiperiodale
Tasso di interesse
Payoff atteso ( y, ) per periodo
f = 1 2 + 2μ
1/2 1/2 3/ 4
na
μ 2 μ 2
μ 4 (per Crusoe) 0, μ 4 μ 16, μ 8
f = ( μ )
2/3
4μ 9
2 μ 27, 4 μ 27
f * ( ; μ )
Na f = μ (PC )
12
Rischio f*
*
Si noti che la posizione di riserva dell’agente z è uguale a zero dal caso 2 al caso 4, così in assenza di contrattazione completa, anche nel caso ad un solo periodo, l’agente riceve una rendita. La ragione per cui esiste una rendita in equilibrio, è differente nei casi 3 e 4. Nel caso multi periodale, la prospettiva di perdere la rendita, nel caso in cui il progetto fallisca, induce l’agente ad adottare un livello di rischio più basso e, sapendo questo, il principale offre una rendita maggiore. Nel caso ad un solo periodo, invece, l’agente non anticipa la perdita della rendita. Comunque, poiché A risponde in modo inverso rispetto a tassi di interesse elevati, il solo modo che ha P di implementare gli incentivi, in modo da massimizzare il profitto, è offrire ad A una transazione superiore alla sua migliore alternativa. In questo caso la rendita è un effetto collaterale non intenzionale generato dal principale le cui opzioni nello stipulare un contratto con A sono limitate. Nel caso multi periodale il creditore ha un potere sul debitore per la stessa ragione per cui il datore di lavoro ne aveva sul dipendente: egli può minacciare di ritirare la rendita del debitore, e questa minaccia induce il debitore ad agire in modi che avvantaggiano il creditore. L’eccesso del valore attuale della transazione del debitore rispetto alla migliore alternativa è così un altro esempio di rendita incentivante (enforcement rent).
V I N C O L I PAT R IM O N IA L I C R E D ITO
ED
E S C L U S IO N E
DAL
M E R C ATO
DEL
Si supponga che l’agente disponga di due tipi di risorse remunerative. Il capitale umano, sotto forma di abilità, istruzione, e investimenti per la salute è fonte di guadagni e non può essere usato come capitale o garanzia in un contratto di prestito. Di contro, molte forme di ricchezza materiale possono essere usate come capitale o garanzia. Da questo momento utilizzeremo il termine ricchezza per riferirci alle attività che possono essere usate come garanzia o capitale. I debitori generalmente hanno una qualche ricchezza (o patrimonio) e, se il progetto genera rendimenti attesi in eccesso rispetto al tasso di interesse privo di
MERCATI CREDITIZI
|17
rischio, sarà nell’interesse del debitore investire nel progetto. Ci sono due ragioni per cui può essere nell’interesse del debitore investire la propria ricchezza nel progetto, a seconda delle due fonti di problemi di incentivo nelle relazioni principale-agente introdotte nel capitolo 7 e cioè, attributi nascosti e azioni nascoste. Primo, se, contrariamente alla nostra assunzione, il creditore non conosce μ , l’investimento del patrimonio del debitore è un segnale credibile della valutazione da parte del debitore della qualità del progetto. Come vedremo a breve, in un equilibrio competitivo, coloro che dispongono di una ricchezza inferiore hanno bisogno di progetti di qualità superiore per ottenere il finanziamento, così il debitore ha interesse ad ingigantire la qualità di un progetto per assicurarsi il prestito. Questo rappresenta il caso di attributi nascosti. La seconda ragione, modellata a breve, è che la differenza tra gli obiettivi del creditore e del debitore nella scelta del livello di rischio (questa è l’azione nascosta) risulterebbe mitigata se il debitore investisse nel progetto in modo da condividere parte del rischio di fallimento con il creditore. Useremo in modo interscambiabile i termini ricchezza e livello di capitale impegnato nel progetto. Assumiamo che gli agenti devolvano tutta la loro ricchezza al progetto, se decidono di investirne alcuna. Rischio non negoziabile con capitale del debitore. Si supponga che l’agente abbia un patrimonio pari a k attualmente investito in un’attività non rischiosa, che rende k . Se egli impiegasse questi fondi in un progetto rischioso, prenderebbe a prestito solo 1 k e i rendimenti attesi (incluso il costo opportunità dei rendimenti a cui si rinuncia sull’attività non rischiosa) sarebbero y ( f ; ) = μ f (1 f ) (1 k )(1 f ) (1 + )k
L’agente allora selezionerà f in modo da massimizzare y , con la risultante condizione di primo ordine, f ( , k ) =
1 (1 k ) + 2 2μ
(9.9)
Questa equazione è esattamente come la (9.3), eccetto che per il termine (1 k) ; quando la quota di capitale dell’agente (k) aumenta, il livello scelto di rischio
decresce. Come prima, il tasso di interesse più elevato ( ) sposta verso l’alto la funzione di risposta ottima, mentre progetti di qualità superiore ( μ) la spingono verso il basso. Si noti che quando k 1, f * 1/2 , ciò significa che il completo finanziamento del progetto da parte dell’agente riproduce il risultato socialmente ottimale di Robinson Crusoe, come ci si aspettava. Il creditore conosce la quota di capitale dell’agente k . Egli, come prima, agisce
18 | MICROECONOMIA
da first mover e massimizza il profitto atteso (9.2’) rispetto a , soggetto alla funzione di risposta ottima dell’agente (9.9). Il creditore selezionerà *=μ/2(1-k). L’esito, {f*,*}, è un equilibrio per l’interazione del principale e dell’agente presi isolatamente: entrambe le condizioni di primo ordine relative al problema di massimo dei due attori sono soddisfatte. Probabilità di Fallimento: f
=1 +
*
Tasso d’interesse: Figura 9.3. Esclusione dal mercato del credito. La funzione di zeroprofitto è indicata con =1 . Una maggiore ricchezza (k > k° > 0) determina una risposta ottima del debitore preferita dai creditori
Ricordiamo che nel capitolo 8, avendo analizzato la relazione binaria principale-agente tra datore di lavoro e dipendente, abbiamo poi inserito questo modello in uno scenario di equilibrio economico generale introducendo una condizione di profitti nulli per regolare il livello di occupazione. Qui, tratteremo il mercato creditizio allo stesso modo. Poiché ci sono molti creditori in competizione, in equilibrio essi dovranno tutti ricevere un rendimento atteso uguale al tasso di interesse privo di rischio, . La ricchezza attesa alla fine del periodo dovrà essere la stessa per quelli che investono in attività senza rischio e in progetti rischiosi, ossia: = (1 f ) = (1 + )
(9.10)
Questa espressione esprime la condizione di profitti nulli nell’equilibrio competitivo. Essa definisce un luogo dei punti in cui il profitto atteso è lo stesso cioè una curva di “iso-profitto atteso” nello spazio ( f , ) , come rappresentato dalla figura (9.3). Al di sotto di questa curva di iso-profitto atteso (per valori di f più bassi o valori più alti di ), il tasso di interesse atteso supera il tasso competitivo privo di rischio, inducendo coloro che possiedono ricchezza ad investirla nel mercato del
MERCATI CREDITIZI
|19
credito. Al di sopra della curva di iso-profitto, i fondi verranno ritirati. Ciò significa che l’equilibrio competitivo si colloca sul luogo dei punti a profitto nullo. Reddito atteso dal Debitore, y
y( )
y( *)
1 + = ( )
( *)
Profitto atteso dal Creditore, ˆ Figura 9.4. Il problema di contrattazione tra il debitore e il creditore. ab rappresenta la frontiera della contrattazione. I punti a e b rappresentano i risultati a e b nella precedente figura.
Ora, si supponga che esista un debitore la cui ricchezza, k° , sia appena sufficiente perché la sua funzione di risposta ottima sia tangente alla condizione di profitto nullo (il cui risultato è indicato in figura dal punto di tangenza con coordinate ( f °, °) ). Minori livelli di ricchezza producono una funzione di risposta ottima che giace totalmente al di sopra della curva di zero profitto. In questo caso non esiste nessuna offerta da parte del creditore che possa generare un rendimento atteso per il creditore stesso almeno pari a . I debitori con k < k° , quindi, non possono chiedere un credito. Essi sono esclusi dal mercato del credito. Per quanto riguarda i debitori con k > k° , la loro funzione di risposta ottima (con ricchezza k ) è raffigurata nella figura (9.3). Prima di passare al caso competitivo, esploreremo come si determinano il tasso di interesse ed il livello di rischio per uno scambio bilaterale non competitivo quando questo ha luogo tra un banco dei pegni della città e un povero debitore, oppure una banca di una piccola città e i suoi clienti. Se il creditore agisce da first mover, egli massimizzerà i profitti attesi soggetti alla funzione di risposta ottima del debitore, e porrà = * come mostra la figura 9.3. Si noti che, in questo caso, sia il rendimento atteso del creditore sia il valore che massimizza il profitto variano quando varia il livello di ricchezza del debitore. Di
20 | MICROECONOMIA
contro, se fosse il debitore a muovere per primo (improbabile nei casi già menzionati), egli saprebbe che i suoi profitti attesi variano inversamente al tasso di interesse e quindi offrirebbe di pagare semplicemente = , il tasso di interesse che (data la risposta ottima del debitore) darebbe al creditore un tasso di profitto atteso appena uguale al tasso di rendimento privo di rischio.
Naturalmente qualunque risultato con [ , *] è possibile, a seconda delle istituzioni che regolano la contrattazione. Il problema di contrattazione tra debitore e creditore è illustrato nella figura 9.4 dove y( ) rappresenta il reddito atteso del
debitore se il tasso di profitto atteso del creditore è uguale al tasso privo di rischio, e y( *) e ( *) sono, rispettivamente, il reddito atteso del debitore e del creditore
quando il creditore muove per primo. In assenza di un’indicazione specifica della struttura istituzionale del problema di contrattazione non possiamo aggiungere altro sul risultato. Si supponga la presenza di una competizione tra i creditori tale che nell’equilibrio competitivo il profitto atteso di ciascun creditore sia pari a . La transazione di equilibrio dovrà essere sulla curva zero profitto, cioè, = , per un
debitore con capitale pari a k° . Poiché una ricchezza maggiore sposta la funzione di risposta ottima verso il basso, è facile osservare che è decrescente in k per i debitori con k > k° . Come risultato, il tasso di interesse nell’equilibrio competitivo
varia inversamente con la ricchezza del debitore. I debitori più ricchi saranno anche capaci di finanziare progetti più grandi e progetti di qualità inferiore. Per vedere come questo accade, poniamo l’ampiezza del progetto, inizialmente posta uguale a 1, adesso pari a K 1, in modo tale che k / K sia la quota di capitale del debitore. Consideriamo due debitori, uno con ricchezza appena pari a k° e che quindi possa finanziare un progetto di ampiezza 1 al tasso di interesse ° , come prima, e l’altro con ricchezza k > k° . Se il progetto del debitore più ricco fosse di ampiezza k / k° >1 , allora le quote di capitale e così le funzioni di risposta ottima dei due debitori sarebbero identiche. Ad entrambi sarebbe offerto ° e come risultato gli agenti selezionerebbero f ° e la condizione di equilibrio competitivo sarebbe soddisfatta. Con progetti
identici, l’agente più ricco effettua la transazione allo stesso tasso di interesse del debitore meno ricco ma è capace di prendere a prestito di più per finanziare un progetto più grande in modo tale da ottenere un reddito atteso maggiore. I meno ricchi sono in questo caso vincolati al credito, essi possono prendere a prestito ma sono limitati ad un ammontare minore rispetto ai più ricchi.
MERCATI CREDITIZI
|21
Finora abbiamo assunto che tutti i progetti siano della stessa qualità, cioè che μ non vari tra i debitori. Modificando questa assunzione, riveleremo un’altra penalità imposta ai meno ricchi. Si assuma che un agente incapace di fornire capitale ( k = 0 ) abbia un progetto per cui
μ = μ° e un debitore più ricco
(k > 0)
abbia
μ < μ° (l’agente più povero ha un progetto migliore). k
Per permettere un paragone, si supponga che entrambi siano debitori marginali appena capaci di finanziare i loro progetti in un equilibrio competitivo, e quindi entrambi paghino lo stesso tasso di interesse . (Nella figura 9.3, la funzione di risposta ottima per ciascun agente è tangente alla curva di zero-profitto). Cosa sappiamo circa la produttività dei loro progetti? Usando le funzioni di risposta ottima dei due debitori, possiamo riscrivere la condizione di equilibrio di profitti nulli come segue: 1 (1 k ) 1 o k =
= 1+ = o = k 2μ 2 2μ 2
Questa espressione significa che se i due progetti sono entrambi finanziati in un equilibrio competitivo, i loro rendimenti attesi devono essere uguali e congiuntamente uguali al tasso privo di rischio 1 + . Questo ci permette di dedurre qualcosa sulla qualità dei progetti offerti da un agente ricco e uno non ricco che potrebbero essere finanziati in un equilibrio competitivo. Per farlo, sfruttiamo l’assunzione che risulti uguale per entrambi i debitori, ciò permette la seguente semplificazione della precedente espressione: 1 k 1 = 2μ k 2μ o
equivalente a, μk = 1 k μo
(9.11)
Dall’osservazione dell’equazione (9.11) possiamo dedurre che l’agente con una ricchezza inferiore possiede un progetto qualitativamente superiore a quello dell’agente ricco. Se l’agente ricco può offrire metà del costo del suo programma in capitale, il suo progetto sarà qualitativamente buono la metà di quello dell’agente povero (che non può offrire niente). E’ facile notare che se l’agente povero avesse avuto una qualche ricchezza disponibile utilizzabile come capitale, k° < k , la relazione precedente diventerebbe: μ k (1 k ) = μ o (1 k o )
Questo significa che la qualità minima richiesta ad un progetto per assicurarsi
22 | MICROECONOMIA
un finanziamento, espressa come rapporto tra due potenziali debitori, è proporzionale alla frazione del progetto che non può essere auto finanziato. Abbiamo, quindi, tre risultati nel caso di equilibrio competitivo: per i debitori con ricchezza sufficiente ad assicurarsi un prestito per finanziare il progetto con ampiezza minima (K =1) ma non sufficiente per auto finanziare l’intero progetto, i più ricchi saranno capaci di finanziare progetti più ampi e progetti di qualità inferiore; inoltre, per progetti della stessa ampiezza e qualità come per quelli meno ricchi, i debitori ricchi pagheranno tassi di interesse minori.
Figura 9.5. Perdite di efficienza allocativa dovute a differenze di ricchezza.
Questo risultato, naturalmente, può non essere efficiente. Esso implica che ci siano alcuni agenti poveri con progetti buoni che non saranno implementati, mentre alcuni agenti ricchi (e ricchi principali) avranno reddito sufficiente o riceveranno un prestito sufficiente per portare avanti progetti inferiori. Per vedere questo come accade, si supponga che sia disponibile un dato ammontare di finanziamento, normalizzato all’unità, da dividere tra i progetti (tutti della stessa ampiezza, 1) eseguiti da individui ricchi o meno ricchi (ciascuno dei quali ha un insieme di progetti di varietà variabile). Ordiniamo i progetti di ciascuno dal migliore (con il valore più alto di μ ) al peggiore, e assumiamo che i progetti vengano finanziati in ordine di qualità. Si assuma che i due debitori abbiano un’identica distribuzione della qualità dei progetti. Nella figura 9.5 il numero di progetti offerti dal povero e che sono finanziati è pari a n . Il numero di progetti offerti e poi finanziati del ricco sono (1 n) . Definiamo μ°(n) la qualità dell’ennesimo progetto del debitore povero e μ (n) la qualità del peggiore progetto finanziato del debitore ricco quando il debitore povero finanzia n progetti. L’ottimo sociale richiede che nessun progetto escluso sia di qualità inferiore ad alcun progetto incluso. (Se ci fosse un ampio numero di piccoli k
MERCATI CREDITIZI
|23
progetti questo renderebbe (approssimativamente) uguale la qualità dei progetti marginali offerti da ciascuno). Tabella 9.2. Redistribuzione che accresce l’efficienza
Prima Dopo
Surplus totale
Reddito del Proprietario Reddito dell’esecutore
3μ 16 = (1 + )3 2
μ 8 = 1+
μ 16 = (1 + ) 2
μ 8 = 1+
μ 8 = 1+
μ 4 = 2 (1 + )
Nota: La linea del “prima” riproduce la riga della tabella 9.1, con μ = 8(1 + ) .“Dopo” descrive l’effetto del trasferimento dell’attività e dell’imposta descritte nel testo.
Si supponga che l’ottimo si realizzi quando il povero ottiene un finanziamento per n
progetti. Ma l’equilibrio competitivo, precedentemente rappresentato dall’equazione (9.11), mostra che il progetto marginale del debitore più ricco sarà di qualità inferiore del progetto marginale del debitore meno abbiente. Così, il povero otterrà finanziamento solo per n* < n . Si può dire di più: usando il fatto che per i max
max
progetti marginali in equilibrio competitivo μ / μ° =1 k , sappiamo che μ° μ , la differenza nella qualità del progetto dei progetti marginali dei due individui sarà uguale a μ°k . Questa è una misura dell’inefficienza allocativa, ed è ovviamente crescente in k , la differenza di ricchezza fra i due debitori. In questo modello, una k
k
redistribuzione della ricchezza dal ricco al povero (assumendo che l’esecuzione sia priva di costi) accrescerebbe il surplus sociale: n * aumenterebbe, accrescendo così la qualità media dei progetti. Se tale redistribuzione fosse seguita da un pagamento compensativo ai ricchi si otterrebbe un miglioramento Paretiano? È risaputo che una redistribuzione può non passare il test Paretiano per la semplice ragione che anche le ridistribuzioni generano perdenti e vincitori. Per dimostrare che questo non è necessariamente uno di quei casi, facciamo riferimento alla tabella 9.1. Si supponga che μ = 8(1 ) , come nel caso del modello di rischio non soggetto a contrattazione (in un solo periodo), i profitti attesi del creditore ( μ /8) sono pari a uno più il tasso di interesse privo di rischio, mentre il debitore povero ha un reddito atteso ( μ /16) pari a (1 + ) /2 . Si immagini che all’inizio di un qualche periodo il governo confischi la macchina da $1, richiesta per il progetto, dal suo ricco precedente proprietario e la attribuisca all’exdebitore povero che poi la faccia funzionare alla stessa maniera di Robinson Crusoe. (Oppure si immagini che il governo imponga al creditore ricco una tassa di $1 e poi trasferisca questo ammontare al debitore povero). Il governo impone, inoltre, una tassa al beneficiario di questa redistribuzione, esigendo che questi paghi (1 + ) alla fine del periodo (se il progetto fallisce, egli pagherà la tassa mediante i guadagni derivanti dal suo capitale umano). Il guadagno atteso del beneficiario prima del pagamento dell’imposta sarebbe lo stesso di quello di Crusoe, cioè μ / 4 , oppure,
24 | MICROECONOMIA
dato il valore assunto da μ, 2(1 + ) . Se il beneficiario realizza questo ammontare, egli può pagare la tassa cui è sottoposto, che verrà poi utilizzata dal governo per compensare il precedente proprietario, pagandogli il suo rendimento atteso come proprietario (1 + ) . Il beneficiario della redistribuzione trattiene per sé un ammontare pari a (1 + ) , e quindi come risultato sarà più ricco. (Ricordiamo che come debitore aveva ottenuto solo metà di questo ammontare). Tutto ciò che è richiesto è che il surplus totale sia maggiore nel caso del proprietario-esecutore (Crusoe). La tabella 9.2 riassume questi conteggi. Se, quindi, esiste la possibilità di un miglioramento Paretiano, ci si domanda come mai i proprietari delle macchine non le affittino ai poveri in cambio di una promessa di pagamento al proprietario di una rendita pari a 1 + alla fine del periodo. Questa transazione replica semplicemente i problemi di incentivo incontrati nel contratto di affitto poiché la promessa di pagare una rendita non è enforceable. Il governo affronta questo problema estraendo la compensazione dal beneficiario indipendentemente dal risultato del progetto, offrendo essenzialmente un contratto enforceable di affitto al beneficiario al tasso di interesse privo di rischio. Il trasferimento dell’attività più la tassa rende il proprietario-esecutore del progetto il detentore del diritto su tutto il rischio indotto dalle sue scelte (piuttosto che essere protetto dal rischio di fallimento mediante la promessa non enforceable di ripagare il prestito o di pagare una rendita). E’ questo che spiega la superiorità allocativa del caso di Robinson Crusoe e permette la (apparentemente anomala) redistribuzione che genera un miglioramento Paretiano.
AV V E R S IO N E A L R ISC H IO , P R O P R I E T À , A L L O C AT I VA
ED
EFFICIENZA
Per mostrare come sia impossibile implementare una tale redistribuzione o per motivare il fatto che, se questa fosse imposta, ridurrebbe il benessere anche per i suoi beneficiari, dobbiamo rendere più realistico il modello precedente. Abbiamo assunto che tutte le parti fossero neutrali al rischio. Tuttavia, esiste una forte evidenza empirica che mostra la generale avversione al rischio dei poveri e che tale avversione decresce all’aumentare del livello di reddito di un individuo5. Il povero, quindi, potrebbe preferire la mezzadria o un’occupazione salariata, dato che questi contratti lo proteggono dal rischio, pur se il reddito atteso risulterebbe maggiore se egli assumesse rischi e diritti. La riforma della terra in Cile 5
Binswanger (1980), Saha, Shumway, e Talpaz (1994).
MERCATI CREDITIZI
|25
evidenzia questo punto. Questa sezione affronta due problematiche. Primo, quali sono le condizioni per cui il povero preferisce davvero detenere attività produttive esposte al rischio? Secondo, esiste una classe di ridistribuzioni in grado di accrescere l’efficienza allocativa, considerato che questa non sarebbe raggiunta tramite contrattazione volontaria, sostenibile come equilibrio competitivo? Per rispondere a questi interrogativi abbiamo bisogno di nuovi strumenti6. Ricordiamo dal capitolo 3 che, se l’utilità di un individuo come funzione del reddito è rappresentata da U = U( y) , allora la misura dell’avversione al rischio di Arrow-Pratt è pari a a = U'' /U' . Se la funzione di utilità è meno concava per livelli più alti di reddito, ossia se da / dy < 0 , allora si ottiene un’avversione al rischio decrescente7. Ricordiamo anche che
mentre la concavità della funzione di utilità cattura indubbiamente aspetti importanti del comportamento in presenza di rischio, essa certamente non contempla importanti influenze sul comportamento, come l’avversione all’incertezza, l’ambiguità, la paura del non conosciuto, e così via. Introdurremo ora una struttura che tratta la concavità della funzione di utilità come una delle tante ragioni per cui la gente evita il rischio. L’idea di base è rappresentare il reddito atteso come un bene e la variazione del reddito come un male. Si supponga che il reddito di un individuo, y , vari in risposta a shock stocastici secondo questa relazione: y = z + g ( )
(9.12)
Dove g( ) è il reddito atteso e z è una variabile casuale con media zero e deviazione standard pari a uno. La deviazione standard del reddito, una misura del rischio, è rappresentata da . L’individuo sceglie tra diversi stati che differiscono fra loro per il grado di rischio che comportano ( ). Possiamo scrivere la funzione di utilità dell’individuo come v = v {g ( ), } con vg > 0 e v 0
(9.13)
Questa funzione esprime la valutazione positiva dell’individuo per alti livelli di valore atteso del reddito e la valutazione negativa per il reddito più incerto, senza per 6 7
Questa sezione si basa su Bardhan, Bowles, e Gintis (2000). a rappresenta l’ avversione al rischio assoluta e viene distinta dall’avversione al rischio relativa, che è misurata da aR = yU'' /U' = ya . L’avversione al rischio relativa decrescente implica che quando il reddito aumenta, a si riduce più che proporzionalmente all’aumento del reddito.
26 | MICROECONOMIA
questo implicare che l’incertezza nel reddito sia dovuta alla concavità della funzione di utilità U( y) . Per il particolare modo in cui è stato introdotto il rischio, comunque, questa funzione è anche capace di catturare la logica della misura di Arrow-Pratt8. Le curve d’indifferenza che rappresentano un individuo con l’avversione al rischio (ArrowPratt) decrescente sono raffigurate nelle figura 9.6. Queste curve di indifferenza sono crescenti e convesse in , sono piatte nei pressi dell’intercetta verticale ( = 0 ), quando > 0 diventano più piatte all’aumentare di g , e più ripide all’aumentare di .
Reddito atteso
g( )
Deviazione standard del Reddito, Figura 9.6. Curve di indifferenza per un individuo con avversione al rischio decrescente e scelta del livello di rischio. Si noti che * rappresenta la scelta di rischio per un individuo neutrale al rischio.
L’inclinazione di una curva di indifferenza, v / v rappresenta il saggio marginale di sostituzione tra rischio e reddito atteso. Così, (g, ) è una misura del
g
livello di avversione al rischio di un individuo con un dato livello di reddito e rischio attesi. E’ chiaro che questa misura è crescente rispetto al livello di esposizione al rischio. L’intercetta verticale di ciascuna curva rappresenta l’equivalente certo degli altri punti appartenenti alla curva: esso rappresenta il massimo ammontare che un individuo sarebbe disposto a pagare per l’opportunità di estrarre un reddito da una distribuzione con media e dispersione date da ciascun altro punto sulla curva. 8
La funzione di utilità generale U( y) può, in questo caso, essere espressa come una semplice funzione di utilità in due parametri poiché la variazione nel reddito è generata da ciò che è chiamato classe lineare di disturbi. I dettagli analitici sono in Bardhan, Bowles, e Gintis (2000), ispirati al precedente lavoro di Meyer (1987) e Sinn (1990).
MERCATI CREDITIZI
|27
È plausibile assumere che la cosiddetta funzione rischio-rendimento, g( ) , abbia la forma di una U invertita: all’inizio cresce raggiungendo un massimo e poi decresce (come raffigurato in figura 9.6.). La scelta di può riferirsi ad una scelta tecnologica, come la “velocità della macchina” o la scelta di una varietà di semi altamente produttivi ma altamente rischiosi contro altri meno rischiosi ma meno redditizi. Oppure si potrebbe riferire all’investimento in capitale umano o ad una scelta di prodotto mista come ad esempio il grado di specializzazione, l’istruzione più specializzata o il mix di prodotto che produce rendimenti (in un certo intervallo) maggiori ma incorre in molti più rischi. Funzioni di rischio-rendimento di questo genere sono anche state stimate rispetto alla biodiversità, essendo la maggiore diversità una protezione contro variazioni climatiche e altri influssi ambientali. L’agente deciderà di massimizzare v rispetto a soggetto a g = g( ) : g' =
v vg
(9.14)
La (9.14) richiede che il saggio marginale di trasformazione del rischio nel reddito atteso (a sinistra dell’equazione) sia eguagliato al saggio marginale di sostituzione tra il rischio e il reddito atteso. Un individuo neutrale al rischio (uno per cui v = 0 ) porrà semplicemente g' = 0 , massimizzando il reddito atteso in = *. L’individuo avverso al rischio (con v > 0 ) selezionerà un livello di rischio tale che g' > 0 , che implica un livello di rischio ( ) inferiore, con un rendimento atteso corrispondente inferiore.
Ora possiamo rispondere alla prima domanda: Sotto quali condizioni un agente povero di mezzi preferirebbe essere proprietario-esecutore anziché un lavoratore salariato nello stesso progetto? Si assuma un progetto con durata infinita che generi un flusso di reddito come precedentemente descritto e che richieda un ammontare di capitale k per essere eseguito; il costo opportunità per ciascun periodo è rappresentato dal tasso di interesse privo di rischio, . Se il progetto è eseguito da un dipendente che non è anche titolare dei diritti, il proprietario dovrà pagare i costi di supervisione m e pagare un salario w (uguale alla disutilità del lavoro) all’impiegato, producendo un profitto per il proprietario pari a ( ) = z + g ( ) k m w
Si supponga che il datore di lavoro sia neutrale al rischio; egli selezionerà
28 | MICROECONOMIA
= *. Si assuma che la competizione tra molti datori di lavoro simili imponga una
condizione di profitto atteso nullo, in modo tale che il salario di equilibrio w * (imponendo ( *) = 0 ) sia dato da w* = g( *) k m . Ci domandiamo se il dipendente che riceve w * con certezza preferirà essere il titolare del diritto residuale sul reddito incerto, derivante dal progetto, assumendo che egli possa anche scegliere il livello di rischio. Assumiamo (contrariamente a quanto abbiamo fatto nella sezione precedente) che i beni capitali richiesti siano affittati per k per periodo, o che l’ex-dipendente possa prendere a prestito per acquistare del capitale al tasso di interesse , il che è equivalente. Per semplicità assumiamo che, come proprietario-esecutore, l’ex-dipendente impieghi esattamente lo stesso impegno, da dipendente, ma senza incorrere in costi di supervisione. Allora il suo reddito al netto del costo opportunità sarà y ( ) = z + g ( ) k
Definiamo il reddito atteso del proprietario-esecutore come = g( ) k e la sua funzione di utilità sia pari a v = v( ( ), ) . Massimizzando l’utilità rispetto a avremo, ' =
v v
Assumiamo che il livello di rischio scelto sia ° . I due riquadri nella figura 9.7 raffigurano due situazioni possibili. In entrambi i riquadri, la funzione di rischio-rendimento per il proprietarioesecutore, ( ) , è al di sopra della funzione di salario, w *( ) , di un ammontare m poiché nel primo caso il lavoro autonomo elimina i costi di supervisione. Ma il proprietario-esecutore, essendo avverso al rischio, seleziona un livello di rischio minore di quello che massimizza il reddito atteso scelto dal datore di lavoro. Nel riquadro a, l’equivalente certo dell’esito del proprietario esecutore, w° , è inferiore a w *; ciò significa che l’individuo preferirebbe rimanere un dipendente piuttosto che
assumere il rischio associato al possesso dei diritti. Nel riquadro b l’individuo è meno avverso al rischio e quindi il caso è opposto.
MERCATI CREDITIZI
m
w°
|29
( ) w°
( )
m
Figura 9.7. I payoff da lavoro dipendente e come proprietario per un individuo altamente avverso al rischio (a) e per un individuo poco avverso al rischio (b). Si noti che l’individuo molto avverso al rischio preferisce il lavoro salariato piuttosto che essere proprietario.
Nel secondo caso ci aspetteremmo di vedere progetti eseguiti dai proprietari piuttosto che da dipendenti: i dipendenti acquisirebbero attività e diventerebbero proprietari, implementando un trasferimento dei diritti di controllo e della titolarità del diritto di proprietà che implica un miglioramento Paretiano. Questa rappresenta esattamente l’intuizione di Coase: sotto adeguate condizioni, i trasferimenti volontari di diritti di proprietà dovrebbero implementare un’allocazione efficiente, con titolarità del diritto e controllo sul progetto assegnato a coloro che possono portarlo avanti in modo più produttivo. Ciò che rende possibile questo risultato, nel nostro caso, è la fittizia assunzione che il proprietario esecutore possa affittare i beni capitali o contrarre un prestito per acquistarli ad un tasso di interesse privo di rischio. Sappiamo (dalla precedente sezione) che sotto condizioni competitive, il tasso d’interesse varierà inversamente rispetto al rapporto tra il capitale del debitore, k , e l’ampiezza del progetto k . Si supponga, allora, che il costo dell’interesse nel prendere a prestito per acquistare l’attività (e il costo opportunità di devolvere la propria ricchezza al capitale per il progetto) non sia ma piuttosto sia r , dove k r = r k
con r ' < 0 e r (1) =
Il reddito netto atteso per un proprietario esecutore con ricchezza pari a k è adesso k k = g ( ) r k k
La situazione raffigurata nella figura 9.7b con questa nuova funzione rischio-
30 | MICROECONOMIA
rendimento (chiamata ), per un individuo con ricchezza limitata è presentata nella figura 9.8. k
Si noti che, nel caso descritto, l’equivalente certo per la scelta di rischiorendimento dell’individuo è inferiore a w *. È chiaro che il potenziale proprietario esecutore vincolato al credito preferirà rimanere un dipendente, anche se, se fosse stato capace di prendere a prestito al tasso , avrebbe preferito essere proprietario. In questo caso, se i dipendenti avessero ricchezza pari o minore a k , nell’equilibrio competitivo, esisterebbe il lavoro salariato. (Assumiamo che questi non-proprietari investirebbero qualunque ricchezza di cui dispongono in uno strumento il cui rendimento è ).
Reddito atteso
( )
w
+
w
k+
k
Deviazione standard del Reddito, +
Figura 9.8. Accrescendo la ricchezza del dipendente da k a k il costo opportunità del capitale si riduce e sposta il contratto ottimo dal lavoro salariato alla modalità proprietario-esecutore.
Si supponga che abbia luogo una redistribuzione delle attività tale che l’impiegato abbia una ricchezza pari a k maggiore di k . La sua funzione di rischiorendimento (la linea tratteggiata nelle figura 9.8) gli darebbe, come nella figura 9.7, un equivalente certo maggiore di w *. +
In questo caso egli sarebbe capace di prendere a prestito ad un tasso (o sopportare il costo opportunità di per l’uso della propria ricchezza nel progetto) e così diventerebbe (e rimarrebbe) un proprietario-esecutore. Sia il trasferimento preridistributivo del diritto e del controllo sia il trasferimento post-ridistributivo sono quindi sostenibili come equilibri di Nash. Ne consegue che una redistribuzione dei titoli di proprietà, che non avrebbe
MERCATI CREDITIZI
|31
avuto luogo mediante contrattazione privata, può essere implementata in modo forzoso. Si supponga che questa redistribuzione sia conseguita tassando i possessori di ricchezza che prima e dopo la redistribuzione erano neutrali al rischio e ricevevano un rendimento sulle loro attività pari al tasso privo di rischio. Tale redistribuzione (se portata avanti senza costi amministrativi ed altro) accresce il surplus totale in questo senso: il costo opportunità delle attività a cui rinunciano coloro su cui gravano i costi ( ) sarebbe inferiore ai rendimenti goduti dai beneficiari (sappiamo questo perché al tasso di interesse il dipendente avrebbe preferito la proprietà). La fonte del guadagno di efficienza è l’eliminazione dei costi di monitoraggio permessa dalla sostituzione dei lavoratori autonomi ai lavoratori salariati. Questo guadagno è parzialmente pareggiato dal passaggio del controllo della scelta del rischio da un ex-proprietario neutrale al rischio ad un proprietario-esecutore avverso al rischio, in aggiunta all’eliminazione dell’assicurazione contro il rischio efficiente fornita dall’assegnazione dei diritti al proprietario neutrale al rischio. Naturalmente, la redistribuzione non genera un miglioramento Paretiano poiché il ricco subirà una perdita di benessere. Inoltre, nonostante i guadagni di efficienza sostenuti dalla redistribuzione, è difficile immaginare una compensazione effettuabile per i “perdenti”. La redistribuzione delle attività è essenziale per generare guadagni di efficienza, quindi, compensare i perdenti attenuerebbe quei guadagni. Non abbiamo considerato un effetto ovvio della redistribuzione: i beneficiari del trasferimento dell’attività sarebbero, come risultato, meno avversi al rischio, dato che l’avversione al rischio è decrescente. Come proprietari-esecutori essi sceglierebbero quindi livelli di rischio più elevati, e raggiungerebbero redditi attesi maggiori. Per trasferimenti di attività sufficientemente ampi, l’avversione al rischio ridotta potrebbe indurre gli ex-dipendenti a diventare proprietari indipendentemente dall’effetto di riduzione dei vincoli al credito precedentemente visto. La redistribuzione di attività è un veicolo per l’esplorazione dell’interazione fra vincoli al credito, avversione al rischio, e proprietà. Non è un disegno di politica economica. La progettazione di politiche di distribuzione dei beni prevede di affrontare sia gli aspetti amministrativi come quelli di equilibrio generale e gli effetti dinamici di lungo periodo, non considerati qui. Per esempio, si deve considerare il caso in cui il povero adotta strategie di risparmio ed investimento che preservino o accrescano le sue attività.
32 | MICROECONOMIA
L’analisi precedente mostra semplicemente che essi non preferirebbero vendere le attività se le potessero acquistare per un costo pari a o minore. Torneremo su questi interrogativi sulle strutture alternative di proprietà e controllo delle imprese nel capitolo 10. I modelli presentati in questo capitolo non solo prevedono che i meno abbienti pagheranno tassi di interesse maggiori quando prendono a prestito, o verranno interamente esclusi dai mercati del credito, ma anche che i poveri di capitale riceveranno anche rendimenti più bassi sulla loro ricchezza. Adam Smith (1937[1776]:93) intendeva questo quando scrisse: “ I soldi, dice il proverbio, creano soldi. Quando ne hai un po’ è facile averne di più. La più grande difficoltà è ottenere quel po’ ”. Ci sono due ragioni per questo. Primo, coloro esclusi dal prestito dovranno investire qualunque bene essi posseggano al tasso di interesse privo di rischio, , mentre tra coloro che posseggono capitale sufficiente per prendere a prestito, tutti tranne il debitore marginale possono ottenere un rendimento maggiore (assumendo che il mercato dei prestiti sia competitivo). Secondo, i meno ricchi e così gli individui avversi al rischio, selezioneranno progetti con redditi attesi minori (come mostra la figura 9.6). La nostra previsione trova evidenza empirica negli Stati Uniti anche per individui abbastanza ricchi, restringendo il paragone ad un tipo di attività specifico: i titoli aziendali detenuti da individui ad alto reddito crescono di valore più velocemente di quelli detenuti da individui meno ricchi (Yitzhaki 1987).
C O N C L U S IO N I I modelli presentati in questo capitolo comportano chiare conseguenze per la trasmissione di status economico da genitori a figli. Le differenze di ricchezza possono persistere tra generazioni a causa delle opportunità limitate del prestito e delle opportunità di investimento meno redditizie di coloro che non ereditano ricchezza dai loro genitori. Numerosi autori hanno approfondito le implicazioni dinamiche degli aspetti non contrattuali dei mercati finanziari. Un’altra implicazione di questo capitolo è che alcune distribuzioni di ricchezza sono più efficienti di altre. Laddove le disparità di ricchezza sono tali da permettere che una piccola riduzione dei beni dei ricchi non precluderebbe loro la possibilità di portare avanti qualunque contratto tecnicamente effettuabile e, garantendo beni addizionali ai poveri aprirebbe loro opportunità contrattuali, allora una redistribuzione della ricchezza potrebbe essere un mezzo per attenuare i problemi di
MERCATI CREDITIZI
|33
incentivo che si sollevano con le relazioni tra principale ed agente. Questa conclusione sfida la nozione di efficienza-neutralità asserita dal Teorema Fondamentale di Coase. Inoltre, solleva dubbi su uno dei fondamenti della saggezza popolare in economia e cioè sul trade-off tra efficienza ed equità. In circostanze nelle quali le assunzioni dei due famosi teoremi non vengono soddisfatte, così che la distribuzione di diritti di proprietà può avere effetti sull’efficienza allocativa, il tradeoff tra efficienza ed equità asserisce che l’aumento dell’equità ridurrà l’efficienza. (Questa appare come un’espressione della “saggezza popolare” poiché si tratta di qualcosa che “tutti conoscono” e che appare ancora in molti libri universitari, ma che nessuno ha dimostrato formalmente, a differenza del Teorema Fondamentale. Un estratto convincente dell’idea è presentato in Okun (1975)). I precedenti modelli mostrano che la distribuzione della ricchezza è importante per l’efficienza allocativa. Nella misura in cui tale distribuzione risulta essere rilevante in quanto attenua i problemi di incentivo derivanti dall’incompletezza contrattuale, essa lo è in modo asimmetrico9. Le distribuzioni maggiormente egualitarie sono probabilmente più efficienti poiché i poveri, non i ricchi, sono esclusi dai contratti più efficienti. Se una particolare attività fosse più produttiva se il controllo e il titolo fossero nelle mani di un individuo ricco, ci sarebbero pochi impedimenti a che ciò possa essere ottenuto tramite scambio volontario. In questo caso, il processo competitivo tenderà ad assegnare i diritti di proprietà in modo efficiente. La mancanza di un tale processo, nel caso di un individuo povero di beni ma che potrebbe essere il proprietario più efficiente, significa che il rimedio necessario è accrescere le opportunità contrattuali del povero. Non è difficile trovare eccezioni a questa affermazione. Per esempio, la concentrazione della ricchezza può permettere la soluzione di problemi di azione collettiva nella fornitura di beni pubblici (Olson 1965). Pertanto, i problemi di monitoraggio dei manager aziendali, da parte dei proprietari sarebbero attenuati se un gruppo di persone fosse così ricco da acquisire le imprese completamente (o perché essi sono neutrali al rischio, o perché hanno abbastanza reddito da essere gli unici proprietari senza compromettenti diversificazioni di portafoglio)(Demsetz e Lehn 1985). Queste eccezioni sono importanti ma potrebbero esserci ragioni più convincenti per dubitare degli effetti di efficienza di una redistribuzione egualitaria. Il maggior guadagno di efficienza permesso dalla concentrazione di ricchezza è che essa assegna sia il controllo che il diritto agli individui meno avversi al rischio. Questi, allora, offrono contratti fornendo, agli agenti meno ricchi, assicurazioni meno valutabili nella forma di occupazioni a salario fisso, mezzadria, e altri contratti che proteggono gli agenti 9
Ovvero, si applica soltanto nel caso in cui il povero sia più efficiente e non il contrario. N.d.t.
34 | MICROECONOMIA
avversi al rischio dagli shock sul reddito. La principale controindicazione a questo assetto risiede nel fatto che esso richiede che coloro che compiono le azioni non contrattabili (impegno nel lavoro, per esempio) non siano coloro sui quali ricade la conseguenza delle azioni stesse. Come risultato, gli incentivi ad agire sono compromessi. La redistribuzione della ricchezza affronta questo problema di incentivo ma al costo della riduzione della propensione all’assunzione del rischio. Il modello statico qui utilizzato non cattura l’impatto di lungo periodo di un livello di rischio più basso; in un contesto dinamico più appropriato, apparirebbe sotto forma di un livello inferiore di innovazione e, di conseguenza, di un livello di crescita della produttività di lungo periodo ridotta. Anche in circostanze in cui non è coinvolta l’esposizione al rischio, non c’è ragione di credere che il controllo di un’attività, ed i diritti sul flusso di reddito ad essa associati, saranno assegnati a coloro che possono farne un uso migliore. Quando l’allocazione dello sforzo ad uno specifico compito da parte di un agente e l’allocazione delle risorse al monitoraggio dell’impegno da parte di un principale non sono ottimali (come nel modello del capitolo 8), una redistribuzione dei diritti e del controllo all’agente può migliorare l’allocazione complessiva. Ma questa reassegnazione di diritti è a volte impedita dalle restrizioni all’accesso al mercato del credito, come nel caso della riforma della terra cilena. Pertanto, il fallimento di mercato associato alla regolamentazione dell’impegno lavorativo non viene eliminato a causa del fallimento del mercato del credito. Una sfida per la politica economica e il disegno istituzionale consiste nella elaborazione di rimedi al problema della riduzione degli incentivi che si pone in presenza di azioni non soggette a contrattazione, quando la ricchezza è concentrata. Ne sono un esempio, attinente sia al problema degli attributi nascosti, che delle azioni nascoste, le istituzioni del microcredito. Alcune forme di microcredito rendono tutti gli individui appartenenti ad un gruppo (auto-selezionato) di debitori responsabili della restituzione del prestito di ciascuno. Un altro modo in cui vengono accresciute le opportunità contrattuali degli agenti che non dispongono di ricchezza sufficiente è mediante un meccanismo che colleghi il pagamento dei membri del gruppo produttivo al livello osservabile di produzione di output del gruppo stesso (rendendo così i membri del gruppo responsabili del proprio impegno). Un’ulteriore sfida è rappresentata dall’indurre i proprietari meno ricchi ad assumere maggiori rischi. Una proposta promettente è accrescere l’assicurazione contro shock pubblici osservabili che influenzano i rendimenti delle proprie attività (assicurazioni sulle condizioni metereologiche per gli agricoltori, per esempio) o contro shock non
MERCATI CREDITIZI
|35
collegati alla proprietà delle attività produttive (assicurazione sanitaria o assicurazione contro la variazione di prezzo delle case)10. Se approfondissimo adesso questi importanti argomenti ci troveremmo ben presto troppo fuori tema. Esiste, comunque, una importante implicazione dei modelli qui presentati: trasferimenti di proprietà prescritti dal governo possono consentire di realizzare miglioramenti di efficienza che non si verificherebbero tramite scambio volontario. L’abilità, propria unicamente del governo, di costringere i partecipanti è essenziale per i guadagni del miglioramento Paretiano (vedi l’esempio della tabella 9.2). In assenza della capacità del Governo di estrarre la compensazione derivante da una tassa per l’ex proprietario, sarebbe stato impossibile assicurare che il beneficiario della redistribuzione fosse il depositario del diritto e delle conseguenze su tutti i rischi conseguenti alle sue decisioni. L’imposizione del governo gioca anche un indispensabile ruolo di accrescimento dell’efficienza nel trasferimento delle attività che permettono guadagni di efficienza tecnica (progetti migliori, monitoraggio ridotto) studiati nelle sezioni precedenti, perché questi trasferimenti non sarebbero stati raggiungibili mediante scambio volontario. Nel capitolo 14, ritorneremo su questa problematica, e suggeriremo che i governi e i mercati possono agire in modo complementare per accrescere i rendimenti economici.
10Questi
argomenti sono affrontati in dettaglio in Bardhan, Bowles, e Gintid (2000). Sul microcredito, vedi Morduch (1999).
36 | MICROECONOMIA
Riferimenti bibliografici Bardhan, P., S. Bowles, et al. (2000). Wealth Inequality, Credit Constraints, and Economic Performance. Handbook of Income Distribution. A. Atkinson and F. Bourguignon. Dortrecht, North-Holland: 541-603. Binswanger, H. P. (1980). "Attitudes towards risk: experimental measurements in rural india." American Journal of Agricultural Economics 62(August): 395407. Black, J., D. d. Meza, et al. (1996). "House Prices, the Supply of Collateral and the Enterprise Economy." Economic Journal 106(434): 60-75. Blanchflower, D. and A. Oswald (1998). "What Makes a Young Entrepreneur?" Journal of Labor Economics 16(1): 26-60. Carter, M., B. Barham, et al. (1996). "Agricultural Export Booms and the Rural Poor in Chile, Guatemala and Paraguay." Latin American Research Review 31(1): 33-65. Demsetz, H. and K. Lehn (1985). "The Structure of Corporate Control: Causes and Consequences." Journal of Political Economy 93(6): 1155-1177. Evans, D. and B. Jovanovic (1989). "An Estimated Model of Entre-pre-n-eur-ial Choice under Liquidity Constraints." Journal of Political Economy 97(4): 808-827. Glaeser, E. and DiPasquale (1999). "Incentives and Social Capital: Are Homeowners Better Citizens?" Journal of Urban Economics 45(2): 354-384. Green, L., J. Myerson, et al. (1996). "Temporal Discounting in Choice Between Delayed Rewards: The Role of Age and Income." Psychology and Aging 11(1): 79-84. Gross, D. and N. Souleles (2002). "Do Liquidity Constraints and Interest Rates Matter for Consumer Behavior? Evidence From Credit Card Data." Quarterly Journal of Economics 117(1): 149-185. Guiso, L., T. Jappelli, et al. (1996). "Income Risk, Borrowing Constraints, and Portfolio Choice." American Economic Review 86(1): 158-172. Hausman, J. (1979). "Individual Discount Rates and the Purchase and Utilization of Energy-using Durables." Bell Journal of Economics 10(1): 33-54. Holtz-Eakin, D., D. Joulfaian, et al. (1994). "Sticking it Out: Entrepreneurial Survival and Liquidity Constraints." Journal of Political Economy 102(1): 53-75. Jappelli, T. (1990). "Who is credit constrained in the U.S. economy?" Quarterly Journal of Economics 105(1): 219-234. Jarvis, L. (1989). The Unraveling of Chile's Agrarian Reform, 1973-1986. Searching for Agrarian Reform in Latin America. W. Thiesenhusen. Boston, UnwinHyman: 240-265. Laffont, J. J. and M. S. Matoussi (1995). "Moral Hazard, Financial Constraints, and Share Cropping in El Oulja." Review of Economic Studies 62(3): 381-399. Lanjouw, P. and N. Stern, Eds. (1998). Economic Development in Palanpur Over Five Decades. Delhi, Oxford University Press. Meyer, J. (1987). "Two-Moment Decision Models and Expected Utility." American Economic Review 77(3): 421-430. Morduch, J. (1999). "The microfinance promise." Journal of Economic Literature XXXVII(December): 1569-1614. Okun, A. (1975). Equality and Efficiency: The Big Trade-Off. Washington,
MERCATI CREDITIZI
|37
Brookings Institution Press. Olson, M. (1965). The Logic of Collective Action: Public Goods and the Theory of Groups. Cambridge, MA, Harvard University Press. Ransom, R. L. and R. Sutch (1977). One Kind of Freedom: The Economic Consequences of Emancipation. Cambridge, Cambridge University Press. Rosenzweig, M. and H. P. Binswanger (1993). "Wealth, Weather Risk and the Composition and Profitability of Agricultural Investments." Economic Journal 103(416): 56-78. Rosenzweig, M. and K. I. Wolpin (1993). "Credit Market Constraints, Consumption Smoothing, and the Accumulation of Durable Production Assets in LowIncome Countries: Investment in Bullocks in India." Journal of Political Economy 101(2): 223-244. Saha, A., R. C. Shumway, et al. (1994). "Joint Estimation of Risk Preference Structure and Technology Using Expo-Power Utility." American Journal of Agricultural Economics 76(2): 173-184. Savage, H. (1995). Who could afford to buy a house in 1995? Washington, D.C, U.S. Census Bureau: 1-6. Sinn, H. W. (1990). "Expected Utility, mu-sigma Preferences, and Linear Distribution Classes: A further Result." Journal of Risk and Uncertainty 3: 277-281. Smith, A. (1937 [1776]). An inquiry into the nature and causes of the wealth of nations. New York, Random House. Tocqueville, A. d. (1958). Journeys to England and Ireland. London, Faber and Faber. Unhappy? Evidence From Panel Data." Economica 65(257): 1-15. Vega, S. (1999). Short term lending final report, Illinois Department of Financial Institutions. Verba, S., K. L. Schlozman, et al. (1995). Voice and Equality: Civic Voluntarism in American Politics. Cambridge, MA, Harvard University Press. Yitzhaki, S. (1987). "On The Relation Between Return and Income." Quarterly Journal of Economics 102(1): 77-95.
X L E I STITUZIONI DI UN ’E CONOMIA C APITALISTA
[Il mercato del lavoro]..è il vero Eden dei diritti innati dell’uomo. Lì...comandano la Libertà, l’Uguaglianza e la Proprietà. Nel lasciare questa sfera [per entrare nella fabbrica] pensiamo di poter percepire un cambio nella fisiologia della nostra dramatis personae. Colui che prima era il detentore di denaro ora ci sta di fronte come capitalista; il possessore di forza-lavoro segue come suo lavoratore. Karl Marx, Il Capitale, I (1867)
Si tenga a mente che in un mercato perfettamente competitivo, in realtà non importa distinguere chi assume da colui che viene assunto; che sia allora il lavoro ad impiegare il capitale. Paul Samuelson, “Salari ed Interessi” (1957)
Nel 1921 un gruppo di taglialegna, carpentieri e meccanici di Olympia, nello stato di Washington negli USA, formarono la cooperativa di falegnameria “Olympia Veneer”. Con un investimento di 1000 dollari, ogni membro conseguiva il diritto a lavorare nell’impianto, nonché il diritto ad una quota proporzionale dei profitti.1 Per lasciare la cooperativa, i membri erano tenuti a vendere le proprie quote azionarie. Per poter diventare membro, dietro approvazione del gruppo, si era obbligati a comprare quote che nel 1923 erano vendute a 2550$ l’una. Nel 1939, 250 lavoratori nella vicina Anacortes investirono 2000$ a testa in una seconda cooperativa di falegnameria. La forte domanda di legno compensato nel periodo della guerra spinse in alto il valore delle quote fino a 28.000$ nel 1951; nello stesso tempo i membri pagavano se stessi un salario pari al doppio del salario sindacale percepito dai lavoratori nei vicini stabilimenti di falegnameria tradizionali. Incoraggiati dal successo di Olympia Veneer e Anacortes, tra il 1949 ed il 1956 altre ventuno cooperative entrarono nel settore del legno nello stato di Washington ed in Oregon, nove delle quali attraverso l’acquisto di aziende convenzionali già esistenti. Alcune cooperative si erano de facto trasformate in aziende convenzionali o ad esse vendute. Per esempio, a 1
La migliore fonte di informazione sulle cooperative di falegnameria è una collana di studi da parte di Craig e Pencavel (Craig e Pencavel 1992, Craig e Pencavel 1995, Pencavel 2002). In generale, sulle cooperative di proprietà dei lavoratori si veda Dow (2002). Quanto segue è basato su tali studi.
2 | MICROECONOMIA
metà secolo i pochi membri-proprietari rimanenti di Olympia Veneer impiegavano un migliaio di lavoratori con contratti salariali ordinari, restando cooperativa solo nel nome. Nel 1954, essi vendettero le proprie quote alla U.S. Plywood Corporation; nella vendita, ventitrè dei membri iniziali realizzarono un rendimento medio sul loro investimento iniziale di 652.000$ (in dollari del 1954). Fino a quando l’intera industria si spostò dal Nord-Est al Sud-Ovest negli 80 e 90, circa la metà delle industrie di falegnameria erano cooperative, il resto erano aziende convenzionali, alcune di esse con lavoratori organizzati in sindacati, altre no. Sebbene le cooperative e le aziende convenzionali usassero in pratica gli stessi macchinari, le cooperative si specializzarono nel legno smerigliato che aveva una più alta intensità di lavoro poiché, come commentò un esperto di cooperative, “dava un premio all’impegno del lavoratore” (Bellas 1972:30). La struttura della tipica cooperativa di falegnami era sia egalitaria che democratica. Con poche eccezioni, i lavoratori-proprietari ricevevano un’uguale paga, e gli incarichi erano spesso ricoperti a rotazione. L’amministrazione era eletta dal consiglio dei membri-lavoratori. Alcuni dei non-membri erano assunti con contratti salariali convenzionali; in media essi rappresentavano un quarto della forza lavoro totale. Una forte etica lavorativa tra i membri permetteva di ottenere alti livelli di produttività, mantenuti attraverso controlli e stimoli reciproci. Di conseguenza, il risparmio sui costi di supervisione era sostanziale: quando un’azienda ordinaria si convertiva in una cooperativa, il numero dei supervisori veniva ridotto ad un quarto del livello precedente. Le quote in vendita dai membri che abbandonavano o andavano in pensione erano pubblicizzate nei giornali locali. I prezzi medi delle quote oscillavano tra un ammontare pari al reddito annuale dei singoli individui fino a tre volte tanto. Anche se ragguardevoli, questi prezzi erano di molto inferiori rispetto al valore attuale della differenza tra i guadagni nelle cooperative e nelle fabbriche sindacali: un individuo che avesse comprato una quota ed avesse lavorato nella cooperativa per qualche anno, avrebbe ottenuto un reddito il cui valore attuale era di molto superiore rispetto ad un individuo che avesse depositato la somma corrispondente in una banca di Portland ed avesse lavorato al salario sindacale in un’impresa ordinaria. La coesistenza di cooperative ed imprese tradizionali nella produzione di prodotti analoghi, con l’utilizzo di tecnologie praticamente identiche e per un periodo pari a tre-quarti di secolo, fornisce un’ottima opportunità per un’analisi comparata delle istituzioni. Durante questo periodo, le imprese convenzionali e le cooperative erano capaci di attrarre sia lavoro che capitale nello stesso modo. La produttività
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|3
totale dei fattori delle cooperative era sostanzialmente superiore – le migliori stime, da parte di Craig e Pencavel (1995), indicano percentuali tra il 6 e il 45 per cento superiori, a seconda del metodo di stima. Inoltre, le cooperative rispondevano alle fasi d’insufficiente domanda del prodotto a modo loro: piuttosto che licenziare i membri, esse riducevano la paga di tutti i lavoratori, distribuendo così l’impatto degli shock negativi tra tutti i membri del gruppo. In questo caso particolare, al contrario di quanto detto da Samuelson, era molto rilevante distinguere tra “chi assumeva e chi veniva assunto.” Uno dei compiti di ogni teoria delle istituzioni economiche è quello di spiegare fenomeni come la coesistenza nell’industria del legno di cooperative ed imprese convenzionali e le particolari forme assunte da queste ultime. Per esempio, data la superiore produttività totale dei fattori delle cooperative, ed i più alti guadagni di cui i loro membri beneficiavano, perché le cooperative non soppiantarono le imprese convenzionali? Per rispondere a domande di questo tipo, è necessario spiegare in genere sia la nascita che la cessazione dei vari tipi d’attività d’impresa, così come è necessario esplorare come le imprese si espandono, si fondono e si dividono. Ciò richiede, ovviamente, un’analisi di come i fornitori di capitale, i lavoratori ed i clienti scelgono tra vari tipi di impresa, basandosi sulle loro previsioni dei costi e dei benefici associati ad ognuna di esse. In questo capitolo userò le idee dei modelli sui mercati del lavoro e del credito sviluppate nei capitoli 8 e 9 per studiare la distribuzione dei contratti in un’economia capitalista. Con l’espressione distribuzione dei contratti, intendo riferirmi al modo in cui vengono assegnati a particolari individui i diritti di controllo sulle risorse e le rivendicazioni sul reddito residuo derivante dalle stesse risorse. Nell’industria del legno, le imprese convenzionali e le cooperative esemplificano due modi diversi di attribuzione dei diritti rilevanti: nelle seconde sia il diritto al residuo sia i diritti di controllo sono assegnati ai membri-proprietari che forniscono sia il capitale che il lavoro. Nelle prime, coloro che forniscono capitale e lavoro sono individui distinti, e il diritto al residuo (residual claimancy) e i diritti di controllo sono assegnati ai fornitori di capitale. Uso i termini diritto al residuo e diritti di controllo invece che il più generico termine proprietà per permettere la descrizione di situazioni in cui i diritti di controllo (la facoltà di utilizzo di una risorsa, inclusi la vendita ed il diritto di impedirne l’utilizzo ad altri) e la rivendicazione del reddito residuo generato dalla risorsa sono assegnati a soggetti distinti.
L’idea chiave del capitolo può essere sintetizzata brevemente. Dati i benefici
4 | MICROECONOMIA
della specializzazione e delle economie di scala, l’attività economica è necessariamente sociale anziché individuale, ed i tipi di accordi istituzionali che governano la produzione e lo scambio riflettono il fatto che i conflitti di interesse tra le parti interessate sono regolati da contratti incompleti. L’effetto congiunto di contratti incompleti e conflitti d’interesse è quello di far sì che l’esito finale dipenda da chi esercita il potere nella transazione. Il potere è generalmente esercitato da coloro che hanno i diritti residuali di controllo, cioè il diritto di determinare ciò che non è specificato nel contratto.2 Un primo compito, quindi, è quello di capire come questi diritti residuali di controllo vengano assegnati alle varie parti in causa in una transazione. Nella prima sezione che segue, si esaminerà uno dei possibili modi per affrontare questa questione – l’ipotesi di design efficiente – e si spiegherà perché essa è erronea. Sebbene l’assegnazione dei diritti di controllo sia presente in ogni transazione, essa è esaminabile con più chiarezza nello studio dell’impresa, cosa di cui ci si occuperà nella sezione successiva. Le teorie dell’impresa pongono la domanda: come si può esercitare potere negli scambi competitivi? Si offrirà una risposta (insieme ad una definizione di potere) nella sezione seguente. Si esplorerà quindi il modo in cui la ricchezza individuale determina il modo in cui gli individui si trovano ad occupare posizioni strutturali differenti a seconda dei contratti a disposizione e come questo processo determina a sua volta la distribuzione dei contratti in un’economia. Emergeranno tre risultati importanti. Primo, le differenze di ricchezza si riflettono nelle differenze tra le categorie di contratti fattibili e nelle scelta contrattuale effettuata dagli individui tra quelli possibili. Secondo, alcuni tra gli accordi contrattuali prevedono una struttura di autorità tale che i partecipanti ad un lato della transazione avranno potere (in un senso ben definito) sugli altri partecipanti, anche quando lo scenario è competitivo nel senso consueto di assenza di barriere all’entrata ed all’uscita. Pertanto, il fatto che la partecipazione sia volontaria non impedisce che venga esercitato potere. Terzo, i soggetti che esercitano potere saranno coloro con maggiore ricchezza. Nella penultima sezione, userò questa analisi per esplorare la struttura di classe di un’economia capitalista.
C A P ITA L IS M O
E
DESIGN EFFICIENTE
Perchè le cooperative, le associazioni e le altre alternative alle convenzionali imprese capitaliste hanno un’importanza così limitata nelle economie moderne? Cosa
2
L’attribuzione dei diritti di controllo non è condizione sufficiente né necessaria per l’esercizio del potere, dal momento che i primi danno ad un individuo l’autorità legittima di decretare un’azione, mentre il secondo presume che l’azione sia efficace, cosa per la quale l’autorità legittima non è né richiesta né adeguata. Sarà più semplice proseguire su questo punto dopo che il concetto di potere sarà stato introdotto con più precisione.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|5
spiega la straordinaria crescita economica delle economie le cui unità di produzione di base sono proprio le imprese capitaliste? Sarà istruttivo notare come i modelli introdotti fino ad ora offrano, quanto meno, riposte parziali a queste domande (e così facendo si avrà anche una prospettiva dei fallimenti del mercato endemici ad un’economia capitalista che sono stati individuati nelle pagine precedenti). Per economia capitalista, intendo un’economia nella quale la forma di organizzazione economica predominante è un’impresa nella quale i proprietari privati dei mezzi di capitale esercitano i diritti di rivendicazione del residuo e i diritti di controllo sui propri mezzi, impiegando altri input, compreso il lavoro salariato, per produrre beni e servizi da vendere allo scopo di realizzare profitti. Il capitalismo è un sistema economico di origine recente, che ha le sue radici nelle economie urbane di metà millennio fa nell’Italia settentrionale, in Inghilterra e nei Paesi Bassi. Un sistema che si espanse rapidamente prima in Europa, quindi nei luoghi dove gli emigranti Europei si stabilirono, ed infine nella maggior parte delle economie nel mondo. Altri aspetti della vita economica a volte usati per definire il capitalismo—la ricerca individuale del guadagno negli affari economici, lo scambio di mercato e l’uso del denaro—sono stati così presenti nella storia dell’umanità e sono apparsi in sistemi economici così tanto differenti l’uno dall’altro che una definizione più precisa come quella appena offerta sembra importante. Il capitalismo ha inaugurato una nuova era economica così diversa da quella che la precedette come lo fu l’emergere dell’agricoltura e la diffusione delle nuove istituzioni associate ad essa circa undici millenni prima. L’aspetto più evidente della “rivoluzione capitalista” fu la rapida crescita della produttività del lavoro, che rese possibile uno straordinario e prolungato innalzamento degli standard di vita materiale. Questo risultato produttivo non è materia di controversia neppure tra i più severi critici del capitalismo—Marx ed Engels lo sottolinearono nel Manifesto Comunista. Il fatto che non tutte le economie capitaliste abbiano prosperato in tutti i secoli, e che altri sistemi economici siano riusciti anch’essi a favorire una rapida e sostenuta crescita nella produttività del lavoro (per esempio, la Cina nell’ultimo terzo del ventesimo secolo) non sminuisce l’entità dei risultati ottenuti dal capitalismo nel corso dei secoli come sistema di straordinaria produttività. Ciò che il capitalismo ha ottenuto, e ciò che spiega gran parte del suo successo produttivo, è la circostanza che alcuni individui avevano la possibilità di innovare ed assumersi rischi su progetti di grande scala con la ragionevole aspettativa di trarne benefici in caso di successo ed allo stesso tempo di sopportarne i costi in caso di fallimento. Le disuguaglianze nella ricchezza, l’esistenza del credito e degli altri
6 | MICROECONOMIA
mercati finanziari (con l’ausilio dell’introduzione della responsabilità limitata) permisero a singoli individui o a piccoli gruppi di raccogliere sotto un’unica direzione importanti risorse. Il mercato del lavoro consentì che queste risorse materiali fossero utilizzate impiegando un ampio numero di lavoratori, così da poter trarre beneficio dai rendimenti crescenti sia tecnologici sia organizzativi. La ricchezza (e la garanzia del credito) dei dirigenti di questi progetti imprenditoriali rese tollerabile il rischio associato all’innovazione. Questa gli permise anche di offrire una quota d’assicurazione de facto a coloro che essi ingaggiavano, nella forma del contratto salariale. Il risultato fu che coloro che non avevano nulla da offrire salvo che il proprio lavoro potessero essere coinvolti in progetti i cui rischi essi non avrebbero mai voluto assumersi personalmente. Per la prima volta nella storia, la competizione tra i membri dell’elite economica dipendeva dal successo di ognuno nell’introduzione di modi inediti di organizzazione della produzione e delle vendite, di nuove tecnologie e di nuovi prodotti. Il successo di queste organizzazioni dipese in modo decisivo dalla relativa sicurezza del possesso data dalle regole del diritto, ottenute in larga parte dai sempre più potenti stati nazionali che crebbero in simbiosi con le istituzioni economiche capitaliste. Il capitalismo non si avvalse di contratti completi per il suo successo. È vero piuttosto il contrario: il capitalismo stimolò la rapida diffusione di nuove tecniche attraverso un processo competitivo nel quale una buona parte del surplus generato dagli innovatori poteva essere carpito da coloro che replicavano le innovazioni. Questo processo di innovazione ed emulazione rese possibili delle allocazioni che erano largamente diverse da quelle implicate dalle condizioni statiche di efficienza caratteristiche di un equilibrio competitivo in un’economia Walrasiana idealizzata. Inoltre il capitalismo accrebbe la produttività espandendo significativamente la portata sia del mercato del lavoro sia di quello finanziario. Entrambi i mercati erano noti allora come lo sono adesso per la natura tipicamente incompleta dei contratti rilevanti, non per la loro conformità con i principi Walrasiani. (Allo stesso modo, la rapida crescita dell’economia Cinese nel tardo ventesimo secolo fu guidata da una nuova forma organizzativa—l’impresa delle “piccole città e dei villaggi”— caratterizzata da contratti incompleti e da un insieme di diritti di proprietà non ben definiti.) Gli economisti tuttavia usano spesso ciò che io chiamo l’ipotesi di design efficiente come comoda scorciatoia analitica ispirata dalla biologia evoluzionista. I biologi a volte suppongono che poiché le creature viventi sono soggette alla selezione naturale, esse si adatteranno col tempo in maniera ottimale al loro ambiente circostante. Questa ipotesi di design efficiente riduce l’onere di studiare, caso per caso, i particolari del processo di eredità genetica, l’espressione del genotipo nel
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|7
fenotipo, la natura del processo selettivo, e così via. Gli economisti spesso invocano un ragionamento simile. Sappiamo dal Teorema Fondamentale che se tutte le azioni che hanno un effetto sul benessere altrui sono regolate da contratti il cui enforcement può essere assicurato a costo zero, gli equilibri competitivi saranno Pareto efficienti, a prescindere dalla distribuzione della ricchezza. Ma anche quando la completezza contrattuale ipotizzata dal Teorema Fondamentale viene meno, il presupposto di design efficiente è spesso mantenuto. L’economia dei costi di transazione di Oliver Williamson (1985, p.22) si basa, come egli spiega, “sull’efficacia della competizione nel […] distinguere tra modelli di organizzazione più o meno efficienti e di smistare risorse in favore dei primi.” Holmstrom e Tirole (1989, p.63) descrivono il pensiero dominante in economia in questo modo: “I design contrattuali sono creati per minimizzare i costi di transazione…. Ciò segue dall’ipotesi originale di Coase che vede le istituzioni come adattamenti ottimali ai vincoli contrattuali.” Ma essi notano “che raramente o quasi mai si conosceranno i dettagli di come un assetto efficiente venga trovato” (p.64). Nonostante il caveat individuato da Holmstrom e Tirole, in economia è prassi assumere che laddove la proprietà delle risorse può essere prontamente scambiata e dove non ci siano impedimenti ad una contrattazione efficiente, l’assegnazione inefficiente del controllo e del diritto al residuo sulle risorse sarà eliminata dallo scambio volontario dei diritti. Questa intuizione di Coase motiva l’aspettativa che in economie di mercato competitive e con pochi impedimenti alla contrattazione privata, le risorse saranno possedute da coloro che possono usarle nella maniera più efficiente, a prescindere dalla loro ricchezza. Se un inquilino può fare un uso migliore della casa come proprietario, la casa varrà di più per l’inquilino che per il proprietario, e quindi ci si può aspettare che l’inquilino compri il bene immobile. L’ipotesi di design efficiente permette quindi una notevole semplificazione: senza sapere in ogni caso particolare se l’assegnazione dei diritti di proprietà sia efficiente o meno, possiamo presupporre o che lo sia, o che sia approssimativamente tale, oppure ancora che tenda in quella direzione. La presunzione di efficienza può allora guidarci nell’individuare quali particolari caratteristiche istituzionali siano di interesse analitico, e quali siano invece marginali o rare. Il diffuso (spesso implicito) utilizzo dell’ipotesi di design efficiente è in parte spiegato dal fatto che è virtualmente impossibile determinare dal punto di vista empirico se un particolare assetto istituzionale sia efficiente oppure no. Esistono pochi tentativi in tal senso, e ne esistono ancora meno che possano vantare un consenso da parte degli studiosi delle rispettive aree di ricerca. Alcune delle ragioni per le quali processi evolutivi plausibili possono portare ad
8 | MICROECONOMIA
istituzioni inefficienti sono state delineate alla fine del capitolo 2. Ora invece è possibile spiegare un ulteriore problema con l’ipotesi di design efficiente. Le stesse asimmetrie informative che fanno sì che alcune attribuzioni dei diritti di proprietà siano più efficienti di altre, impediscono sistematicamente il processo di redistribuzione negoziata dei diritti di proprietà ipotizzato da Coase che determinerebbe un aumento della produttività. L’errore nel ragionamento di base dell’economia delle transazioni e di approcci simili sta nel fatto che laddove i contratti sono incompleti, non c’è alcuna ragione di pensare che la competizione (o qualsiasi altro processo) possa determinare risultati ottimali (eccetto nel senso tautologico che essi sono il risultato di un’ottimizzazione individuale). In particolare, gli agenti che non hanno abbastanza ricchezza potrebbero essere razionati nel credito e quindi non avere la possibilità di acquistare quei mezzi sui quali l’esercizio dei diritti di controllo e del diritto al residuo permetterebbe i miglioramenti in efficienza. Inoltre, come abbiamo visto nel capitolo 5, è improbabile che si ottenga una negoziazione efficiente in condizioni anche solo minimamente realistiche. Contrariamente ad una comune errata interpretazione del pensiero di Coase, in tali casi la distribuzione dei diritti di proprietà ha un effetto sull’efficienza allocativa. (Il “teorema” non è sbagliato. Il malinteso nasce dal fatto che in questo caso risulta violata l’ipotesi che non ci siano impedimenti alla contrattazione efficiente.) Il fallimento dell’ipotesi di design efficiente pone una sfida interessante: se la struttura dei contratti e le altre istituzioni non sono il risultato di un algoritmo non meglio definito che implementa soluzioni efficienti ai problemi allocativi, quali strumenti analitici possiamo adoperare per spiegare le istituzioni osservate empiricamente e la loro evoluzione? Questa domanda occuperà il resto del libro, a cominciare dall’analisi delle istituzioni di un’economia capitalista in questo capitolo per occuparci dopo della questione riguardante la nascita, l’evoluzione e l’estinzione delle istituzioni nei prossimi tre capitoli, per concludere quindi con un’analisi delle nuove configurazioni istituzionali e di quelle contemporanee. Nella struttura analitica che sarà sviluppata, sarà importante “chi viene assunto e chi assume” poiché in un mondo di contratti incompleti, l’assegnazione dei diritti di controllo dà ad una delle parti il potere di determinare tutto ciò che non è specificato contrattualmente. L’affermazione di Samuelson è vera nel modello Walrasiano perché in quell’impianto “assumere” significa semplicemente “comprare”. “Cosa significa,” chiese Oliver Hart (1995, p.62), “dare a qualcuno l’incarico di un’azione o di una decisione se tutte le azioni possono essere specificate in un contratto?” Questo semplice punto spiega anche perché, nelle parole di Marx, le transazioni contrattuali
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|9
sui mercati competitivi appaiano come un libero scambio tra eguali (“un vero Eden dei diritti innati dell’uomo”), mentre nel posto di lavoro le parti di un contratto di lavoro assumono un’apparenza diversa: il datore di lavoro è il capo, e l’impiegato il “suo lavoratore.”
IMPRESE: PERCHÉ
IL
C A P ITA L E A S S U M E
IL
L AV O R O
Come per rispondere a Samuelson, John Kenneth Galbraith (1967, p.47) criticava gli economisti per non essersi chiesti “perché il potere sia associato con alcuni fattori [di produzione] e non con altri.” Un buon punto di partenza per poter dare una risposta è quello che ho chiamato in precedenza (capitolo 8) la teoria di Marx-Coase-Simon sul rapporto di impiego. La caratteristica fondamentale di questa teoria è quella di rappresentare l’impresa come un gruppo di fornitori di input per un processo produttivo comune le cui attività sono coordinate da una struttura autoritativa piuttosto che da scambi di mercato regolati da contratti completi.3 Tra le versioni moderne di questa teoria ci sono gli approcci basati sull’informazione asimmetrica (o non verificabile) ed i contratti incompleti ed incentivi non allineati che a questa conseguono nei mercati del lavoro e del credito analizzati nei capitoli 8 e 9. Altri studi hanno osservato che coloro che forniscono fattori di produzione all’impresa non possono impegnarsi in maniera credibile a non sfruttare la riduzione nella posizione di riserva di quei membri dell’impresa che hanno effettuano investimenti in mezzi produttivi specifici alla transazione. (Gli investimenti specifici alla transazione sono stati introdotti come un ostacolo alla contrattazione efficiente nel capitolo 5.) Il problema analitico chiave è quello di capire come la struttura dell’impresa affronti i problemi di conflitto e di incentivi che derivano dal fatto che l’incompletezza dei contratti di lavoro, di credito e di altri tipi di contratto, permette a coloro che godono dell’autorità di prendere decisioni nell’impresa di avere potere sul denaro, sulle risorse e sul lavoro di altre persone. Una domanda importante da porsi, allora, è come mai nelle economie capitaliste i diritti di controllo non sono generalmente assegnati a coloro che lavorano nell’impresa ma a coloro che forniscono capitale alla stessa, o ai loro rappresentanti. Per rispondere a questa domanda, quattro diversi approcci evidenziano (rispettivamente) l’impiego salariato come una forma di assicurazione per i lavoratori avversi al rischio, il problema del monitoraggio dell’impegno lavorativo, il problema di holdup dovuto alle risorse
3
Tra i più importanti contributi in materia ci sono Alchian e Demsetz (1972), Williamson (1985), Milgrom (1988), Grossman e Hart (1986), e Hart (1995). Esistono differenze tra questi autori, ma essi condividono quella che io ho chiamato la concezione di Marx-Coase-Simon dell’impresa.
10 | MICROECONOMIA
specifiche alla transazione, ed i vincoli al credito fronteggiati dai fornitori di lavoro.4 Il primo approccio, che può essere ricondotto a Frank Knight (1921), spiega la struttura dell’impresa mediante due elementi: il primo è che il reddito derivante da un processo di produzione congiunto varia in maniera stocastica, il secondo elemento è che il costo del rischio è maggiore per i fornitori di lavoro che per fornitori di capitale. Il contratto a salario fisso offre un’assicurazione contro le variazioni nel reddito, e questa copertura ha un valore per i fornitori di lavoro maggiore rispetto al costo che incorrono i fornitori di capitale nell’offrirla.5 La logica sottostante a questo approccio è stata presentata nella penultima sezione del capitolo 9, dove l’avversione al rischio spiegava come i fornitori possano non avere la possibilità di diventare i titolari del diritto al reddito residuale che essi generano anche quando ciò permetta aumenti tecnici di efficienza. Il contratto a salario fisso rende i fornitori di capitale necessariamente i titolari del diritto al residuo sul flusso di reddito del processo produttivo. In questo caso, un assetto in cui i fornitori di capitale esercitano anche il controllo sulle risorse rilevanti riduce il costo di attrarre capitale sul progetto. (Essere titolari del diritto al residuo del flusso di reddito di una risorsa di cui non si ha il controllo non è una prospettiva attraente per gli investitori se, come è generalmente il caso, il modo di utilizzo di una risorsa non è soggetto a contrattazione completa.) Questo approccio è facilmente esteso ai casi in cui i fornitori di lavoro sopportano parte del rischio sia come titolari del diritto al reddito residuale dell’impresa (suddivisione dei profitti) sia perché parte della loro paga è basata su una misura imperfetta della loro stessa performance lavorativa. L’idea di base è che la struttura dell’impresa rappresenti un adattamento ai diversi livelli di avversione al rischio tra i fornitori di input. Seguendo un secondo approccio, quello di Armen Alchian e Harold Demsetz (1972), l’assegnazione del controllo e del diritto al residuo è spiegata dalla natura collettiva della produzione e dai vantaggi derivanti dal porre il titolare del diritto al residuo come supervisore dell’impegno lavorativo. Se i benefici della specializzazione e delle economie di scala impediscono la produzione individuale, è nell’interesse di tutte le parti trovare un metodo per prevenire il free riding da parte dei membri del team di produzione. Lo shirking da parte dei membri del gruppo può essere arginato 4
La lista non è esaustiva. Una trattazione più completa è fornita da Putterman e Dow (2000). Il fatto che i fornitori di lavoro siano più avversi al rischio rispetto ai fornitori di capitale non richiede che l’avversione al rischio sia decrescente nel reddito né che i primi siano più poveri dei secondi. La maggiore avversione al rischio dei fornitori di lavoro (misurata, come nel capitolo 9, per mezzo del loro tasso marginale di sostituzione tra reddito atteso e rischio) potrebbe essere ugualmente spiegata dalla loro maggiore esposizione al rischio dovuta al fatto che i fornitori di capitale hanno la possibilità di ridurre la variabilità del loro reddito per mezzo della differenziazione della loro proprietà, ed alle difficoltà che hanno i lavoratori nel diversificare le loro fonti di reddito. 5
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|11
da un controllore, ma i livelli d’impegno del controllore sono anch’essi variabili e non soggetti a contratto: “chi controlla il controllore?” si chiedono Alchian e Demsetz (p. 781). Una possibile soluzione è quella di pagare ai membri un salario fisso e lasciare che il controllore sia il titolare del diritto al reddito residuale del team. Per essere efficace, il controllore deve avere l’autorità di modificare i termini del contratto dei singoli membri, compresa l’autorità di porre fine alla loro appartenenza al gruppo. L’assegnazione dei diritti che Alchian e Demsetz chiamano “l’impresa capitalistica classica” controllata da un proprietario-controllore risolve quindi il problema dello shirking. Si noti che il ragionamento non richiede che il controllore abbia la proprietà del capitale fornito all’impresa. In ogni caso, è facilmente dimostrabile che fin quando i contratti riguardanti l’uso e la manutenzione dei mezzi di produzione sono incompleti, vi sarà divergenza di incentivi ogni qualvolta che il proprietario dei mezzi ed il detentore dei diritti di controllo e del diritto al residuo siano soggetti distinti. Il problema verrebbe eliminato se la parte che detiene il diritto al residuo e i diritti di controllo fosse la stessa che ha la proprietà dei mezzi. Si possono notare due problemi posti dall’impresa di Alchian e Demsetz intesa come espediente contro lo shirking. Primo, l’impresa “classica” spiegata da questo approccio ricopre un ruolo soltanto marginale nelle economie moderne, dove il monitoraggio dell’impegno lavorativo è raramente eseguito dai proprietari, ed è eseguito piuttosto da un ampio numero di soggetti per la maggior parte dei quali le paghe sono debolmente, se non per nulla, correlate alla performance di coloro che essi supervisionano. Secondo, come è stato suggerito nel capitolo 4, il monitoraggio reciproco tra colleghi può essere efficace quando il gruppo è il titolare del reddito residuale che genera. L’evidenza sperimentale sui giochi con beni pubblici e punizione (capitolo 3) supporta questo modello alternativo di monitoraggio, così come lo corrobora il successo delle cooperative del legno sopra menzionate. Lo stesso problema di monitoraggio posto da Alchian e Demsetz potrebbe essere meglio risolto rendendo titolari del reddito residuale i membri del team, assumendo eventualmente un manager cui poter riferire infrazioni delle regole lavorative da parte dei colleghi di lavoro (se i metodi diretti di supervisione reciproca non bastassero), ed offrendo una rendita sostanziale al manager, il quale rimarrebbe assunto fin quando la performance dell’impresa (che è osservabile) sia soddisfacente.6 Il terzo approccio prevede che i diritti di controllo siano assegnati alla parte che 6 Alchian e Demsetz assumono che un tale arrangiamento sarebbe peggiore rispetto al loro contolloreproprietario specializzato, ma il loro ragionamento—che esistano forti incentivi allo shirking in grandi gruppi di titolari del diritto al residuo—non è suffragato né dagli esperimenti con gruppi numerosi (Isaac, Walker e Williams 1994) né dall’efficacia della paga collettiva in gruppi di lavoro di notevole dimensione (Hansen 1997, Prendergast 1999).
12 | MICROECONOMIA
ha maggior interesse a proteggere il valore degli investimenti specifici alla transazione. Si ricordi (dal capitolo 5) che i mezzi specifici alla transazione sono quelli il cui valore in una particolare transazione è maggiore rispetto alla loro prossima migliore alternativa. La conoscenza da parte di un impiegato del software utilizzato dal proprio datore di lavoro è un esempio, così come l’investimento che un’impresa fa nel reclutare e addestrare un particolare impiegato, oppure la collocazione di un’azienda in una particolare area geografica al fine di sfruttare le competenze specifiche dei lavoratori che vi risiedono. Gli investimenti specifici ad una determinata transazione hanno l’effetto di diminuire la posizione di riserva dell’investitore rispetto alla posizione di riserva che avrebbe avuto se l’investimento fosse stato generale invece che specifico. Di conseguenza, se una transazione soddisfa ex ante tutti i relativi vincoli di partecipazione come eguaglianza, il progetto genererà rendite positive ex post, cioè dopo che gli investimenti specifici siano stati effettuati. Se le parti non possono impegnarsi ex ante al rispetto di una determinata ripartizione di queste rendite, su di esse avverrà una negoziazione ex post. Coloro che effettuano investimenti specifici, e che quindi subiscono una riduzione della loro posizione di riserva, saranno soggetti al cosiddetto hold-up della controparte, cioè alla rinegoziazione dei termini della transazione sulla base delle posizioni di riserva ex post. Il risultato (come mostrato nel capitolo 5) sarà che gli investimenti generici verranno favoriti e ci sarà una tendenza ad investire in misura sub-ottimale in risorse specifiche alla transazione. Supponiamo ora che per uno dei fornitori di input le opportunità di compiere investimenti specifici siano molto limitate o nulle, mentre supponiamo che gli investimenti specifici della controparte contribuiscano in maniera sostanziale al prodotto congiunto dell’impresa. Se l’impresa è strutturata in maniera tale che il fornitore con l’opportunità di realizzare investimenti specifici detiene anche tutto il potere contrattuale, egli carpirà tutto il surplus ex-post, a prescindere dalla sua decisione di investimento, e non avrà quindi nessun incentivo ex ante a compiere investimenti specifici in modo sub-ottimale. Se entrambi i fornitori possono contribuire in modo sostanziale al progetto attraverso investimenti specifici, l’attribuzione del potere contrattuale ad una sola delle parti risulterebbe in un investimento nullo della controparte; per cui l’allocazione dei diritti di controllo ad una sola parte difficilmente massimizzerà il surplus congiunto. Se, come comunemente ipotizzato, i fornitori di capitale hanno l’opportunità di effettuare investimenti specifici più importanti rispetto ai fornitori di lavoro, allora i fornitori di capitale devono avere tutto il potere contrattuale e, di conseguenza, i diritti di controllo nell’impresa.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|13
Secondo questo approccio la distribuzione dei diritti di controllo nell’impresa deriva quindi dalla misura in cui gli investimenti specifici sono capaci di aumentare il valore produttivo del lavoro, dei beni capitali e degli input forniti dagli altri partecipanti all’impresa. Questo potrebbe sembrare uno di quei casi in cui la tecnologia (che si esplicita negli input che traggono più vantaggio dagli investimenti specifici) determina la struttura istituzionale (che si riflette nella distribuzione dei diritti di controllo nell’impresa). Ma, come è stato sottolineato da Ugo Pagano (1993), la relazione causale potrebbe anche operare in direzione opposta, dalla struttura istituzionale alla tecnologia. Qualora i lavoratori avessero forti garanzie di non licenziamento, essi sarebbero più disponibili ad investire nell’acquisizione di competenze specifiche alla transazione e quindi le imprese avrebbero un incentivo ad adottare tecnologie che usino tali competenze. Pagano dimostra che sono possibili molti di questi “equilibri tecnologico-istituzionali”; in alcuni di essi i fornitori di capitale avranno i diritti di controllo ed il capitale sarà il fattore più specifico, in altri il lavoro sarà invece il fattore più specifico alla transazione ed i lavoratori deterranno i diritti di controllo. L’approccio basato sulla specificità dei mezzi di produzione fu sviluppato inizialmente per spiegare le dimensioni delle imprese e i rapporti tra di esse piuttosto che le relazioni tra capitale e lavoro all’interno delle stesse. Per molti aspetti, questo approccio risulta più efficace nello spiegare il suo argomento originale. Una componente della teoria è inconfutabile: vi è una sostanziale perdita di valore associata all’installazione di macchinari, anche ad uso generico – tipicamente più della metà del costo iniziale (Asplund, 2000). Ma non è chiaro come questi investimenti siano suscettibili all’hold-up da parte degli impiegati di un’impresa. Se uno di essi o anche tutti abbandonassero, la scelta dell’impresa non sarebbe quella di distruggere i propri macchinari o di venderli sul mercato dell’usato, sarebbe invece quella di pagare i costi di sostituzione per rimpiazzare la forza lavoro. Questi costi sono tipicamente molto minori rispetto alle perdite derivanti dalla distruzione dei macchinari, probabilmente nell’ordine del 5–10 per cento della paga di un impiegato durante il primo anno (Malcomson 1999). Un secondo problema dell’approccio basato sulla specificità dei mezzi è l’incongruenza tra l’ipotesi che i membri dell’impresa non possano impegnarsi ex ante ad una divisione delle rendite ex post ma che essi possano invece impegnarsi ad uno schema di negoziazione che assicuri lo stesso risultato. L’ultimo approccio alla teoria dell’impresa prevede che l’assegnazione ai fornitori di capitale del diritto al residuo e dei diritti di controllo dipende dal fatto che il costo del capitale fornito ad un impresa controllata dai suoi impiegati sarebbe maggiore rispetto al costo del capitale per un’impresa, per altri aspetti identica, ma
14 | MICROECONOMIA
controllata dai suoi fornitori di capitale. Questo risultato deriva dal fatto che i lavoratori non hanno abbastanza ricchezza, insieme al fatto (approfondito nel capitolo 9) che gli interessi da pagare su un prestito, determinati da un mercato competitivo, sono inversamente proporzionali alla ricchezza del debitore, per un progetto di date dimensioni e qualità. Il basso valore delle quote delle cooperative del legno menzionate all’inizio del capitolo suggerisce un alto prezzo implicito del capitale per i fornitori di lavoro. Ma le cooperative del legno mostrano anche un aspetto più sottile della questione. Le banche che davano prestiti alle cooperative spesso sentivano la necessità di concludere accordi direttamente con i membri della cooperativa invece che solo con l’amministrazione, dal momento che i singoli membri potevano prontamente terminare il contratto dell’amministratore. La maggiore difficoltà di questi assetti organizzativi ha sicuramente aumentato il costo dei prestiti (Gintis, 1989a). Sebbene anche le amministrazioni delle imprese convenzionali possano essere liquidate dai proprietari, l’eterogeneità di interessi (e quindi la possibilità di processi decisionali incoerenti nel tempo) è considerevolmente maggiore tra i lavoratori che tra i fornitori di capitale. In parte ciò è vero perchè i secondi hanno una relazione a distanza (arms-length) con il progetto e possono facilmente accordarsi sull’obiettivo di massimizzare i rendimenti sui loro mezzi, mentre le risorse dei lavoratori sono concentrate nel progetto, ed essi possono fornire lavoro solo essendo presenti nell’impresa.7 Sia separatamente che (con più probabilità) congiuntamente, queste quattro teorie sembrano fornire una spiegazione convincente della tendenza ad attribuire i diritti residuali di controllo nelle imprese ai fornitori di capitale piuttosto che ai lavoratori.8 Ciò che non è stato spiegato, però, è perchè i diritti di controllo conferiscano potere. Dal punto di vista empirico l’impresa sembra essere un’istituzione politica, nel senso che alcuni dei suoi membri impartiscono regolarmente degli ordini aspettandosi che questi vengano eseguiti, quando altri membri sono soggetti ad obbedire. Dire che il manager ha il diritto di decidere cosa fa il lavoratore significa solo che ha l’autorità legittima di farlo, non il potere di garantire che il lavoratore effettivamente obbedisca. Dal momento che il manager ed il controllore sono chiaramente limitati quanto ai tipi di punizione che essi possono infliggere, e poiché il lavoratore è libero di lasciare, il fatto che gli ordini sono
7 Le preferenze eterogenee dei lavoratori possono rendere l’esercizio dei diritti di controllo più costoso o portare ad un’incoerenza nel processo decisionale, il che offre un’ulteriore motivo per il quale i diritti di controllo sono assegnati ai fornitori di capitale. 8 Dico “sembrano” perchè questi modelli sono stati usati raramente per spiegare le variazioni nella struttura delle imprese dal punto di vista empirico; e nei pochi casi esistenti, i risultati sono misti (Prendergast 1999).
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|15
tipicamente eseguiti rappresenta un rebus. Perchè, usando la formulazione iniziale di Coase, il comando di un manager (di trasferirsi “dalla divisione Y alla divisione X”) viene obbedito? Notando la mancanza di una buona risposta, Alchian e Demsetz sfidarono l’idea di Coase che l’impresa sia una “mini-economia di comando,” e suggerirono che il contratto di impiego non differisce assolutamente da altri contratti: L’impresa [...] non ha potere di fiat, né alcuna autorità o azione disciplinare minimamente diversa da una normale contrattazione di mercato tra due persone qualunque.... In che cosa allora differisce la relazione tra un droghiere ed un suo impiegato dalla relazione tra un droghiere ed un suo cliente? (1972, p.777)
Hart offre la seguente risposta ad Alchian e Demsetz: [I]l motivo per cui un impiegato è più suscettibile alla volontà del suo datore di lavoro rispetto a quanto lo sia un droghiere [...] alla volontà del suo cliente [...] è che il datore di lavoro [...] può negare all’impiegato l’utilizzo dei mezzi con cui egli lavora ed assumere un altro lavoratore per lavorare con gli stessi mezzi, mentre il cliente può solo negare al droghiere solo se stesso e fin tanto che il cliente è piccolo, presumibilmente non è troppo difficile per il droghiere trovare un altro cliente (1989, p.1771).
Hart individua la differenza tra il droghiere ed il datore di lavoro assumendo che l’impiegato non ha bisogno di avere un qualsiasi lavoro (e quindi dei mezzi qualunque) ma necessita dei mezzi di quel particolare datore di lavoro. Ciò può essere dovuto ad una complementarietà tra i due (per esempio, l’impiegato potrebbe aver effettuato un investimento nell’acquisizione di competenze specifiche che hanno valore solo quando utilizzate con quei particolari mezzi). Si pensi anche ad altri esempi meno ovvi (e forse più importanti). Un lavoratore a cui viene negato l’utilizzo di una particolare risorsa potrebbe essere costretto a trasferirsi altrove, con conseguenze negative sulla famiglia e le amicizie. La perdita di un lavoro potrebbe anche danneggiare la reputazione del lavoratore. Sebbene investimenti specifici di questo tipo spieghino indubbiamente alcune delle relazioni di autorità – in città nelle quali esiste una sola compagnia o per certi professionisti e manager – l’approccio non sembra sufficientemente generale da fornire un’adeguata spiegazione dell’intera struttura d’autorità di un’impresa, specialmente nei grandi mercati del lavoro urbani e per gli impiegati non professionisti. Nella sezione che segue si svilupperà una spiegazione complementare basata sul fatto che l’impiegato al quale viene negato l’accesso ad un particolare mezzo produttivo possa non avere accesso ad un qualsiasi altro mezzo anche in un’economia competitiva in cui gli investimenti specifici siano assenti. Ciò richiederà un chiarimento su cosa intendiamo per potere. Persino l’autore della più famosa definizione di potere, Robert Dahl, espresse le sue perplessità sulla vaghezza del termine.9 Tuttavia sembra difficile astrarre dal concetto di “potere” ed 9
La definizione di Dahl (1957:202–203) è: “A ha potere su B se riesce a far fare a B qualcosa che B
16 | MICROECONOMIA
infatti esso è sempre più utilizzato, anche in economia.
P O T E R E “S H O RT -S ID E ”
IN U N O
S C A M B IO C O M P E T I T I V O
L’uso comune del termine suggerisce una serie di caratteristiche che devono essere presenti in ogni plausibile rappresentazione del potere. Primo, il potere è interpersonale, un aspetto di una relazione tra persone, non una caratteristica di un singolo individuo. Secondo, l’esercizio del potere implica la minaccia e l’uso di sanzioni.10 Terzo, il concetto di potere dovrebbe essere normativamente indeterminato, in modo da permettere miglioramenti Paretiani (come è stato sottolineato dagli studiosi di potere da Hobbes a Parsons) ma anche suscettibile di uso arbitrario a danno di altri ed in violazione di principi etici. Infine, per essere rilevante all’analisi economica, il potere deve essere sostenibile come equilibrio di Nash di un gioco propriamente definito. Il potere può ovviamente essere esercitato anche in situazioni di disequilibrio, ma come aspetto duraturo di una struttura sociale deve riflettere comportamenti che siano ottimali. Il fatto che le sanzioni siano essenziali al suo esercizio rende il potere distinto da altri strumenti per l’ottenimento di benefici, compresi strumenti come la ricchezza che possono operare persino in assenza di interazioni strategiche, come nel contesto di un mercato Walrasiano. La condizione sufficiente per l’esercizio del potere che segue include queste quattro caratteristiche: Affinché B abbia potere su A, è sufficiente che, attraverso l’imposizione di sanzioni o la minaccia delle stesse su A, B sia capace di influenzare le azioni di A in maniera tale che B ne benefici, ed allo stesso tempo A non abbia questa capacità su B (Bowles e Gintis 1992). La definizione chiarisce la differenza tra datore di lavoro e droghiere nella risposta di Hart ad Alchian e Demsetz: le sanzioni imposte ad un impiegato privandolo dell’accesso al bene capitale sono severe, mentre quelle imposte al droghiere dal cliente perso sono trascurabili o nulle. La ragione per cui il consumatore non impone una sanzione al droghiere è che il droghiere (in un equilibrio competitivo) sta massimizzando i profitti scegliendo un livello di vendite che eguaglia il costo marginale ad un dato prezzo dato esogenamente così che una piccola variazione nelle vendite ha solo un effetto di secondo ordine sui profitti. Verifichiamo ora come questa concezione di potere possa applicarsi al rapporto d’impiego in assenza di specificità della transazione. altrimenti non farebbe.” 10 Infatti, molti teorici politici considerano le sanzioni come la caratteristica che definisce il potere. Lasswell e Kaplan (1950:75) fanno dell’uso di “severe sanzioni…per sostenere una politica contro l’opposizione” una caratteristica che definisce una relazione di potere, e Parsons (1967:308) osserva che “la presupposizione dell’enforcement per mezzo di sanzioni negative in risposta ad una situazione di rivolta” sia una condizione necessaria per l’esercizio del potere.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|17
Se ritorniamo al modello del capitolo 8, sappiamo che e* > e: in equilibrio il lavoratore si impegna di più di quanto avrebbe fatto in assenza di una strategia di incentivi da parte del datore di lavoro. Per cui sappiamo che in equilibrio il lavoratore riceve una rendita (v* > z) e che lavorando con un impegno maggiore di e permette al datore di lavoro di ottenere un tasso di profitto più alto, * > (e ,w) . Questi risultati, considerati congiuntamente, implicano che il datore di lavoro induca il lavoratore ad agire nell’interesse del datore di lavoro per mezzo di una credibile minaccia di sanzione. Il lavoratore non ha questa capacità, poiché se egli minacciasse di sanzionare il datore di lavoro in caso di mancato aumento salariale (danneggiando i macchinari o picchiandolo o semplicemente lavorando meno sodo) la minaccia non sarebbe credibile. Il datore di lavoro semplicemente rifiuterebbe di rispondere, consapevole del fatto che l’esecuzione della minaccia non è nell’interesse del lavoratore.
Si noti che l’esercizio del potere permette un miglioramento Paretiano rispetto ad una situazione controfattuale in cui il potere non possa essere esercitato, cioè quella in cui il lavoratore è assunto al suo salario di riserva w e lavora al livello di impegno di riserva e. Come sappiamo ciò deriva direttamente da v* > v(e, w) = z e * > (e,w) , cioè dal fatto che sia l’utilità attesa permanente del lavoratore che i profitti dell’impresa sono maggiori in equilibrio (nel caso in cui venga esercitato il potere) rispetto alla posizione di riserva (in assenza di potere). Questo è un ulteriore esempio di una situazione nella quale l’esercizio del potere aiuta ad affrontare i fallimenti del coordinamento, sebbene con conseguenze a volte discutibili sulla distribuzione dei benefici. Un esempio segue. Consideriamo nuovamente l’analisi delle amenità sul posto di lavoro del capitolo 8. Supponiamo che a non rappresenti un’amenità innocua, come la qualità della musica del sistema audio in ufficio, ma invece pratiche manageriali che incidono sulla dignità del lavoratore, come ad esempio il non essere soggetto ad insulti razziali, ad abusi sessuali, o ad altri soprusi sul posto di lavoro. Sappiamo che in equilibrio p = 0 e n > 0 . Ne segue che il datore di lavoro può infliggere costi di primo ordine a
a
sul lavoratore (riducendo di poco a) ed un costo di secondo ordine a se stesso (i costi sono di secondo ordine perchè p = 0 ). Quindi, l’equilibrio competitivo in un a
rapporto d’impiego offre al datore di lavoro non solo la capacità di esercitare potere per attenuare i problemi di coordinamento, ma anche di esercitare potere arbitrariamente, cioè di infliggere costi ad altri con un costo nullo per se stesso. Per cui l’interazione strategica tra datore di lavoro e lavoratore permette l’esercizio del potere in maniera conforme alle quattro condizioni delineate sopra: le
18 | MICROECONOMIA
sanzioni sono minacciate (ed usate) in modo credibile in un’interazione strategica che descrive un equilibrio di Nash ed il risultante esercizio del potere rappresenta un miglioramento Paretiano rispetto ad una plausibile situazione alternativa, ma può anche essere usato arbitrariamente. È facile verificare che il potere, nel senso che abbiamo definito, può essere esercitato anche nel modello con rinnovo condizionato (contingent renewal) del mercato del credito studiato nel capitolo 9. Il creditore offre al debitore termini contrattuali migliori rispetto alla posizione di riserva, e di conseguenza il debitore segue una strategia meno rischiosa di quella che avrebbe seguito se il creditore non avesse offerto una rendita oppure in caso di interazione non ripetuta (un solo periodo). Laddove il vincolo di partecipazione del debitore è soddisfatto come uguaglianza, il potere nel senso sopra definito non può essere esercitato, per la semplice ragione che il debitore è indifferente tra la transazione corrente e la sua prossima migliore alternativa, così che l’unica sanzione permessa in un’economia liberale – la revisione o la terminazione del contratto – non ha alcuna forza. Un caso meno ovvio riguarda il potere del consumatore, a volte sintetizzato con l’espressione “sovranità del consumatore.” Riconsideriamo il modello principaleagente nel quale la qualità del prodotto non è facilmente misurabile (capitolo 7). In equilibrio, l’acquirente paga al venditore un prezzo che eccede la migliore alternativa del venditore. La possibilità di perdere la relativa rendita conferita dal compratore al venditore induce quest’ultimo a fornire una qualità maggiore di quella che avrebbe fornito in assenza di una minaccia di sanzione. In questo caso il compratore ha esercitato potere sul venditore.11 Come l’esempio suggerisce, il compratore può esercitare potere sul venditore in ogni situazione nella quale la minaccia del compratore di rivolgersi ad un altro venditore sia credibile ed infligga un costo al venditore. Si considerino due venditori in concorrenza monopolistica (ovvero imprese che fronteggiano una funzione di domanda decrescente) ed un consumatore che sia indifferente tra acquistare da un venditore o dall’altro. Entrambi i venditori hanno scelto un livello di output che massimizza i profitti, eguagliando il costo marginale al ricavo marginale (che è minore rispetto al prezzo poiché la domanda è inclinata negativamente). Per entrambi i venditori, quindi, il prezzo eccede il costo marginale (p > mc), per cui la scelta del consumatore conferisce una rendita ad uno di essi sottraendola all’altro. Il lettore potrebbe chiedersi come possa sorgere una rendita se le imprese hanno scelto il 11
Gintis (1989b) sviluppa questo caso.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|19
livello di output che massimizza i profitti, ognuna ponendo p = 0 . Si osservi che lo spostamento del compratore da un venditore all’altro non è un movimento sulla funzione di domanda (su cui si basa la scelta di output dell’impresa) ma invece un movimento orizzontale della funzione di domanda (verso l’interno per l’impresa che il consumatore abbandona, e verso l’esterno per l’impresa alla quale si rivolge). Il risultato è che l’impresa fortunata è capace di vendere un’unità in più al prezzo corrente, carpendo la rendita p – mc. a
Ironicamente, le condizioni Walrasiane ideali sotto le quali si dice che valga la sovranità del consumatore non danno al consumatore nessun potere nel senso qui definito, mentre deviazioni dall’ipotesi concorrenziale canonica che il prezzo eguaglia il costo marginale creano una situazione in cui il consumatore può esercitare potere. Ovviamente la posizione strategica del consumatore in qualità di principale tra i molteplici principali di fronte ad un singolo agente è abbastanza diversa da quella del datore di lavoro di fronte a numerosi lavoratori potenziali oppure da quella del creditore di fronte a molteplici potenziali debitori. Un singolo consumatore non sarà generalmente nella posizione di imporre al venditore un miglioramento della qualità del prodotto e di attendersi che egli obbedisca. Il potere dei consumatori è quindi circoscritto dai limiti all’abilità dei vari principali di agire in modo coordinato. Tornerò su questo punto quando considererò il termine potere di mercato. I tre casi per i quali ho analizzato l’esercizio del potere – compratore su venditore, creditore su debitore, e datore di lavoro su lavoratore – appartengono alla classe generica di relazioni di potere sostenibili in equilibrio in un sistema di scambi competitivi e volontari. In tutti e tre i casi, coloro che hanno potere stanno effettuando una transazione con degli agenti che ricevono delle rendite e che quindi non sono indifferenti tra la transazione corrente e la loro migliore alternativa. In questo caso, devono esistere altri agenti identici che sono razionati nella quantità, vale a dire i disoccupati, gli esclusi dal mercato del credito o limitati nell’ammontare del prestito, ed i venditori che non riescono a vendere. Affinché questa situazione sia di equilibrio è necessario che i mercati non siano in bilancio, il che, come abbiamo già visto, è generalmente vero. In questi casi, coloro che hanno potere sono quelli sul lato del mercato che in equilibrio produce il minor numero di transazioni desiderate, in altri termini quelli sul lato corto del mercato. Si noti che il lato corto può essere sia la domanda (il datore di lavoro, il compratore) che l’offerta (il creditore). Coloro che sono sul lato lungo del mercato saranno di due tipi: quelli che scambiano l’ammontare desiderato, e quelli che sono razionati nella quantità (gli esclusi dalla transazione o coloro che scambiano meno dell’ammontare desiderato).
20 | MICROECONOMIA
Per sottolineare la relazione tra mercati non in bilancio e l’esercizio del potere io e Gintis ci riferiamo al potere del compratore, del creditore e del datore di lavoro come potere “del lato corto”, sulla base dei modelli di rinnovo condizionato esaminati nei capitoli precedenti. Il potere, come lo definiamo noi, può essere esercitato in altri modi, anche quando i mercati sono in pareggio. Un primo esempio è fornito dal caso delle tasse sul lavoro (capitolo 8), nel quale la tassa elimina la rendita ex ante del lavoro (quindi il mercato è in pareggio, ed il lavoratore è indifferente tra accettare il lavoro oppure no), ma una rendita ex post esiste comunque, dando al datore di lavoro la possibilità di sanzionare il lavoratore. Una tassa sul lavoro di questo tipo è un puro caso di investimento specifico alla transazione da parte del lavoratore; in questo caso il fondamento del potere del datore di lavoro rappresenta un esempio del ragionamento di Hart riportato in precedenza. Negli esempi appena riportati, in tutti e tre i casi coloro che hanno il potere – il compratore, il creditore, il datore di lavoro – hanno come aspetto comune quello di contribuire con del denaro alla transazione – il prezzo pagato dal compratore, il prestito concesso dal creditore, il salario offerto dal datore di lavoro. In ognuno dei tre casi, il denaro è concesso in cambio di una promessa, rispettivamente, di restituzione e di impegno lavorativo. Questo potrebbe apparire come un fondamento analitico dell’adagio popolare che “il denaro parla”, ma la conclusione sarebbe erronea. Si tenga a mente che nelle economie Comuniste e centralmente pianificate i beni di consumo durevoli (e molti altri beni di consumo) erano venduti al di sotto del prezzo di pareggio del mercato. Il conseguente eccesso di domanda veniva allocato mediante code o altri mezzi (Kornai, 1980). In questo caso i produttori (venditori) erano sul lato corto del mercato, e coloro che apportavano denaro alla transazione, i compratori, alcuni dei quali non riuscivano a completare lo scambio, erano sul lato lungo. La notoria inferiorità della qualità dei beni di consumo nelle economie pianificate centralmente in confronto alle economie capitaliste può essere in parte spiegata dal fatto che i consumatori erano sul lato lungo del mercato nelle prime e su quello corto nelle seconde. Oppure, in modo più figurato, una delle ragioni che rendeva le auto Ford migliori rispetto alle loro controparti Russe durante la guerra fredda era che in Russia i clienti aspettavano in fila per comprare le Volga mentre negli Stati Uniti, i rappresentanti della Ford si mettevano in coda per vendere le auto ai clienti. Un’altra ragione è che negli Stati Uniti i lavoratori aspettavano in fila per avere un lavoro alla Ford. Altri utilizzi del termine potere sono comuni in economia. Il potere d’acquisto è semplicemente un’altra parola per esprimere il vincolo di bilancio di un individuo (o
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|21
la sua ricchezza), e non implica l’esercizio di sanzioni e ancor meno alcuna interazione strategica.12 Il potere di mercato sorge in mercati ad alta concentrazione dove un agente può variare il prezzo e trarne beneficio. Nel caso standard della concorrenza monopolistica si dice che il venditore dispone di potere di mercato. Il venditore è meno vincolato nel senso che egli ha di fronte una domanda inclinata negativamente piuttosto che una funzione di domanda orizzontale, mentre il consumatore ha più vincoli nel senso che ha a disposizione un minor numero di venditori di beni sostituti tra i quali scegliere. Ma abbiamo appena visto che in questo caso il consumatore che preferisce un venditore ad un altro conferisce una rendita all’azienda prescelta. (Questo é il motivo per il quale i rappresentanti di vendita della Ford si mettono in fila per vendere le auto.) Quindi, se il compratore può minacciare in maniera credibile di sottrarre rendite al venditore, egli potrà esercitare potere del lato corto su di esso. Per cui non è chiaro come si possano riconciliare le nozioni usuali di potere – l’uso di sanzioni per ottenere un beneficio – con l’affermazione che il monopolista esercita potere sul consumatore. Infine, esiste l’opaca nozione di potere contrattuale, che tipicamente si riferisce alla quota di surplus guadagnata in una contrattazione. Seguendo questo utilizzo del termine, gli esponenti usati nel “prodotto di Nash” nella soluzione del modello esteso di contrattazione del capitolo 5 indicano il potere contrattuale delle due parti. Usato in questo modo, il potere contrattuale si riferisce agli esiti – a quanto vantaggio una parte può guadagnare – piuttosto che ad un particolare modo di ottenerlo (per esempio, minacciando una sanzione). Se il problema di negoziazione è parte di una interazione prolungata, allora il potere contrattuale ed il potere del lato corto non solo appaiono distinti ma anche contrari. Nell’equilibrio competitivo del modello standard principale-agente, per esempio, il datore di lavoro riceve una rendita (v* – z). Perciò, secondo la prospettiva del potere contrattuale il lavoratore avrebbe tutto il potere contrattuale. Ma secondo la prospettiva del potere del lato corto potremmo concludere che lungi dall’essere un segno di potenza del lavoratore, la rendita conferitagli dal datore di lavoro, che risulta dalla massimizzazione dei profitti, è la ragione stessa per la quale il datore di lavoro ha potere sul lavoratore. Ho menzionato in precedenza i dubbi di Robert Dahl sulla possibilità di definire in modo univoco il termine potere. Questo è ciò che egli disse (Dahl 1957, p.201) “[Una] Cosa a cui molte persone danno diverse etichette con significati 12
Un problema con la definizione di potere di Dahl (cfr. nota 9) è che include il potere d’acquisto: se compro un prodotto, ci saranno una serie di effetti sull’economia che porteranno altri a fare delle cose che altrimenti non avrebbero fatto. Ma dire che acquistare il pane sia un esercizio di potere su un qualsiasi agricoltore che produce grano con il quale non interagisco strategicamente espanderebbe il concetto di potere oltre il dovuto.
22 | MICROECONOMIA
leggermente o notevolmente differenti [...] probabilmente non è proprio una Cosa ma molte Cose.” Le differenze di significato fra le espressioni potere contrattuale, potere di mercato e potere del lato corto suggeriscono che Dahl potrebbe aver ragione.
LA DISTRIBUZIONE D E I C O N T R AT T I
DELLA
RICCHEZZA
E LA
DISTRIBUZIONE
Finora ho semplicemente parlato di datori di lavoro e lavoratori, creditori e debitori, senza spiegare come particolari individui si trovino ad occupare tali posizioni. Nella spiegazione che segue l’idea chiave è che l’allocazione degli individui a queste o ad altre posizioni economiche sia il risultato di un’ottimizzazione individuale vincolata dai contratti a disposizione e dalle risorse di ognuno. Queste risorse includono non solo la ricchezza convenzionalmente definita ma anche altri attributi della persona che sono correlati al reddito come le abilità (competenze) e la salute di ciascuno. In ogni modo, per semplificare l’analisi, mi limiterò alla ricchezza. L’analisi che presento è un adattamento ad un’economia capitalista moderna di un modello di Mukesh Eswaran e Ashok Kotwal (1986). Il loro studio fu stimolato dall’osservazione che nelle economie agrarie, gli individui ripartiscono in genere il proprio tempo tra vari tipi di contratti, ad esempio lavorando la propria terra ed allo stesso tempo lavorando come mezzadro/lavoratore a giornata quella di altri, o anche pagando lavoratori esterni per la coltivare la propria terra. (Gli studi econometrici citati nei capitoli 8 e 9 sull’effetto dei vari tipi di contratto sulla produttività si basano su questo rilievo.) L’insieme dei contratti ai quali un individuo partecipa è correlato alla quantità di terra che egli possiede, come è suggerito dai dati nella tabella 10.1, che provengono dallo stesso villaggio indiano che abbiamo incontrato nei capitoli precedenti. Nel Palanpur, coloro che possedevano più terra raramente svolgevano lavoro salariato (“hire out”) e tipicamente assumevano lavoro esterno, in aggiunta al loro, per lavorare le terre di loro proprietà (“hire in”). Nessuno possedeva larghi appezzamenti; più della metà degli intervistati possedevano meno di metà acro (Lanjouw e Stern, 1998, p.46).
Tabella 10.1. Proprietà terriera e lavoro salariato nel Palanpur.
Terra posseduta (acri) Nessuna
“Hires in” 0.25
“Hires in” e “Hires out” 0.21
“Hires out” 0.54
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
<0.47
0.30
0.37
0.33
>0.47
0.81
0.15
0.04
|23
Le celle riportano le frazioni di ogni classe terriera che assume lavoro esterno (hires in), che lavora la terra altrui (hires out), e che fa entrambe le cose.
Il modello che mi accingo a presentare dimostrerà che l’allocazione del tempo tra i contratti disponibili che massimizza l’utilità degli individui dipende dal livello di ricchezza degli stessi individui. Le persone si divideranno in sei classi che io definisco come lavoratori salariati puri, produttori indipendenti e lavoratori salariati misti, produttori indipendenti, piccoli capitalisti, capitalisti puri, e capitalisti di rendita. Per mantenere contatto con la realtà empirica, assumo contratti incompleti in due aspetti. Primo, quando si assume lavoro, il lavoratore deve essere monitorato, e (prendendo a prestito una pagina di Alchian e Demsetz, sopra) assumo che solo il titolare del diritto al residuo (il datore di lavoro) può esercitare attività di monitoraggio (l’introduzione di supervisori esterni non aggiungerebbe nulla al modello). Per distinguere tra lavoro non di monitoraggio e lavoro di monitoraggio uso il termine lavoro produttivo per indicare il lavoro che appare tra gli argomenti di una funzione di produzione. Secondo, tutti gli individui possono prendere e dare a prestito allo stesso tasso d’interesse, r, ma il livello massimo del prestito concesso è determinato dalla ricchezza totale dell’individuo (a prescindere dal suo utilizzo). All’inizio di ogni periodo, ognuno può richiedere un prestito per assumere lavoro esterno o per prendere in affitto beni capitali di proprietà altrui, pagando i salari e l’affitto all’inizio del periodo e restituendo il prestito con certezza alla fine del periodo di produzione. Ogni individuo può anche dare in affitto i propri fattori di produzione ad altri o lavorare in cambio di un salario (ed essere pagato all’inizio del periodo). La relazione tra i vari input ed il singolo output è descritta dalla funzione di produzione lineare ed omogenea q = f(k, n), dove n è il lavoro produttivo totale (proprio ed assunto), k è l’ammontare di beni capitali omogenei dedicati alla produzione, e l’output q è crescente e concavo nei suoi argomenti. Il prezzo dell’output è normalizzato ad uno. Per poter produrre è necessario pagare un costo iniziale, K (coloro che non esercitano attività diretta di produzione, vendendo ad altri il proprio lavoro ed eventualmente dando in affitto i capitali di loro proprietà, non devono sostenere il costo K). Il tempo totale di ognuno (normalizzato ad uno) può essere diviso in frazioni relative al tempo speso come lavoratore autonomo, l, come lavoratore per conto altrui, t, come supervisore di altri impiegati, s, o riposando, R.
24 | MICROECONOMIA
L’ammontare di monitoraggio eseguito varia con la quantità di lavoro impiegato, L; cioè s = s(L) con s’ > 0 e s” > 0, s(0) = 0 e s’(0) < 1. Il livello di monitoraggio richiesto è appena sufficiente ad indurre i lavoratori assunti esternamente ad esercitare lo stesso livello di impegno di coloro che sono residual claimant del loro stesso lavoro. Per cui il lavoro produttivo totale è n = l + L. L’accesso di ogni individuo al credito, B, dipende dalla sua ricchezza, misurata in unità di bene capitale possedute, k, per cui B = B(k) con B’ > 0 e B(0) = 0 (coloro che non dispongono di risorse non possono prendere a prestito, ed il limite massimo di credito è crescente nella quantità di risorse). Poiché ogni individuo inizia il periodo solo con le risorse k, la scelta dei contratti è vincolata dal limite al credito. Siano w e v i prezzi del lavoro e dei beni capitali determinati esogenamente. Ne consegue che se l’individuo decide di produrre (cioè, di pagare il costo iniziale K e di dedicare parte del suo tempo lavorativo al proprio progetto) il vincolo di credito è: B(k) > w(L – t) + v(k – k) + K
(10.1)
Il primo termine del lato destro rappresenta il costo per il salario dei lavoratori assunti (al netto del lavoro retribuito che un individuo fa per conto di altri), mentre il secondo termine è il costo d’affitto per l’utilizzo dei beni capitali aggiuntivi rispetto a quelli propri. Ovviamente, questi due termini possono avere qualsiasi segno. La funzione di utilità (neutrale al rischio) è additiva nel reddito e nell’utilità del riposo: U = Y + u(R), con u’ > 0 e u” < 0. (Per essere sicuri che R > 0, si assuma anche che u’(0) sia pari ad infinito.) Se l’individuo decide di produrre, alla fine del periodo di produzione la sua utilità sarà: w1 = f(k,(l + L)) – (1 + r ){w(L – t) + v(k – k) + K }+ u(R)
(10.2)
dove il secondo termine sul lato destro rappresenta il costo sostenuto al termine del periodo per ripagare il prestito preso all’inizio del ciclo produttivo (il prodotto è disponibile solo alla fine del periodo, e per semplicità si assume che anche il consumo e il riposo avvengano alla fine del ciclo produttivo). Se invece l’individuo lavora per conto di altri e dà in affitto i suoi beni capitali, l’utilità di fine periodo sarà: w0 = (1 + r)(wt + vk) + u(R) (10.3) dove il tasso di interesse appare perché i salari e gli affitti sono pagati all’inizio del periodo, e possono quindi generare un guadagno durante il ciclo produttivo. Se consideriamo il primo caso descritto dall’equazione (10.2), il problema di
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|25
massimizzazione dell’utilità per ogni individuo è quello di scegliere k, R, t, L e l in modo da massimizzare l’eq. (10.2) tenendo conto del vincolo di credito (10.1) e di un vincolo di bilancio temporale. Usando la relazione di bilancio l 1 – s(L ) – t – R (10.4) per definire l (che non è un vincolo), possiamo esprimere il vincolo di bilancio temporale come un vincolo non-negativo sul lavoro autonomo, l: 1 – s(L) – t – R > 0 così come, ovviamente, gli altri vincoli k > 0, L > 0 e t > 0.
(10.5)
L’individuo massimizzerà quindi l’eq. (10.2) sotto i vincoli (10.1) e (10.5). Siano m e l i moltiplicatori di Lagrange associati rispettivamente ai vincoli (10.1) e (10.5).
Usando l’eq. (10.5) per eliminare l (sostituendo l con il lato destro dell eq. (10.4) nella funzione di produzione) e definendo L come la derivata della relativa espressione i
Lagrangiana rispetto alla variabile i, otteniamo le condizioni di primo ordine: Lk = fk – (1+ r + l)v = 0 LL = fn{1 – s’(L)} – (1 + r + l)w – ms’(L) < 0 (soddisfatta come eguaglianza se L > 0) LR = – fn + u’(R) – m = 0
(10.6) (10.7)
(10.8)
Lt = – fn + w(1+ r +l) – m < 0 (soddisfatta come eguaglianza se t > 0) Le equazioni (10.6) e (10.8) sono soddisfatte come eguaglianze perché assumiamo che k > 0 e 0 < R < 1. La suddivisione degli individui nelle varie classi dipenderà da quali tra questi vincoli sono stringenti e da quali equazioni sono invece soddisfatte come disuguaglianze. Prima di procedere con l’analisi, però, consideriamo un’interpretazione economica di queste condizioni di primo ordine. L’eq. (10.6) richiede che il prodotto marginale del bene capitale sia uguale al suo prezzo moltiplicato per uno più il costo del prestito, che è uguale al tasso di interesse più il prezzo ombra del capitale (l). Possiamo interpretare l in questo modo perché—come nel caso del moltiplicatore di Lagrange per il vincolo di credito—esso indica l’incremento marginale nell’utilità associato ad un allentamento marginale del vincolo di credito. Si noti che nel caso in cui il lavoro proprio sia dedicato alla produzione con beni capitali propri (l > 0), il vincolo non-negativo su l non è stringente e m = 0. Allora l’eq. (10.7), che è soddisfatta come uguaglianza quando si utilizza lavoro esterno, richiede che il prodotto marginale del lavoro (al netto dei costi di
26 | MICROECONOMIA
supervisione del lavoro procurato) eguagli il tasso di salario moltiplicato per uno più il costo del credito. Nel caso in cui m = 0, l’eq. (10.8) rappresenta la nota condizione che il prodotto marginale del lavoro eguagli l’utilità marginale dello svago. L’eq. (10.9) richiede che nei casi in cui si assume lavoro esterno ed allo stesso tempo si lavora per se stessi, il prodotto marginale del lavoro deve essere uguale al tasso di salario moltiplicato per uno più il costo del credito. (Si ricordi che i salari sono pagati all’inizio del periodo mentre il prodotto marginale si concretizza alla fine del ciclo.) Questo è un classico problema di Kuhn-Tucker; per dati valori delle variabili esogene v, w, r e k, si ha un’unica soluzione. Ciò significa che variando il livello di ricchezza possiamo determinare i contratti ai quali gli individui parteciperanno. Ci sono cinque regioni distinte, ognuna definita da un intervallo di valori di ricchezza, come illustrato in figura 10.1. Ore Salario Salario lavoratore lavoratore/produttore indipendente
Produttore indipendente
Piccolo capitalista
Capitalista puro
Figura 10.1. Le differenze di ricchezza spiegano le diverse scelte contrattuali. Il grafico in alto mostra il totale delle ore lavorate, e la distribuzione di queste ore tra lavoro per conto altrui, lavoro per se stessi, e lavoro di monitoraggio a seconda dei livelli di ricchezza. Il grafico in basso a sinistra mostra come diversi livelli di ricchezza influenzano l’allocazione del tempo tra lavoro per conto altrui (lavoro salariato) e per conto proprio (produzione indipendente). Il grafico in basso al centro mostra la scelta di ore lavorative del produttore indipendente. Il grafico in basso a destra mostra l’allocazione del tempo del capitalista tra lavoro produttivo e supervisione.
Per gli individui con poca ricchezza, il costo iniziale di produzione in proprio potrebbe essere tale che l’uso più proficuo delle proprie risorse sia quello di lavorare per conto d’altri come lavoratore salariato ed affittare a terzi i propri beni capitali. In altre parole, il valore massimo nell’eq. (10.3) potrebbe essere superiore al massimo dell’equazione (10.2). Questi individui sono lavoratori salariati puri. Se K è
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|27
sufficientemente piccolo rispetto a k da giustificare la produzione in proprio, e se k è minore del valore critico k1, l’individuo è un misto tra produttore indipendente e lavoratore salariato. I soggetti in questa classe lavoreranno sia per conto d’altri sia per se stessi usando i propri beni capitali, e la divisione del tempo tra queste due attività sarà determinata dalle condizioni (10.8) e (10.9) con m = 0. Ciò richiede che il lavoro di un individuo sia allocato in maniera tale che i guadagni marginali da entrambi i tipi di lavoro si eguaglino, e siano anche uguali all’utilità marginale del riposo: w(1 + r + l) = fn = u’.
Si noti che per i livelli di ricchezza detenuti in questa regione, il fatto che la funzione di produzione sia omogenea, e che i prezzi dei fattori siano esogeni, determina il rapporto tra capitale e lavoro produttivo usato, a prescindere dal livello di ricchezza.13 Per cui, tanto maggiore la ricchezza di un individuo quanto maggiore il tempo che egli lavorerà con i suoi beni capitali e minore il tempo che egli dedicherà al lavoro salariato. Quindi, per k che tende verso k1, t tende verso zero. Il valore critico di k è definito da fn = w(1 + r + l) = u’(R), dove il prodotto marginale del lavoro è valutato a (t = 0 e k = k1), vale a dire il valore di k per il quale il prodotto marginale del lavoro è uguale al tasso di salario (moltiplicato per uno più il costo del credito) di un individuo che dedica tutto il proprio tempo lavorativo al lavoro autonomo. Livelli maggiori di ricchezza definiscono una nuova regione. Le regioni rilevanti ed i loro confini sono sintetizzate nella tabella 10.2. Tabella 10.2. La relazione contratti-ricchezza Posizione
Contratti
Ricchezza
Lavoratore salariato puro
t > 0, l = k = s(L) = 0, m > 0, l = 0
[0, k1]
Lavoratore salariato/produttore indipendente Produttore indipendente
t > 0, l > 0, k > 0, s(L) = 0, m = 0, l > 0
[0, k1]
t = 0, l > 0, k > 0, s(L) = 0, m = 0, l > 0
(k1, k2]
Piccolo capitalista
t = 0, l > 0, k > 0, s(L) > 0, m = 0, l > 0
(k2, k3]
Capitalista puro
t = l = 0, k > 0, s(L) = 1 – R, m > 0, l > 0
(k3, k4]
Capitalista di rendita
t = l = 0, k > 0, s(L) = 1 – R, k < k, m > 0, l =0
> k4
Per k k < k l’individuo è un produttore indipendente, che non assume lavoro né lo vende, con una quantità di tempo lavorativo dedicato alla produzione che deriva da f = u' (perché l > 0 , m = 0). Quando k aumenta, l’agente lavora di più (il prodotto marginale della funzione di lavoro trasla verso l’esterno ed u’ è anche in aumento dal 1
2
n
13
L’omogeneità (la più debole ipotesi di omoteticità sarebbe sufficiente) assicura che il rapporto tra i prodotti marginali dei due input dipenda solo dal rapporto capitale-lavoro.
28 | MICROECONOMIA
momento che R diventa più scarso). Raggiunto il valore k2 il maggior prodotto marginale del lavoro è sufficiente a giustificare i costi di supervisione derivanti dall’assunzione di lavoro esterno. Il costo di assunzione per un’unità di lavoro è w(1 + r + l) + s’ fn (il secondo termine tiene conto del fatto che assumere lavoro richiede
che il datore di lavoro trasferisca parte del suo tempo da lavoro produttivo a supervisione s’, il cui costo opportunità è fn). Per cui il valore critico di k è definito da fn = w(1 + r + l) + s’(0) fn oppure w(1 + r + l) =fn(1 – s’(0)). Valori di k più alti
rendono il prodotto marginale dei lavoratori assunti maggiore del costo di assumere, così che l’impiego di quantità positive di lavoro esterno introduce una nuova regione. Per k k < k l’agente è un piccolo capitalista che effettua lavoro produttivo ed allo stesso tempo assume lavoro esterno, dividendo le sue giornate tra supervisione, lavoro autonomo e riposo. I rispettivi valori di s, l e R sono determinati da 2
3
u' = f = w(+r + l) /(1 s') , dove la prima disuguaglianza determina il livello ottimale n
del lavoro produttivo e la seconda disuguaglianza determina il livello ottimale del lavoro da assumere. Si noti che la seconda uguaglianza può essere riscritta in modo tale da esprimere la condizione che il costo opportunità di monitorare un incremento marginale nel lavoro impiegato, diminuendo il lavoro produttivo, (cioè s' f ) deve n
essere uguale al prodotto marginale del lavoro meno il costo di assunzione. s' f = f w(1 + r + l) n
n
Per k che aumenta, il prodotto marginale del lavoro aumenta, incrementando entrambi i lati di questa equazione. Ma un incremento di f ha un effetto proporzionale maggiore sul lato destro dell’espressione (come mostrato dalle linee tratteggiate nel riquadro inferiore destro della figura 10.1). Quindi per valori di k n
maggiori, è ottimale assumere più lavoro, il che causerà un aumento di s’ (poiché s’’ > 0) e quindi anche di u’. Una conseguenza di ciò sarà che l’agente dedicherà meno
tempo alla produzione diretta e più tempo al monitoraggio. Ad un certo punto (quando k raggiunge k ), u'( R) = f per R =1 s , così che il proprietario non ha alcun incentivo ad eseguire lavoro produttivo. Per k k l’agente è un puro capitalista, 3
n
3
il quale adempie solo a compiti di supervisione. Ci saranno alcuni livelli di ricchezza detenuta tali che i vincoli al credito non saranno più stringenti. Incrementi addizionali di ricchezza saranno quindi associati ad un bisogno di credito sempre inferiore fino al punto in cui si inizierà a concedere prestiti. Si assuma che il livello di ricchezza in corrispondenza del quale un individuo diventa creditore, indicato da k , sia maggiore di k . Coloro per cui k > k saranno 4
3
4
capitalisti finanziari, e dedicheranno tutto il loro tempo lavorativo al monitoraggio dei lavoratori che utilizzano parte dei loro beni capitali e daranno in affitto i beni
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|29
restanti. La Tabella 10.2 schematizza la correlazione tra ricchezza e posizione contrattuale. L’analisi appena presentata, sebbene altamente semplificata, mostra per ogni livello di ricchezza i tipi di contratto ai quali un individuo sceglierà di partecipare. La stessa analisi indica allora una corrispondenza tra la distribuzione della ricchezza e la distribuzione dei ruoli contrattuali nella popolazione. Una società con pochi grandi detentori di ricchezza e molti detentori medi di ricchezza porterebbe ad una distribuzione dei contratti con molti lavoratori autonomi, mentre una società con una alta concentrazione della ricchezza e molti individui con ricchezza nulla sarebbe una società di lavoratori salariati e con pochi capitalisti puri o capitalisti finanziari. Ovviamente, cambiamenti importanti nella distribuzione della ricchezza (e quindi cambiamenti nella domanda di partecipazione a particolari tipi di contratto) altererebbero il saggio di salario, il canone di affitto dei beni capitali ed il tasso d’interesse, che si assume siano tutti dati esogenamente nel modello appena presentato. Le persone non si suddividono tra le varie posizioni contrattuali solo sulla base della ricchezza. Esse differiscono per il grado di avversione al rischio, per il livello di istruzione, il tasso di preferenza temporale ed altre caratteristiche individuali che influenzano questo processo. Tali caratteristiche sono tutte influenzate dal livello di ricchezza di ognuno (o dal livello di ricchezza dei propri genitori) ma variano anche indipendentemente dalla ricchezza. Per cui, questo modello è lungi dall’essere completo.
C L A S S E : R I S O R S E I N E G U A L I , C O N T R AT T I I N C O M P L E T I POTERE
E
La distribuzione dei contratti schematizzata nella tabella 10.2 offre la ripartizione degli individui in classi discrete risultante da differenze continue nella ricchezza. Mentre gli storici ed altri scienziati sociali fanno regolarmente uso di termini come “classe operaia” e “colletti bianchi,” gli economisti generalmente cercano di evitare tali rappresentazioni categoriche. Raggruppamenti discreti spesso convogliano meno informazioni rispetto a variabili continue come il reddito e la ricchezza, per esempio l’uso del termine “classe media” per indicare niente più che il reddito medio. In parte questo è il motivo per il quale il concetto di classe degli economisti classici—che era un fondamento non solo dell’economia Marxista ma anche dell’economia di Ricardo e Smith— cadde in disuso con l’avvento del paradigma Walrasiano.14
14
Knut Wicksell (1851–1926), contemporaneo di Walras, fu il primo a dimostrare che se la funzione di produzione è omogenea di primo grado (rendimenti costanti) non c’è nessuna differenza analitica
30 | MICROECONOMIA
La teoria contemporanea dei contratti incompleti presentata nei capitoli 7, 8 e 9 insieme al concetto di potere introdotto in questo capitolo suggerisce una teoria della struttura di classe in cui le categorie discrete sottintendono informazioni non catturate dalla ricchezza o da altre misure continue. Due aspetti della struttura di classe schematizzata nella tabella 10.2 forniscono esempi in tal senso. Primo, i membri di una classe hanno più cose in comune che semplicemente un simile livello di ricchezza: la loro relazione con le altre classi è la stessa. Per cui tutti i lavoratori salariati interagiscono quotidianamente con un datore di lavoro e ricevono un reddito nella forma di un salario. I produttori indipendenti, al contrario, si rapportano agli altri solo nell’acquisto degli input e nella vendita degli output, ed il loro reddito prende la forma di ricavi dalle vendite. Secondo, un aspetto delle relazioni di classe è che alcune classi hanno potere sulle altre. Quindi, essere un capitalista puro significa essere il capo di un gruppo di lavoratori, ed essere un capitalista di rendita può significare avere potere del lato corto nei confronti di coloro ai quali si concedono prestiti (a seconda della natura del contratto). Senza l’analisi della ricchezza e dei contratti di cui sopra, sapere che un individuo ha una ricchezza pari a k (k ,k ) , per esempio, non darebbe alcuna indicazione riguardo la natura delle relazioni sociali in cui quell’individuo è tipicamente coinvolto nel corso delle sue attività di sostentamento. Ciò che la classe aggiunge all’analisi sono le relazioni sociali caratteristiche di particolari posizioni in termini di ricchezza, ed in particolare l’aspetto politico di queste relazioni, cioè, l’esercizio asimmetrico del potere. L’importanza analitica di tutti questi aspetti che i membri di una classe hanno in comune (anche quando il reddito ed i patrimoni siano diversi) dipende dalla domanda cui si vuole dar risposta. La centralità dell’esercizio del potere nella teoria moderna dell’impresa suggerisce che il concetto di classe può dare spiegazioni non solo ai soliti quesiti degli storici e dei sociologi ma anche a quelli degli economisti. 3
4
Il modello della struttura di classe di un’economia capitalista con contratti incompleti è sintetizzato nella figura 10.2, che introduce il mercato dei manager come un tipo distinto di contratto con rinnovo condizionato. Nella figura 10.2, i soggetti sul lato corto (B) esercitano potere ( ) sui soggetti sul lato lungo con cui effettuano una transazione (A) mentre i soggetti sul lato lungo esclusi (C) sono razionati nella quantità. nell’approccio neoclassico tra il rappresentare il datore di lavoro come il residual claimant che paga ai lavoratori il loro prodotto marginale, oppure al contrario avere il lavoratore come il residual claimant che paga al capitale il suo prodotto marginale. Egli concluse: “Avremmo potuto in ugual modo iniziare considerando gli operai stessi come imprenditori” (Wicksell 1961[1893]:24–25). In tal senso, egli fu un precursore della considerazione di Samuelson sulla non rilevanza della distinzione tra “chi assume chi viene assunto.”
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|31
Gli individui che appaiono come creditori e debitori nel mercato dei capitali ( ) appaiono come proprietari nel mercato dei manager, mentre i proprietari e coloro che riescono ad ottenere una posizione nel mercato dei manager appaiono come datori di lavoro nel mercato del lavoro. La dimensione politica della struttura di classe rappresentata nella figura è un processo “a cascata” di potere del lato corto a partire da creditori ricchi che esercitano potere sui debitori abbastanza ricchi da ottenere una transazione. A loro volta i ricchi e coloro che riescono ad ottenere un prestito esercitano potere sui manager (coloro che riescono a procurarsi degli impiegati), che a loro volta, insieme ai proprietari (nell’impresa classica di Alchian e Demsetz) esercitano potere del lato corto sui lavoratori. Mercato dei Creditori
Creditori Debitori (B)
Mercato dei Managers
Razionati nel Credito
(A)
Proprietari Managers (B)
Mercato del Lavoro
|
(C)
|
Razionati nel Lavoro
(A)
Datori di Lavoro (C)
(C)
Occupato | Disoccupato (A)
(B)
Figura 10.2. Il modello con contratti incompleti della struttura di classe. I tipi B sono i principali sul lato corto che esercitano potere sui tipi A (gli agenti sul lato lungo con cui compiono transazioni); i tipi C sono i soggetti sul lato lungo vincolati nella quantità.
Ovviamente, i datori di lavoro possono esercitare potere sui lavoratori anche attraverso altri mezzi (per esempio se il lavoratore sta guadagnando una rendita associata ad una risorsa specifica alla transazione). Si noti che sebbene ci sia un’evidente corrispondenza tra ricchezza ed esercizio del potere, la ricchezza non è condizione necessaria né sufficiente per l’esercizio del potere del lato corto. I manager non devono essere ricchi per poter esercitare potere sugli impiegati. Allo stesso modo, i produttori indipendenti nella tabella 10.2 hanno un patrimonio significativo ma non esercitano alcun potere (assumendo che i mercati dei beni siano competitivi ed in equilibrio). Si noti anche che contrariamente a quanto previsto dal modello Walrasiano (nel capitolo 6), la distribuzione del reddito non è più determinata unicamente dalla distribuzione della ricchezza; gli occupati ed i disoccupati sono identici eppure hanno redditi molto diversi. Lo stesso vale per i longsider di successo rispetto a quelli vincolati nella quantità nel mercato dei manager.
32 | MICROECONOMIA
Nell’estendere la teoria dei contratti incompleti fino a fornire una fondazione microeconomica al concetto di classe si afferma quindi la natura a volte gerarchica delle relazioni di scambio competitivo cui Marx alludeva nell’epigrafe. D’altra parte, l’approccio dei contratti incompleti non riproduce semplicemente i vecchi concetti di classe. Il modello qui sviluppato è in forte contrasto con quella che può essere chiamata una visione organica delle classi, secondo la quale le persone “nascono” in una classe ed adottano schemi comportamentali caratteristici della propria classe (compresa l’azione collettiva in difesa degli interessi di classe) senza fornire una spiegazione del perchè i singoli membri di una classe agiscano in modi che rendono vere queste affermazioni. L’approccio può anche essere paragonato con l’approccio di Oliver Williamson ai mercati e alle gerarchie. Piuttosto che vedere le imprese semplicemente, come le definiva Robertson, come “delle isole di potere consapevole in questo oceano di cooperazione inconsapevole,” l’approccio dei contratti incompleti fa risalire l’esercizio del potere alla struttura dei mercati invece che alla struttura delle imprese. L’impresa è un luogo importante nel quale viene esercitato potere, ma come il modello sul mercato del credito rende chiaro, il potere può essere esercitato in assenza di imprese o addirittura in assenza di qualunque forma organizzativa. Il potere del lato corto è esercitato nei mercati, non semplicemente fuori dai mercati o nonostante i mercati.
C O N C L U S IO N E Il modello Walrasiano di equilibrio generale competitivo presentato nel capitolo 6 fu pensato per spiegare come gli scambi tra agenti con dotazioni iniziali eterogenee possano sostenere un vettore di prezzi di equilibrio ed un’allocazione finale di beni ed utilità. I modelli qui sviluppati sono stati pensati per spiegare i modi in cui un’economia competitiva ripartisce individui con dotazioni iniziali eterogenee tra diversi contratti, e quindi tra diverse posizioni di classe che differiscono sia nel reddito sia nel grado di potere che può essere esercitato sugli altri. Nel modello di equilibrio competitivo, c’è un solo contratto che governa lo scambio dei beni ed i prezzi sono endogeni. Questo capitolo modella la coesistenza di diversi contratti, molti dei quali sono incompleti, assumendo che i prezzi siano esogeni. Piuttosto che modelli alternativi dello stesso fenomeno, questi approcci sono meglio visti come rappresentazioni dell’economia capitalista da punti di vista distinti, uno che enfatizza lo scambio di mercato di beni contrattabili e l’altro che evidenzia le interazioni sociali non contrattuali tra membri di classi diverse. Una delle sfide più importanti sarà quella di modellare la formazione dei prezzi e dello scambio in economie con vari contratti possibili cosi come la ripartizione endogena degli individui nelle varie
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|33
posizioni contrattuali. Un tale modello individuerebbe l’equilibrio competitivo che sostiene simultaneamente un vettore di prezzi, una struttura politica del processo di scambio ed una distribuzione del benessere individuale. L’idea apparentemente nuova che la struttura politica dei mercati e delle imprese gioca un ruolo centrale nell’analisi economica è lungi dall’essere nuova. La Corte Suprema degli Stati Uniti nel caso Holden vs. Hardy (1898) affermò la logica di ciò che quasi un secolo dopo sarebbe stato chiamato il modello di disciplina del lavoro: [I] proprietari degli [...] stabilimenti ed i loro operai non sono allo stesso livello, [...] i rispettivi interessi sono alquanto in conflitto. I primi ovviamente desiderano ottenere il maggior impegno lavorativo possibile dai loro impiegati, mentre i secondi sono spesso indotti per paura di essere licenziati a conformarsi ai regolamenti che a loro giudizio, se considerati imparzialmente, sarebbero da dichiarare nocivi alla salute o alla loro forma fisica. In altre parole, i proprietari decidono le regole ed i lavoratori sono praticamente obbligati ad obbedirle.
Tuttavia molti economisti considerano l’esercizio del potere da parte dei datori di lavoro come un fenomeno illusorio. Joseph Schumpeter si spese molto nel sostenere che: “Ciò che distingue il lavoro dirigente da quello dipendente sembra essere a prima vista fondamentale,” ma in realtà la differenza, egli scrisse, “non costituisce una distinzione economica essenziale [...][L]a condotta dei primi è soggetta alle stesse regole dei secondi [...] e stabilire questa regolarità è il compito essenziale della teoria economica” (Schumpeter, 1934, p.20–21). Un importante testo di microeconomia (Alchian e Allen, 1969, p.320) potrebbe aver stupito alcuni studiosi con ciò che segue: Chiamare il datore di lavoro capo è un’usanza derivante dal fatto che il “capo” stabilisce i compiti particolari. Si potrebbe ugualmente chiamare capo il lavoratore perchè egli ordina al datore di lavoro di essere pagato con una somma specifica se vuole che i servizi siano eseguiti. Ma le parole sono parole.
Non penso proprio che gli autori appena citati sarebbero in disaccordo, dal punto di vista empirico, con la valutazione della Corte Suprema. Come Samuelson (nell’epigrafe), essi stavano descrivendo la logica di un modello, non un aspetto empirico dell’economia. Nell’approccio post-Walrasiano qui modellato, l’esempio di Alchian e Allen avrebbe un significato diverso. É chiaro che il datore di lavoro si rifiuterebbe di pagare ogni domanda di salario da parte dell’operaio a meno che essa non sia w*, vale a dire il salario che massimizza i profitti. Una qualità degli approcci post-Walrasiani sembra essere quella di poter prontamente descrivere (piuttosto che oscurare) un aspetto del rapporto di impiego che sembra così incontestabile. Ma il modello del potere qui sviluppato è troppo semplice per poter fornire una base per qualcosa di più che una comprensione superficiale delle relazioni sociali che definiscono il posto di lavoro o le transazioni nel mercato del credito. Un difetto
34 | MICROECONOMIA
chiave è che nel tentativo di catturare la natura essenzialmente gerarchica delle relazioni di classe—il potere “a cascata” nella figura 10.2—non include casi in cui il potere non è asimmetrico, ma è esercitato invece in modo bilaterale. Ciononostante, esso fornisce una ragione convincente per dubitare del vecchio adagio, “I ricchi sono diversi da tutti gli altri; essi hanno più denaro.” La ricchezza in effetti determina la posizione del vincolo di bilancio di un individuo e quindi porta a più beni e servizi. Ma coloro che sono ricchi abbastanza da poter realizzare i propri progetti o da poter prendere a prestito grosse somme di denaro al tasso di interesse corrente, godono di qualcosa di più che un maggior potere d’acquisto. Essi possono avere il comando sulle persone oltre che sui beni. L’accesso al capitale permette loro, ma non ad altri, di diventare datori di lavoro e come tali di occupare posizioni di potere del lato corto in mercati non in pareggio. Thomas Hobbes aveva ragione nel dire “La ricchezza insieme alla liberalità [generosità] è Potere; perchè procura amici, e servi” (1968[1651], p.150). In effetti, ai tempi di Hobbes il termine “servo” si riferiva ad ogni lavoratore.
LE ISTITUZIONI DI UN’ECONOMIA CAPITALISTA
|35
Riferimenti bibliografici Alchian, A. A. and H. Demsetz (1972). "Production, Information Costs, and Economic Organization." American Economic Review 62(5): 777-795. Alchian, A. A. and W. Allen (1969). Exchange and Production: Theory in Use. Belmont, Wadsworth, 1969. Asplund, M. (2000). "What fraction of a capital investment is sunk costs?" Journal of Industrial Economics XLVIII(3): 287-303. Bellas, C. (1972). Industrial Democracy and the Worker-Owned Firm: A Study of Twenty-one Plywood Companies in the Pacific Northwest. New York, Praeger. Bowles, S. and H. Gintis (1992). "Power and Wealth in a Competitive Capitalist Economy." Philosophy and Public Affairs 21(4): 324-353. Craig, B. and J. Pencavel (1992). "The Behavior of Worker Cooperatives: The Plywood Companies of the Pacific Northwest." American Economic Review 82(5): 1083-1105. Craig, B. and J. Pencavel (1995). "Participation and Productivity: A Comparison of Worker Cooperatives and Conventional Firms in the Plywood Industry." Brookings Papers on Economic Activity: Microeconomics: 121-160. Dahl, R. (1957). "The Concept of Power." Behavioral Science 2: 201-215. Dow, G. (2002). Governing the firm: Workers' control in theory and practice. Cambridge, Cambridge University Press. Eswaran, M. and A. Kotwal (1986). "Access to Capital and Agrarian Production Organization." Economic Journal 96(382): 482-498. Galbraith, J. K. (1967). The New Industrial State. Boston, Houghton Mifflin. Gintis, H. (1989a). Financial Markets and the Democratic Enterprise. Microeconomic Issues in Labour Economics: New Approaches. R. D. a. R. Perlman. New York, Wheatsheaf: 155-176. Gintis, H. (1989b). The Power to Switch: On the Political Economy of Consumer Sovereignty. Unconventional Wisdom: Essays in Honor of John Kenneth Galbraith. S. Bowles, R. Edwards and W. G. Shepherd. New York, Houghton-Mifflin: 65-80. Grossman, S. and O. Hart (1986). "The Costs and Benefits of Ownership: A Theory of Vertical and Lateral Integration." Journal of Political Economy 94(4): 691-719. Hansen, D. G. (1997). "Individual Responses to a Group Incentive." Industrial and Labor Relations Review 51(1): 37-49. Hart, O. (1989). "An Economist's Perspective on the Theory of the Firm." Columbia Law Review 89(7): 1757-1774. Hart, O. (1995). Firms, Contracts, and Financial Structure. Oxford, Clarendon Press. Holmstrom, B. and J. Tirole (1989). The Theory of the Firm. Handbook of Industrial Organization, Volume I. R. S. a. R. Willig. Amsterdam, NorthHolland: 61-133. Isaac, R. M., J. M. Walker, et al. (1994). "Group Size and Voluntary Provision of Public Goods: Experimental Evidence Utilizing Large Groups." Journal of Public Economics 54(1): 1-36. Kornai, J. (1980). Economics of Shortage. Amsterdam, North-Holland. Lasswell, H. and A. Kaplan (1950). Power and Society: A Framework for Political Enquiry. New Haven, Yale University Press.
36 | MICROECONOMIA
Malcomson, J. (1999). Individual employment contracts. Handbook of Labor Economics. O. Ashenfelter and D. Card. Amsterdam, Elsevier. 3B: 22922372. Marx, K. (1967). Capital: A critique of political economy, I The process of capitalist production. New York, International Publishers (original publication, 1867). Milgrom, P. (1988). "Employment Contracts, Influence Activities, and Efficient Organization Design." Journal of Political Economy 96(1): 42-60. Pagano, U. (1993). Organizational Equilibria and Institutional Stability. Markets and Democracy: Participation, Accountability and Efficiency. S. Bowles, H. Gintis and B. Gustafsson. Cambridge, Cambridge University Press. Parsons, T. (1967). On the Concept of Political Power. Sociological Theory and Modern Society. T. Parsons. New York, Free Press: 297-354. Pencavel, J. (2002). Worker Participation: Lessons from the Worker Co-ops of the Pacific North-West. New York, Russell Sage Foundation. Prendergast, C. (1999). "The Provision of Incentives in Firms." Journal of Economic Literature 37(1): 7-63. Putterman, L. and G. Dow (2000). "Why Capital Suppliers (usually) Hire Workers: What We Know and What We Need to Know." Journal of Economic Behavior and Organization 43(3): 319-336. Samuelson, P. (1957). "Wages and Interest: A Modern Dissection of Marxian Economics." American Economic Review 47(6): 884-921. Schumpeter, J. (1934). The Theory of Economic Development: An Inquiry into Profits, Capital, Credit, Interest and the Business Cycle. Oxford, Oxford University Press. Wicksell, K. (1961). Lectures on Political Economy. London, Routledge & Kegan Paul Ltd (first published as Uber Wert Kapital und Rente, in 1893). Williamson, O. E. (1985). The Economic Institutions of Capitalism. New York, Free Press.
XI
E VOLUZIONE I STITUZIONALE ED I NDIVIDUALE
Ad un certo stadio del loro sviluppo, le forze materiali di produzione (le tecnologie) … entrano in conflitto con … le relazioni di proprietà con le quali hanno funzionato in passato. Da loro forme di sviluppo, queste relazioni diventano le catene delle forze di produzione. E’ allora che inizia il periodo di rivoluzione sociale. Karl Marx, Preface to the Critique of Political Economy, 1859
… Le persone egoiste e litigiose non collaborano, e senza collaborazione, niente può succedere. Una tribù che possiede … un maggior numero di membri coraggiosi, solidali e fedeli, sempre pronti a proteggersi dal pericolo, ad aiutarsi e a difendersi gli uni con gli altri … si espanderà e sconfiggerà le altre tribù…A quel punto le qualità sociali e morali tenderanno lentamente a progredire e diffondersi in tutto il resto del mondo. Charles Darwin, The Descent of Man, 1873
I N T R O D U Z IO N E Nell’ottobre 1898 il Segretario Generale del Partito Comunista della Germania dell’Est, Erich Honecker, durante il quarantesimo anniversario della fondazione della Repubblica Democratica Tedesca, celebrò quell’avvenimento come una “necessità storica” e un “punto di svolta nella storia del popolo tedesco”. Parate e manifestazioni commemorarono l’evento1. Gli oppositori del regime avevano messo su qualcosa come una dozzina di manifestazioni nei mesi estivi, racimolando meno di 10000 partecipanti in tutto. Ma dodici giorni dopo il suo discorso, Honecker si dimise, perché altre manifestazioni anti-regime scoppiarono prima in Leipzig e poi in tutto il Paese, con un La prima citazione è tratta da Marx (1904: 11-12), la seconda da Darwin (1998:134). 1 Il racconto è basato su Lohmann (1994).
2 | MICROECONOMIA
milione e mezzo di partecipanti ad ottobre e il doppio a novembre. Nel giro di un mese, le Germanie dell’Est e dell’Ovest avrebbero danzato sul Muro di Berlino, prima di buttarlo giù. Dopo meno di un anno, la commemorazione della Repubblica Democratica Tedesca di Honecker fu cancellata, in seguito alla riunificazione con la Repubblica Federale Tedesca. In conseguenza di ciò, i cittadini della nazione precedentemente comunista passarono da un sistema di governo ad un altro, il quale includeva un insieme di diritti di proprietà e processi politici del tutto nuovi. Pochi avrebbero predetto l’immediatezza e l’estensione di questi e degli altri radicali cambiamenti che interessarono gran parte dell’ex mondo comunista in quel periodo. Un processo di cambiamento istituzionale meno discusso, ma ugualmente profondo, riguarda le dolorose e pericolose pratiche di circoncisione femminile e le altre forme di amputazione genitale femminile (FGC2) in molte aree dell’Africa3. Proprio come la fasciatura del piede, una volta molto praticata in Cina, la FGC è una convenzione cui le famiglie si adeguano per far sì che le figlie possano maritarsi. La promozione dell’istruzione e altre influenze modernizzanti sul continente durante il XX secolo, non intaccarono la FGC; anzi, in alcune regioni questa si diffuse ulteriormente. All’inizio del ventunesimo secolo, si stimava che due milioni di ragazze africane venivano sottoposte alla pratica ogni anno. Pur tuttavia, nel 1997, ad una assemblea nel piccolo villaggio Bambara di Malicounda in Senegal, i residenti decisero di rifiutare all’unanimità la FGC. Una simile posizione a Malicounda non era il risultato di una campagna anti-FGC, quanto piuttosto merito di una organizzazione non governativa che si era rivolta alle donne promuovendo l’istruzione e affrontando lo sviluppo della comunità e i problemi sanitari. Nel vicino Keur Simbara, gli abitanti del villaggio decisero prudentemente di consultare tutti gli altri villaggi tra i cui membri si combinavano i matrimoni; ad un certo punto tutti questi 13 villaggi insieme decisero di abbandonare la pratica. In seguito ad altre simili assemblee, i rappresentanti di un altro gruppo di 18 villaggi del gruppo etnico Fulani fecero lo stesso. Il rifiuto si diffuse da villaggio a villaggio. Nel giro di un anno a partire dalla dichiarazione dei Fulani, il Governo del Senegal dichiarò la FGC una pratica illegale. Un ultimo esempio di cambiamento istituzionale viene dalle Filippine, dove il tipico contratto che regola la raccolta del riso si chiamo hunusan (“condivisione” in Tagalog). In base al sistema hunusan, ogni membro della comunità può prender parte alla 2 3
Acronimo per l’inglese “female genital cutting”. Nota del traduttore. Questo riferimento è basato su Mackie (1996) e Mackie (1999)
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|3
raccolta dei campi di un proprietario terriero, ricevendo un sesto dell’ammontare che raccoglie4. Il proprietario non può legittimamente rifiutare questo diritto a nessuno, e la consuetudine stabilisce che i membri della sua famiglia non possono prendere parte al raccolto e che né questi o lui stesso possono supervisionare il lavoro. Negli anni ’60, la quota di un sesto per un ora di lavoro di raccolto forniva un compenso equo rispetto alle altre opportunità di guadagno nelle aree rurali, sostenendo così una sorta di equilibrio tra contratti tradizionali e moderni. Tuttavia, il maggiore utilizzo di varietà di riso più produttive negli anni ‘70 e ‘80 (la Rivoluzione Verde) quasi duplicò la produzione, in tal modo incrementando di molto il valore di un sesto del raccolto stabilito dal sistema hunusan. Il risultato fu che, alla fine degli anni ‘70, il raccolto regolato dal sistema hunusan era ricompensato con un guadagno molto al di sopra della prossima migliore alternativa per il lavoratore (in termini di lavoro salariato). Qualche grosso latifondista provò a trarre vantaggio dal cambiamento riducendo la quota di raccolto ad un nono, ma questa violazione della consuetudine provocò una forte indignazione tra i lavoratori, il che forse spiega i sospetti incendi notturni delle coltivazioni. Le fattorie maggiori quindi, iniziarono ad investire molto sia in raccoglitori meccanici che nel monitoraggio del lavoro di raccolta. Le fattorie più piccole, invece, continuarono ad offrire la quota di un sesto, ma aggiunsero un’antica obbligazione che era stata a lungo tipica in alcune regioni adiacenti. Si trattava della restrizione del lavoro a coloro che avevano fornito servizi di raccolto senza essere remunerati nella precedente stagione. In contrasto con la strategia adottata dai grossi proprietari, la nuova obbligazione imposta dai piccoli proprietari non violava la reciprocità sulla quale si basava il sistema hunusan. Hayami (1998):45 riporta che “nella mente degli abitanti del villaggio raccogliere senza essere direttamente pagati è considerato … una espressione di gratitudine dei lavoratori nei confronti delle buone intenzioni del proprietario che riconosce loro un salario stabile e garantito … per un certo periodo”. Amalgamando due contratti tradizionali, il sistema hunusan modificato ridusse la remunerazione de facto del lavoro di raccolta quasi allo stesso livello di un equivalente lavoro salariato, eliminando così le rendite introdotte dalla Rivoluzione Verde. Nei capitoli precedenti ho cercato di chiarire come funzionano le istituzioni: in che modo queste forniscono incentivi e limiti, tenendo in considerazione i comportamenti individuali e le conseguenze che ne derivano nell’aggregato, ed anche in che modo le istituzioni influenzano le preferenze e le credenze individuali. In questo e nei prossimi 4
Come riportato da Hayami (1998) e Hayami e Kikuchi (1999).
4 | MICROECONOMIA
due capitoli affronto la domanda più difficile: Come cambiano le istituzioni? Ed in che modo le preferenze e le credenze degli individui evolvono insieme ai loro ambienti istituzionali? Queste questioni sono tra le più importanti e intellettualmente stimolanti nelle scienze sociali e comportamentali, e hanno attratto alcune delle maggiori menti negli ultimi tre secoli, tra cui Adam Smith, David Hume, Karl Marx, Karl Menger, Joseph Schumpeter e Frederich Hayek. Eppure, a partire dal concepimento del paradigma economico Walrasiano alla fine del 19° secolo, i processi di cambiamento istituzionale e di sviluppo individuale hanno occupato una posizione periferica nelle scienze sociali, e soprattutto in economia. In parte come conseguenza di ciò, il cambiamento istituzionale e l’evoluzione individuale sono stati modellati formalmente solo negli ultimi anni grazie allo sviluppo di nuovi strumenti analitici che lo hanno reso possibile. In questo e nei prossimi tre capitoli, farò uso di questi progressi analitici per applicare alcune delle intuizioni evoluzioniste di Darwin e di Marx al processo di cambiamento istituzionale, e per identificare nel processo qualche difetto delle loro prospettive.
U N I N Q U A D R A M E N TO D E L L A Q U E S T IO N E Per istituzioni si intendono le leggi, le regole non formali e le usanze che conferiscono una struttura durevole alle interazioni sociali, determinando chi incontra chi, per fare cosa, con quali azioni, e con quali conseguenze comunemente subite. In qualche contesto analitico ha senso prendere l’ambiente istituzionale come un dato, spesso descrivendone le regole principali attraverso la specifica struttura di un gioco. Nel modello del mercato del lavoro presentato nel capitolo 8, questo approccio era semplificato trattando il datore di lavoro come first mover con un insieme di strategie dato (il tasso di salario, il livello di monitoraggio, la funzione di chiusura), e il lavoratore come il giocatore che si muove per secondo, con un diverso insieme di strategie, pur sempre dato. In questo caso, il gioco descrive le istituzioni rilevanti. Tuttavia, se siamo interessati al processo di evoluzione istituzionale, dobbiamo raffigurare le istituzioni non come vincoli esogenamente dati, ma piuttosto come il risultato delle interazioni individuali. In altri termini, vogliamo andare “dietro” il gioco che descrive l’istituzione per scoprire l’interazione dalla quale questa si è evoluta. Per far questo specifichiamo un gioco sottostante che ha come possibili risultati alcuni modi differenti in cui i partecipanti possono interagire. I risultati del gioco sottostante sono quindi
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|5
le istituzioni; il processo di cambiamento istituzionale sarà dunque studiato come il passaggio dall’uno all’altro di questi risultati. Un modo molto efficace di descrivere i risultati del gioco sottostante è dire che ci sono convenzioni, cioè equilibri di Nash di un gioco con n giocatori, in cui la coerenza individuale al comportamento convenzionale è una risposta ottimale, se l’individuo crede che un numero sufficiente degli altri giocatori agirà coerentemente alla convenzione. Il cambiamento istituzionale avviene quando una convenzione è sostituita da un’altra. Quindi l’innovazione e il cambiamento istituzionale diventano un problema di selezione degli equilibri. Si consideri un caso specifico. Gli aspetti del mercato del lavoro nell’apartheid sudafricano erano una convenzione (o un insieme di convenzioni) che regolavano uno schema di discriminazione razziale, la quale era esistita per gran parte della storia del Sud-Africa di cui si ha memoria scritta, ed era stata formalizzata all’inizio del 20° secolo e soprattutto nel periodo successivo alla Seconda Guerra Mondiale. Dal punto di vista dei bianchi, la convenzione può essere espressa nel modo seguente: Offri solo salari bassi per lavori di basso livello ai neri. Per i neri, la convenzione era: Offri il tuo lavoro ad un salario basso, e non chiedere di più. Queste azioni rappresentano risposte ottimali reciproche: fino a quando (quasi) tutti i datori di lavoro bianchi aderivano dal canto loro alla convenzione, la risposta ottimale dei lavoratori neri era di aderire a loro volta alla convenzione, e vice versa (presentare questo sistema come una risposta ottimale reciproca è coerente con il fatto che l’apartheid era anche un sistema altamente coercitivo, che utilizzava la repressione brutale contro i suoi oppositori). L’apartheid può essere descritto come una convenzione perché altre risposte ottimali reciproche, non basate sulla razza e più egualitarie, erano in teoria possibili anche se di difficile attuazione. Il potere delle convenzioni nel mercato del lavoro dell’apartheid è suggerito dal fatto che i salari reali dei minatori di oro neri non crebbero tra il 1910 e il 1970, nonostante le periodiche carenze di manodopera nelle miniere e una esponenziale crescita della produttività5. Tuttavia, una serie di scioperi che ebbe inizio nei primi anni ‘70 e accelerò nella seconda metà degli anni ‘80, ebbe il risultato di segnalare il rigetto della convenzione aumentando il numero dei lavoratori neri. In questo modo, ovviamente, i lavoratori e i datori di lavoro non si stavano conformando alle risposte 5
Come riportato in Wilson (1972) e Wood (2000).
6 | MICROECONOMIA
ottimali previste dallo status quo della convezione dell’apartheid. Il loro allontanarsi dalla convenzione provocò ulteriori defezioni; molti datori di lavoro stabilirono che la vecchia convenzione non rappresentava più la risposta ottimale, e questo li portò a modificare le loro relazioni di lavoro, aumentando i salari reali e promuovendo i lavoratori neri. Le azioni di riposta non ottimale dei lavoratori neri avevano alterato le risposte ottimali dei datori di lavoro; il risultato fu che la convenzione si sgretolò. Nel giro di un decennio l’intero sistema di apartheid fu abbandonato. Il caso sud-africano rappresenta uno dei due processi attraverso i quali le istituzioni cambiano: l’emergere all’interno di una società di un gran numero di individui che si comportano in modo da violare la convenzione, arrivando a scardinarla. Questo processo spesso assume la forma (come nel materialismo storico di Marx) di un conflitto tra attori indipendenti che beneficiano in modo diverso dell’una o dell’altra forma istituzionale. Un processo di cambiamento istituzionale all’interno del gruppo può rappresentare una rottura radicale con il passato, come nel caso dell’abbandono del Comunismo nella Germania dell’Est e della FGC in Senegal. Ma non deve essere necessariamente così. Il cambiamento istituzionale può avvenire attraverso un graduale adattamento delle istituzioni a nuove esigenze ed opportunità (come nella modifica del sistema hunusan nelle Filippine). Nel prossimo capitolo presenterò un modello di dinamiche all’interno del gruppo che portano la società a passare da una convenzione all’altra. Il secondo processo che conduce al cambiamento istituzionale è la competizione tra i gruppi governati da diverse istituzioni. Secondo questa prospettiva, le istituzioni di successo sono quelle che contribuiscono alla sopravvivenza di nazioni, imprese, gruppi musicali, unità etnico-linguistiche e altri gruppi in competizione tra loro. Hayek, per esempio, utilizza un argomento di questo tipo per spiegare perché il sistema di mercato – il suo “ordine esteso” – si è diffuso in tutto il mondo. Darwin (nella citazione iniziale) pensava che la competizione tra gruppi porta alla diffusione di caratteristiche come il coraggio, che vanno a beneficio del gruppo stesso. Nel capitolo 13 mi concentrerò sull’evoluzione delle preferenze etero-interessate come risultato di conflitti tra gruppi, usando un modello di selezione del gruppo (o selezione multi-livello). La trasformazione istituzionale affrontata in questo capitolo – la prima rivoluzione dei diritti di proprietà – si basa sulla combinazione di processi di competizione tra gruppi e all’interno del gruppo, che determinano il passaggio da una convenzione all’altra. È spesso utile – per disciplinare il processo di costruzione teorica – avere una idea
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|7
chiara di quali fenomeni empirici si vogliono comprendere. Cinque osservazioni che emergono dagli esempi del Sud-Africa, della Germania, del Senegal e delle Filippine, illustrano alcune caratteristiche abbastanza generali del processo di cambiamento istituzionale, e giocheranno un ruolo prominente nella descrizione del processo di innovazione istituzionale che segue. La prima è che molte istituzioni importanti – quelle che regolano le relazioni tra le classi economiche, per esempio – sono ben descritte da un gioco sottostante che è asimmetrico sia nelle strategie che nei payoffs, e in cui i diversi gruppi della popolazione giocano ruoli diversi. Gli esempi includono le istituzioni che regolano la ripartizione del raccolto, i salari e le condizioni di lavoro dei lavoratori, e il pagamento dei debiti. Dato che in questi casi i risultati distributivi cambiano a seconda delle convenzioni, molti equlibri saranno Pareto-ottimali. Per questo motivo, i raggruppamenti nella popolazione possono avere interessi conflittuali riguardo alla convenzione da selezionare. In secondo luogo, gli sviluppi fortuiti o esogeni – letteralmente eventi esterni al modello – giocano un ruolo importante nell’evoluzione istituzionale (per esempio, la fine della guerra fredda o il ruolo peculiare dei presidenti de Klerk e Mandela nella transizione del Sud-Africa). Laddove gli sviluppi esogeni rappresentano dei processi secolari ben compresi come il cambiamento tecnico (il caso delle Filippine), il compito analitico è di anticipare il modo in cui un cambiamento può eliminare l’equilibrio che rappresenta la convenzione dello status quo, e di stabilire quale nuovo equilibrio potrà allora farsi strada. Il locus classicus di questo modo di pensare è l’idea di Marx, espressa nella citazione iniziale, per cui l’avanzamento tecnologico produce un cambiamento istituzionale quando le convenzioni regnanti inibiscono (“incatenano”) la realizzazione del progresso tecnico che sarebbe possibile sotto altre istituzioni. In altri casi è esplicativo presentare questi elementi fortuiti come “rumore comportamentale”, cioè come simili alle mutazioni nel contesto Darwiniano, tranne per il fatto che non sono ereditabili. Qui di seguito combinerò cambiamento tecnologico esogeno e rumore comportamentale nel modellare la trasformazione dei diritti di proprietà associata alla crescita dell’agricoltura. Nel capitolo 13 introdurrò il caso come una mutazione genetica ereditabile. Terzo, il processo di cambiamento da una convenzione istituzionale all’altra è spesso promosso dall’azione collettiva dei membri di un gruppo svantaggiato dalla convenzione dello status quo, che cercano di rimuoverla a favore di un insieme di istituzioni più favorevole. Questo è stato il caso del Senegal, del Sud-Africa e della
8 | MICROECONOMIA
Germania. Quindi giocare una risposta non ottimale è spesso una scelta piuttosto che un fatto accidentale, e l’assimilazione in un modello al rumore comportamentale o alle mutazioni non è molto rappresentativa. Il ruolo dell’azione collettiva sarà modellato nel capitolo seguente. Quarto, anche se (come Marx suggerisce) il cambiamento istituzionale può essere rappresentato come un adattamento al processo di cambiamento tecnologico, si osserva spesso il persistere per lunghi periodi di convenzioni inefficienti (il che significa che ci sono quelli che piantano in ritardo a Palanpur, per cui quasi tutti sono danneggiati rispetto all’applicazione di convenzioni alternative). Il quinto dato, suggerito dagli esempi sud-africano, senegalese e tedesco, è testimoniato in un vasto numero di studi storiografici e antropologici, ed è il fatto che le convenzioni spesso presentano una stabilità di lungo periodo seguita da un repentino sconvolgimento, per poi favorire l’emergere rapido e l’assestamento di convenzioni nuove. I processi dinamici sottostanti producono quelli che i biologi chiamano equilibri punteggiati. Alcuni esempi sono stati forniti nel capitolo 2; altri esempi includono la rapida diffusione dell’uso generalizzato dei pronomi personali informali al posto di quelli formali in molte lingue europee in meno di una generazione (Paulston, 1976), e il passaggio radicale dalla metà ai tre quarti nell’antica modalità di ripartizione dei raccolti dei proprietari terrieri nel Bengal occidentale durante gli anni ‘80, descritto nel prologo. Di un esempio molto interessante nel Burma (attuale Myanmar) dà testimonianza Edmund Leach (1954:198). Due strutture sociali completamente diverse si sono succedute nel tempo come sistemi di governo: …i gumsa si vedono governati da capi che sono membri di una aristocrazia ereditaria; i gumlao ripudiano ogni nozione di differenziazione di classe…Ma mentre i due termini rappresentano …due modalità organizzative fondamentalmente opposte…le comunità gumsa si sono trasformate in comunità gumlao e vice versa.
Infine, gli ambienti istituzionali influenzano la distribuzione delle preferenze nella popolazione, mentre le preferenze degli attori influenzano il processo di cambiamento istituzionale. Per esempio, la caduta delle istituzioni di apartheid è in parte spiegata dal ripudio e dalla rabbia provocate dal razzismo, e allo stesso tempo l’abbandono stesso dell’apartheid ha contribuito alla proliferazione di preferenze non basate sulla razza e all’identità della popolazione del Sud-Africa. Un modello adeguato dovrebbe pertanto catturare i processi co-evolutivi per cui le istituzioni a livello del gruppo e le preferenze individuali sono parte di un unico sistema dinamico.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|9
Un modello formale, ovviamente, può fornire una rappresentazione solo parziale dei casi empirici che ho presentato. Inizierò dalle preferenze endogene, fornendo un’interpretazione di come le istituzioni, economiche e non, disegnano l’evoluzione delle nostre motivazioni. Introdurrò a quel punto un modello per cui le preferenze cambiano nel corso del processo di eredità culturale, per dimostrare come il processo di cambiamento istituzionale può a sua volta indurre cambiamenti nelle preferenze. Infine, richiamerò il problema dell’evoluzione dei diritti di proprietà introdotto nel capitolo 2, e presenterò un modello dinamico che riproduce le azioni all’interno del gruppo, insieme ad un processo di selezione tra i gruppi. Utilizzerò questo modello per raffigurare l’emergere e il proliferare dei diritti di proprietà privata, come la conseguenza del processo di cambiamento tecnologico associato alla diffusione dell’agricoltura.
L’E V O L U Z I O N E C U LT U R A L E
DELLE
PREFERENZE
Noi acquisiamo le preferenze tramite l’eredità genetica e l’apprendimento culturale. Dato che entrambi sono influenzati da istituzioni economiche e non, le preferenze sono endogene. I modelli che presento evidenziano il modo in cui le strutture di interazione sociale determinano la direzione e la velocità dell’evoluzione delle preferenze. Le preferenze possono essere endogene per altri motivi. Per esempio, l’indottrinamento religioso o politico e la pubblicità sono senza dubbio importanti. Ma gli studi empirici a disposizione sulle preferenze per marchi celebri di generi alimentari, saponi, film, e altri oggetti di consumo, per i quali ci si aspetterebbe un effetto condizionante chiaro e rilevante, dimostrano che la pubblicità sembra essere meno importante dei contatti personali e di altre influenze. Le preferenze sono come gli accenti; possiamo provare ad acquisirli – imparando ad amare Prokoviev e le lumache, o assumendo un “accento da upper class” – ma per lo più siamo solo vagamente consci di come li abbiamo acquisiti. Per questo motivo, i modelli seguenti ricalcano le impronte degli studi di cambiamento di linguaggio. Sulla base dell’intenso studio empirico sul cambiamento linguistico a Filadelfia, per esempio, William Labov concluse che: …i tratti linguistici non sono trasmessi al di là dei limiti del gruppo semplicemente per esposizione ai mass media o alla scuola…Il nostro sistema di linguaggio basilare non si acquisisce dagli insegnanti di scuola o dagli annunciatori alla radio, ma da amici e concorrenti; coloro che ammiriamo, e coloro per battere i quali dobbiamo impegnarci (Labov 1983:23).
Ciò non significa che le istituzioni come la scuola e le chiese non siano importanti, ma la comprensione della loro importanza evolutiva può essere migliorata dal vederli come schemi distinti di interazione sociale che - insieme con mercati, imprese, famiglie, e governi – influenzano il replicarsi differenziato dei tratti comportamentali.
10 | MICROECONOMIA
Nei processi di eredità culturale, i comportamenti sono appresi dai genitori (trasmissione verticale), da altri appartenenti alla generazione precedente (trasmissione obliqua), o da un pari (trasmissione orizzontale). Per ogni tipo di trasmissione l’apprendimento è rappresentato dal copiare: si adotta la stessa religione dei propri genitori o si passa ad un’altra religione grazie al contatto con un insegnante, per esempio. Perché i comportamenti di alcune persone sono copiati e altri no? Fino ad ora (capitoli 2 e 7), ho modellato l’apprendimento basato sui payoff, in cui i comportamenti di quelli che hanno successo materiale tendono ad essere imitati. Ma anche altri fattori sono importanti. Il processo di riproduzione culturale può favorire coloro che sono numerosi piuttosto che coloro che sono in numero scarso, indipendentemente dal loro successo economico: le pressioni sociali all’uniformità sono tra le propensioni umane più largamente documentate6. Per trasmissione conformista, intendo la circostanza che la probabilità che un individuo adotti un particolare comportamento varia con la prevalenza di quel comportamento nella popolazione (indipendentemente da altre influenze sull’apprendimento come i payoff relativi). L’importanza della frequenza nella popolazione di un tratto comportamentale potrebbe emergere se gli individui semplicemente desiderassero adottare quello che considerano il comportamento più comune. Ma allo stesso modo dei payoff relativi, il conformismo potrebbe comparire perché le istituzioni sociali privilegiano i comportamenti più comuni nel processo di trasmissione. Questo sarebbe il caso se i modelli culturali con la maggiore esposizione fossero quelli che aderiscono alle norme comportamentali più comuni, come succede in gran parte dei sistemi scolastici contemporanei, dove gli insegnanti tendono a far parte della razza e dei gruppi etnici numericamente predominanti. I processi di trasmissione culturale appena descritti sono essi stessi il risultato di una evoluzione, presumibilmente sotto l’influenza della selezione naturale, della selezione dei gruppi culturali, e di altre pressioni evolutive. Considerando la natura endogena del processo di apprendimento, un modello plausibile deve includere un processo di trasmissione che sia capace di riprodurre se stesso. È facile capire perché imitare colui che ha successo potrebbe essere una regola di apprendimento di facile diffusione. Anche l’apprendimento conformista si ricollega a questa regola, dato che ci sono forti ragioni teoriche per ritenere che, sotto condizioni abbastanza generali in cui l’apprendimento è costoso, la trasmissione conformista dei tratti contribuirà al successo materiale e riproduttivo degli individui, e dunque può essersi evoluta sotto l’influenza di eredità 6
Si considerino Boyd e Richerson (1985:223 e ss.) Ross e Nisbett (1991:30 e ss.), Bowles (1998) e i lavori citati in quella sede.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|11
genetiche o culturali7. Il modello della sezione seguente fornisce l’intuizione alla base di questi risultati: Finché il conformismo non è troppo comune, è un modo efficace di ridurre i costi di apprendimento. Per spiegare l’influenza delle istituzioni economiche e non economiche sulle preferenze, estenderò il modello di riproduzione dinamica presentato nel capitolo 2. Per catturare le influenze del conformismo e dei payoff sul cambiamento delle preferenze, si consideri una popolazione in cui gli individui possono avere una o due leggi apprese, x e y , con una frequenza nella popolazione p e 1 p con p [0,1] . I membri della popolazione sono accoppiati in modo da interagire per un periodo, in un gioco di coppia simmetrico, i cui payoff sono individuati da ( x, y) , ovvero dal payoff per la strategia dettata dalla norma x contro il partner che gioca seguendo l’altra regola (in alcuni casi mi riferisco a “regola” per indicare la strategia dettata dalla regola). Come in precedenza, b ( p) ) e b ( p) sono i payoff attesi per il comportamento in base alle regole x e y in una popolazione dove il p percento è del tipo x . y
x
Il processo di aggiornamento è formalmente lo stesso che nei modelli di riproduzione dinamica dei capitoli 2 e 7, fatta eccezione per il fatto che per ridurre la confusione nelle notazioni, assumo che tutti i membri della popolazione siano in fase di aggiornamento in ogni periodo ( =1). Ad ogni modo, al posto del processo di aggiornamento monotonico dei payoff modellato in precedenza, gli individui aggiorneranno alla luce di due informazioni, il proprio payoff relativo a quello degli altri, e la frequenza dei due tratti nella popolazione, per cui il grado di conformità misura l’importanza del secondo fattore rispetto al primo. Si definisca dunque il grado di conformismo (0,1] , come l’importanza dell’aspetto conformista del processo di apprendimento rispetto alle influenze basate sui payoff nell’aggiornamento, dove 1 rappresenta l’importanza relativa dei payoff, e k la frequenza nella popolazione della regola sulla quale l’apprendimento conformista non ha nessun effetto (presumibilmente una metà), mentre per p > k la prevalenza della regola x nella popolazione la favorisce nel processo di aggiornamento, indipendentemente dai payoff attesi dalle regole (anche questi dipendenti dalla frequenza)8. Si definisce la propensione alla riproduzione di una regola r and r . x
y
7Si 8
vedano Feldman, Aoki e Kumm (1996), Boyd e Richerson (1985) e Henrich and Boyd (1998).
L’effetto conformista non deve essere necessariamente lineare in p, ovviamente, ma non si guadagnerebbe nulla da una formulazione più generale.
12 | MICROECONOMIA
[ ] r =1/2[ (k p) + (1 )(b b )] r =1/2 ( p k) + (1 )(b b ) x
x
y
y
y
x
(11.1)
(Dato che le dinamiche dipendono solo dalla grandezza relativa delle due propensioni alla riproduzione, porre è un’ipotesi arbitraria ma conveniente perché consente una semplificazione nell’espressione seguente). Con probabilità (r r ) un tipo x diventerà un tipo y se accoppiato con un tipo y se r < r ; viceversa, se r r , l’individuo non cambia. Quelli che sono accoppiati con il loro stesso tipo non cambiano. y
x
y
x
x
y
Utilizzando la derivazione della riproduzione dinamica nel capitolo 2, abbiamo dp = p' p = p(1 p) (r r ) = p (r r) dt x
y
x
(11.2)
dove r è la propensità media del gruppo alla riproduzione, e come in precedenza, il coefficiente di adozione è una costante positiva che riflette il maggiore effetto sul cambiamento di differenze nella propensità alla riproduzione relativamente più grandi (propriamente dimensionate in modo che la probabilità del cambiamento vari all’interno di un intervallo unitario.) Dalla (11.2) è chiaro che dp / dt = 0 if r r = 0 , il che richiede che x
y
( p k) = b ( p) b ( p) 1 y
x
(11.3)
oppure che p sia 0 o 1 (dato che quando p =1 , r = r ). Se la (11.3) è soddisfatta, p è stazionario perché gli effetti della trasmisisone conformista (la parte a sinistra della (11.3)) spiazzano gli effetti del differenziale dei payoff (il lato destro). Dunque, in presenza di trasmissione conformista, e per p (0,1) , i payoff di equilibrio relativi alla x
regola favorita dal conformismo saranno sempre minori dei payoff associati alla regola prevalente. La figura 11.1 rappresenta tale regola. Per p (0,1) , dp / dt prende il segno di r r . Un equilibrio è asintoticamente stabile (si auto-corregge) se la derivata di (11.2) rispetto a p è negativa, il che richiede: x
y
db db < (1 ) dp dp y
oppure
x
(11.4a)
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
< ( y, x) ( y, y) ( x, x) + ( x, y) 1
|13
(11.4b)
che è soddisfatta se il vantaggio conformista conferito su x da un piccolo incremento di p, ovvero , è più che compensato dal vantaggio nel payoff conferito su y dallo stesso incremento di p (parte destra). Nella Figura11.1, p * rappresenta la soluzione di (11.3) che soddisfa (11.4) ed è quindi un equilibrio stabile di distribuzione delle regole.
Effetto Payoff
Effetto Conformismo
Figura 11.1 L’equilibrio culturale. La stazionarietà di p richiede che nel punto p=p* i vantaggi del conformismo del tratto prevalente (x) siano spiazzati dai vantaggi in termini di payoff di y.
Dalla (11.3) e dalla (11.4) si osserva che il conformismo ha due effetti. Innanzi tutto, (11.3) dimostra che le strategie che conducono a payoff bassi posso persistere. Per esempio, x è una strategia evolutiva stabile (SES) nella sua dinamica di riproduzione culturale se i payoff attesi per una piccola parte di popolazione, che gioca secondo la regola y , introdotta in una popolazione omogenea di individui che giocano secondo la regola x , superano i payoff degli individui che giocano secondo la regola x per meno di (1 k) /(1 ) . Questa condizione è chiaramente meno stringente di quella convenzionale rappresentata dalla SES, che richiede che i payoff degli individui mutantiy siano minori dei payoff degli individui dominanti x . Dunque, comportamenti che non sono delle risposte ottimali definiti sui payoff del gioco, possono persistere nella popolazione. Secondo, livelli sufficientemente elevati di conformismo devono violare (11.4), e
14 | MICROECONOMIA
rendere p * un equilibrio instabile e dunque renderlo il confine tra il bacino di attrazione degli equilibri con p = 0 e p =1 . In assenza di conformismo la stabilità richiede solo che la parte destra della (11.4) sia positiva, ovviamente una condizione più debole. Controintuitivamente, il conformismo può dunque aiutare a spiegare sia gli equilibri punteggiati che caratterizzano il cambiamento culturale rapido, sia la sopravvivenza nel lungo periodo di regole individualmente costose, siano esse benefiche al gruppo o no. Il conformismo si aggiunge dunque alla complementarità strategica (con risultati positivi) del tipo considerato nei giochi di assicurazione, essendo motivo della persistenza di comportamenti e convenzioni socialmente disfunzionali. I cambiamenti nelle strutture dei payoff, o altri dettagli degli individui accoppiati per giocare, o il grado il conformismo, sposteranno la distribuzione di equilibrio delle norme comportamentali in una popolazione se p * è interno e stabile. Se p * non è stabile, questi cambiamenti cambieranno la dimensione relativa dei bacini di attrazione dei due equilibri estremi, mutando la probabilità che l’uno o l’altro persistano in un ambiente stocastico. Questa osservazione suggerisce un modo di studiare l’endogeneità delle preferenze: si utilizzi l’equazione (11.3) per studiare lo spostamento di p * causato da quei cambiamenti istituzionali come le riforme scolastiche e i payoff dei comportamenti alternativi. Nella Figura 11.1, se una riforma scolastica che volesse aumentare il numero degli insegnanti appartenenti a gruppi di minoranza, riducesse la dimensione della trasmissione conformista, p * sarebbe trascinato verso sinistra. Ugualmente, cambiamenti dei parametri che riflettono la struttura delle interazioni sociali nel capitolo 7 – ripetizione di interazioni, accoppiamento non casuale, e costi di informazione sul proprio partner – sposterebbero la distribuzione di equilibrio delle regole. Come si può utilizzare questo modello per analizzare gli effetti delle istituzioni economiche sull’evoluzione delle preferenze?
PREFERENZE ENDOGENE Ecco un esempio dell’utilizzo del modello precedente nell’esplorazione dell’effetto delle istituzioni su una particolare preferenza, quella evidenziata da Joseph Schumpeter nella sua teoria dell’imprenditorialità, innovazione e crescita economica, ovvero la predisposizione ad innovare e comandare opposta a quella ad imitare e a seguire. Si consideri un ambiente in mutamento, in cui i membri di una popolazione sono accoppiati per interagire in un gioco simmetrico con due strategie. Gli accoppiamenti
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|15
non sono casuali: se la frazione della popolazione dei tipi x è p , allora i tipi x saranno accoppiati in media con il loro stesso tipo non il p per cento delle volte, ma il μ = s + (1 s) p > p per cento delle volte. Allo stesso modo, i tipi y saranno accoppiati con i tipi y il μ = (1 s) p < p per cento delle volte. La differenza tra queste due probabilità condizionali, s , è il grado di segmentazione, introdotto nel capitolo 7. xx
yx
La strategia di apprendimento (L) prevede di studiare l’ambiente ad un costo di 1 e, sulla base della conoscenza che si ottiene, di selezionare un’azione che porta benefici pari a 2. La strategia di imitazione (I) non costa nulla, e comporta un beneficio di 2 se l’imitatore è accoppiato con un apprendista, e di 2 se due imitatori sono accoppiati, dove >1 è una misura normalizzata della variabilità dell’ambiente. La struttura dei payoff riflette il fatto che gli apprendisti si adeguano sempre all’ambiente esistente (ma ad un costo), mentre gli imitatori lo fanno solo se sono accoppiati con un apprendista e sono dunque capaci di sfruttare senza costi la sua conoscenza aggiornata. Quando un imitatore è accoppiato con un altro imitatore, entrambi copiano un comportamento che non è aggiornato alla luce della situazione corrente. Quanto il loro comportamento sia inappropriato dipende dalla misura del cambiamento ambientale, . Sia p la frazione della popolazione degli apprendisti. Se l’aggiornamento è monotonico rispetto al payoff (ignorando il conformismo e ponendo = 0 nell’equazione 11.1), la condizione stazionaria per p è b = b , L
I
p* = ( 1) /(1 s)
Si noti che dp * / d > 0 , quindi un aumento nella stocasticità dell’ambiente aumenta la frequenza degli apprendisti nella popolazione. Si mostra facilmente che p* < p è la frequenza della popolazione che massimizza i payoff medi con un accoppiamento casuale. L’intuizione dietro questo risultato è che gli apprendisti generano dei benefici sociali che eccedono i loro benefici privati (raccolgono informazione per gli imitatori quando sono copiati). Quindi, il livello di equilibrio degli apprendisti è più basso del livello socialmente ottimale. Molto presumibilmente dp * / ds > 0 , quindi una segmentazione maggiore aumenta la frazione di equilibrio degli apprendisti. Un assortimento (o segmentazione) positivo sottrae agli imitatori parte di questi benefici, diminuendo i loro payoff e riducendo la frequenza di equilibrio nella popolazione. Come un copyright o un brevetto, un assortimento positivo aumenta la ricerca. Ma ha anche lo stesso effetto di ridurre l’efficienza della protezione mediante copyright dell’informazione ottenuta dagli apprendisti; riduce il flusso di informazione aggiornata che va dagli apprendisti agli imitatori. L’effetto di ciò è una riduzione dei max
16 | MICROECONOMIA
payoff medi, perché fornire informazione agli imitatori è senza costi, sebbene sia vantaggioso per l’apprendista. Al contrario delle preferenze dipendenti dal contesto (situation-specific), le preferenze sono endogene quando le proprie esperienze comportano cambiamenti duraturi nel proprio comportamento, in una certa situazione. I modelli presentati si riferiscono a questo, dal momento che mostrano come il processo di aggiornamento comportamentale sia influenzato dalle interazioni dell’individuo con il suo ambiente sociale e materiale. Dato che il cambiamento delle preferenze riguarda un processo di apprendimento di lungo periodo – che spesso avviene durante l’infanzia o l’adolescenza – e i cambiamenti significativi nelle istituzioni economiche sono inusuali, anche gli studi empirici rilevanti sull’impatto delle istituzioni economiche sulle preferenze sono rari. Alcuni degli studi più illuminanti riguardano l’impatto delle nuove istituzioni economiche durante un processo di crescita economica, o l’impatto di istituzioni di una società sulle persone di un’altra società. Tra gli esempi più esotici vi è il seguente. La penetrazione del commercio nelle ex società non di mercato, per esempio, è spesso accompagnata dal proliferare della stregoneria e di comportamenti simili. Ciò avvenne nella Costa d’Oro (ora Ghana) durante l’espansione della prima attività di raccolto finalizzata alla vendita (cacao): i diritti di proprietà comuni preesistenti non erano più adeguati nel momento in cui la terra acquistò molto valore, e dunque vennero fuori i cosiddetti dottori stregoni, per decidere delle dispute sui confini dei campi. Episodi simili avvennero in Bolivia con l’arrivo dell’estrazione dello stagno, in Colombia con la diffusione delle coltivazioni di zucchero, e nel diciassettesimo secolo nel Salem Villane (Massachusetts) con la crescita del commercio lungo la strada che va da Boston verso nord. La stregoneria, sembra, fu almeno in parte una risposta ai conflitti sociali e all’esposizione al rischio, dovuta alla inadeguatezza dei sistemi tradizionali di diritti e obbligazioni nel coordinare la moderna attività economica basata sullo scambio di mercato. Anche gli esperimenti suggeriscono che le preferenze sono endogene. Si ricordi che negli esperimenti che io e i miei collaboratori abbiamo effettuato su 15 società semplici, il gioco sperimentale sembrava riflettere gli schemi comportamentali derivati dalla vita quotidiana, e soprattutto dal tipo di sostentamento del gruppo in questione. In particolare, quelli che per usanza condividevano grosse quantità di cibo, tendevano a dividere la torta dell’ultimatum game equamente, o persino ad offrire la parte più grande all’altro. Lì dove la fornitura di beni pubblici era chiaramente una tradizione (il sistema
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|17
Harambee, tra gli Orma, in Kenia), i contributi nel gioco sperimentale dei beni pubblici corrispondevano ai contributi effettivi previsti dal sistema Harambee. I nostri esperimenti hanno rivelato delle ampie variazioni nel comportamento all’interno dei diversi gruppi culturali, e tra i gruppi stessi. All’inizio abbiamo provato a spiegare il comportamento negli esperimenti sulla base di informazioni su sesso, età, ricchezza relativa ed istruzione degli individui. Sorprendentemente, nessuna di queste misure a livello individuale sembrava sistematicamente legata al gioco sperimentale. Anche le ampie differenze tra i gruppi rappresentavano un enigma. Ci siamo chiesti se questo avvenisse perché le preferenze erano influenzate da condizioni specifiche del gruppo, come istituzioni sociali o norme di equità. La grande varianza nelle istituzioni e nelle norme nel nostro campione, ci ha permesso di affrontare questa questione in modo sistematico. Abbiamo ordinato le società secondo due aspetti delle interazioni sociali coinvolte nel condurre un’attività di sostentamento, e poi abbiamo provato ad usare queste misure per predire il comportamento nell’ultimatum game. La prima, i payoff potenziali della cooperazione, era una misura del modo in cui l’ecologia locale consente rendimenti crescenti di scala, del tipo che potrebbe essere sfruttato produttivamente dalle misure cooperative. I cacciatori di balena Lamelara sono risultati al primo posto, e i coltivatori delle foreste Machiguenga all’ultimo. Abbiamo pensato che in quei gruppi dove il beneficio per la produzione cooperativa era minimo, ci sarebbero state poche norme comuni riguardo alla condivisione. Al contrario, quelli in cui il sostentamento dipendeva da una cooperazione di larga scala, come i Lamelara, avrebbero sviluppato dei modi di condividere il surplus congiunto. La seconda dimensione, l’integrazione del mercato, misurava la frazione delle attività di un popolo che avveniva attraverso uno scambio di mercato. L’idea per questa misura era che più frequentemente si effettuano delle transazioni di mercato, più si ricorre anche alla condivisione del surplus congiunto (i guadagni del commercio), persino con una persona sconosciuta. L’esperienza del commercio poteva essere associata a principi di condivisione astratti. Abbiamo provato a spiegare l’offerta media del gruppo nell’ultimatum game e la misura della propensità a rigettare offerte basse, sulla base di queste due dimensioni della struttura economica. Entrambi questi aspetti del gioco dell’ultimatum game sono risultati positivamente (e sensibilmente) correlati con le nostre due misure, alle quali si poteva ricondurre più della metà della varianza in entrambi i casi. L’impatto di queste misure del sistema economico è rimasto ampio e robusto nelle equazioni attese del gioco sperimentale individuale (piuttosto che della media del gruppo).
18 | MICROECONOMIA
Il fatto che misure ordinali, persino rudimentali, del sistema economico rappresentino dei forti strumenti di predizione del gioco sperimentale, suggerisce un notevole impatto delle istituzioni sulle preferenze9 (l’obiezione che la relazione causale si muove al contrario – le persone ragionevoli si stabiliscono in posti dove le attività cooperative sono benefiche e l’integrazione di mercato è possibile - non è convincente). Il suddetto processo di trasmissione culturale rappresenta una descrizione di come la struttura economica può impattare sulle preferenze. Negli ambienti che offrono ampie opportunità di produzione cooperativa, le persone ragionevoli guadagnerebbero payoff più alti di quelle che seguono solo le proprie preferenze. Di conseguenza, il processo di aggiornamento culturale favorisce la ragionevolezza in quelle società, più che in altri posti, in cui gli esclusi dalla cooperazione non sopporterebbero nessun costo materiale. Il processo di aggiornamento spesso riguarda istituzioni di socializzazione, e soprattutto metodi per allevare bambini. Dunque ci aspetteremmo che le modalità con le quali sono allevati i bambini varino con le esperienze economiche. L’impatto della attività principale di sostentamento sull’allevamento del bambino nelle società industriali avanzate è stato menzionato alla fine del Capitolo 8. Si tratta di un esempio rilevante del processo di cambiamento delle preferenze nella transizione dal foraggio all’allevamento. Herbert Barry, Margaret Child e Irvin Bacon (1959) hanno categorizzato 70 società, per lo più non letterate, in base alla forma prevalente di attività (allevamento, agricoltura, caccia e pesca) e la relativa facilità di conservazione del cibo, o altre forme di accumulazione della ricchezza, dato che questo rappresenta un fattore notevolmente legato alla struttura e alla stratificazione sociali. La conservazione del cibo è diffusa nelle società agricole ma non tra i foraggieri. Gli autori hanno anche raggruppato l’evidenza sulle forme di allevamento del bambino, tra cui l’educazione all’obbedienza, l’autonomia, l’indipendenza e la responsabilità. Hanno trovato grosse differenze nelle pratiche di allevamento. Queste variavano molto con la struttura economica, influenzando altre misure della struttura sociale come l’unilateralità della prole, la misura della poligamia, i livelli di partecipazione delle donne dall’attività predominante di sussistenza, la dimensione delle unità di popolazione. Gli autori conclusero “la conoscenza dell’economia in sé consentirebbe di predire con molta accuratezza se le pressioni di socializzazione di una società siano principalmente verso l’obbedienza o l’affermazione” p.59). La relazione causale difficilmente va dall’allevamento del bambino alla struttura economica, dato che questa ultima, nel 9
Una presentazione più completa di metodi, risultati ed interpretazioni di questi esperimenti si trova in Henrich, Boyd, Bowles, Fehr e Gintis (2004) e Henrich, Bowles, Boyd, Fehr, Camerer, Gintis e McElreath (2001).
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|19
campione di società semplici studiate, è determinata principalmente dalla geografia. I modelli introdotti fino ad ora suggeriscono il seguente nesso causale. La produzione e la distribuzione di beni e servizi, in ogni società, è organizzata da un insieme di regole, tra cui l’allocazione di proprietà, imprese e altre organizzazioni, allocazioni patriarcali e altre usanze basate sul genere, età e affinità (che per esempio, si riscontrano all’interno delle famiglie), dono, furto, contrattazione e, naturalmente, i mercati. Queste regole di allocazione, insieme ad altre regole, determinano cosa si debba o non si debba fare per acquisire il proprio sostentamento. Queste regole influenzano anche lo stesso processo di trasmissione culturale, per cui, per esempio, una complessa divisione del lavoro rappresenta un notevole impulso all’introduzione dell’istruzione moderna (e obbligatoria). Le istituzioni economiche quindi impongono precisi schemi di interazione sulle persone che compongono una società, influenzando chi incontra chi, a quali condizioni, per fare cosa, e con quali aspettative di guadagno. Queste allocazioni e regole di trasmissione culturale influenzano il processo con cui le persone aggiornano il loro comportamento, che ha a che fare con personalità, abitudini, gusti, identità, valori e credenze. Fino ad ora ho modellato il modo in cui le preferenze possono evolversi in risposta a differenze istituzionali; ma le istituzioni stesse si evolvono. Il modello e la simulazione che seguono esplorano questo processo co-evolutivo. In pratica, intendo fare chiarezza su una transizione storica di piccole dimensioni e poco compresa: l’eclissarsi delle strutture sociali collettiviste tipiche dei gruppi foraggieri, in favore dei sistemi agricoli basati sui diritti di proprietà individuali.
G L I E Q U IL IB R I
DI
HOBBES
E DI
ROUSSEAU
Per gran parte della storia dell’umanità – più o meno dai 90000 ai 110000 anni fa – le interazioni sociali erano organizzate senza l’aiuto di nessuna istituzione che potesse anche solo lontanamente somigliare agli Stati contemporanei o alla proprietà privata. I gruppi mobili dediti al foraggio, che costituivano allora la tipica forma di organizzazione sociale umana, non sembravano soffrire il caos dello stato di natura Hobbesiano. Piuttosto, molto probabilmente, erano organizzati in una maniera simile ai contemporanei cacciatori-raccoglitori mobili, con vite regolate da regole sociali (spesso includendo monogamia e condivisione delle risorse), il cui enforcement era garantito dalla punizione collettiva di quelli che non le rispettavano. Christopher Boehm (1982:421) scrive:
20 | MICROECONOMIA
In queste …comunità, la sanzione di gruppo è emersa come lo strumento più potente per la regolazione dei comportamenti legati alla soddisfazione personale, in particolare, quelli che disturbavano la cooperazione e l’equilibrio sociale necessari alla stabilità.
Con l’avvento dell’agricoltura, all’incirca undici millenni fa, la richiesta del rispetto dei diritti di proprietà individuali diventò più comune soprattutto sulla terra e sul bestiame. Questi nuovi diritti di proprietà emersero e si diffusero senza l’assistenza di Stati o di altre agenzie centralizzate di controllo. Solo alla fine (diversi millenni dopo l’avvento dell’agricoltura), le forme centralizzate di punizione e di controllo sui diritti di proprietà cominciarono ad emergere come una nuova forma di organizzazione. Questo è senz’altro uno dei più importanti casi testimoniati di evoluzione istituzionale. Il modello che segue riguarda quella che io chiamo la prima rivoluzione dei diritti di proprietà (considererò la nascita dello stato moderno nel capitolo 13). Si supponga che n membri di un gruppo dedito al foraggio siano accoppiati a caso per dividere un bene il cui valore è v . Possono adottare tre strategie: Usurpare, Condividere, e Punire10. Il tipo di un individuo non è direttamente osservabile, e dunque è sconosciuto prima che avvenga l’interazione. Quando i Condivisori si incontrano, dividono equamente il bene. Quando gli Usurpatori incontrano i Condivisori, si impossessano del bene; quando si incontrano tra di loro litigano, guadagnando il bene o sopportano il costo della sconfitta, c > v , con uguale probabilità. Quando i Punitori incontrano i Condivisori, o altri Punitori, dividono il bene equamente. Tuttavia, quando un Punitore è in coppia con un Usurpatore, tutti i Punitori cercano di punire l’Usurpatore. Se hanno successo, il bene è distribuito il parti uguali tra tutti i Punitori, mentre se non hanno successo, il Punitore sopporta il costo della sconfitta c . La strategia della punizione è collettiva, nel senso che gli altri Punitori aiutano ogni Punitore accoppiato con un Usurpatore, e il risultato è che la probabilità di punire con successo un Usurpatore dipende dalla frazione di Punitori nella popolazione. Per semplificare la presentazione seguente, assumo che la probabilità di punire con successo un Usurpatore corrisponde alla frequenza nella popolazione dei Punitori, . Nella simulazione adotto un’ipotesi molto meno semplificativa. Dato che il Punitore ottiene v / n se ha successo, il che avviene con probabilità , il payoff atteso di un Punitore accoppiato con un Usurpatore è: ( p,g) = 10
v (1 )c n
Questo gioco sarà riconosciuto come una modifica del gioco Falco-Colomba, dove l’innovazione è rappresentata dalla strategia della punizione.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|21
Tabella 11.1. I Payoff nel Gioco della Punizione (Con il payoff del giocatore nella riga)
Usurpare
Condividere
v
Punire
Usurpare
(v-c)
(1-)v – c
Condividere
0
v
v
Punire
v/n-(1-)c
v
v
(al momento considero la distribuzione dei guadagni dagli altri Punitori di successo). Dunque, i payoff sono rappresentati dalla Tabella 11.1. Se è la frequenza nella popolazione dei Condivisori, i (n 1) altri Punitori di successo in una interazione con un Usurpatore saranno (n 1)(1 ) . Ogni Punitore riceverà v / n da ognuno di questi, quindi i Punitori riceveranno un ammontare atteso (n 1)(1 )
v 1 = (1 )v
n n
dalla redistribuzione dei compagni Punitori. I payoff attesi di queste tre strategie quindi sono: v 2 v = ( + ) + (1 )(v (1 )c) 2 v c = v + {(1 )v c} + (1 ) 2 = ( + ) c
(11.5)
p
(11.6)
u
(11.7)
Una buona rappresentazione dello spazio per questo sistema è la Figura 11.2.
Si supponga che le tre strategie siano dei tratti culturali, appresi da altri, e che la trasmissione culturale sia basata su questi payoff con un processo monotonico di aggiornamento. Si assuma che n sia sufficientemente grande in modo che i payoff realizzati siano approssimati dai payoff attesi. Dunque abbiamo d = ( ) dt d = ( ) dt c
(11.8)
p
(11.9)
22 | MICROECONOMIA
Dove il payoff medio, , è + + (1 ) c
p
u
Cosa possiamo dire sui risultati che probabilmente verranno prodotti da questo sistema dinamico? Le dinamiche rappresentate dalle equazioni precedenti sono rappresentate nella Figura 11.4. I vettori indicano la direzione del movimento per una popolazione composta dalle frequenze date dal punto alla base delle frecce. Dunque, per esempio, nella regione IV e sono entrambe crescenti (le frecce sono dirette verso l’esterno dei vertici Tutti Condivisori e Tutti Punitori) mentre , la frazione degli Usurpatori, è decrescente. La figura rappresenta anche i luoghi lungo i quali le quote della popolazione sono stazionarie. Tutti Punitori
Tutti Condivisori
Tutti Usurpatori
Figura 11.2 La distribuzione delle strategie in un gruppo. All’altezza d, la lunghezza del segmento perpendicolare ad ogni estremo rappresenta la frequenza della strategia indicata al vertice opposto all’estremo; questi segmenti hanno somma unitaria. Dunque ai vertici la popolazione è omogenea.
Due tipi di risultati stazionari sono di particolare interesse. Nel primo, = 0 , =1 v /c (e = v /c ). Questo risultato, il punto b nella figura, è analogo al familiare equilibrio del gioco Falco-Colomba, ed è asintoticamente stabile. I Punitori non possono invadere questa popolazione. I Punitori non fanno meglio dei Condivisori quando interagiscono con questi, e fanno molto peggio degli Usurpatori quando interagiscono con questi (litigano sempre e quasi sempre perdono). Chiamerò questo un equilibrio Hobbesiano, perché è caratterizzato da frequenti litigi sulla proprietà, e come Hobbes concluse nella citazione iniziale al capitolo 4, da un conseguente basso livello di payoff medi.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|23
Tutti Punitori
Nota: la regione V è la piccola area al di sotto di = 0
Tutti Condivisori
Tutti Usurpatori
Figura 11.3 Dinamiche all’interno del gruppo. I vettori indicano la direzione del movimento nelle regioni definite dai luoghi in cui , e sono stazionari.
Il secondo risultato stazionario nell’insieme dei risultati in cui + =1 e < (0,1) , è indicato dal punto a nella Figura 11.3. Dato che questo equilibrio combina la condivisione incondizionata e il sostegno collettivo alle norme sociali ammirato da Jean-Jacques Rousseau, lo chiamerò Rousseauviano. Di particolare interesse sono gli stati nella parte superiore di questo bordo, ovvero quelli per i quali < max , il punto indicato da a nella figura 11.3. Ognuno di questi punti è un equilibrio di Lyapunov (neutralmente) stabile, cioè, è stazionario ma le perturbazioni non sono auto-correttive. Ogni risultato in questo insieme non può essere invaso dagli Usurpatori (o da ogni strategia mista sostenuta dall’Usurpazione). Questo perché, per < e + =1, < = . Ma se non si ha nessun comportamento di reazione non ottimale, questi equilibri tendono ad essere trascinati verso il basso lungo la frontiera del simplex. Il trascinamento si presenta perché i Condivisori e i Punitori sono da un punto di vista comportamentale non distinguibili in assenza degli Usurpatori. max
max
u
c
p
L A S E L E Z I O N E D E L L ’ E Q U IL IB R IO ( D E L T I P O C A C C IATO R E -R A C C O G L ITO R E ) Quali di questi equilibri ci aspetteremo di ottenere? Tutto ciò che si può dire in assenza di un gioco di risposte non ottimali è che il risultato dipende dalle condizioni iniziali. Per rispondere alla domanda in un contesto più realistico, dobbiamo estendere il modello e prendere in considerazione gli eventi fortuiti. Questi potrebbero essere
24 | MICROECONOMIA
mutazioni (se consideriamo i tratti comportamentali come espressione dell’eredità genetica) o qualche altro tipo di risposta non ottimale, cioè, azioni intraprese per ragioni non considerate nel modello, tra le quali sperimentazione ed errori. Dato che le tre strategie nel modello rappresentano tratti comportamentali, le azioni di risposta non ottimale prendono la forma di cambiamenti della propria strategia per ragioni non specificate nel modello. Formalizzerò questo processo nel prossimo capitolo, ma anche senza l’aiuto di un modello del processo stocastico, è chiaro che gli eventi fortuiti possono introdurre uno spostamento dall’area di un equilibrio verso il bacino di attrazione dell’altro. Se si considerano gli eventi fortuiti, nel modello fino ad ora sviluppato l’equilibrio Rousseauviano non persisterà a lungo. Si supponga che =1, e quindi che ci siano solo i Punitori. Dato il gioco di risposta non ottimale, sia gli Usurpatori che i Condivisori saranno introdotti nella popolazione. Gli Usurpatori perderanno in teoria tutte le loro battaglie, dato che i Punitori sono numericamente superiori, e verranno dunque eliminati. Ma in una popolazione composta di soli Condivisori e Punitori, tutti condivideranno e, fatta eccezione per la possibilità di presenza fortuita di un Usurpatore, riceveranno lo stesso profitto. In base al saggio al quale gli eventi accadono, ci vorrà più o meno tempo per accumulare un numero sufficiente di Condivisori, in modo che gli Usurpatori possano invadere, dal momento che i Punitori sono troppo pochi per imporre abbastanza punizioni su di loro. In altre parole, la popolazione si sposterà lungo l’estremo a sinistra del simplex nella Figura 11.3, dopo il punto a, cioè nel bacino di attrazione dell’equilibrio Hobbesiano. Diversamente dall’equilibrio Rousseauviano, l’equilibrio Hobbesiano è asintoticamente stabile, e dunque non sarà soggetto allo spostamento indotto dal caso fortuito cui è soggetto il precedente. Ovviamente, anche l’equilibrio Hobbesiano si sposterà: prima o poi, un insieme di eventi fortuiti porteranno la popolazione verso il bacino di attrazione dell’equilibrio Rousseauviano. Ma il fatto che l’equilibrio Hobbesiano non è soggetto a trascinamenti significa che il suo spostamento sarà improbabile in ogni periodo, dunque sarà non frequente. La popolazione spenderà gran parte della storia dell’umanità nell’area dell’equilibrio Hobbesiano. Allora perché gran parte della storia dell’uomo ha dimostrato soluzioni sociali più vicine all’equilibrio Rousseauìvano? Cosa manca nel modello? Tre fattori possono contribuire al suo successo evolutivo. Primo, se i gruppi sono soggetti a periodiche avversità, sia in termini ambientali che di conflitti con altri gruppi, i gruppi con i rendimenti medi più alti sopravviveranno
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|25
con più probabilità. I rendimenti medi nell’equilibrio Rousseauviano sono v /2 , e nell’equilibrio Hobbesiano v(1 v /c) /2 , dunque i gruppi senza gli Usurpatori saranno favoriti (e quelli con gli Usurpatori saranno svantaggiati in proporzione alla frazione degli Usurpatori ( v c ) nella popolazione). Assumendo v = 2 e c = 3 , la Figura 11.4 rappresenta il payoff atteso medio di ogni composizione del gruppo nel simplex, dove i contorni indicano i luoghi di iso-payoff-medio. Se i gruppi con un payoff più alto si espandono alle spese dei gruppi con un payoff più basso, la direzione del cambiamento sarà quella indicata dalle frecce, cioè non verso lo stato di Tutti Punitori, ma piuttosto verso l’estremo sinistro, dove non ci sono Usurpatori e i payoff medi sono massimizzati. Secondo, la trasmissione culturale conformista andrà in senso contrario al trascinamento, rendendo l’esito Tutti Punitori asintoticamente stabile. In teoria, se tutti i membri sono Punitori, anche un debole conformismo sarà sufficiente ai Condivisori per essere eliminati, perché i payoff per la condivisione e la Punizione sono uguali in assenza degli Usurpatori. Infine, in prossimità dell’equilibrio Rousseauviano, i Condivisori e i Punitori sono distinguibili perché l’Usurpatore che capita per caso, fornirà ai Punitori una opportunità di punizione collettiva. Il Condivisore (anche questo raro) si asterrà dalla punizione collettiva, approfittando dell’attitudine civica dei Punitori. Ma date le capacità umane di costruire e mettere in pratica codici di condotta morale (già praticati dai Punitori contro gli Usurpatori), è chiaro che i Condivisori che non puniscono saranno anch’essi puniti. Quando si aggiunge questa cosiddetta punizione di secondo ordine, l’equilibrio Rousseauviano diventa asintoticamente stabile, anche se il costo imposto sui Condivisori che approfittano è limitato, per esempio, ad un breve allontanamento o ad una porzione più limitata di cibo. Il motivo, come nel caso del conformismo, è che la punizione di secondo ordine non ha bisogno di innescare la selezione contro i Punitori; deve solo prevenire la deriva11.
11
Ci sono altre ragioni per cui l’equilibrio Rousseauviano potrebbe persistere. Non è realistico ipotizzare che la grandezza o altre caratteristiche del premio siano lineari, piuttosto che concavi, rispetto all’ammontare acquisito. Ciò non è vero in particolare per la caccia di un grosso animale, dato che il premio singolo – per esempio un antilope - può rappresentare abbastanza cibo per tutti i membri del gruppo in una forma che non è facilmente conservabile. Questa è la base dell’interpretazione del “furto tollerato” di Blurton-Jones (1987) sulla condivisione di grosse quantità di cibo nelle società semplici. Considerare la concavità dei rendimenti, ridurrebbe i rendimenti degli Usurpatori, e promuoverebbe i rendimenti dovuti alla condivisione dell’animale (Condividere o Punire).
26 | MICROECONOMIA
Tutti Punitori
Tutti Condivisori
Tutti Usurpatori
Figura 11.4 Payoff medi e dinamiche tra i gruppi. I contorni indicano le distribuzioni delle tre strategie nella popolazione per cui il livello del payoff medio di gruppo è lo stesso. Le frecce indicano la direzione della crescita. Il payoff medio di gruppo più alto v /2 =1 si presenta quando non ci sono Usurpatori (estremo a sinistra). Quindi un gruppo di composizione a (molti condivisori, pochi usurpatori e punitori) avrà payoff più alti del gruppo b con molti punitori, pochi usurpatori e pochi condivisori. Si noti i) che un gruppo con una maggioranza di punitori come c avrà payoff più bassi di un gruppo in equilibrio usurpatore-condivisore d; ii) la superficie è virtualmente piatta nei dintorni della distribuzione tutti condivisori. Le coordinate dei punti indicati sono (1 , , ) : [a=(0.15, 0.70, 0.15), b=(0.16, 0.29, 0.55), c=(0.33, 0.12, 0.55), d=(0.66, 0.34, 0)]
La punizione di secondo ordine, il destino condiviso dai membri del gruppo di fronte alle avversità, e la trasmissione culturale conformista rendono plausibile che gli equilibri Rousseauviani possano persistere per lunghi periodi di tempo, anche millenni, ovvero, fino all’arrivo dell’agricoltura. Richerson, Boyd e Bettinger (2001) dimostrano che un notevole miglioramento della variabilità climatica circa 12 millenni fa, ha trasformato la coltura delle piante e l’allevamento degli animali, da attività in precedenza “impossibili”, ad attività che nel lungo periodo divennero “necessarie”. Ma la nuova tecnologia non ha potuto essere utilizzata nell’ambiente istituzionale dei tipici gruppi foraggieri. Un ostacolo significativo fu la mancanza di diritti di proprietà individuale sulla carne, le altre risorse commestibili di grande dimensione e la terra, e il principio della divisione egualitaria. Un esempio dal passato recente di un gruppo di foraggieri in Malesia mostra il problema:
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|27
Le nozioni tradizionali Batek per cui tutte le risorse naturali non sono possedute fino al momento in cui sono messe insieme e per cui tutto il cibo ottenuto in eccesso rispetto ai bisogni della famiglia di chi l’ha procurato deve essere condiviso con le altre famiglie sembra molto adatta ad una vita foraggiera nomade, ma completamente inadatta a …l’allevamento stanziale… abbandonare quell’insieme di idee e pratiche sarebbe psicologicamente una cosa molto difficile da fare per loro dato che l’obbligazione di condividere il cibo è uno dei componente principali dell’identità Batek e uno dei vincoli principali che legano le famiglie Batek insieme in una società. (Endicott, 1988:126127)
Endicott riporta che alcuni Batek piantavano il riso e altri (sempre foraggieri) semplicemente lo raccoglievano (ovviamente, sentendosi obbligati a condividere il raccolto con quei foraggieri che arrivavano troppo tardi), costringendo alcuni degli allevatori Batek ad abbandonare l’area. Dato che l’agricoltura si sviluppa da una intensificazione del raccolto piuttosto che dalla caccia, la sua emergenza ha avuto un impatto sulla divisione del lavoro tra i sessi. Nell’America Sud-Ovest, i gruppi il cui ordine sociale rimaneva orientato esclusivamente alle attività maschili come la caccia, furono sostituiti da gruppi che adattarono le loro istituzioni in modo da essere meglio in grado di sfruttare il maggiore potenziale produttivo di quello che storicamente era stato il “lavoro delle donne” (Bettinger e Baumhauf, 1982). Il caso Batek suggerisce che lo sviluppo dell’agricoltura dipende dall’emergere dei diritti di proprietà individuale sui raccolti, gli animali addomesticati e la terra. I diritti di proprietà ora sono riconosciuti dagli Stati: ma la proprietà individuale si è affermata e si è diffusa prima che si affermasse il riconoscimento centralizzato dei diritti. Come è stato possibile? Sembra plausibile che, se l’esempio Batek si riproponesse in molti casi, una nuova strategia potrebbe emergere e diffondersi: comportati come un Usurpatore se possiedi qualcosa, e come un Condivisore se non possiedi nulla. Questa è chiaramente la strategia Borghese nel gioco Falco-Colomba presentato nel capitolo 3. Si ricordi che la strategia Borghese è evolutivamente stabile e può invadere l’equilibrio Hobbesiano, creando un nuovo equilibrio asintoticamente stabile (con nessun Punitore, Usurpatore e Condivisore presente) che chiamerò Borghese. Nella misura in cui il possesso non è ambiguo, in questo equilibrio non ci sono litigi, quindi i payoff medi sono v /2 . Come si è visto nel capitolo 2, se la proprietà è contestata la strategia Borghese diventa indistinguibile dall’Usurpazione. Se qualcosa di simile alla strategia Borghese non fosse emerso, sembra difficile pensare che l’agricoltura si sarebbe diffusa così velocemente come è stato. Ma se l’equilibrio Borghese è così positivo, il lettore può chiedersi, perché non si è
28 | MICROECONOMIA
affermato prima dell’avvento dell’agricoltura? Una risposta possibile è che l’agricoltura ha reso il possesso non ambiguo: è molto più facile determinare se questo insieme di terre coltivate è di mia proprietà o no, che sapere chi possiede la preda che si sta inseguendo. La proprietà di un territorio foraggiero vasto, con popolazione umana sparsa, sarebbe ugualmente difficile da definire e sostenere. Abbiamo visto (nel capitolo 2) che se i diritti di proprietà sono sufficientemente non ambigui, la strategia borghese non è più un SES. Sembra plausibile che una economia di cacciatori e raccoglitori abbia combattuto molto contro il successo della strategia Borghese, mentre l’agricoltura ha creato le condizioni per il suo successo. Inoltre, l’agricoltura ha favorito l’equilibrio Borghese in altri due modi. Primo, diversamente dalla carne e da molti dei cibi raccolti, il grano ed altri cereali potevano essere conservati ad un costo relativamente contenuto. Ciò rese la relazione tra ricchezza o altri valori dei payoff e l’ammontare del premio ottenuto più lineare. Non solo la conservazione, ma anche l’accumulazione divenne possibile. Questa linearizzazione dei benefici ha ridotto i vantaggi intrinseci del condividere. Fu possibile auto-assicurarsi contro gli eventi futuri avversi attraverso la conservazione, piuttosto che confidare nella condivisione reciproca per attenuare i capricci dell’economia foraggiera. Secondo, con l’equilibrio Borghese, anche se i vantaggi in termini di produttività dell’agricoltura possono non essere stati riconosciuti inizialmente, i successivi progressi nella produttività dell’agricoltura permisero a quelle comunità che la avevano adottata, di crescere e sopravvivere alle avversità dovute all’ambiente e al gruppo stesso, con una probabilità più elevata rispetto ai gruppi foraggieri. La diffusione dei diritti di proprietà borghesi ha gradualmente eclissato gli ordini sociali di tutti i gruppi foraggieri tranne poche eccezioni, che arrivarono ad occupare delle nicchie ambientali protette e molto più confinate. La grande precisione con cui la proprietà poteva essere definita nelle società agricole, insieme alla riduzione dell’abilità dei membri delle comunità semplicemente di muoversi per evitare la punizione, ha permesso una codificazione più efficace e l’enforcement da parte di terzi dei diritti di proprietà. Allo stesso tempo, l’incremento delle disuguaglianze tra i membri della comunità (favorito dall’abilità di accumulare ricchezza) ha prodotto interessi economici più differenziati tra le famiglie e può aver reso le forme multilaterali di applicazione della norma più difficili. La risultante crescita delle istituzioni centralizzate di enforcement (proto-Stati) alla fine ha ridotto il ruolo del monitoraggio reciproco e dell’enforcement tra pari.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
U N M O D E L L O A D A G E N T I ( A G E N T- B A S E D ) R IV O L U Z IO N E D E I D I R I T T I D I P R O P R I E T À
DELLA
|29
P R IM A
Le argomentazioni fornite fino ad ora, sebbene coerenti con le informazioni sui fatti rilevanti, sono incomplete da un punto di vista importante: non ho dimostrato che il modello della struttura sociale delle bande foraggiere potrebbe aver persistito nel lunghissimo termine, sotto condizioni ambientali e non, che assomiglino a quelle degli albori dell’esistenza umana. Non ho neppure dimostrato che le influenze causali che si applicano, avrebbero portato una rivoluzione nei diritti di proprietà sotto queste condizioni empiriche. Questo è un compito difficile, non solo a causa della scarsità dei dati, ma anche perché il processo è troppo complicato per essere modellato analiticamente, soprattutto se si considera il ruolo degli eventi fortuiti. Anche limitando la nostra attenzione ad un singolo gruppo, non possiamo dire molto altro se non che ci sono tre equilibri (considerando il continuo di Condivisori e Punitori come un solo equilibrio), uno dei quali è instabile, uno che è asintoticamente stabile (l’equilibrio Borghese) e l’altro (il Rousseauviano) che è solo neutralmente (Lyapunov) stabile, e dunque soggetto a scostamenti. Ci piacerebbe poter rispondere a domande del tipo: se osservassimo dieci gruppi del genere, per un periodo lungo, in quale momento la popolazione sarà in prossimità di un equilibrio Borghese o piuttosto di un equilibrio Rousseauviano? Se un gruppo si trova in equilibrio Rousseauviano, quanto ci vorrà prima che eventi casuali introducano abbastanza Condivisori nella popolazione, in modo da renderla vulnerabile alla predominanza di un Usurpatore o di un Borghese? Allo stesso modo, quanto ci vorrà in media prima che una popolazione in equilibrio Borghese si sposti verso il bacino di attrazione dell’equilibrio Rousseauviano? Perché, come penso sia in effetti successo nei primi anni della nostra specie, l’equilibrio Rousseauviano prevalse per un lungo periodo, fino ad essere sostituito quasi ovunque da un equilibrio Borghese? Sappiamo che se i diritti di proprietà sono in qualche modo ambigui, l’equilibrio Rousseauviano consente payoff medi più alti, ma è più suscettibile a spostamenti dovuti ad eventi fortuiti (trascinamenti) dell’equilibrio rispetto al meno efficiente ma più robusto (perché asintoticamente stabile) equilibrio Borghese. Se i gruppi interagiscono, e i gruppi più potenti sostituiscono i gruppi più deboli, in che modo il processo di selezione al livello del gruppo condiziona la distribuzione dei comportamenti nella popolazione? I vantaggi in termini di payoff dell’equilibrio Rousseauviano risulteranno in sufficienti vittorie dei gruppi Rousseauviani sui gruppi Usurpatori-Condivisori, così che i vantaggi in termini di robustezza dell’equilibrio Usurpatore-Condivisore saranno
30 | MICROECONOMIA
più che compensati, e i gruppi Rousseauviani potranno predominare? In che modo la migrazione tra i gruppi condizionerà il risultato? E il perfezionamento dei diritti di proprietà basati sul possesso associato all’affermazione dell’agricoltura, alla fine, distruggerà le comunità Rousseauviane? La complessità matematica del modello è portata all’estremo soprattutto dal fatto che sono all’opera sia eventi stocastici che processi di selezione tra i gruppi e all’interno del gruppo. Nel prossimo capitolo, svilupperò il concetto di uno stato stocasticamente stazionario, per studiare i processi evolutivi sotto l’influenza di variazioni stocastiche nel comportamento. Nel capitolo 13, presenterò un utile strumento analitico – l’equazione di Price (dal nome del biologo teorico Gorge Price; niente a che fare con i prezzi) – per studiare il processo di selezione multi-livello. Ma nessuno di questi strumenti analitici è del tutto adeguato. L’unico modo pratico di rispondere alle suddette domande è di simulare una società artificiale, con caratteristiche che si avvicinano ai gruppi e alle ecologie degli albori della storia umana. La simulazione fornisce dei suggerimenti su processi evolutivi, che sono talmente complicati, che i modelli matematici non conducono a soluzioni analitiche illuminanti (o nella maggior parte dei casi, non conducono a nessuna soluzione). I due obiettivi principali della simulazione sono vedere se qualcosa di simile all’equilibrio Rousseauviano avrebbe potuto persistere per molti millenni prima di 11000 anni fa, ed esplorare gli effetti dell’aumento della certezza della proprietà in questo ordine sociale. Per perseguire il primo obiettivo, studierò una popolazione di Condivisori, Usurpatori e Punitori e successivamente introdurrò l’alternativa Borghese. La nostra società artificiale è composta di individui – Condivisori, Usurpatori e Punitori – che vivono in gruppi12 (I Borghesi saranno introdotti successivamente). Tra i gruppi, gli individui interagiscono seguendo il gioco precedentemente descritto (con piccole modifiche che vanno descritte); e interagiscono anche con i membri degli altri gruppi, quando i gruppi arrivano al conflitto sulle risorse o per qualche altra ragione. L’interazione è la seguente. Durante ogni periodo (una generazione), ognuno dei 20 membri di un gruppo è accoppiato a caso con un altro membro per giocare il gioco Usurpatore-Condivisore-Punitore. Ogni membro gioca il gioco (ogni volta con un partner diverso) un certo numero di volte in una generazione (nella maggior parte delle simulazioni, cinque). Se un Punitore e un Usurpatore si incontrano, la probabilità di 12
Le simulazioni sono state effettuate da Bowles e Jung-Kyoo Choi (2002). Il codice è disponibile presso http://www.santafe.edu/bowles (nella sezione “artificial histories”).
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|31
vittoria del Punitore dipende da n , il numero dei Punitori nel gruppo (chi si associa nel punire l’usurpatore) e dal numero degli usurpatori, u , con la probabilità di vittoria dei Punitori pari a n /(n + u) dove [0,1/2] è il vantaggio che il singolo Usurpatore ha nel resistere alla punizione collettiva (si noti che se = 0 , un solo Punitore che combatte con un singolo Usurpatore avrebbe una possibilità di vittoria uniforme. Questa e altre piccole modifiche del modello teorico sono state introdotte perché qualcuna delle assunzioni adottate per mantenere il modello teorico analiticamente trattabile sono irrealistiche. Assunzioni più plausibili sono introdotte facilmente nel modello di simulazione). Come nel caso precedente, se i Punitori vincono, si dividono il premio, v . Il modello ad agenti può consentire una descrizione molto più dettagliata del processo di trasmissione culturale: Assumiamo che i membri del gruppo vivano per sempre, ma che di tanto in tanto affrontino un periodo (lo si chiami adolescenza) durante il quale possono adottare dei comportamenti nuovi. Una volta per ogni generazione – dopo che tutti i giochi sono stati giocati – ogni membro è accoppiato ad un modello culturale, per esempio un insegnate, un capo religioso, o un concorrente. Questo processo di accoppiamento riflette il modo in cui il gruppo socializza i suoi membri. Se il modello e il membro sono dello stesso tipo, il membro semplicemente mantiene i suoi tratti. Se questi hanno tratti diversi, allora il membro confronta il suo payoff totale di questo periodo con il payoff del modello, e assume il tratto del modello se il payoff del modello è più alto. La regola di accoppiamento introdurrà il conformismo nel processo di trasmissione, se ogni membro dei gruppi più numerosi ha più probabilità di altri di essere trascinato da un modello culturale. Per permettere ciò, fissiamo la probabilità che un Condivisore sia trascinato da un modello culturale come + +
dove > 0 è una misura della trasmissione culturale distorta (biased). La probabilità che un Usurpatore o un Punitore sia trascinato per l’insieme del modello culturale è calcolata in modo simile. Come si può vedere dalla figura 11.5, per >1, l’influenza è conformista con i gruppi più ampi che contribuiscono più che proporzionalmente all’insieme dei modelli culturali. Per =1 l’accoppiamento dei membri e dei modelli culturali è casuale (per <1 la tendenza è anti-conformista, con i gruppi più ampi che contribuiscono meno che proporzionalmente all’insieme).
Probabilità di un individuo con tratti x di essere selezionato come modello cultuale
32 | MICROECONOMIA
Frequenza del tratto x all’interno del gruppo Figura 11.5 La trasmissione culturale distorta (biased). Il parametro determina la misura in cui i modelli culturali sono estratti in modo sproporzionato dai tipi più comuni. La figura mostra il grado di distorsione (bias) in un gruppo con due tipi.
I gruppi sono stati posti su un torus (un grafico a forma ciambella senza estremi, il che assicura che ogni gruppo abbia lo stesso numero di dintorni). In ogni generazione il gruppo inizia un conflitto con un vicino scelto a caso (La diffusione del conflitto fu forse molto maggiore; considererò l’evidenza della frequenza dei conflitti nel capitolo 13). Il gruppo con i payoff più alti vince il conflitto con una probabilità che aumenta con la differenze dei payoff tra i due gruppi. I payoff per i perdenti sono risolti e sono assimilati nel gruppo vincente13. Di conseguenza, i membri del gruppo vincente giocano un ruolo preminente nella socializzazione della futura generazione di perdenti. Modello questo fatto nel modo seguente. I modelli culturali per il gruppo perdente sono tutti presi dal gruppo vincente, in base ad una regola di accoppiamento data da un certo valore di . Dunque se il gruppo vincente è per lo più composto da Punitori e il gruppo perdente è composto da Usurpatori e Condivisori, in teoria tutti modelli culturali ai quali i perdenti saranno esposti saranno Punitori, quindi automaticamente nessuno nella generazione futura manterrà il tratto, ma tutti adotteranno un tratto basato sul confronto dei payoff. I vincitori di un conflitto si impossessano anche di alcune risorse del gruppo dei perdenti, per esempio occupando degli habitat privilegiati. Questo aspetto è 13
Questo modello si basa sullo studio dei processi di assimilazione storica come per esempio quello che avvenne tra i Dinka conquistati dai Nuer nel corso del 20° secolo e l’assimilazione delle culture locali europee nei stati nazionali che le sostituirono tra il 1500 e il 1900. Si vedano Weber (1976), Gellner (1983) e Kelly (1985).
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|33
modellato tramite una riduzione dei payoff di tutti i membri del gruppo perdente. I perdenti quindi soffrono due effetti dalla loro perdita, i quali aumentano entrambi la probabilità che essi assumano un tratto che è comune tra i vincitori: nella generazione in cui sono stati sconfitti gli sono stati assegnati modelli del gruppo vincente, e i loro payoff sono stati ridotti. La Struttura di Interazione (a) conflitto di gruppo, trasmissione con una propensione, punizione del 2° tipo (b) nessuna delle precedenti (c) trasmissione con una propensione e punizione del 2° tipo (d) conflitto di gruppo (e) conflitto di gruppo e trasmissione con una propensione (f) conflitto di gruppo e punizione del secondo ordine
18.8
72.0
9.2
0.72
31.5 12.9
8.6 7.1
60.0 79.9
0.30 -0.19
39.0 37.7 24.7
27.6 41.5 57.0
33.4 20.8 18.3
0.62 0.74 0.59
Tabella 11.2 Selezione dell’equilibrio: distribuzione media di strategie e payoff Le colonne indicate come , e danno la composizione media della popolazione totale, cioè la percentuale di Condivisori, Punitori, e Usurpatori, rispettivamente in 10 turni per un totale di 300,000 generazioni (for ogni entrata). Le sei strutture di interazione sono le stesse che nella Figura 11.7 Il payoff medio del gioco è . Il set di parametri per questi turni è come segue: ci sono 25 gruppi di 20 membri, i tassi di migrazione e di risposta idiosincratica sono entrambi 0,2 per ogni generazione, il conflitto fra i gruppi ha luogo ogni generazione, in ogni generazione vengono giocati 5 giochi, con =2, v = 2, c =3, = 0,2. a seguito di un conflitto fra Punitori e un Usurpatore, ogni Condivisone soffre una punizione di secondo ordine di 0,3, mentre i Punitori sopportano un costo dall’infliggere la punizione pari a 0,15, suddiviso fra tutti. il trasferimento di risorse dai gruppi perdenti ai vincenti successivo al conflitto è pari a 3 (che, comparato ad una differenza massima nei payoff di 25 per generazione può sottostimare le perdite economiche associate allo stato di conflittualità).
Jung-Kyoo Choi ed io abbiamo simulato questa dinamica. Per comprendere la possibilità dell’equilibrio Rousseauviano, abbiamo confrontato sistematicamente la distribuzione dei tipi nella popolazione totale sotto le diverse sei strutture di interazione sociale all’interno del gruppo e tra i gruppi elencate nella Tavola 11.2. La migrazione avviene tra i gruppi confinanti (il modello di integrazione cosiddetto “stepping stone”) mentre la dimensione dei gruppi si mantiene costante a 20. Il set di parametri per questi turni è come segue: ci sono 25 gruppi di 20 membri, i tassi di migrazione e di risposta idiosincratica sono entrambi 0,2 per ogni generazione, il conflitto fra i gruppi ha luogo ogni generazione, in ogni generazione vengono giocati 5 giochi, con = 2, v = 2, c = 3, = 0,2 . a seguito di un conflitto fra Punitori e un Usurpatore, ogni Condivisone soffre una punizione di secondo ordine di 0,3, mentre i Punitori sopportano un costo dall’infliggere la punizione pari a 0,15, suddiviso fra tutti. il
34 | MICROECONOMIA
trasferimento di risorse dai gruppi perdenti ai vincenti successivo al conflitto è pari a 3 (che, comparato ad una differenza massima nei payoff di 25 per generazione può sottostimare le perdite economiche associate allo stato di conflittualità). Abbiamo iniziato ogni simulazione con una distribuzione casuale di tipi in ogni gruppo. Per essere sicuri di aver catturato il comportamento medio di lungo periodo del sistema, abbiamo effettuato venti o trenta simulazioni di 10.000 generazioni per i risultati riportati (ciò ha assicurato che le condizioni iniziali o l’adesione occasionale di lungo periodo ad un certo equilibrio non influenzasse il nostro risultato. La Figura 11.6 rappresenta un esempio dei risultati principali; i gruppi a e b, rispettivamente, rappresentano specificazioni per cui la maggior parte dei gruppi era nei dintorni dell’equilibrio Rousseauviano e Hobbesiano.)
Figura 11.6. Selezione dell’equilibrio: risultati della simulazione. I simplex qui mostrati sono gli stessi della figura 11.3: il vertice superiore indica il risultato “tutti Punitori”, il vertice di sinistra indica il risultato “tutti Condivisori” e il vertice di destra indica il risultato “tutti Usurpatori”: ciascun simplex rappresenta una struttura distinta delle interazioni fra gruppi ed all’interno dei gruppi. I punti in ciascun simplex indicano la composizione di un gruppo in una generazione. Le strutture di interazione rappresentate in ciascuna immagine sono: (a) conflitto di gruppo, trasmissione culturale distorta (biased), punizione di secondo ordine; (b) nessuno degli elementi precedenti; (c) trasmissione culturale distorta (biased) e punizione di secondo ordine; (d) conflitto di gruppo; (e) conflitto di gruppo e trasmissione culturale distorta; e (f) conflitto di gruppo e punizione di secondo ordine. Le 5000 osservazioni qui riportate rappresentano la composizione di tutti i 25 gruppi in 200 generazioni consecutive selezionate in modo da corrispondere strettamente
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|35
alle composizioni medie delle 300.000 generazioni simulate per ciascun trattamento.
Quello che spiega la differenza nei gruppi a e b è che il primo era una simulazione che rappresentava la struttura delle interazioni sociali che io considero tipiche dei gruppi foraggieri nomadi: i conflitti nel gruppo, la punizione di secondo ordine, e la trasmissione culturale conformista. Al contrario, la simulazione nel gruppo b non includeva nessuno di questi aspetti di una società di cacciatori e raccoglitori. La Tabella 11.2, che riporta la media di 300.000 generazioni per ogni colonna, conferma l’impressione data dal campione dei dati nella Figura 11.6. Quando tutti e tre gli aspetti sono presenti, i Punitori costituiscono almeno tre quarti della popolazione in media, e quando tutti e tre sono assenti, gli Usurpatori costituiscono il 60 per cento della popolazione. I payoff medi sono più del doppio sotto la prima condizione. Il confronto di a e b suggerisce che questi tre aspetti di interazione sociale (o una qualche loro combinazione) hanno giocato un ruolo centrale nella considerevole persistenza dello stile di vita foraggiero. Per identificare il contributo di ognuno, abbiamo prodotto simulazioni con tutte le combinazioni possibili. Per esempio, quando la trasmissione culturale distorta (biased) e la punizione del secondo ordine sono all’opera, ma non ci sono conflitti di gruppo (figura c) una quota persino maggiore della popolazione è di Usurpatori, e i Condivisori sono in corrispondenza di meno. La ragione è che la trasmissione conformista favorisce gli Usurpatori mentre la punizione del secondo ordine dei Condivisori da parte dei pochi Punitori presenti riduce i payoff di entrambi i gruppi. Quando il conflitto di gruppo e la punizione di secondo ordine sono combinate senza trasmissione conformista (f), la popolazione oscilla tra i contorni degli equilibri Rousseaviano e Hobbesiano. Si noti che quando la popolazione è nel dintorni dell’equilibrio Rousseauviano, tipicamente è presente un numero consistente di Condivisori. Questo è in parte il risultato di un trascinamento lungo l’estremo sinistro del simplex, come già detto. Ed inoltre, il conflitto di gruppo favorisce di molto i gruppi con molto Condivisori (si ricordi il payoff medio di gruppo della figura 11.6). Un risultato sorprendente di questa selezione di gruppo è che la selezione di gruppo per se tende a destabilizzare l’equilibrio Rousseauviano accelerando il movimento verso il basso lungo l’estremo sinistro del simplex, spingendo i gruppi nel bacino di attrazione dell’equilibrio Hobbesiano. Al contrario, nelle simulazioni con la punizione di secondo ordine e la trasmissione conformista combinata con il conflitto di gruppo, gran parte dei gruppi è rimasta
36 | MICROECONOMIA
abbastanza vicina all’equilibrio Rousseauviano, così da evitare lo stravolgimento del suo ordine sociale. I gruppi occasionalmente presso l’equilibrio Hobbesiano sono allora eliminati dal conflitto di gruppo (si ricordi la differenza sostanziale dei payoff). Quando il conflitto di gruppo da solo è operativo, la popolazione è divisa quasi uniformemente, con una leggera preponderanza dei Condivisori, dato che i Punitori sono la più ridotta delle tre sub-popolazioni (Tabella 11.2). Alcune simulazioni non riportate indicano che se i conflitti di gruppo sono meno frequenti (uno ogni due o tre generazioni) l’equilibrio Rousseauviano si sostiene per gran parte del tempo, se la punizione di secondo ordine e la trasmissione culturale conformista ( = 2 ) sono all’opera. I risultati non risentono molto delle variazioni della grandezza del gruppo, dei saggi di risposta non ottimale e di migrazione. In che modo la riduzione dell’ambiguità dei diritti di proprietà associata all’introduzione dell’agricoltura e il contemporaneo apparire dei giocatori Borghesi modificano il quadro? Come si può sospettare, la risposta dipende da quanto efficaci sono i diritti di proprietà. Come nel capitolo 2, assumo che i diritti di proprietà possono essere non ambigui, nel qual caso la proprietà non è mai messa in dubbio, quindi due tipi Borghesi, quando si incontrano, non litigano mai. Ma i diritti di proprietà possono essere in dubbio, nel qual caso in qualche frazione di tempo, μ , il Borghese che si introduce crede di essere il proprietario (o si comporta in quel modo), provocando una lite con il Borghese proprietario. Per modellare questa nuova situazione, eliminiamo gli Usurpatori (sappiamo che il Borghese si comporta come un Usurpatore quando i diritti di proprietà sono confusi, e si comporterà meglio di un Usurpatore se i diritti di proprietà sono definiti almeno una volta, quindi sarebbero ad ogni modo eliminati dalle forze evolutive che stiamo modellando). Ma conserviamo i Condivisori, perché il loro ruolo nello svelare l’equilibrio Rousseauviano è una parte essenziale del processo evolutivo che si sta osservando. Frequenza di popolazione della borghesia
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|37
Conflitto di gruppo & trasmissione distorta
Conflitto di gruppo
Tutti( incluse le punzioni di 2°ordine)
Ambiguità dei diritti proprietari, μ (inversa) Figura 11.7 La prima rivoluzione dei diritti di proprietà. Ogni punto rappresenta la frequenza media in 20 simulazioni da 10.000 generazioni ognuna. Le simulazioni che combinano il conflitto di gruppo e la punizione di secondo ordine erano in teoria identiche a quella precedentemente mostrata che combina il conflitto di gruppo e la trasmissione distorta (biased).
Un modo per esplorare l’effetto del declino dell’ambiguità dei diritti di proprietà è quello di simulare la popolazione per le diverse combinazioni delle strutture di interazione all’interno del gruppo e tra i gruppi, per valori di μ che vanno da 1 (ambiguità totale) a 0. La Figura 11.7 presenta questi risultati. Dato che la strategia Borghese è identica alla completa ambiguità dei diritti di proprietà nella strategia dell’Usurpazione, la frazione Borghese nella simulazione con μ =1 ripete i risultati per la colonna degli Usurpatori nella Tabella 11.2. Quando il conflitto di gruppo, la trasmissione culturale distorta (biased) e la punizione di secondo ordine sono tutti all’opera, la frazione Borghese della popolazione rimane bassa fino a quando μ si riduce a metà o meno. Ma con dei miglioramenti addizionali alla definizione dei diritti di proprietà, la frazione Borghese aumenta moltissimo. Al contrario, quando solo il conflitto di gruppo è all’opera, anche piccole riduzioni nell’ambiguità dei diritti di proprietà comportano degli aumenti significativi nella frazione Borghese. Cosa si può concludere da queste simulazioni? Abbiamo imparato che per i valori dei parametri e la specificazione del modello adottata, l’equilibrio Rousseauviano è sostenibile sia contro l’equilibrio Hobbesiano che contro quello Borghese se i diritti di
38 | MICROECONOMIA
proprietà sono ambigui e la punizione di secondo ordine, la trasmissione conformista o il conflitto di gruppo sono all’opera. Inoltre a mano a mano che i diritti di proprietà diventano più certi (per via di un incremento della frazione del sostentamento di ciascuno che deriva dall’agricoltura e lo sviluppo di regole di proprietà), questi meccanismi non possono sostenere l’equilibrio Rousseauviano neanche quando essi sono tutti all’opera contemporaneamente. La rilevanza storica dell’ordine sociale modellato sotto il nome di equilibrio Rousseauviano, il ruolo critico dell’emergere dell’agricoltura e l’aumento della certezza della proprietà, sono fortemente suggeriti da queste simulazioni. Chiaramente ciò non significa che la rivoluzione dei diritti di proprietà sia avvenuta per le ragioni suddette. Questa e altre simulazioni possono solo dimostrare che potrebbe essere stato così14. Il modello ha sottolineato l’importanza di uno shock tecnologico esogeno nell’emersione dei diritti di proprietà individuali. La convinzione diffusa che la precedente addomesticazione di animali e piante abbia creato l’ambiente nel quale i diritti individuali potessero assumere un’aumentata importanza è sicuramente scorretta. Come suggerisce il caso degli sfortunati coltivatori di riso Batek, se qualcosa come il sistema egualitario e collettivista di diritti tipico dei gruppi foraggieri non avesse lasciato spazio ai diritti di proprietà individuali, è altamente improbabile che l’agricoltura sarebbe risultata un’alternativa allettante allo stile di vita foraggiero. La precoce trasformazione della dieta umana nel senso dell’inclusione di un maggior quantitativo di carne offre un altro esempio. Winterhalder e Smith (1992:60) scrivono: [S]oltanto con l’evoluzione della reciprocità o di trasferimenti di cibo basati sullo scambio diventò economico per cacciatori individuali cacciare prede di grandi dimensioni. Il valore effettivo di un grande mammifero per un cacciatore solitario...probabilmente non era sufficientemente elevato da giustificare il costo del tentativo di cacciarlo e catturarlo. ... Tuttavia, una volta che sistemi efficaci di reciprocità e scambio aumentarono il valore effettivo di prede molto grandi per i cacciatori, la probabilità di inclusione di tali prede nella dieta ottimale è aumentata.
Come per il caso dell’addomesticazione, il cambiamento tecnologico - cacciare prede di grandi dimensioni - non sembra precedere e causare il cambiamento culturale, piuttosto sembra che i due si siano sviluppati in contemporanea. Una spiegazione della prima rivoluzione dei diritti di proprietà che riconoscesse il ruolo della cultura nell’influenzare la rivoluzione tecnologica così come l’inverso, identificherebbe il cambiamento climatico come uno shock esterno, con la tecnologia (l’addomesticazione)
14
Questa spiegazione sarebbe più convincente se dovesse risultare difficile modellare e simulare scenari alternativi per la creazione delle transizioni storiche rilevanti, per l’insieme significativo dei parametri.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|39
e la cultura (nuovi diritti di proprietà) che coevolvono nella nuova e migliore ecologia15. Il modello può dunque offrire i nessi causali sottostanti all’affermazione che i diritti di proprietà basati sul possesso possono essere annoverati nella lista degli universali evolutivi proposta da Parson (discussa nel capitolo successivo) e allo stesso tempo rendere giustizia al suggerimento di Hayek che le istituzioni di mercato potrebbero essersi evolute attraverso la selezione culturale a livello di gruppo16. Ironicamente, il meccanismo causale all’opera nelle simulazioni e Marxiano in origine, visto che Marx è stato il primo a proporre la visione secondo la quale rivoluzioni della struttura sociale sono indotte da progressi tecnologici (si veda la citazione in apertura). Lo stesso meccanismo (sebbene con conseguenze meno rivoluzionarie) sembra essere stato all’opera in un insieme di transizioni fra sistemi di diritti di proprietà. gli esempi includono l’introduzione del filo spinato e il suo impatto sui diritti di proprietà nel Sudest degli Stati Uniti (Anderson e Hill, 1975) e l’impatto dei mulini ad acqua sui diritti ripari nel New England del diciannovesimo secolo (Horwitz, 1971). Oliver (1962) ci offre un’interpretazione analoga della trasformazione della struttura sociale degli Indiani delle pianure statunitensi a seguito dell’introduzione del cavallo. Ovviamente, se questo approccio generale all’evoluzione dei diritti di proprietà fosse corretto, non ci sarebbe alcuna ragione di dubitare che mutamenti tecnologici futuri possano condurre ad ulteriori trasformazioni dei diritti di proprietà, suggerendo che le implicazioni teleologiche che talvolta vengono lette nel lavoro di Parsons, Hayek e Marx sono fuori luogo.
C O N C L U S IO N E Sembra plausibile, dunque, che le preferenze e le istituzioni co-evolvano, le une influenzando lo sviluppo delle altre. La logica del modello delle preferenze endogene all’inizio del capitolo era quella di far assumere ad una data regola (anche inconscia) che si modifica – copiare i comportamenti che sono prevalenti e che hanno successo – il ruolo centrale ed esplicativo generalmente assegnato all’ottimizzazione consapevole delle preferenze date. La regola che si modifica, come la struttura delle interazioni sociali, 15
Richerson e Boyd (2001) propongono una simile interpretazione co-evolutiva della evoluzione della complessità sociale. 16 Il modello può anche offrire una base causale per la spiegazione, altrimenti funzionalista, dei diritti di proprietà offerta da Alchian e Demsetz (1973) e da altri lavori seminali del paradigma dei diritti di proprietà. Molti studi storici ed etnografici ispirati dalla scuola dei diritti di proprietà, tuttavia, offrono una persuasiva spiegazione delle modificazioni introdotte nei sistemi di diritti di proprietà. Fra gli studi di questo tipo che non sono stati citati altrove vi sono Davis e North (1971), Firmin-Sellers (1996), Umbeck (1977) e Libecap (1978).
40 | MICROECONOMIA
determina il modo in cui le preferenze evolvono. Le preferenze quindi sono endogene, con una regola esogena di aggiornamento ed una data struttura delle interazioni sociali che realizzano la funzione analitica che in un modello standard è svolta dalle preferenze esogene. Le istituzioni sono anch’esse endogene. Le preferenze determinano quali istituzioni sono realizzabili e possono perdurare. La distribuzione dei tipi comportamentali in una popolazione, come abbiamo visto nel capitolo 7, determina la distribuzione di equilibrio dei contratti. In questo capitolo, i cambiamenti esogeni nella tecnologia (la crescita dell’agricoltura, la possibilità di conservare il cibo) hanno giocato un ruolo importante nella promozione del cambiamento tanto delle istituzioni quanto delle preferenze, confermando la visione di Marx per cui “lo sviluppo delle forze materiali della produzione” è una delle forze dinamiche principali nella storia. Il motivo per cui, come Marx suggerisce, le istituzioni possano essere una forza di inerzia periodicamente sbloccata dal cambiamento tecnologico (piuttosto che il contrario) è una sorta di enigma. Una risposta possibile è che le istituzioni sono caratterizzate da alti livelli di complementarità strategiche, quindi anche se solo pochi membri di una popolazione adottano dei comportamenti adeguati ad una nuova convenzione istituzionale, molto difficilmente si trarranno dei benefici, nonostante la convenzione domini in termini di payoff lo status quo. Il fatto che la simulazione propone un raggruppamento attorno agli equilibri Hobbesiano e Rousseauviano (i gruppi a, b, c ed f della Figura 11.6) dimostra l’aspetto “tutto o niente” dell’evoluzione istituzionale. Al contrario, le nuove tecnologie possono a volte essere adottate lentamente, e gli individui che le adottano ottengono sostanziali vantaggi di payoff. Nel prossimo capitolo, modellerò questa inerzia istituzionale che deriva dalla complementarità strategica. Fornendo una spiegazione di come l’inerzia può a volte essere vinta, e del perché alcune istituzioni sono più resistenti di altre, affronterò la questione del perché alcune istituzioni sono generalmente più diffuse di altre.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|41
Riferimenti bibliografici Alchian, A. A. and H. Demsetz (1973). "The Property Right Paradigm." Journal of Economic History 33(1): 16-27. Anderson, T. and P. J. Hill (1975). "The Evolution of Property Rights: A Study of the American West." Journal of Law and Economics 18(1): 163-179. Barry, H. I., I. L. Child, et al. (1959). "Relation of Child Training to Subsistence Economy." American Anthrolpologist 61: 51-63. Bettinger, R. L. and M. Baumhauf (1982). "The numic spread: great basin cultures in competition." American Antiquity 47(3): 485-503,. Blurton-Jones, N., G. (1987). "Tolerated Theft, Suggestions about the Ecology and Evolution of Sharing, Hoarding, and Scrounging." Social Science Information 26(1): 31-54. Boehm, C. (1982). "The Evolutionary Development of Morality as an Effect of Dominance Behavior and Conflict Interference." Journal of Social and Biological Structures 5: 413-421. Bowles, S. (1998). "Endogenous Preferences: The Cultural Consequences of Markets and Other Economic Institutions." Journal of Economic Literature 36(1): 75111. Bowles, S. and J.-K. Choi (2002). The First Property Rights Revolution. Santa Fe Institute. Boyd, R. and P. J. Richerson (1985). Culture and the Evolutionary Process. Chicago, University of Chicago Press. Darwin, C. (1998). The Descent of Man. Amherst, N.Y., Prometheus Books. Davis, L. E. and D. C. North (1971). Institutional Change and American Economic Growth. Cambridge, Cambridge University Press. Endicott, K. (1988). Property, power and conflict among the Batek of Malaysia. Hunters and Gatherers. T. Ingold, D. Riches and J. Woodburn. New York, St. Martin's Press: 110-127. Feldman, M. W., K. Aoki, et al. (1996). Individual Versus Social Learning: Evolutionary Analysis in a Fluctuating Environment, Santa Fe Institute Working Paper 96-05031. Firmin-Sellers, K. (1996). The Transformation of Porperty Rights in the Gold Coast. Cambridge, Cambridge University Press. Gellner, E. (1983). Nations and nationalism. Ithaca, Cornell University Press. Hayami, Y. (1998). "Norms and Rationality in the Evolution of Economic Systems: A View From Asian Villages." The Japanese Economic Review 49(1): 36-53. Hayami, Y. and M. Kikuchi (1999). "Technology, Market, and Community in Contract Choice: Rice Harvesting in the Phillipines." Economic Development and Cultural Change 47(2): 371-386. Henrich, J. and R. Boyd (1998). "The evolution of conformist transmission and the emergence of between-group differences." Evolution and Human Behavior 19(4): 215-242. Henrich, J., R. Boyd, et al., Eds. (2004). Foundations of Human Sociality: Economic Experiments and Ethnographic Evidence in 15 Small-scale Societies. Oxford, Oxford University Press.
42 | MICROECONOMIA
Henrich, J., S. Bowles, et al. (2001). "In search of Homo economicus: behavioral experiments in 15 small-scale societies." American Economic Review 91(2): 7378. Horwitz, M. (1977). The Transformation of American Law. Cambridge, Harvard University Press. Kelly, R. C. (1985). The Nuer Conquest: The Structure and Development of an Expansionist System. Ann Arbor, University of Michigan Press. Labov, W. (1983). De Facto Segregation of Black and White Vernaculars. Lingiustics Laboratory, University of Pennsylvania. Leach, E. R. (1954). Political systems of highland Burma; a study of Kachin social structure. Cambridge,, Harvard University Press. Libecap, G. D. (1978). "Economic Variables and the Development of the Law: the Case of Western Mineral Rights." Journal of Economic History 38(2): 338 - 362. Lohmann, S. (1994). "Dynamics of Informational Cascades: The Monday Demonstrations in Leipzig." World Politics 47(1): 42-101. Mackie, G. (1996). "Ending Footbinding and Infibulation: A Convention Account." American Sociological Review 61(6): 999-1017. Mackie, G. (1999). Female Genital Cutting: The Beginning of the End. Oxford, St. John's College. Marx, K. (1904). A contribution to the Critique of Political Economy. Chicago, C. H. Kerr. Oliver, S. C. (1962). Ecology and Cultural Continuity as Contributing Factors in the Social Organization of the Plains Indians. Berkeley, University of California Press. Paulston, C. B. (1976). "Pronouns of address in Swedish: social class semantics and a changing system." Language Sociology 5(3): 359-86. Richerson, P. J. and R. Boyd (2001). Institutional Evolution in the Holocene: The Rise of Complex Societies. The Origin of Human Social Institutions. W. G. Runciman, Proceedings of the British Academy 110: 197-204. Richerson, P., R. Boyd, et al. (2001). "Was Agriculture Impossible During the Pleistocene but Mandatory During the Holocene? A Climate Change Hypothesis." American Antiquity 66(3): 387-411. Ross, L. and R. E. Nisbett (1991). The Person and the Situation: Perspectives of Social Psychology. Philadelphia, Temple University Press. Umbeck, J. (1977). "The California Gold Rush: A Study of Emerging Property Rights." Explorations in Economic History 14: 197-226. Weber, E. (1976). Peasants into Frenchmen: The Modernization of Rural France, 18701914. Stanford, Stanford University Press. Wilson, F. (1972). Labour in South African Goldmines. Cambridge, Cambridge University Press. Winterhalder, B. and E. A. Smith, Eds. (1992). Evolutionary Ecology and Human Behavior. New York, Aldine de Gruyter. Wood, E. J. (2000). Forging Democracy From Below: Insurgent Transitions in South Africa and El Salvador. Cambridge, Cambridge University Press.
EVOLUZIONE ISTITUZIONALE ED INDIVIDUALE
|43
XII C ASO , A ZIONE C OLLETTIVA , E I NNOVAZIONE I STITUZIONALE
Il problema centrale dell’evoluzione … risiede in quel meccanismo di tentativi ed errori attraverso il quale il locus in una popolazione può essere trasportato lungo una sella da un picco ad un altro arrivando forse in una posizione più alta. Questa visione è in contrasto con la concezione del progresso costante tramite selezione naturale … Da questo punto di vista considerare i mezzi con i quali il locus in una popolazione può essere portato attraverso questa sella può essere interessante. Sewall Wright, Journal of Genetics (1935)
Gli uomini fanno la propria storia, ma non la fanno in modo arbitrario, in circostanze scelte da loro stessi, bensì nelle circostanze … determinate dai fatti e dalla tradizione. La tradizione di tutte le generazioni scomparse pesa come un incubo sul cervello dei viventi. Karl Marx, Il 18 Brumaio di Luigi Bonaparte (1852)
Nelle lunghe lettere al Re di Spagna Carlo I, Hernán Cortés descrive i costumi esotici e inusuali che lui e la sua armata incontrarono durante l’avanzata verso Temistitan nel 1519. Ma alla luce dei tredici o più millenni che erano passati senza alcun prolungato contatto tra i popoli del Vecchio e del Nuovo Mondo, ciò che sorprende dal suo resoconto sul Messico è quanto tutto fosse familiare. Mentre raggiungeva Temistitan (la moderna Città del Messico), Cortés scrive: Nella città vi sono numerosissime piazze con mercati animati dal continuo viavai di commercianti. La piazza più grande è due volte quella della città di Salamanca. Interamente circondata da portici, dove ogni giorno tra compratori e venditori ci saranno più di sessantamila persone; lì vi è ogni genere di mercanzia … Ci sono in vendita molte varietà di filato di cotone in matassa di tutti i colori, che ricordano i mercati delle sete di Granada e che anzi li superano per quantità. Le cose sono vendute a misura e numero, ma, per quello che ho visto, mai a peso. In questa grande piazza c’è una sorta di palazzo della giustizia dove siedono dieci o dodici persone, giudici, che dirimono le diverse cause che riguardano il mercato … Sempre nella stessa piazza è possibile vedere delle persone che si aggirano nelle diverse strade e controllano attentamente la merce in vendita e in qualche occasione sono stati visti distruggere le misure false. (Cortes, 1987:109-10)1
1
Hernán Cortés (1987), La conquista del messico. RCS Rizzoli Libri: Milano.
2 | MICROECONOMIA
La struttura di classe Atzeca non presenta sorprese: Ci sono molti signori che risiedono nella città, mentre i contadini loro vassalli vivono nei villaggi e ciascuno possiede la propria terra. Alcuni ne hanno più di altri … E ci sono molti poveri che chiedono l’elemosina ai ricchi per le strade, nelle case e nei mercati, proprio come fanno i poveri in Spagna e negli altri paesi dove c’è gente generosa. (p. 72, 80)
Cortés continua, descrivendo “la città ricca di moschee e le case di idoli”, e commenta che “il loro modo di governarsi ricorda quello di Venezia, Genova o Pisa dove non esiste un capo assoluto.” (p. 72). Certi prodotti sociali – come mercati, stati, monogamia, proprietà privata, venerazione di entità soprannaturali, scala sociale, condivisione di beni necessari tra persone non legate da vincoli di parentela – sono stati molto diffusi per lunghi periodi della storia umana e sono emersi indipendentemente e sono perdurati in ambienti molto diversi. Altri di importanza transitoria sono generalmente presenti in limitate nicchie ecologiche. Alcuni studiosi, così come Cortés, restano impressionati dall’affinità delle istituzioni in ambienti così diversi e hanno postulato un insieme coerente di “moderni” modelli organizzativi verso i quali tenderebbe la maggior parte delle traiettorie sociali. Talcott Parsons (1964) ha definito questi universali evolutivi – quei modi di ordinare la società che affiorano con sufficiente frequenza in una varietà di circostanze da suggerire una loro generale praticabilità evolutiva. Parsons ha presentato la sua concezione di universali evolutivi partendo da un’analogia biologica; un altro esempio potrebbe essere la riproduzione sessuale. Entrambi sono emersi in una grande varietà di circostanze e in molte specie diverse. Egli ha identificato i soldi, i mercati, la burocrazia, la stratificazione sociale e la democrazia come esempi umani di questi universali evolutivi. Frederich Hayek (1988) si riferisce alla connessione tra mercati e proprietà privata – il suo “ordine esteso” – con lo stesso tenore. Come abbiamo visto nel capitolo 2, molti attribuiscono il successo evolutivo di queste istituzioni alla loro efficienza sociale. La concezione di Marx della successione storica delle istituzioni sotto l’influenza del cambiamento tecnologico, come illustrato nell’epigrafe del capitolo 11, indica analogamente una tendenza a prevalere – sebbene nel lunghissimo periodo – per le istituzioni che aumentano l’efficienza dinamica. Altri hanno sottolineato la fondamentale dipendenza dalle condizioni iniziali dell’evoluzione (path-dependent evolution) delle strutture sociali: storie sociali molto diverse possono derivare da piccole differenze iniziali. Il caso, non il progresso, gioca il ruolo centrale in queste considerazioni, come nell’epigrafe di Sewall Wright all’inizio di questo capitolo. Questa visione mette in risalto non la convergenza ma la
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3
coesistenza nel lungo periodo di diverse istituzioni evolutivamente stabili. Il Messico, ancora una volta, ci fornisce un efficace esempio di questo modello di divergenza istituzionale. Il servigio di Cortés alla corona fu ripagato con il titolo di Marchese della Valle di Oaxaca. In questa stessa regione, ricercatori contemporanei sono rimasti disorientati dalla vicinanza di villaggi con tassi di omicidio incredibilmente alti ad altri nei quali l’omicidio è di fatto sconosciuto. Questi villaggi non si differenziano per nessuna delle cause associate comunemente alla violenza come l’uso di alcool, le dispute di confini, il sovraffollamento, la competizione politica. Comunque, alcuni degli abitanti dei villaggi si distinguono per una lunga tradizione di “antiviolenza” unita all’assenza di scala sociale e alla rotazione delle cariche di villaggio (Paddock 1991, 1975; Greenberg, 1989). Almeno un caso di sostituzione di una consuetudine violenta per una nonviolenta è stato registrato tra le comunità di Oaxaca. Queste differenze istituzionali e sociali tra i villaggi della valle di Oaxaca insieme alla familiarità delle istituzioni che Cortés incontrò a Temistitan pone una delle questioni che verranno affrontate in questo capitolo: quali sono le caratteristiche (se ci sono) delle istituzioni evolutivamente di successo? Per fornire una risposta, avremo bisogno di capire la nascita, la diffusione e la scomparsa delle istituzioni ed il processo attraverso il quale un’istituzione soppianta un’altra. Questo richiederà una discussione su come le caratteristiche delle istituzioni contribuiscono al loro successo evolutivo. Come abbiamo visto nel capitolo 11, i processi che provocano un cambiamento istituzionale possono coinvolgere una combinazione di competizione tra gruppi e dinamiche nei gruppi. In questo capitolo, mi limito all’analisi dei processi all’interno gruppi, ritornando nel capitolo 13 a considerare quelli tra gruppi diversi. Possono essere identificati due approcci notevolmente diversi ai processi che determinano innovazioni istituzionali nei gruppi. Il primo, che è simile all’uso del drift genetico di Sewall Wright per spiegare il passaggio da un picco di fitness ad un altro attraverso un avvallamento nei livelli di fitness, usa la teoria dei giochi evolutivi stocastici, introdotti da Dean Foster e Peyton Young. In questo approccio di ispirazione darwiniana, il cambiamento avviene attraverso il raggruppamento casuale delle azioni di risposta idiosincratica (idiosincratic non-best response) degli individui. Queste azioni possono occasionalmente essere sufficienti per spostare il processo dinamico sottostante dal bacino di attrazione di un equilibrio convenzionale ad un altro. Cambiamenti nell’uso del linguaggio, nelle quote contrattuali, nei giorni di mercato, nell’etica professionale sono stati modellati in questo modo.
4 | MICROECONOMIA
Il secondo approccio, introdotto da Marx, dà rilievo alle asimmetrie tra i giocatori e spiega le innovazioni istituzionali attraverso le modificazioni nel bilanciamento dei poteri tra coloro che beneficiano di diversi modelli organizzativi sociali. In questo contesto, cambiamenti istituzionali rivoluzionari possono avvenire più facilmente quando le istituzioni esistenti facilitano l’azione collettiva di coloro i quali beneficerebbero del cambiamento istituzionale, e quando, poiché le istituzioni esistenti sono inefficienti rispetto ad un’alternativa, ci sono sostanziali guadagni potenziali nel fare il cambiamento. Questo approccio basato sull’azione collettiva è stato usato per modellare sia i conflitti di classe che hanno generato una trasformazione radicale dell’organizzazione sociale come nelle rivoluzioni francese, russa, cubana; sia i cambiamenti graduali nell’ordinamento sociale come l’erosione secolare del feudalesimo europeo. Questi approcci ci permettono di dire qualcosa sulle caratteristiche delle istituzioni evolutivamente di successo? Sebbene i meccanismi causali siano diversi, l’approccio di ispirazione marxiana condivide con la teoria dei giochi evolutivi stocastici di ispirazione darwiniana l’aspettativa che gli ordinamenti sociali inefficienti o altamente iniqui sopporteranno un handicap evolutivo e quindi tenderanno nel lungo periodo ad essere sostituiti da istituzioni più efficienti e più egualitarie.2 Questa è un’affermazione molto forte alla luce della storica persistenza di lungo periodo di ordinamenti sociali che non sembrerebbero né efficienti né egualitari. Esplorerò questa proposizione nel tentativo di introdurre e di estendere l’approccio teorico dei giochi evolutivi stocastici. Inizierò nella prossima sezione con un semplice gioco con popolazione non stocastica nel quale ogni stadio del gioco esibisce due equilibri convenzionali. L’evoluzione delle istituzioni è quindi rappresentata come un problema di selezione di equilibri, studiato con un modello di persistenza e accessibilità delle istituzioni. Per fare questo introdurrò la teoria dei giochi evolutivi stocastici. Partendo dai lavori di Young e Kandori, Mailath, e Rob, mostrerò che si ottiene una caratterizzazione delle istituzioni evolutivamente di successo piuttosto forte affine agli universali evolutivi di Parsons. La teoria dei giochi evolutivi stocastici ha prodotto due contributi di rilievo nello studio delle dinamiche istituzionali. Primo, ci ha permesso di andare oltre quella conclusione corretta ma non illuminante che “la storia conta” e di studiare come i processi evolutivi favoriscono alcuni tipi di istituzioni rispetto ad altre. Secondo, essa 2
Le istituzioni efficienti ottengono un surplus aggregato più grande, mentre in una situazione più egualitaria la quota di surplus del membro tipicamente nelle peggiori condizioni è più alta.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 5
fornisce un modo per tenere in considerazione l’importanza degli eventi casuali. I maggiori difetti della teoria dei giochi evolutivi stocastici nella spiegazione dei processi storici reali di cambiamento istituzionale sono due. Primo, i teoremi rilevanti sulle caratteristiche delle istituzioni più robuste si applicano solo quando la percentuale di giocate di risposta idiosincratica (idiosincratic non-best response) è arbitrariamente piccola. Secondo, essa trascura l’importanza giocata dall’azione collettiva nel processo di innovazione istituzionale e di trasformazione. Non fu un ammasso di improbabili eventi casuali che abbatté l’apartheid o il Comunismo, ma piuttosto la combinazione di eventi casuali e azioni deliberate e coordinate prese da individui ragionevoli che ambivano a vivere sotto altre istituzioni. Per questa ragione amplierò il contesto stocastico introducendo giocatori che perseguono intenzionalmente interessi configgenti attraverso l’azione collettiva. Usando questo modello esteso, esplorerò la persistenza di lungo periodo di convenzioni egualitarie ed efficienti nel caso in cui convenzioni meno efficienti e meno egualitarie sono possibili. Le dinamiche supportate da azioni di risposta idiosincratica (idiosincratic non-best response) intenzionali piuttosto che accidentali non sono le stesse, e i modelli che incorporano le azioni intenzionali nel perseguire l’interesse comune suggeriscono che mentre le istituzioni più efficienti e più egualitarie, sotto certe condizioni, sono favorite da questo processo evolutivo, è comunque vero che istituzioni inefficienti ed inique possono persistere per periodi di tempo molto lunghi.
LA
PERSISTENZA
E
L’ACCESSIBILITÀ
DI
ISTITUZIONI
S TO R I C A M E N T E C O N T I N G E N T I
A causa della loro importanza storica, focalizzerò l’attenzione sulle istituzioni economiche che regolano il livello del surplus sociale e la sua distribuzione. Un'istituzione può essere rappresentata come un numero di possibili equilibri convenzionali in cui i membri di una popolazione si comportano tipicamente con modalità che costituiscono risposte ottime alle azioni prese da altri e che hanno formato aspettative che sostengono un mantenimento continuato di queste azioni convenzionali. Esempi di queste convenzioni distributive, includono semplici principi di divisione quali “finders keepers” (chi trova si appropria) o “first come, first served” (primo arrivato, primo servito), così come più complicati principi di allocazione come la varietà di regole che ha governato gli scambi di beni o la divisione dei prodotti nel corso dell'evoluzione umana. Poiché una convenzione è una
6 | MICROECONOMIA
delle molte possibili risposte ottime reciproche definite dal gioco sottostante, le istituzioni non sono determinate dall'ambiente ma sono piuttosto costruzioni umane (non necessariamente frutto di un progetto deliberato). Visto che prendendo un caso veramente semplice non si perde alcun aspetto di rilievo degli argomenti centrali, mi limiterò all'analisi delle dinamiche evolutive che governano la transizione tra due convenzioni in un gioco a due persone e due strategie, dove una larga popolazione di individui è suddivisa in due gruppi, i cui membri sono accoppiati casualmente per interagire in un gioco non cooperativo con i membri dell'altro gruppo. La giocata individuale di miglior risposta è basata su una memoria di un solo periodo: gli individui massimizzano i loro payoff attesi basati sulla distribuzione della popolazione nel periodo precedente. Tabella 12.1.
A offre il contratto 1 A offre il contratto 0
Payoff nel gioco del contratto
B offre il contratto 1 B offre il contratto 0 0,0 0,0
I due sottogruppi della popolazione, inizialmente assunti della stessa grandezza, sono definiti A e B, e ogni giocatore quando è accoppiato con un membro dell'altro gruppo può scegliere l'azione 1 o 0. Per quanto riguarda i payoff degli A, rappresenta il payoff di una persona del gruppo A che gioca l'azione i contro un persona del gruppo B che gioca l'azione , e lo stesso vale per i membri di B. Se i due membri estratti scelgono la stessa azione avranno un beneficio positivo, mentre se scelgono azioni diverse avranno un payoff minore. Per concretezza, supponiamo che i sottogruppi siano classi economiche che devono selezionare un contratto per regolare la produzione congiunta, che potrà essere ottenuta solo se le parti si accordano su un contratto. I payoff sono quote del surplus aggregato del progetto, normalizzando a zero per entrambi il risultato di non produzione. I payoff, con i giocatori del gruppo A sulle righe e i giocatori B sulle colonne, sono mostrati nella tabella 12.1. Per catturare il conflitto d'interesse tra i due gruppi, assumiamo che così che i membri del gruppo B preferiscono strettamente il risultato in cui entrambi giocano 0, mentre i membri di A preferiscono la divisione egualitaria che si ottiene quando entrambi giocano 1.3 Questi due risultati sono 3
In sintesi, mi riferisco a come alla convenzione “egualitaria”. I livelli di benessere raggiunti dai membri dei gruppi A e B non possono essere determinati senza altre informazioni. Per esempio, se i membri di A sono mezzadri che interagiscono soltanto con un membro di B (un latifondista), i membri di B interagiscono con molti membri di A, quindi la convenzione egualitaria porterà a risultati diseguali rispetto al reddito dei due gruppi.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 7
entrambi equilibri di Nash in senso stretto, e rappresentano quindi convenzioni che saranno indicate con e (o e ). Le due popolazioni sono normalizzate ad uno, quindi mi riferirò indifferentemente al numero di giocatori e alla frazione della popolazione, astraendo da problemi di numeri interi.
0
1.0
0
1.0
Figura 12.1. Payoff attesi nel gioco del contratto (contract game). Si noti che i payoff dei membri di A dipendono da , la frazione dei membri di B che offrono il contratto 1. Poiché , la convenzione (cioè, ) è preferita dai membri di A mentre è preferita dai membri di B.
Lo stato di questa popolazione in ogni periodo è , dove è la frazione di A che ha giocato 1 nel periodo precedente, e è la frazione di B che ha giocato 1. Per ogni stato della popolazione, i payoff attesi e , per i membri di A e B che giocano la strategia , dipendono dalla distribuzione delle giocate nel gruppo opposto nel periodo precedente, cioè, togliendo l'indice temporale,
La relazione tra lo stato della popolazione e i payoff attesi per ogni azione è illustrata nella figura 12.1. Gli individui scelgono una determinata azione – essi sono giocatori di tipo 1 o 0 – e continuano a fare lo stesso di periodo in periodo finché non aggiornano la loro azione, a quel punto possono cambiare. Supponiamo che all'inizio di ogni periodo una frazione di ciascuna sotto-popolazione possa aggiornare la sua azione. (Questo può essere dovuto alla struttura di età della popolazione, dove l'aggiornamento viene fatto soltanto ad una certa età, in questo caso i “periodi” potrebbero essere intesi come “generazioni”. Ovviamente l'aggiornamento può essere molto più frequente.)4 L'aggiornamento si basa sui payoff attesi dalle due 4
Considerare individui con una memoria più lunga (di un solo periodo), o una regola di aggiornamento meno naif, o una conoscenza più limitata della distribuzione dei tipi nell'altro gruppo, non avrebbe sostanzialmente dato spunti diversi sulle questioni qui esplorate. L'assunzione
8 | MICROECONOMIA
Frazione dei B che offrono il contratto 1,
azioni. Queste aspettative sono semplicemente i payoff che si realizzerebbero se lo stato del periodo precedente rimanesse immutato (la composizione della popolazione nel periodo precedente diventa conoscenza comune nel periodo corrente). Anche se questo processo di aggiornamento non è molto sofisticato, può realisticamente riflettere le capacità cognitive degli individui e assicura che in equilibrio – quando lo stato della popolazione è stazionario – le convinzioni degli agenti formate in questo modo così naif sono confermate nella pratica.
Frazione degli A che offrono il contratto 1, Figura 12.2. Lo spazio degli stati. Si noti che assorbenti nella dinamica non stocastica; z è una sella.
e
sono stati
Gli individui sono rappresentati semplicemente come portatori delle strategie che adottano, mentre la distribuzione di strategie tra loro varia. Analizzerò le variazioni tra un periodo e l'altro nello stato della popolazione sotto l'assunzione che l'aggiornamento individuale delle strategie è monotonico nei payoff attesi così che e hanno il segno di e . La dinamica della popolazione risultante è illustrata nella figura 12.2, dove le regioni rilevanti sono definite da ciò che può essere chiamato “tipping frequencies” (frequenze di rovesciamento): di generazioni sovrapposte riguardo l'aggiornamento è comunque importante poiché significa che gli shocks stocastici dovuti a giocate idiosincratiche (introdotte ora) sono persistenti poiché la distribuzione del gioco del periodo precedente riflette gli shocks sperimentati su molti periodi passati.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 9
(12.1) queste due distribuzioni di popolazione che eguagliano, rispettivamente per i due gruppi, i payoff attesi dalle due strategie. Questi valori di e definiscono le la miglior risposta per i membri di B è 0, e funzioni di miglior risposta: per per la miglior risposta è giocare 1; può essere interpretato analogamente Quando
e
(nella regione sud-ovest della figura 12.2), è ovvio
che
e sono negativi e la popolazione si muove verso . Analogo ragionamento vale per la regione di nord-est. Nelle regioni di nord-ovest e di sud-est del diagramma, possiamo definire un insieme degli stati per i quali il sistema tende verso l'equilibrio interno . Gli stati al di sotto di questo insieme tendono verso
e quelli al di sopra verso . Il bacino di attrazione di è l'area sotto la linea tratteggiata decrescente nella figura 12.2; la sua dimensione varierà con
. Mentre l'equilibrio interno è un equilibrio di Nash instabile (una e sono gli stati assorbenti del processo dinamico, il che sella), gli esiti significa che se la popolazione è già in uno di questi stati, non potrà spostarsi. Essendoci più di uno di questi stati assorbenti, il processo dinamico è non-ergodico, cioè, il suo comportamento standard nel lungo periodo è dipendente dalle condizioni iniziali.
CASO
E
C A M B IA M E N TO
Come può quindi avvenire il cambiamento istituzionale? Poiché la giocata di miglior risposta rende entrambe le convenzioni stati assorbenti, è chiaro che al fine di comprendere il cambiamento istituzionale, una sorta di giocata di risposta idiosincratica (idiosincratic non-best response) deve essere introdotta. Si supponga che ci sia una probabilità che quando gli individui sono in procinto di aggiornare, possano cambiare il loro tipo per ragioni idiosincratiche. Allora, è la probabilità che l'individuo segua il processo di aggiornamento di miglior risposta descritto sopra. Le giocate idiosincratiche che spiegano il comportamento non ottimale, non hanno bisogno di essere irrazionali o folli; semplicemente rappresentano le azioni le cui ragioni non sono esplicitate nel modello. Esse includono la sperimentazione, il capriccio, l'errore, e altri atti intenzionali che mirano ad influenzare i risultati del gioco ma le cui motivazioni non sono catturate dal gioco appena descritto.
10 | MICROECONOMIA
Giocate idiosincratiche possono portare a transizioni da una convenzione all'altra nel seguente modo: se la convenzione in essere è ma un sufficiente numero di membri di A gioca 1 per una serie di ragioni che non sono catturate dal modello, allora nel periodo successivo la miglior risposta dei membri di B, che hanno incontrato i membri di A che giocano 1, è 1. Nel periodo successivo, la miglior risposta dei membri di A che hanno incontrato questi B che giocano 1 sarà 1, e così via, possibilmente portando al “rovesciamento” della popolazione dalla convenzione a quella
.
Per popolazioni con un numero finito di membri, la presenza di giocate idiosincratiche trasforma il sistema dinamico descritto sopra da un processo non ergodico ad uno ergodico senza alcuno stato assorbente. L'ergodicità implica che noi possiamo specificare il suo comportamento standard di lungo periodo indipendentemente dalle condizioni iniziali, in ciò che segue questo è un risultato di fondamentale importanza. Il caso più semplice si ha quando
(ovvero tutti i membri aggiornano in ogni periodo). Allora il processo markoviano descritto nel modello produce una matrice di transizione strettamente positiva, il che significa che da ogni stato il sistema si sposterà su ogni altro stato con probabilità positiva. Per verificare se questo sia vero, supponendo che tutti i membri dei due gruppi siano selezionati per la giocata idiosincratica, si nota che ogni distribuzione delle loro risposte è possibile, per cui si può dare pesi positivi alla probabilità di muoversi su ogni altro stato, indipendentemente dallo stato originario.5 Allora la popolazione è
continuamente in moto, o almeno suscettibile di movimento, e il suo stato è dipendente dalle condizioni iniziali: dove si trovava nel recente passato influenza dove sarà con maggior probabilità in ogni momento. La storia conta, e non si ferma mai. Il fatto che lo stato della popolazione cambi continuamente, non significa ovviamente che ogni stato sia ugualmente possibile: il comportamento standard di lungo periodo del sistema può essere studiato. L'idea di base è che una convenzione che richiede un grande ammontare di giocate idiosincratiche per essere rimossa e un basso numero di giocate idiosincratiche per arrivarci, persisterà per lunghi periodi, e se viene sostituita da un altra convenzione, riemergerà con facilità. Definisco queste convenzioni “robuste”. Abbiamo bisogno di formalizzare l'intuizione che le convenzioni robuste sono “facili da raggiungere, difficili da lasciare” (easy to get to, hard to leave). 5
Dove <1, l'intuizione precedente rimane corretta, poiché se in ciascun periodo ogni distribuzione delle giocate tra i potenziali innovatori è possibile, allora in un periodo di tempo sufficientemente lungo ogni distribuzione delle giocate nell'intera popolazione è possibile.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 1 1
Primo, una convenzione robusta è “persistente”: una volta nella convenzione o vicino ad essa, c'è bisogno di un ammontare significativo di giocate di risposta idiosincratica (idiosincratic non-best response) per rimuoverla. Con “rimuoverla”, intendo che per creare una situazione nella quale non si richiede nessuna altra giocata idiosincratica per indurre la popolazione a lasciare la convenzione. Consideriamo la convenzione . Essa può essere rimossa in due modi: se una frazione degli A o una frazione dei B maggiore di gioca 1. Più grandi sono e maggiore di , meno probabile è che ci sia un evento di rimozione della convenzione, e quindi e sono misure della persistenza di rimossa se più di degli A o più di
. Allo stesso modo,
può essere
dei B idiosincraticamente gioca 0.
Secondo, una convenzione robusta è “accessibile”: nel caso
, questo significa che l'altra convenzione non è persistente: non è richiesto un grosso ammontare di giocate di risposte idiosincratiche nell'altra convenzione per spostare lo stato della popolazione nel bacino di attrazione della convenzione robusta. Quanto accessibile è ? Se più di degli A o più di dei B gioca 0, la a quello . L'ammontare di popolazione si può muovere dal contratto giocate di risposta idiosincratica (idiosincratic non-best response) che spinge dal bacino di attrazione di a quello di è più probabile tanto più grandi sono e ,e quindi queste frazioni sono una misura dell'accessibilità di . La persistenza corrisponde alla stabilità evolutiva e alla non-invadibilità introdotte da Maynard Smith e Price (1973), e rappresentano “le barriere all'invasione” o il minimo numero di giocatori mutanti che giocano 1 che condurrebbe alla proliferazione se fossero introdotti nella popolazione di giocatori che giocano 0. L'accessibilità è analoga al concetto di capacità di invadere – chiamata “vitalità iniziale” (initial viability) da Axelrod e Hamilton (1981). Si noti che e coordinamento
e
misurano sia la persistenza che l'accessibilità di
quelle di
(e
). Il fatto che nella struttura del gioco di
l'accessibilità di una convenzione sia proprio uno meno la e sono maggiori di , persistenza sarà importante più avanti. Allora se le qualità di una convenzione robusta: facile da raggiungere, difficile da lasciare. cosa succede se , o il contrario? Si ricordi che ci sono due modi
sua ha Ma
per raggiungere una convenzione e due modi per lasciarla, ovvero per l'azione idiosincratica degli A o dei B. Dobbiamo tenere in considerazione entrambe. Discuterò due risposte a questa domanda, una proposta dalla teoria dei giochi evolutivi stocastici e l'altra (qui introdotta) basata sulla rappresentazione di giocate idiosincratiche non come eventi accidentali ma piuttosto come azioni collettive
12 | MICROECONOMIA
intenzionali. Si definisca come “stato stocasticamente stabile” quello che si verifica con una probabilità non trascurabile quando il tasso di giocate idiosincratiche è arbitrariamente piccolo. Quando tende a zero, la popolazione spenderà generalmente la maggior parte del tempo in una convenzione; questo è uno stato stocasticamente stabile. Lasciare tendere a zero risolve il problema precedente di quale sia il sentiero che la popolazione seguirà per passare da una convenzione ad un'altra: è più facile scegliere il sentiero più probabile, e quando va a zero, la probabilità di scegliere il sentiero meno probabile è così piccola da scomparire e quindi può essere ignorata. Il sentiero più probabile è quello che richiede meno casi di risposta idiosincratica (idiosincratic non-best response). Seguendo Young (1998), si definisca
, la “resistenza ridotta” sul sentiero da
a , come il minimo numero di individui in una popolazione che aderisce alla che, cambiando idiosincraticamente la loro strategia in , convenzione indurrebbero i loro partner che giocano la miglior risposta a cambiarle strategia. Allora
(12.2) La convenzione per la quale la resistenza ridotta è più piccola è lo stato stocasticamente stabile. Le resistenze ridotte per una convenzione sono anche i fattori di rischio della convenzione ( è il fattore di rischio di ). Quindi lo stato stocasticamente stabile è quello con il minimo fattore di rischio e quindi è l’equilibrio rischio-dominante (risk-dominant equilibrium).6 Allora, la convenzione
Usando i payoff
sarà stocasticamente stabile se
abbiamo
(12.3) 6
Young (1998), teorema 4.1. Nel modello aggiornato su cui questo teorema è basato (e il teorema del contratto citato più avanti), gli agenti hanno una memoria di m periodi, e un campione ( ) dalla loro memoria per formare le aspettative (nel modello descritto ). I risultati di Young generalizzano il concetto di stabilità stocastica al di là del gioco di coordinamento qui trattato.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 1 3
Allora quando tende a zero, è l’azione idiosincratica dei membri di B che incentiva il movimento da a mentre le azioni idiosincratiche degli A sarà lo stato stocasticamente inducono il movimento inverso. La convenzione stabile se , o usando le espressioni 12.3, se (12.4) Si noti che i due termini nell’equazione (12.4) sono esattamente il prodotto della differenza dei payoff degli A e dei B con la loro posizione di riserva (che è zero). Allora, un contratto che è più vicino (in questo senso) alla soluzione di Nash per il gioco di divisione (division game) è stocasticamente stabile. Questa non dovrebbe essere una sorpresa dato il risultato del capitolo 5 che la negoziazione che massimizza il prodotto di Nash è la norma distributiva stazionaria in una dinamica plausibile quando la giocata è occasionalmente idiosincratica. Cosa ci dice l’equazione (12.4) sulle caratteristiche degli stati stocasticamente stabili? Supponiamo che i contratti si differenzino nelle loro quote distributive e anche nel livello del surplus totale ottenuto. Sia il surplus totale denominato in unità di prodotto fisico, e assumiamo che le funzioni di utilità (alla von-NeumannMorgenstern) degli A e dei B siano lineari nel prodotto, così che manteniamo l’assunzione della massimizzazione dei payoff attesi. Il surplus totale varia con le quote distributive poiché alcuni contratti sono più efficienti di altri. Questo può succedere se l’uso di una particolare tecnologia richiede un insieme diverso di diritti di proprietà, che a loro volta supportano un particolare contratto di equilibrio. Un esempio di questa mappatura della relazione tra tipo di contratto e tecnologia può essere visto nel caso dell’ascesa dell’agricoltura e dell’emergere dei diritti di proprietà individuali nel capitolo precedente. L’analisi del gioco del contratto può essere semplificata assumendo
, così che
è una misura
dell’efficienza relativa della convenzione
; quando ha valore 2, le due convenzioni producono lo stesso surplus totale. Inoltre, sia la quota del che favorisce i B, e la surplus totale dei giocatori di tipo A nell’equilibrio quota ottenuta dai B. La tabella 12.2 riassume questi payoff. Tabella 12.2. Payoff modificati nel gioco del contratto
B offre il contratto 1 A offre il contratto 1 A offre il contratto 0
B offre il contratto 0 0,0
0,0
Per esplorare l’effetto dei termini del contratto sulla stabilità stocastica dello stato definito dalla convenzione in cui quel contratto è universale, si consideri lo spazio dei contratti nella figura 12.3. Il contratto è definito come il contratto
14 | MICROECONOMIA
Benchmark, ed è la convenzione associata. Lo spazio dei contratti rappresenta un insieme di contratti alternativi che definiscono la convenzione . Il punto è il contratto Benchmark (con rappresentati dai punti e poiché sia
e
). Allora se i due possibili contratti sono
, entrambi i gruppi preferiscono il contratto Alternativo
che eccedono 1. I contratti sopra .) al Benchmark. (Per adesso si ignori il luogo dei punti
sono Pareto-superiori
Il conflitto di interesse tra i due gruppi è confinato ai contratti che stanno sotto e sopra . Questo non assicura che sia sostituito da un contratto alternativo come . La ragione è che sebbene sia Pareto-superiore a , è una mutua miglior risposta e quindi sarà sostituita solo grazie a giocate di risposta idiosincratica (idiosincratic non-best response). La nostra intuizione, comunque, è che le convenzioni Pareto-inferiori devono essere svantaggiate in un ambiente stocastico. Questa intuizione è corretta: le convenzioni Pareto-inefficienti non sono robuste nella dinamica evolutiva, e possiamo dire molto di più.
Figura 12.3. Contratti contrastanti. Ciascun punto indica l’efficienza e la . quota distributiva del contratto Alternativo che supporta l’equilibrio sono Pareto-superiori al contratto Benchmark con I contratti sopra sono Pareto-inferiori al = 2 e =1/2 .I contratti sotto contratto Benchmark.
Peyton Young (1998) ha prodotto un teorema notevole che dimostra come le istituzioni che supportano gli stati stocasticamente stabili sono non solo efficienti ma anche egualitarie se diamo a questo termine un significato piuttosto speciale. Per ogni
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 1 5
coppia di due contratti, si definisca come payoff relativo il payoff ottenuto dai membri del gruppo nel contratto , relativo al massimo payoff che possono avere nei due contratti. Sotto alcune innocue restrizioni sul processo di aggiornamento, il “teorema del contratto” (contract theorem) di Young mostra che lo stato stocasticamente stabile è quello che massimizza i payoff relativi del gruppo che ha il payoff relativo più basso.7 Perché questo è vero e in che senso la proprietà che gli stati stocasticamente stabili sono quelli che massimizzano il minimo payoff relativo (maximin di qui in avanti) può essere definita egualitaria, sarà chiarito usando ciò che già sappiamo rispetto a questi stati. La convenzione sarà, come abbiamo visto, uno stato stocasticamente stabile se
. Usando i payoff della tabella 12.2 questo richiede che (12.5)
E’ chiaro da questa condizione che sia l’efficienza relativa che l’uguaglianza delle quote contribuiscono alla stabilità stocastica della convenzione (il termine (1 ) è massimizzato per =1/2 ). La figura 12.3 illustra la relazione tra efficienza
e uguaglianza come determinanti della stabilità stocastica: SS' è il luogo delle combinazioni di e tali che (1 ) =1 e che allora eguagliano il fattore di rischio di {0,0} con quello della convenzione egualitaria {1,1} (per il quale = 2 e 2
=1/2 ). Allora SS' è il luogo dei contratti alternativi tale per cui entrambe le
convenzioni sono stocasticamente stabili. I contratti alternativi sopra SS' sono stocasticamente stabili quando l’altra convenzione è il contratto Benchmark. Per i contratti alternativi sotto SS' il contratto Benchmark è stocasticamente stabile. Si noti che mentre gli stati stocasticamente stabili sono maximin nei payoff relativi (cioè massimizzano i minimi payoff relativi), non sono maximin nei payoff. I contratti alternativi che stanno tra SS' e AS' sono stocasticamente stabili, ma i payoff degli A sono più bassi nel contratto Alternativo che nel contratto Benchmark. Allora, gli stati stocasticamente stabili sono egualitari solo in un senso molto particolare. E’ facile vedere perché le convenzioni efficienti sono favorite in questo impianto. Per almeno un gruppo, offrire il contratto efficiente deve essere rischiodominante nel senso standard che se uno crede che l’altro offrirà uno dei due contratti con uguale probabilità, allora la miglior risposta è offrire il contratto più 7
Per vedere che gli stati stocasticamente stabili sono il maximin nei payoff relativi, è sufficiente , che definisce l’equivalenza della stabilità stocastica del mostrare che la condizione contratto Alternativo e del Benchmark uguaglia anche i payoff relativi minimi dei due contratti. Allora e , e il payoff minimo relativo nel contratto abbiamo Alternativo e nel Benchmark, sono rispettivamente e . Eguagliando le ultime due espressioni si ottiene la condizione appena descritta per gli stati associati ai due contratti stocasticamente stabili.
16 | MICROECONOMIA
efficiente. Le convenzioni inefficienti non sono accessibili poiché è necessario un ampio ammontare di giocate di risposta idiosincratica per indurre coloro che giocano la miglior risposta a cambiare da una convenzione efficiente ad una non efficiente. Si noti che questo non succede perché coloro che giocano la miglior risposta anticipano le conseguenze del loro cambiamento sulle dinamiche globali della popolazione. Piuttosto la loro risposta è puramente individuale e basata sugli stati della popolazione passati (non su quelli futuri anticipati); nessun individuo cerca di implementare la convenzione più efficiente. Per ragioni analoghe, le convenzioni inefficienti non sono persistenti. Meno trasparente è il risultato che convenzioni altamente inique non sono buoni candidati per la stabilità stocastica. Questo è conseguenza del fatto che esse sono facilmente superate, poiché come ha mostrato Young (1998:137) “Non sono necessari molti shock stocastici per creare un ambiente nel quale i membri del gruppo insoddisfatto preferiscono provare qualcosa di diverso.” Si noti che in questo esempio, come per le resistenze ridotte discusse sopra, è la giocata idiosincratica del gruppo privilegiato che disfa la convenzione iniqua, cioè, la convenzione nella quale essi traggono profitto sproporzionatamente. Ritorneremo in seguito su questa anomalia. Per capire perché il processo di transizione da una convenzione all’altra dipende dalla quota dell’individuo nelle peggiori condizioni all’interno della convenzione iniqua, si possono usare l’equazione (12.3) e i dati della tabella 12.2 per ottenere le espressioni delle resistenze ridotte dei sentieri per i due equilibri.
Quando
tende a zero (cioè il povero non ottiene niente nella convenzione iniqua), la resistenza sul sentiero per la convenzione egualitaria ( ) va a zero. La ragione è che in una popolazione vicino alla convenzione
, anche se gli A (i poveri) credono effettivamente che tutti i B giocheranno 0, la loro miglior risposta sarebbe di giocare lo stesso 1. Questo perché se , i poveri non beneficerebbero dal chiudere il contratto giocando 0, e quindi finché ci sarà la possibilità di incontrare un giocatore del gruppo B che gioca 1, il payoff atteso sarà massimizzato giocando 1. Allora, la popolazione transiterà nella convenzione più egualitaria per un ammontare arbitrariamente piccolo di risposte idiosincratiche dei ricchi. Questa è l’interpretazione fatta dai teorici dei giochi evolutivi della retorica marxiana sulla
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 1 7
classe lavoratrice che “non ha niente da perdere se non le proprie catene”. Allora la convenzione iniqua diventa meno persistente più diventa iniqua. Efficienza,
Quota degli A, Figura 12.4. Fattori di rischio e grado di iniquità. Si noti che più grande è l’iniquità delle quote nella convenzione iniqua ( più piccolo) più si riduce il fattore di rischio di entrambe le convenzioni, ma questo processo influenza la convenzione egualitaria più di quella iniqua.
La figura 12.4 mostra che più le quote nella convenzione sono inique, più entrambe le convenzioni diventano facilmente accessibili (cioè, si riduce la resistenza dei due equilibri). Ma l’accessibilità della convenzione più egualitaria è aumentata relativamente di più. diventa più accessibile perché nelle vicinanze della convenzione
sono necessarie meno risposte idiosincratiche degli A per indurre i B ad approfittare dell’occasione e giocare 0 (se a loro succede di incontrare un A che gioca 0, loro lo giocheranno volentieri). Allora la resistenza sul sentiero della convenzione iniqua si riduce quando si riduce. Ma la resistenza di questo sentiero rimane positiva anche quando i B ottengono tutto il surplus aggregato in
, in
questo caso sarebbe r =1/(1 ) . 10
Ho illustrato le intuizioni della teoria dei giochi evolutivi stocastici confrontando due contratti; ma si noti che ciascuno dei due contratti lungo la curva della figura 12.3 è uno stato stocasticamente stabile. Possiamo dunque interpretare come il luogo dei punti di stabilità iso-stocastica, e si noti che questo è soltanto uno della classe di questo tipo di luoghi. Per ogni coppia di contratti, e , . Supponiamo ora che, date le lungo uno di questi luoghi accade che tecnologie, le preferenze e ogni altro dato rilevante ottenibile in un dato periodo
18 | MICROECONOMIA
storico, esiste un insieme di possibili contratti definiti nello spazio [ , ] . Due elementi della classe dei luoghi di stabilità iso-stocastica (S’S’ e S’’S’’) e dell’insieme dei possibili contratti delimitati da CC sono illustrati nella figura 12.5. Se vengono considerati soltanto due contratti, e i punti x e y giacciono sullo stesso luogo di stabilita iso-stocastica, ci aspettiamo che la popolazione si muova tra queste due convenzioni nel lungo periodo, spendendo un uguale ammontare di tempo in ognuna di esse. Ma se x fosse la convenzione corrente e z l’alternativa, allora ci dovremmo aspettare che z emerga e persista di fatto indefinitamente.
Figura 12.5. Selezione casuale dell’equilibrio dall’insieme dei contratti possibili. Lo spostamento dell’insieme dei contratti possibili induce alla selezione di una convenzione più efficiente e più iniqua.
Il miglioramento della tecnologia e l’evoluzione delle preferenze muovono l’insieme dei contratti possibili. Un possibile spostamento è indicato dalla nuova frontiera delle possibilità contrattuali sotto la quale è massimizzato da un insieme dei contratti che favorisce i membri di B, rispetto a . La teoria dei giochi evolutivi stocastici induce ad aspettarsi la comparsa di un nuovo contratto, nel quale si è ridotto, che è indicato da z’ sulla tangenza con il nuovo luogo dei punti di stabilità iso-stocastica. Un processo di questo tipo si può essere verificato durante l’ascesa dell’agricoltura descritta nel capitolo precedente, o durante lo sviluppo del capitalismo di mezzo millennio fa. L’introduzione
della
giocata
idiosincratica
rimuove
la
dipendenza
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 1 9
deterministica dei risultati dalle condizioni iniziali che caratterizza l’approccio non stocastico. Piuttosto, l’approccio stocastico permette di predire in media lo stato della popolazione per un periodo storico sufficientemente ampio, e consente una caratterizzazione abbastanza forte della natura di questi stati stocasticamente stabili. Questo approccio offre allora una spiegazione di come le istituzioni, che Parsons chiamava “universali evolutivi”, possono essere storicamente ricorrenti e molto diffusi in ogni istante: le istituzioni che supportano stati stocasticamente stabili sarebbero, come Parsons (1964:340) scrisse, stati “nei quali è probabile che si imbattano vari sistemi operanti sotto diverse condizioni”, perdurati per lunghi periodi.
A Z IO N I I N T E N Z IO N A L I D I R I S P O S TA I D IO S IN C R AT IC A GRUPPI DI DIMENSIONI DIVERSE
CON
Una spiegazione abbastanza diversa e storicamente più plausibile per la persistenza e l’innovazione istituzionale si ottiene se la giocata di miglior risposta è modellata come un’azione collettiva intenzionale portata avanti da quelli che hanno qualcosa da guadagnare cambiando lo status quo istituzionale a favore di un’alternativa. Come vedremo, una volta che la giocata idiosincratica è modellata come un’azione collettiva intenzionale, non è più generalmente vero che gli stati stocasticamente stabili sono egualitari ed efficienti. In particolare, se i ricchi sono pochi e i poveri molti, istituzioni inefficienti e inique possono essere molto robuste. La ragione è che quando la giocata di risposta idiosincratica (idiosincratic non-best response) è intenzionale, c’è un solo modo (invece che due) per sovvertire un’istituzione (dall’azione di quelli che beneficerebbero di più dall’altra convenzione), e un grande numero di poveri rende più difficile il raggiungimento della frazione sufficiente di coloro che giocano la risposta idiosincratica (idiosincratic non-best response) necessaria per sostituire l’equilibrio nel quale sono poveri. L’approccio dell’azione collettiva (collective-action) richiede alcune modifiche al modello appena presentato. Primo, bisogna assumere che i giocatori siano coscienti della possibilità di transitare in un nuovo setup istituzionale, e che abbiano la capacità di anticipare le conseguenze delle loro azioni sulle azioni degli altri. Quindi, invece di restringere gli individui all’aggiornamento basato sul passato (backward-looking), introduco una limitata capacità di pensare al futuro. Secondo, quando la frequenza di giocate idiosincratiche non è insignificante, le resistenze ridotte, introdotte sopra, non forniscono più la base per una spiegazione della trasformazione istituzionale. La ragione è che la loro rilevanza è basata sulla giocata di risposta idiosincratica essendo abbastanza raro che il sentiero meno probabile tra due che legano una convenzione ad un’altra possa essere ignorato. Invece di far tendere a zero , questo approccio
20 | MICROECONOMIA
identifica i sentieri possibili da una convenzione all’altra endogenizzando il processo di giocata idiosincratica che usa un modello di azione collettiva.8 Per azione collettiva, intendo l’azione intenzionale congiunta per un fine comune da membri appartenenti ad un largo gruppo di persone che non hanno la capacità di impegnarsi in un accordo vincolante prima di agire (cioè, agiscono in maniera non cooperativa). Esempi includono scioperi, violenza etnica, insurrezioni, dimostrazioni, boicottaggi. La partecipazione individuale ad un’azione collettiva può essere modellata come una risposta idiosincratica (idiosincratic non-best response), che però non prende la forma di un errore generato stocasticamente ma rappresenta un’azione intenzionale motivata dal desiderio di migliorare il proprio benessere e forse anche quello di altre persone. Per questa ragione, è possibile che la frequenza di giocate di risposta idiosincratica vari tra individui e dipenda dalla struttura dei payoff ma anche dal modello di interazione sociale che definisce il gioco sottostante.9 Per chiarire i processi sottostanti, analizzerò per prima cosa il caso degenerato nel quale gli individui partecipano in un’azione collettiva di risposta idiosincratica (idiosincratic non-best response) quando è nel loro interesse individuale che l’azione venga realizzata. Si supponga che ognuno aggiorni in ogni periodo ( =1) e si assuma che ci sia una probabilità (0,1) che ogni persona sia “convocata ad un'assemblea” nella quale coloro che partecipano valutano se intraprendere un azione di risposta idiosincratica. Per esempio, si assuma che venga ottenuta la convenzione B favorevole
{0,0} e che una frazione dei B (risultanti dalla chiamata) stia decidendo di cambiare e offrire il contratto 1. Ma essi non possono beneficiare di questo cambiamento perché preferiscono la convenzione in essere, e destabilizzandola – nel caso in cui cambiasse anche un sufficiente numero di altri innovatori dei B – potrebbero spingere altri verso la convenzione alternativa sotto cui starebbero peggio. Quindi 8
9
Young (1998) ha mostrato che per un gioco 2x2 con un’unica popolazione, essa spende la maggior parte del tempo sullo stato stocasticamente stabile anche quando è significativo (per esempio 0.05 o anche 0.10) purché la popolazione sia grande (e quindi le transizioni sono rare anche con una sostanziale percentuale di giocate di risposta idiosincratica). Si noti che nel caso 2x2 con un’unica popolazione, c’è soltanto un modo per spostarsi da una convenzione all’altra, e quindi questo risultato non è molto sorprendente. Al contrario, in un gioco con due popolazioni, far tendere a zero implica la selezione di quale dei due sentieri che legano una convenzione all’altra deve essere utilizzato come base del calcolo. Sembra probabile che, per popolazioni piccole con tassi significativi di errore entrambi i sentieri dovrebbe essere tenuti in considerazione (poiché il sentiero meno probabile potrebbe essere seguito con probabilità positiva e significativa). Comunque, questo argomento non viene qui trattato. Bergin e Lipman (1996), Young (1998) e van Damme e Weibull (2002) analizzano le mutazioni stato-dipendenti (state-dependent mutations). La condizione che la giocata sia non cooperativa esclude il caso degenerativo (con cui si è cominciato a scopo illustrativo) in cui la struttura dei gruppi è capace di assegnare un’azione obbligatoria a ciascuno dei suoi membri. Mentre le azioni collettive di maggior successo includono un ampio ventaglio di incentivi selettivi e sanzioni tali da dissuadere il free-riding, pochi gruppi se non nessuno hanno la capacità di indurre i loro membri ad adottare comportamenti che favoriscono il benessere del gruppo attraverso un semplice ordine.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 2 1
questi giocatori potenzialmente idiosincratici diminuirebbero la possibilità di innovare.10 Al contrario, si immagini che un gruppo degli A sia convocato in maniera casuale per deliberare riguardo ad un cambiamento dalla convenzione in essere {0,0} , e si supponga che nel caso in cui tutti adottassero una risposta idiosincratica, questo sarebbe di conoscenza comune. Ciascuno quindi potrebbe ragionare nel seguente modo. Se siamo sufficientemente numerosi e se tutti noi cambiassimo, la miglior risposta dei B sarebbe di cambiare a loro volta. Sapendo questo, nel caso in cui tutti cambiassero, essi anticiperebbero la risposta dei B e persisterebbero ad offrire il contratto 1 nel periodo successivo. Di conseguenza, la convenzione {0,0} sfavorevole per gli A sarebbe sostituita. Si supponga che ci siano n membri della popolazione di tipo A (precedentemente normalizzata a 1). Se meno di n * degli A sono convocati, non ci sarebbe nessun beneficio nell'intraprendere l'azione collettiva anche se fosse giocata da tutti uniformemente. Quindi analizziamo il caso in cui il numero dei convocati, , ecceda questo livello critico, cioè > n * . Per dare una certa concretezza a questo esempio, si assuma che cambiare significhi partecipare con altri A ad uno sciopero, rifiutandosi di accettare qualsiasi esito peggiore di a (questo significa offrire il contratto 1, e quindi lasciare inalterato l'insieme delle strategie). Possiamo esplorare il comportamento di lungo periodo del sistema calcolando , il tempo atteso (ovvero il 11
0
numero dei periodi) prima che uno sciopero degli A provochi la transizione dalla convenzione {0,0} a quella {1,1} . Questo tempo è l'inverso della probabilità μ , che in ogni periodo venga indotta una transizione da {0,0} a {1,1} , quindi =1/ μ . Per determinare questa probabilità, si può procedere nel seguente modo. Primo, si contino i sottoinsiemi di A sufficientemente numerosi per indurre la transizione, poi si determini la probabilità (dato ) che ciascun sottoinsieme sia estratto; si sommino 0
0
0
queste probabilità per ottenere la probabilità che ci sia una transizione che induca l'evento μ . In questo caso degenerato che assicura l'azione collettiva venga portata avanti ogni volta che conviene, ogni sottoinsieme degli A con n *o più membri 0
indurrà la transizione. Così, usando C per indicare il numero dei sottoinsiemi di m membri in una popolazione di n individui, abbiamo n, m
10
I gruppi favoriti, come i B nella convenzione {0,0} , potrebbero dispiegare sanzioni governative o informali o potrebbero minimizzare le giocate idiosincratiche dei propri membri. Alcuni esempi includono, le sanzioni più severe imposte ai bianchi che offrivano contratti più favorevoli ai non bianchi in società stratificate su basi razziali come l’apartheid in Sud Africa e il Sud degli Stati Uniti prima del movimento dei diritti civili.
22 | MICROECONOMIA
Un esempio renderà chiari i calcoli. Si supponga che = 0.1 , che quattro individui (W,X,Y e Z) costituiscano la sotto-popolazione A e che * = 3/ 4 . Allora la convenzione E sfavorevole agli A sarà rimossa dalla giocata idiosincratica di una delle seguenti combinazioni: WXY, XYZ, YZW, WXYZ. Le prime tre vengono estratte con probabilità 0.0009 ciascuna e la quarta con probabilità 0.0001, quindi sommando queste probabilità μ = 0.0037 e = 270 periodi. Siccome vogliamo 0
0
0
sapere qual è il comportamento di lungo periodo del sistema, calcoliamo in maniera analoga a ed esprimiamo il tempo medio trascorso nella convenzione E o attorno ad essa, , come 1
0
0
0
0
+ 0
0
1
con (1 ) . Se ci sono 3 individui nel gruppo B e 1 * (la frazione sfavorevole ai B) è 2/3, allora critica richiesta per sostituire la convenzione sarà mantenuta μ = 0.028 e = 35.7 periodi. quindi = 0.88 , il che significa che per la maggior parte del tempo. 1
1
0
1
0
La figura 12.6 mostra il risultato di questo calcolo dove le due sottopopolazioni hanno entrambe 12 membri e per vari valori di e . Dove è uguale a ( = 2 e <1/2 , indicata dalla barra nera corrispondente a queste coordinate), la popolazione spende metà tempo in ognuna delle convenzioni. Si può identificare una banda di convenzioni (simile al locus della figura 12.3) che come ( = 2 e <1/2 ) genera tempi di attesa mediamente uguali (per esempio, = 2.5 , = 0.2
genera questo risultato, così come = 2.25 e = 0.3 ). La popolazione spenderà di fatto tutto il tempo sotto le convenzioni più efficienti o più egualitarie di queste, ed effettivamente mai sotto convenzioni meno efficienti e meno egualitarie.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 2 3
Figura 12.6. Le convenzioni efficienti e egualitarie sono stocasticamente stabili quando le sotto-popolazioni sono della stessa grandezza. Si noti che la convenzione Benchmark è nella quale = 2 e =1/2 . La popolazione spende un ammontare di tempo uguale sotto le due convenzioni se la convenzione alternativa è sia = 2.25 e = 0.4 o = 2.5 e = 0.2 . Se la convenzione Alternativa è più efficiente o meno iniqua di queste, la popolazione spende di fatto tutto il tempo sotto la convenzione Alternativa.
La ragione per cui le convenzioni più egualitarie sono favorite in questa struttura è la seguente: si consideri un contratto alternativo con = 2 e <1/2 . Un aumento della quota distributiva a favore degli A nel contratto alternativo ha due effetti. Primo, riduce * e allora richiede un numero minore di giocate idiosincratiche degli A per abbattere il contratto alternativo, inducendo un movimento verso il Benchmark (che loro preferiscono). La ragione è che quando l'Alternativa è meno iniqua, è necessario un numero inferiore di membri di A idiosincratici per indurre i B a scegliere il Benchmark. Il secondo effetto di un aumento di è quello di aumentare *, riducendo la frazione minima dei B che giocano la risposta idiosincratica, (1 *) , richiesta per indurre gli A ad abbandonare
24 | MICROECONOMIA
il loro contratto preferito, il Benchmark, a favore dell'alternativa. I due effetti di un contratto alternativo più egualitario lavorano in senso opposto, il primo conduce ad accorciare l'attesa per una transizione dall’Alternativa al Benchmark, e il secondo a ridurre il tempo di attesa per la transizione inversa. Ma finché <1/2 , il secondo effetto prevale, e quindi la popolazione spenderà più tempo all'alternativa, e lo farà di più quanto più è egualitaria. Si noti che la figura 12.6 conferma che il sistema spende la maggior parte del tempo negli stati stocasticamente stabili. Questo potrebbe sembrare importante dato che le transizioni che governano la dinamica nell'approccio evolutivo stocastico sono caratterizzate dal fatto che le giocate idiosincratiche dei B tendono a rovinare la convenzione favorevole ai B e allo stesso modo anche per gli A. Al contrario, l'approccio dell'azione collettiva respinge queste transizioni come irrilevanti, focalizzandosi invece sulle giocate idiosincratiche motivate dalla prospettiva dell'aumento dei payoff attraverso la transizione istituzionale, in questo contesto, le giocate idiosincratiche degli A scardinano la convenzione favorevole ai B e viceversa. Perché il comportamento medio del sistema di lungo periodo non è influenzato dall'introduzione dell'azione collettiva intenzionale (invece dell'eliminazione del sentiero meno probabile quando tende a zero)? La ragione è che la convenzione E è più vulnerabile all'azione collettiva intenzionale (degli A) che E (dai B) se * < (1 *) , mentre astraendo dalle intenzioni (cioè, permettendo la giocata idiosincratica a quelli che beneficiano di una convenzione di sostituirla), E è 0
1
1
uno stato stocasticamente stabile se * < (1 *) . Si noti che le due condizioni sono equivalenti. Allora lo stesso stato è identificato come il più robusto dalle due misure. Ma questo è un risultato speciale di questa struttura del gioco 2x2 e non si generalizza a giochi più ampi, o come si vedrà, a giochi 2x2 con un processo di azione collettiva più realistico (non degenerativo), e ai casi in cui le due sottopopolazioni sono di grandezza diversa.
Frazione di tempo spesa nella convenzione indicata
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 2 5
, efficienza
, numero degli A
Figura 12.7. Le convenzioni inique persistono quando i poveri sono in numero maggiore dei ricchi. Si noti che la popolazione è 24; la convenzione Benchmark è nella quale = 2 e =1/2 . è caratterizzato dal valore di indicato e da = 0.3 . Non appena gli A aumentano, la popolazione spende gran parte del tempo in convenzioni (alcune anche molto inefficienti) che sono per loro altamente svantaggiose.
La figura 12.7 mostra l'effetto dell'assunzione di sotto-popolazioni con grandezze diverse (mantenendo il modello degenerato di azione collettiva) per un contratto alternativo con = 0.3 e con i valori di rho come indicato. Al contrario del caso con sotto-popolazioni di uguali dimensioni mostrato nella figura 12.6, quando le dimensioni della popolazione differiscono, la natura intenzionale del comportamento di risposta idiosincratica (idiosyncratic non-best response) fa differenza: convenzioni inique e abbastanza inefficienti possono essere altamente persistenti. Per esempio, nel caso di sotto-popolazioni di uguale dimensione, una convenzione con = 0.3 ha bisogno di un pari a 2.25 per essere persistente tanto quanto E ; ma se il numero degli A è 18 e quello dei B è 6, le due convenzioni saranno ugualmente persistenti quando la convenzione iniqua ( = 0.3 ) è molto meno efficiente dell Benchmark, cioè = 1.25. 1
Se gli A sono 21 (e i B 3), la popolazione spenderà la maggior parte del tempo nella convenzione iniqua anche se il livello di efficienza è metà di quello che si avrebbe nella convenzione egualitaria. Si noti che il livello di iniquità misurato dal reddito
26 | MICROECONOMIA
medio dei B relativo agli A è n(1 ) /[ (24 n)] , ciascun B interagisce con più A finché la quota relativa della popolazione degli A aumenta. Allora, nella convenzione E se = 0.3 e gli A e i B sono ugualmente numerosi, il reddito dei B è 2.33 volte 0
quello degli A, mentre se ci sono 21 A e 3 B il rapporto è 16.33. Quindi, distribuzioni del reddito altamente inique possono derivare dalla dimensione diversa delle sottopopolazioni, e per questa ragione possono essere persistenti. Il successo evolutivo di convenzioni inique e inefficienti che avvantaggiano la classe più piccola tra le due è così spiegato. Finché il tasso di giocata idiosincratica è più basso della frazione critica della popolazione richiesta per introdurre la transizione (ipotesi qui assunta), i gruppi più piccoli sperimenteranno frequentemente “opportunità di rovesciamento” (tipping opportunities) che richiedono una frazione della popolazione “convocata” per caso maggiore della frazione attesa ( stesso). Si noti che in questo caso i piccoli numeri non facilitano l'azione collettiva perché rendono più facile il coordinamento delle azioni dei membri dissuadendo così il free-riding. Invece, il vantaggio del piccolo gruppo consiste nel fatto che (così come mostra la teoria dell'errore campionario) la classe nella quale i numeri sono più piccoli genererà più opportunità di rovesciamento. Per esplorare le condizioni sotto le quali scaturiscono queste opportunità di sostituzione delle istituzioni in essere abbiamo bisogno di modellare l'azione collettiva dei membri del gruppo.
A Z IO N E C O L L E T T I VA Finora ho astratto dal problema dell’azione collettiva assumendo che ogni volta che una frazione sufficiente di una sotto-popolazione viene convocata, i suoi membri adotteranno la risposta idiosincratica (idiosyncratic non-best response) se essi (e il loro gruppo) hanno un vantaggio nel momento in cui tutti i convocati adottano la risposta idiosincratica. L’estensione della teoria dei giochi evolutivi stocastici al fine di catturare più adeguatamente il processo di azione collettiva può essere realizzata imponendo una struttura sociale particolare al processo che genera la giocata di risposta idiosincratica. Questa struttura deve spiegare perché le azioni che sono risposte idiosincratiche nel gioco del contratto possano tuttavia essere il risultato di azioni intenzionali quando il gioco è modificato al fine di includere la possibilità dell’azione collettiva. E’ necessario quindi un modello per il problema del coordinamento prodotto dall’azione collettiva, inserito nella cornice più ampia dei giochi di popolazione (population game) che riproducono l’evoluzione istituzionale. Considerando sia la natura intenzionale dell’azione collettiva sia il problema specifico del coordinamento, l’approccio stocastico sarà migliorato in modo inequivocabile. Poiché le azioni collettive generalmente prendono la forma di giochi del bene
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 2 7
pubblico con n giocatori nei quali la strategia dominante è la non partecipazione se le preferenze sono interamente individualiste, il modello esteso deve tenere in considerazione gli incentivi di ogni individuo a fare free-riding quando gli altri agiscono per compiere gli obiettivi condivisi e comuni. Un secondo elemento desiderato è che il modello dovrebbe riflettere il fatto che le opportunità di azione collettiva spesso nascono per caso, o almeno in modi troppo complessi per modellarli in maniera trattabile, esempi possono essere le depressioni economiche, le guerre, gli shock di prezzo, i boom, i disastri naturali. Infine, diversamente dalla giocata idiosincratica, la partecipazione all’azione collettiva non è solo intenzionale (invece che accidentale) ma anche condizionata dalle convinzioni di ciascuno rispetto alla probabilità e alle conseguenze del numero effettivo di coloro che sceglieranno di cambiare il loro tipo di comportamento. Per questa ragione, i fattori riguardanti i payoff globali oltre a quelli semplicemente locali (cioè, i payoff sia della convenzione in essere che di quella alternativa, invece che soltanto di quelli nei dintorni dello stato attuale della popolazione) potrebbero avere una rilevanza nei risultati.11 Per concretezza, l’azione collettiva di risposta idiosincratica (idiosyncratic non-best response) sarà esemplificata facendo riferimento allo sciopero. Si supponga che lo scioperare produca durante il processo due tipi di benefici. Primo, astraendo dalle conseguenze dell’azione, il conformismo (o la punizione ai non conformisti) può imporre un costo a quelli che non adottano l’azione più comune. Sia quindi c il costo di essere un solo non conformista, e siano (1 s)c i costi del conformismo per quelli che scioperano, dove s è la frazione dei convocati che scioperano. Il costo per i non scioperanti è sc . Secondo, ci sono costi e benefici associati all’azione che potrebbero essere indipendenti dal numero dei partecipanti, che includono il tempo, le risorse, ed eventualmente il rischio di danno associato all’azione collettiva così come il valore positivo del partecipare, ovvero ciò che Elisabeth Wood (2003) ha definito “il piacere di agire” (pleasure of agency).12 E’ ragionevole supporre che questi benefici soggettivi dipendano dalla grandezza dei guadagni che sarebbero ottenuti se l’azione avesse successo, di fatto non perché questi guadagni siano una conseguenza la cui probabilità è influenzata dalla propria partecipazione individuale (il che è veramente improbabile in un gruppo ampio), ma perché la grandezza dei guadagni che sarebbero ottenuti è probabilmente 11
Questo significa che gli individui sono “forward looking” (guardano al futuro) fin dove possono anticipare le conseguenze del successo dell’azione collettiva. 12 La convincente evidenza storica dell’antropologia (Boehm 1993, Knauft 1991) dell’azione collettiva (per esempio Moore 1978), e l’economia sperimentale passata in rassegna nei capitoli precedenti suggeriscono che gli individui si impegnano coscientemente in azioni costose per punire le violazioni delle norme, anche quando queste azioni non possono in ogni caso portare beneficio a chi le intraprende.
28 | MICROECONOMIA
connessa alla forza delle norme che motivano l’azione. Il piacere di partecipare ad un’azione collettiva che se avesse successo cambierebbe le condizioni della propria classe dallo squallore all’abbondanza è probabilmente più grande del piacere di scioperare per un aumento del salario di pochi centesimi in più all’ora. Quindi sia il beneficio netto soggettivo di un membro di A che intraprende un’azione , dove è una costante positiva che collettiva per sostituire la convenzione riflette il fatto che aggiungersi ad un’azione collettiva con l’obiettivo del cambiamento istituzionale dal quale né l’individuo né un’appartenente alla stessa classe beneficerebbero non conferisce alcun vantaggio.13 Payoffs
Figura 12.8. Il problema dell’azione collettiva. Si noti che se , l’equilibrio rischio-dominante è la partecipazione universale allo sciopero.
Se lo sciopero fallisce (perché troppo poche persone vi hanno partecipato), la convenzione in essere persisterà e tutti gli A riceveranno nei periodi successivi indipendentemente dal fatto che abbiano partecipato o no allo sciopero. Ugualmente, se lo sciopero ha successo tutti gli A otterranno a nei periodi successivi, a prescindere dall’aver personalmente intrapreso l’azione in quel periodo. Allora il confronto rilevante è tra il benefico netto di scioperare nel singolo periodo (insistendo sul contratto 1 e rifiutando quello 0), u , e quello di astenersi, u , dove: 11
1
0
(12.6) (12.7) 13
Generalmente le convenzioni non solo distribuiscono i guadagni ma influenzano anche le condizioni culturali e politiche che sono rilevanti per i costi e i benefici netti di intraprendere l’azione collettiva. Ma qui non considero questa problematica (i s non hanno pendici per indicare la convenzione che definisce la posta in gioco).
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 2 9
Queste funzioni dei payoff sono illustrate nella figura 12.8, dalla quale risulta chiaro che se coloro che sono coinvolti credono che almeno s * dei membri del loro gruppo parteciperanno, allora i payoff degli scioperanti saranno più alti dei non partecipanti, e quindi tutti opteranno per lo sciopero. Il valore critico, s * , è quello che eguaglia u e u , 0
1
(12.8) Come si possono formare le convinzioni degli A riguardo al probabile numero dei partecipanti? La più semplice supposizione consistente con il modello descritto sopra è che non avendo nessuna informazione rispetto a cosa faranno gli altri, ciascuno crede che la probabilità che ciascuno degli altri partecipi sia , cosicché la frazione attesa dei partecipanti è , e tutti parteciperanno se s * è minore di .14 Allora, la partecipazione unanime (di quelli convocati) si avrà se lo scioperare è un equilibrio rischio-dominante del gioco di azione collettiva. Questo richiede che il numeratore del secondo termine del lato destro dell’equazione 12.8 sia positivo, o che il “piacere di agire” superi la perdita di reddito nel singolo periodo. (Allora, mentre è condizione necessaria per la partecipazione che i payoff nella convenzione in essere siano inferiori, cioè (a a > 0) , essa non è una condizione sufficiente poiché non 11
00
assicura che (a a ) a > 0 .) 11
00
00
Le proprietà del sistema dinamico sono significativamente alterate quando le giocate idiosincratiche sono modellate come azioni collettive intenzionali. Si noti che se (a a ) a < 0 , l’azione collettiva non avverrà (indipendentemente dal numero 11
00
00
di potenziali innovatori casualmente estratti), e quindi la convenzione {0,0} , che è sfavorevole agli A, sarà uno stato assorbente. Quindi un sistema dinamico di azione collettiva con questo tipo di giocata di risposta idiosincratica è non ergodico, e lock-in istituzionali sono possibili, con le condizioni iniziali che determinano quale delle due convenzioni emergerà e quindi persisterà per sempre. Per vedere che questo può succedere per un valore finito del parametro “piacere di agire” , si consideri una convenzione iniqua con a a ; Quando diviene arbitrariamente piccolo dovrà accadere che (a a ) a < 0 , e quindi l’azione collettiva degli A non sarà intrapresa, e si concretizzerà e persisterà per sempre. Allora, deve esistere un 11
11
14
00
00
00
La scelta di è convenzionale ma arbitraria; gli individui potrebbero avere convinzioni precedenti della frazione che è probabile che partecipi basate su situazioni simili precedenti e cose simili. Allora, se gli individui applicano il loro ragionamento per ciascuno degli altri (ciascuno, supponendo che metà partecipino, parteciperà), predirà correttamente che s =1 . Mentre questo secondo turno di ragionamento può determinare se l’individuo si aspetta che l’azione collettiva abbia successo nel sostituire la convenzione, questa convinzione sulla possibilità del successo non è rilevante per il comportamento dell’individuo, visto che i payoffs relativi di partecipare o no sono indipendenti dal successo dell’azione.
30 | MICROECONOMIA
insieme di convenzioni meno egualitarie e non più efficienti di assorbenti.
che sono stati
Figura 12.9. La selezione di equilibri dovuta al caso e all’azione collettiva.
La figura 12.9. riproduce lo spazio dei contratti per il contratto Alternativo nel caso in cui = 2 (dove è il Benchmark, e e sono i luoghi dei contratti alternativi nei quali la stabilità stocastica è uguale al Benchmark). Contratti Alternativi molto efficienti o molto egualitari sono assorbenti poiché essi o sono Pareto superiori al Benchmark (vedi figura 12.3) o forniscono a quelli che preferirebbero i payoff del Benchmark benefici sufficienti da precludere loro di intraprendere l’azione collettiva. Si può vedere che può essere assorbente anche se non sarebbe stato stocasticamente stabile nel modello evolutivo stocastico convenzionale. Per la regione nella quale nessuno dei due contratti è assorbente, si applica il comportamento medio di lungo periodo indicato nelle figure 12.6 e 12.7. Come devono essere interpretati gli stati assorbenti? Su ampie scale temporali, i parametri del modello possono spostarsi a causa di cambiamenti culturali e politici che influenzano o cambiamenti tecnici o di altro tipo che influenzano i payoffs dei contratti rilevanti. Supponiamo che certi contratti Alternativi iniqui definiscano la convenzione in essere , ed essa rappresenti uno stato assorbente. Se il
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3 1
cambiamento tecnico rendesse il contratto progressivamente più efficiente in confronto a , allora (a a ) potrebbe alla fine superare . Di conseguenza, si otterrebbero le condizioni per l’azione collettiva, e ad un certo punto avverrebbe a . Le transizioni inverse diventerebbero nel tempo più una transizione da improbabili poiché l’aumento di aumenta il minimo numero dei B che giocano la 11
00
risposta idiosincratica richiesta per sciogliere . Allora, le domande istituzionali di nuova tecnologia possono spiegare l’emergere di nuove convenzioni contrattuali. Un cambiamento culturale che aumenta il “piacere di agire” un ruolo giocato per esempio dalla teologia della liberazione in alcune parti dell’America Latina e dalla diffusione dell’ideologia democratica in Sud Africa e nei paesi ex-comunisti – avrebbe lo stesso effetto. Questa è a grandi linee la spiegazione di Marx (nell’epigrafe del capitolo 11), che presenta la storia come una successione progressiva dei “mezzi di produzione”, ciascuno dei quali contribuisce allo “sviluppo delle forze produttive” per un periodo, poi comincia a “incatenarsi” a futuri avanzamenti tecnologici ed è rimpiazzato attraverso l’azione collettiva della classe che trarrebbe beneficio dal lo spostamento verso una nuova convenzione più adatta alle nuove tecnologie.
C O N C L U S IO N E : L’E C O L O G IA I S T I T U Z I O N A L E
D E L L ’I N E G U A G L IA N Z A
L’integrazione di caso e azione collettiva sviluppata qui è lontana dal matrimonio prima proposto tra Darwin e Marx. Scrivendo a Engels nel 1860, Marx vedeva il parallelismo tra Le origini della specie e la loro analisi dell’evoluzione umana all’interno del materialismo storico: “Per quanto sia scritto nel crudo stile inglese, questo è il libro che contiene le basi della storia naturale vista nella nostra ottica”. (Padover 1979:139). Quattordici anni dopo accanto alla tomba di Marx, Engels avrebbe detto: “Così come Darwin ha scoperto la legge dello sviluppo della natura organica, Marx ha scoperto la legge dello sviluppo della storia umana” (Tucker 1978:681). La teoria dei giochi evolutivi stocastici ha recentemente reso disponibili alcuni strumenti analitici potenti di derivazione Darwiniana, fornendo un quadro illuminante per lo studio del cambiamento istituzionale e degli “universali evolutivi”. Un contributo di particolare importanza è consistito nel mostrare che il raggrupparsi di giocate di risposta idiosincratica lavora come un congegno per la selezione degli equilibri e allora offre un meccanismo causale – che manca agli approcci parsoniano e neo-istituzionalista – che incide sul successo evolutivo delle istituzioni efficienti e egualitarie.
32 | MICROECONOMIA
Il fatto di tenere in considerazione le differenze nell’ampiezza dei gruppi e la natura intenzionale dell’azione collettiva, suggerisce comunque che il modello teorico dei giochi evolutivi stocastici standard può aver bisogno di ulteriori sviluppi per essere rilevante nella comprensione dell’evoluzione storica delle istituzioni. Le estensioni che ho introdotto sono quattro. Primo, la giocata di risposta idiosincratica è intenzionale invece che accidentale. Secondo, il tasso al quale avvengono le risposte idiosincrtiche è significativo (invece che essere infinitamente piccolo). Terzo, la giocata di risposta idiosincratica prende la forma dell’azione collettiva invece di comportamenti individuali non correlati e deviati. Quarto, i sottogruppi della popolazione hanno dimensioni diverse, dove quello più numeroso è quello con un benessere inferiore. Ho suggerito tre ragioni perché le istituzioni durevoli possono non essere né efficienti né egualitarie. Primo, indipendentemente dalla dimensione del gruppo, moderati livelli di disuguaglianza possono dissuadere dall’azione collettiva gli individui con benessere inferiore poiché il grado di disuguaglianza non è sufficiente a motivare la partecipazione. Quindi, le convenzioni inique possono persistere indefinitamente. Secondo, indipendentemente dal problema delle motivazioni dell’azione collettiva, il sistema spenderà la maggior parte del tempo nelle convenzioni con distribuzioni inique poiché i B, che preferiscono questa convenzione, sono in numero relativamente minore, cosicché la probabilità che un’estrazione casuale ottenga un numero di B sufficiente a sostituire la convenzione che essi non preferiscono, è più grande di quella necessaria agli A. Questo vantaggio dei piccoli numeri non è collegato al ragionamento convenzionale proposto da Olson (1965) e da altri e cioè che l’azione collettiva in gruppi ampi è difficile da sostenere. Terzo, convenzioni egualitarie sono inaccessibili da convenzioni Alternative altamente inique poiché il numero degli A che giocano una risposta idiosincratica richiesto per indurre i B a cambiare contratto è più grande, più iniqua è l’Alternativa. La conclusione è che la disuguaglianza sociale può essere sostenuta da convenzioni inique e inefficienti per lunghi periodi poiché livelli moderati di ineguaglianza possono essere insufficienti a motivare l’azione collettiva di ognuno dei poveri, mentre convenzioni caratterizzate da livelli estremamente alti di ineguaglianza possono essere sostituiti soltanto attraverso azioni collettive appoggiate da frazioni molto ampie di poveri. Un problema della struttura dei giochi evolutivi stocastici è che si applica soltanto al lunghissimo periodo. Per processi di aggiornamento ragionevoli, dimensione dei gruppi, e tassi di giocate idiosincratiche, i tempi di attesa medi per una transizione da un bacino di attrazione ad un altro sono particolarmente lunghi, certamente sorpassano gli intervalli di tempo storicamente rilevanti, e in alcuni casi
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3 3
non irrealistici eccedono il tempo trascorso dal raggiungimento dell’evoluzione anatomica dell’uomo moderno. La figura 12.10 mostra il numero atteso di periodi prima che vi sia una transizione da un contratto alternativo iniquo al benchmark quando quest’ultimo è uno stato stocasticamente stabile per il caso = 0.1 . La dinamica assunta è il caso degenerato di azione collettiva (ogni volta che c’è un numero di A convocati all’assemblea maggiore di quello critico, essi rifiutano il contratto convenzionale e quindi la transizione si verifica). Si noti che, come ci si potrebbe aspettare, più grande è il numero degli A più lungo è il tempo di attesa. Inoltre, quando l’Alternativa (iniqua) è efficiente quanto il Benchmark (la barra destra), essa è molto persistente anche quando ci sono solo 12 degli A. Se vi sono 32 A, la convenzione iniqua che è efficiente soltanto la metà dello stato stocasticamente stabile ha una persistenza attesa di un milione di periodi.
Figura 12.10. Aspettative dei tempi d’attesa per una transizione dalla convenzione Alternativa alla Benchmark quando il Benchmark è uno stato stocasticamente stabile. Le barre di sinistra sono per un’Alternativa con = 0,3 e =1 , mentre le quelle di destra sono per = 0,3 e =1 .
Mentre il processo biologico sottostante la dinamica a cui si riferisce l’epigrafe di questo capitolo di Sewall Wright può funzionare su centinaia di migliaia di generazioni, un approccio analogo nelle scienze sociali deve essere rilevante su scale temporali molto più brevi. Se il “periodo” fosse molto breve – diciamo un giorno – il lungo periodo di attesa nella figura sarebbe poco preoccupante, ma il periodo
34 | MICROECONOMIA
appropriato qui è un’opportunità per l’azione collettiva di cambiare una convenzione, e per questo, un anno o una decade sembrano essere più appropriate. Inoltre, molti gruppi umani sono più grandi di quelli indicati nella figura, e quindi i periodi d’attesa saranno in relazione più lunghi. La conclusione è che le condizioni iniziali persistono per periodi molto lunghi anche se la convenzione in essere è altamente iniqua e inefficiente in confronto ad una convenzione alternativa. Questo significa che il risultato che la popolazione spenderà “la maggior parte del tempo” nell’alternativa più efficiente e più egualitaria è irrilevante per l’evoluzione storica reale? Non penso sia così. Un numero di plausibili modifiche nel processo di aggiornamento può accelerare clamorosamente il processo dinamico, producendo transizioni su scale temporali storiche rilevanti. Tra queste modifiche ci sono le seguenti. Primo, molte popolazioni (nazioni, unità linguistiche, etc.) sono composte da piccoli gruppi che interagiscono frequentemente tra loro. L’appartenenza a piccoli gruppi aumenta l’importanza relativa di eventi casuali improbabili e quindi la possibilità che le giocate di risposta idiosincratica (idiosyncratic non-best response) portino a transizioni tra convenzioni a livello di gruppo e quindi in tempi più brevi. Poiché le transizioni verso gli stati stocasticamente stabili sono di solito sostenute per lunghi periodi, è possibile che l’intera popolazione transiti verso lo stato stocasticamente stabile (tutti i gruppi alla fine effettuano il cambiamento in un periodo relativamente breve). Le migrazioni o le emulazioni tra i gruppi possono indurre anche tempi di transizione più rapidi per la popolazione nel suo insieme. Hobsbawm e Rude (1968) hanno descritto l’espansione della distruzione luddista delle macchine tra la fine del XVIII e l’inizio del XIX secolo in Inghilterra come un processo di propagazione in piccoli gruppi e di contagio tra gruppi adiacenti. Poiché i gruppi sono di dimensioni abbastanza variabili, il processo può essere considerevolmente accelerato poiché i tempi di transizione dipendono non solo dalla dimensione media del gruppo ma anche da quella del gruppo più piccolo. Secondo, eventi casuali influenzano le strutture dei payoff così come i comportamenti dei membri della popolazione. Si ricordi che nella figura 12.2 la posizione dell’equilibrio instabile interno (la sella z) e il confine tra i due bacini di attrazione sono determinati dalla matrice dei payoff (equazione 12.1). Variazioni degli effetti ambientali sui payoff sposteranno allora il confine tra i due bacini di attrazione, riducendo a volte estremamente il bacino di attrazione della convenzione in essere. Questi effetti insieme alle giocate di risposta non ottima (sia stocastica che intenzionale) accelereranno il processo di transizione. Terzo, ci sono generalmente molte più di due convenzioni realizzabili, e alcune
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3 5
di queste possono essere adiacenti (cioè, le resistenze ridotte tra queste convenzioni sono piccole). Sewall Wright (1935:263), introducendo il passaggio dell’epigrafe, ha osservato che su un fitness landscape, “c’è in generale un numero molto grande di picchi separati da ‘selle’ ombrose”. Una popolazione può velocemente attraversare una larga porzione di spazio degli stati grazie ad una serie di transizioni tra convenzioni adiacenti. Quarto, il conformismo riduce l’ammontare aggregato di giocate idiosincratiche. Ma esso aumenta anche i comportamenti devianti positivamente correlati – per ciascun membro della popolazione la probabilità dell’adozione di una risposta idiosincratica è tanto più elevata quanto più altri stanno facendo lo stesso. Questo produce un raggruppamento più grande di giocate idiosincratiche e quindi, sotto condizioni plausibili, accelera il processo di transizione. Quinto, rendere il processo nel quale avviene l’azione collettiva più realistico può drasticamente ridurre i tempi di attesa per una transizione. Si supponga che una volta “convocati”, gli individui rimangano attivi nel periodo seguente e in quelli successivi finché non sono “disattivati”, e che questo succeda con una certa probabilità in ciascun periodo. Come i rivoluzionari clandestini, questi innovatori latenti continuano “a presenziare l’assemblea” ma non si impegnano nell’azione collettiva a meno che non siano in numero sufficiente per rovesciare la convenzione in essere. Finché questo non avviene essi guadagnano gli stessi payoff degli altri membri della loro sotto-popolazione. Visto che non accusano nessuna riduzione nei payoff finché rimangono latenti, il loro numero può accrescere di periodo in periodo attraverso un processo di accumulazione (drift-like process), capace quindi di abbreviare significativamente il tempo di attesa finché coloro che “presenziano l’assemblea” non superano il valore critico.15 Noi non sappiamo, ovviamente, se le modifiche della dinamica modellate nel contesto di questo capitolo possano fornire una plausibile spiegazione dei processi di cambiamento istituzionale osservati storicamente. Questa è una questione empirica che deve ancora essere esplorata sistematicamente. Per gettare luce su cambiamenti istituzionali tali come la fine dell’apartheid, del Comunismo, o dell’infibulazione in 15
Questo processo è analogo al ruolo delle mutazioni neutrali per l’emergere di caratteristiche complesse nell’evoluzione biologica: mutazioni singole potrebbero non avere effetti fenotipici e quindi i loro portatori non soffrono alcuna pressione di selezione avversa e potrebbero allora proliferare in una popolazione. Comunque l’effetto non additivo di accumulazione di molte mutazioni diverse che singolarmente sono neutrali potrebbero incidere sull’emergere di caratteristiche nuove e complesse. (si veda Stadler, Stadler, Wagner e Fontana (2001), e Rimura (1968).) Timur Kuran (1995) ha analizzato il ruolo delle “preferenze falsificate” in un simile contesto: coloro con l’intenzione di deviare non devono esprimere il loro vero obiettivo poiché facendolo sarebbero svantaggiati.
36 | MICROECONOMIA
Senegal; o la riduzione delle quote di raccolto dei latifondisti in Bengala Occidentale (descritta nel Prologo), sono richieste senza dubbio modifiche addizionali al modello. Tra queste andrebbe modellato il ruolo della leadership e della organizzazione nel coordinamento di giocate di risposta idiosincratica, e il modo in cui la repressione governativa o le riforme alterano le matrici dei payoff e le convinzioni degli agenti. Inoltre, chiaramente le istituzioni si differenziano in modi che non sono catturati dall’efficienza, dalle quote distributive e dalla dimensione dei gruppi. Certe istituzioni possono facilitare l’azione collettiva degli svantaggiati, mentre altre rendono più difficile il coordinamento. In molte situazioni la dimensione effettiva della sotto-popolazione può essere ridotta significativamente se è composta da piccoli gruppi (famiglie, sindacati locali, persone giuridiche) che quasi sempre agiscono all’unisono. Marx, e molti dopo di lui, hanno creduto che le condizioni sociali del capitalismo industriale costituissero una palestra per la rivoluzione, al contrario di precedenti istituzioni come, per esempio, la mezzadria, l’appalto dell’esazione delle imposte in società di contadini indipendenti, e la schiavitù. Barrington Moore (1966) e altri, con forse maggior accuratezza, hanno visto i rapporti clientelari delle società agrarie e i sistemi altamente iniqui di latifondo come esempi particolarmente vulnerabili al rovesciamento rivoluzionario. Invece di proseguire su queste estensioni del modello che descrive i processi di cambiamento istituzionale all’interno di un gruppo, nel prossimo capitolo ci occuperemo del modo in cui le interazioni tra i gruppi possono indurre l’evoluzione istituzionale. Al contrario dei modelli che analizzano le dinamiche all’interno del gruppo, l’approccio della selezione a più livelli, che combina le dinamiche all’interno e tra i gruppi, offre previsioni piuttosto forti sul successo evolutivo delle istituzioni che sono sia egualitarie che efficienti. Le ragioni per questo risultato, come vedremo, sono significativamente diverse da quelle avanzate per simili conclusioni dall’approccio ibrido darwiniano-marxiano o dalla teoria dei giochi evolutivi stocastici.
C A S O , A Z I O N E C O L L E T T I VA E I N N O VA Z I O N E I S T I T U Z I O N A L E | 3 7
Riferimenti bibliografici
Axelrod, R. and W. D. Hamilton (1981). "The Evolution of Cooperation." Science 211: 1390-1396. Bergin, J. and B. L. Lipman (1996). "Evolution With State-Dependent Mutations." Econometrica 64(4): 943-956. Boehm, C. (1993). "Egalitarian Behavior and Reverse Dominance Hierarchy." Current Anthropology 34(3): 227-254. Cortes, H., translated and edited by Anthony Pagden (1986). Letters From Mexico. New Haven, Yale University Press. Greenberg, J. B. (1989). Blood Ties: Life and Violence in Rural Mexico. Tucson, The University of Arizona Press. Hayek, F. A. (1988). The Fatal Conceit: The Errors of Socialism. Chicago, University of Chicago Press. Hobsbawm, E. and G. Rude (1968). Captain Swing. New York, Pantheon. Kimura, M. (1968). "Evolutionary Rate at the Molecular Level." Nature 217: 624-626. Knauft, B. M. (1991). "Violence and Sociality in Human Evolution." Current Anthropology 32(4): 391-428. Kuran, T. (1995). Private Truths, Public Lies: the Social Consequences of Preference Falsification. Cambridge, Harvard University Press. Marx, K. (1963). The Eighteenth Brumaire of Louis Bonaparte. New York, International Publishers (original publication date, 1852). Moore, B. J. (1966). Social Origins of Dictatorship and Democracy; Lord and Peasant in the Making of the Modern World. Boston, Beacon Press. Moore, B. J. (1978). Injustice: The Social Bases of Obedience and Revolt. White Plains, M. E. Sharpe. Olson, M. (1965). The Logic of Collective Action: Public Goods and the Theory of Groups. Cambridge, MA, Harvard University Press. Paddock, J. (1975). "Studies on Anti-Violent and 'Normal' Communities." Aggressive Behavior 1: 217233. Paddock, J. (1991). "Violence and Sociality in Human Evolution." Current Anthropology 32(4): 391428. Padover, S. K., transl., Ed. (1979). The Letters of Karl Marx. Englewood Cliffs, Prentice-Hall. Parsons, T. (1964). "Evolutionary Universals in Society." American Sociological Review 29(3): 339357. Smith, J. M. and G. R. Price (1973). "The Logic of Animal Conflict." Nature 246: 15-18. Stadler, B. M. R., W. Fontana, et al. (2001). "The Topology of the Possible: Formal Spaces Underlying Patterns of Evolutionary Change." Journal of Theoretical Biology 213: 241-274. Tucker, R. C. (1978). The Marx-Engels Reader. New York, W. W. Norton and Company. van Damme, E. and J. W. Weibull (2001). "Evoution in games with endogenous mistake probabilities." Journal of Economic theory 106(2): 296-315. Wright, S. (1935). "Evolution in Populations in Approximate Equilibrium." Journal of Genetics 30: 257-266. Young, H. P. (1998). Individual Strategy and Social Structure: An Evolutionary Theory of Institutions. Princeton, NJ, Princeton University Press.
XIII L A C OEVOLUZIONE DI I STITUZIONI E P REFERENZE
Gli Americani sono soliti spiegare gran parte delle azioni della loro vita con il principio dell’interesse personale, compreso nel modo giusto;…..A riguardo penso che essi continuamente si contraddicano; negli Stati Uniti così come altrove, le persone dimostrano impulsi disinteressati e spontanei che sono naturali al genere umano; ma gli Americani raramente ammettono di provare emozioni di tal tipo. Alexis de Tocqueville, Democracy in America (1830)
Sia che la lotta tra gruppi prenda la forma di una guerra o quella di una più intensa competizione per l’offerta di commercio e di cibo, il gruppo in cui la competizione interna non controllata ha prodotto un ampio proletariato senza alcun interesse concreto nello Stato, sarà il primo a collassare. Karl Pearson, Socialism and Natural Selection (1894)
Quando quattro giovani facinorosi, in una pizzeria aperta durante la notte nella città italiana di Rimini, iniziarono a gettare cibo e ad insultare il fornaio, un uomo senegalese di nome Sarr Gaye Diouf intervenne per difenderlo (Meletti 2001). Uno dei teppisti afferrò Diouf per le braccia e gli altri tre lo pugnalarono una quindicina di volte con i coltelli per la pizza. Diouf morì immediatamente e i colpevoli vennero arrestati. Diouf lavorava temporaneamente come uomo delle consegne, sperando di diventare presto un tassista. Egli non conosceva il fornaio se non come cliente occasionale e i suoi aggressori, in visita a Rimini da Napoli, non avevano mai visto Diouf prima. Eppure Diouf diede la sua vita per difendere il fornaio e i giovani malviventi uccisero lo straniero – Diouf – per nulla scoraggiati dalla certezza dell'arresto. Una tale tragedia evoca orrore, ma non sorpresa. Di continuo si assiste a persone sacrificarsi per degli sconosciuti, né é raro vedere persone ucciderne altre, anche per piccole provocazioni, specialmente quando l'obiettivo é un “outsider”. Questi due aspetti
2 | MICROECONOMIA
del comportamento umano sono pensati, genericamente, come antitetici, ma come vedremo, possono avere un'origine comune: la competizione tra gruppi può avere favorito quelle nazioni, tribù, bande ed altri gruppi che hanno promosso preferenze altruistiche nei confronti di alcuni stranieri e ostilità nei confronti di altri. Un altro esempio empirico – la coevoluzione di cittadinanza moderna e guerra – può suggerire alcuni dei processi sottostanti.
Figura 13.1. Citta’ autonome nel Sud della Germania (Fonte: T.A. Brady (1985),p. xvi)
Otto secoli fa, l'area intorno a Rimini, dove Diouf è stato ucciso, era governata da piú di una dozzina di corpi sovrani. Nell'attuale Italia vi erano dalle due alle trecento città-stato diverse. Nella Germania del Sud, mezzo millennio fa, vi erano sessantanove città libere, oltre a numerosi episcopati, principati, ducati ed altre entità simili allo Stato (Brady 1985). Le figure 13.1 e 13.2 illustrano questa proliferazione di sovranità nel quindicesimo secolo. L'intera Europa, a quel tempo, era governata all'incirca da cinquecento corpi sovrani. Ma con la Prima Guerra Mondiale, rimasero poco più di una trentina di Stati. Questa riduzione degli Stati non solo abbassò il numero dei corpi sovrani, ma ridusse anche l'eterogeneità delle forme di governo. Emerse una singolare forma politica – lo Stato nazionale – dove una volta regnavano, secondo Charles Tilly (1990:5), “imperi, città-stato, federazioni di città, gruppi di proprietari, ordini religiosi, leghe di pirati, bande guerriere e molte altre forme di governo”. A differenza delle varie forme di governo concorrenti che esso ha cancellato, lo Stato nazione esibiva una struttura burocratica centralizzata e manteneva l'ordine su un territorio definito, con la capacità di incrementare sostanzialmente il reddito attraverso la tassazione e di spiegare
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|3
forze armate permanenti1.
Figura 13.2. Entità politiche nel quindicesimo secolo in Italia. La grande maggioranza delle entità sovrane più piccole (come San Gimignano) non sono mostrate; da notare le molte entità, una volta autonome (come Verona, Bergamo, Padova, Vicenza) tutte assorbite da Venezia agli inizi del secolo. Fonte: Matthew (1992:212).
Cosa spiega il successo di questa nuova forma di organizzazione della società? Una semplice risposta é che quando gli Stati-nazione erano in guerra con le altre forme di governo, essi tendevano a vincere. Ma Tilly scrive: “Nessun monarca poteva condurre una guerra senza assicurasi prima l'acquiescenza di tutta la popolazione e la cooperazione attiva di alcuni notabili” (Tilly 1990:75). Un sistema di tassazione pagato in moneta, insieme con la capacità di prendere a prestito somme elevate di denaro, permise agli Stati-nazione di condurre guerre senza dover ricorrere a misure impopolari, come la confisca diretta di cibo, armi e animali. Inoltre, l'introduzione di diritti di proprietà ben definiti e dei mercati facilitava questa tassazione – e l'approccio, basato sul debito, alla mobilizzazione delle risorse necessarie a vincere la guerra. L'istituzione dei mercati 1
In aggiunta a Tilly (1990), sono state utilizzate anche le seguenti referenze: Gellner (1983), Bright e Harding (1984), Tilly (1975), Mack Smith (1959), Anderson (1974). Wallerstein (1974), e Bowles e Gintis (1984).
4 | MICROECONOMIA
favoriva, invece, la formazione dello Stato in un modo meno ovvio, introducendo l'osservanza alla legge. Tilly continua nel suo commento: Coloro che partecipavano ai mercati contribuivano significativamente alla necessaria sorveglianza registrando prezzi e cessioni. I cittadini propriamente civilizzati, inoltre, finirono per attribuire valore morale al pagamento delle tasse; essi si controllavano a vicenda, accusando gli evasori delle tasse di free-riding.
Gli stati europei esibivano una particolare struttura spaziale con entità politiche grandi ma difficilmente controllabili nelle zone periferiche (per esempio, la Russia e l'Impero Ottomano), con raggruppamenti di cittá-stato e di federazioni (le cittá-stato italiane ed i cantoni svizzeri), e Stati più centralizzati, alla fine vittoriosi, come la Francia e il Brandeburgo, una via di mezzo tra i due. Gli stati-nazione di successo assimilavano i popoli che assoggettavano e con il tempo promuovevano e, a volte, imponevano un processo di integrazione delle nuove generazioni attraverso l'istruzione scolastica2. A causa del loro successo, forme politiche simili agli stati nazionali furono esportate si svilupparono in tutto il mondo, soppiantando forme di organizzazione differenti. Con lo stato-nazione e con l’emergere dell'economia capitalistica, la popolazione Europea crebbe notevolmente – si moltiplicò di quindici volte in Gran Bretagna nei quattro secoli successivi al 1500 - superando largamente i tassi di crescita della popolazione in tutto il mondo (eccetto, forse, per il diciottesimo secolo in Cina). Come risultato, la diffusione globale dello stato-nazione venne promossa non solo dalla competizione tra stati della periferia europea, ma anche dalla massiccia emigrazione di persone che non solo esportarono i tratti culturali europei, ma anche le capacità militari che favorirono la costruzione dello Stato in Europa. In breve, lo Stato nazionale si sviluppò perché sconfisse con le guerre differenti forme di organizzazione politica. L'abilità di vincere le guerre dipendeva dalla capacità di mobilizzare soldati e le altre risorse militari. Tale capacità dipendeva dall’ampiezza degli scambi commerciali, dalla disponibilità del credito, dall'osservanza della normativa fiscale e dalla volontà di servire il sovrano in guerra. Queste caratteristiche erano rafforzate dalla diffusione delle norme riguardanti i comportamenti individuali, che, anche se all'inizio non vantaggiose per i singoli individui, contribuivano al successo del gruppo. Tra le ragioni vi erano la volontaria osservanza della normativa fiscale, la volontà di incorrere in 2
Weber (1976) descrive l'assimilazione di popolazioni distinte dallo Stato della Francia. Gellner (1983) sviluppa la connessione tra la nascita del commercio, lo Stato nazionale e il sorgere di ciò che ha chiamato “exo-education”, ovvero, la socializzazione dell'infanzia portata avanti da specialisti che non siano membri della famiglia o parenti stretti del bambino.
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|5
rischi durante una guerra per il sovrano o per la nazione, ed il rispetto dei diritti di proprietà. La norma della monogamia può aver giocato un ruolo simile anche se meno ovvio nel salvaguardare la cooperazione popolare alla realizzazione dei progetti della elite3. Ognuna di queste norme contribuisce, direttamente o indirettamente, alla capacità di uno Stato di fare guerra ma richiede a coloro che rispettano le norme di rinunciare a possibili guadagni e di tollerare eventuali perdite (incluso il minore successo riproduttivo). Ovviamente, gli Stati nazionali crearono anche un ambiente legale e culturale in cui coloro che aderivano alle norme avrebbero potuto migliorare le loro capacità di fare guerra soffrendo una perdita piccola o nulla rispetto coloro che non aderivano a queste norme. Ma l'emergenza e la diffusione rapida degli Stati nazionali si é tipicamente basata sulle norme vantaggiose per il gruppo e costose per il singolo individuo. Altri casi empirici e ben documentati di conflitti ed assimilazioni tra gruppi sono quelli della conquista della Dinka ad opera di Nuer (Kelly 1985) ed il processo dell'evoluzione culturale nella Nuova Guinea (Soltis, Boyd, e Richerson 1995). Un altro esempio é dato dall’ampia diffusione dell'Islam nel secolo seguente la morte di Maometto – nel 750 esso si estendeva su un'ampia zona che andava dal fiume Indo ad est sino al fiume Duro, in Spagna, ad ovest. Ciò fu possibile (secondo Levy 1957:3) perchè la fede in Allah forniva “un legame ben più forte, anche se più sottile di quello di una semplice somiglianza culturale” e facilitava un sistema inclusivo di tasse, arruolamento militare ed alleanza”4. Quindi, il processo del conflitto di gruppo, seguito dall'assimilazione culturale o dall'estinzione fisica, sembra essere un fenomeno molto generale. In questo capitolo, esploreremo il ruolo della competizione tra gruppi nell'evoluzione delle norme altruistiche, e analizzeremo perché alcuni individui sono disposti a rischiare la propria vita per difendere uno sconosciuto assalito da giovani criminali, o ad andare in guerra per la gloria della nazione. 3
4
Herlihy e Klapische-Zuber (1985-157) scrive: “La grande conquista sociale del primo Medioevo fu l'imposizione delle stesse regole di condotta sessuale e domestica sia per i ricchi che per i poveri.” Si veda anche MacDonald (1995). Mentre riduceva i vantaggi delle persone di potere e di successo, la norma della monogamia (così come la successiva estensione del suffragio ai lavoratori) può essere stata strumentale, come Alexander (1979) ed altri suggeriscono, nel permettere ai potenti di reclutare gli altri nei loro progetti, incluso quello della guerra. Un altro caso ben documentato di selezione di gruppo spiega la pratica della condivisione dell'Ilama tra individui non legati da rapporti di parentela nell'altopiano peruviano (Flannery, Marcus e Reynold 1989 e Weinstein, Shugart e Brandt 1983).
6 | MICROECONOMIA
A LT R U IS M O
R E C IP R O C O E R E C IP R O C ITA ’ F O RT E
I modelli nel capitolo 7 hanno mostrato come le strutture delle interazioni sociali possano rendere comportamenti cooperativi come le strategie “occhio per occhio benevolo” (“nice tit-for-tat”) una miglior risposta reciproca, anche quando gli individui posseggono le convenzionali preferenze egoistiche sui risultati delle loro azioni. La cooperazione convenzionale é una forma di ciò che il biologo R. Trivers (1971) ha chiamato altruismo reciproco, ovvero, azioni che conferiscono un beneficio agli altri attraverso un costo a se stessi nei casi in cui ci si aspetta un beneficio successivo reciproco tale da controbilanciare il costo affrontato. L'altruismo reciproco e l’altruismo famigliare (kin altruism) – l'azione, costosa per chi la compie, a beneficio dei membri della famiglia o di altri parenti stretti – sono spiegazioni comuni di atti apparentemente generosi tra individui ed altri animali. Le interazioni ripetute e sfaccettate, permettendo la ritorsione contro le azioni anti-sociali, contribuiscono senza dubbio al successo evoluzionistico degli atti apparentemente generosi. Allo stesso tempo l'altruismo reciproco non costituisce una spiegazione adeguata di quelle forme di cooperazione e mutua assistenza così diffuse tra gli essere umani. Anzitutto, la gran parte dell'evidenza sperimentale riguardo le preferenze altruistiche (capitolo 3) é basata su giochi con interazioni non ripetute, o sulla fase finale di giochi ad interazione ripetuta. E' molto improbabile che in questi esperimenti i soggetti non siano consapevoli di tale struttura basata su un’interazione non ripetuta. Vi é un'evidenza molto forte del fatto che le persone distinguono tra interazioni ripetute e non, e adattano i loro comportamenti di conseguenza. L'evidenza non sperimentale é ugualmente importante: molti atteggiamenti comuni in guerra così come nella vita di tutti i giorni non sono facilmente spiegabili dall'aspettativa di un successivo comportamento reciproco. In secondo luogo, le condizioni degli uomini primitivi possono aver reso il meccanismo ripetizione-punizione uno strumento inefficace per diffondere comportamenti altruistici. I membri delle bande nomadi potevano evitare facilmente la punizione semplicemente spostandosi. Inoltre, in molte situazioni critiche all'evoluzione umana, la ripetizione delle interazioni é abbastanza probabile, come nel caso di gruppi che rischiavano l'estinzione a causa di conflitti o condizioni climatiche sfavorevoli. In terzo luogo, il celebrato “Folk Theorem” mostra che se le interazioni ripetute sono sufficientemente probabili ed i tassi di sconto sufficientemente bassi, l'equivalente
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|7
gioco ad n persone della strategia “occhio per occhio benevolo” (“nice tit-for-tat”) ed altre strategie più complesse, possono sostenere un equilibrio di Nash con alti livelli di cooperazione (Fudenberg e Maskin 1986). Ma il “Folk Theorem” mostra anche che quando il meccanismo di ripetizione-punizione in effetti funziona, funziona troppo bene nel senso che sostiene un vasto numero di risultati – alcuni di essi appena più cooperativi della mutua defezione – mentre non fornisce spiegazioni sul perchè gli equilibri più cooperativi e più efficienti possano essere favoriti ai risultati meno cooperativi. Alcuni modelli recenti (Fudenberg e Maskin 1990) sono stati in grado di restringere l'insieme degli equilibri sostenuti dalla ripetizione. Ma essi richiedono che gli attori vivano all'infinito o (equivalentemente) che abbiano dei tassi di preferenza intertemporale pari a zero, o altre assunzioni non realistiche. Infine, come Boyd e Lorberbaum (1987), Joshi (1987), ed altri hanno puntualizzato, é difficile sostenere una cooperazione attraverso la ripetizione e la ritorsione quando le interazioni non sono diadiche – come nei mercati di cambio studiati nel capitolo 7 – ma invece coinvolgono un gran numero di persone. Eppure, le interazioni tra gruppi con un vasto numero di persone sono abbastanza comuni, ad esempio la difesa o il rischio in comune o la costruzione della reputazione di un gruppo. Per capire il problema, consideriamo un gioco del bene pubblico con individui in cui ogni membro contribuisce se ognuno degli altri membri contribuisce e defeziona in caso contrario. Se i membri a volte adottano un comportamento idiosincratico (non una miglior risposta) o l'osservazione del comportamento altrui é soggetta ad errore, eventi casuali scoraggeranno la cooperazione, in quanto vi sarà sempre qualcuno che crederà che qualcun altro non contribuirà. La stessa fragilità affligge anche strategie che apparentemente sono non così stringenti. Consideriamo una strategia di cooperazione condizionale: si coopera (contribuisce) se almeno n m tra gli altri membri cooperano nella fase finale, dove m < n . Chiamiamo tale strategia m -Cooperare. La sola altra strategia possibile é il Defezionare incondizionatamente. Consideriamo tale popolazione nell'equilibrio di Nash in cui n +1 m stanno giocando la strategia m -Cooperare e adottano Defezionare (vi devono essere m persone che defezionano in equilibrio poiché altrimenti cambiare strategia da m -Cooperare a Defezionare costituirebbe una miglior risposta). Supponiamo che con una ridotta probabilità , coloro che adottano la strategia m -Cooperare cambiano la loro strategia (o per lo meno ciò è quanto osservato dagli altri membri). Abbiamo visto sopra come la popolazione adotterà Defezionare se
8 | MICROECONOMIA
un singolo membro tra coloro che adottavano m -Cooperare defeziona (o viene percepito tale). Quindi, un tale equilibrio di Nash sarà sostenuto in un dato periodo solo se tutti i n +1 m continueranno a giocare la strategia m -Cooperare e questo avviene con probabilità (1 ) che diventa molto piccola per un n grande. Quindi, nei gruppi larghi, gli equilibri cooperativi sostenuti da strategie tipo m -Cooperare sono molto vulnerabili a causa eventi casuali. n+1m
Parte del problema delle strategie tipo m -Cooperare deriva dal fatto che nei gruppi grandi, non sempre ci si può basare sulla punizione inflitta a coloro che defezionano attraverso la mancata cooperazione degli membri del gruppo. Supponiamo che m = 0 , così che tutti gli n +1 membri adottano la strategia m Cooperare e continuano a cooperare se gli altri membri non defezionano. Se un singolo membro defeziona in qualsiasi periodo, allora tutti gli altri membri defezionano per sempre. Supponiamo che, come forma di punizione dell'unica persona che defeziona, la strategia m -Cooperare produca un “male pubblico”: tutti i membri – gli n che m Cooperano e l'unico che defeziona – si accollano la perdita del beneficio della cooperazione. Si può notare che un tale problema esiste, anche se in una forma molto più attenuata nel caso diadico con la semplice strategia tit-for-tat: colui che defeziona si accolla metà (anziché l' del costo totale derivante dalla mancata cooperazione. Ovviamente vi é un vasto numero di strategie possibili e la dimostrazione che una di esse – -Cooperare – non funzioni non significa che nessuna possa funzionare. Allo stesso tempo, i problemi con la strategia -Cooperare, come modo attraverso il quale l’egoismo può promuovere la cooperazione, sono abbastanza generali e possono interessare la maggior parte delle strategie possibili in un tale contesto, se non tutte. Quindi, mentre la punizione egoistica può indurre la cooperazione nelle relazioni diadiche o di piccola scala, essa é costosa da implementare nel caso di gruppi più grandi. Come risultato, ed anche per le ragioni descritte sopra, il tentativo di spiegare – sia in economia che in biologia evoluzionistica – tutti o la maggior parte degli atteggiamenti altruistici come “egoistici nel lungo periodo” non sembra persuasivo. Tocqueville aveva ragione. A volte un atto apparentemente generoso é semplicemente tale – un comportamento costoso che beneficia un altro membro del gruppo senza nessun probabile comportamento reciproco verso l'individuo altruista. Di solito, una tale forma di altruismo incondizionato é rivolta ai propri famigliari, ma vi sono anche frequenti episodi in cui essa é rivolta a sconosciuti, come mostra l'aneddoto raccontato all'inizio del capitolo 3. Come abbiamo visto, la reciprocitá forte – la
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|9
predisposizione a cooperare, punire o premiare gli altri, condizionata al loro comportamento persino in una situazione one shot o in altre situazioni in cui non vi é alcuna aspettativa di un eventuale ritorno – é anch'essa una forma comune di comportamento osservata negli esperimenti. “Forte” sta a sottolineare che si tratta di un comportamento altruistico da non confondere con l'altruismo reciproco di Trivers, che alla fine non é affatto altruismo, e potrebbe essere chiamato reciprocità debole. Al contrario dell'altruismo incondizionato, il comportamento dell'altruista forte dipende dal tipo di persona con cui esso sta interagendo. Usando le parole del poema epico Norse del tredicesimo secolo The Edda (Clarke 1923:55), un reciprocatore forte sarà “amico dei suoi amici” e “sorriderà ai sorrisi e mentirà con i traditori”. Una forma importante di reciprocità forte é la punizione altruistica, ovvero, l'affrontare un costo per infliggere costi a coloro che violano le norme benefiche per il gruppo. Il comportamento é altruistico se induce una maggiore aderenza alle norme, incrementando il beneficio medio del gruppo. L'evidenza sperimentale della punizione altruistica deriva dai giochi dei beni pubblici, passati in rassegna nel capitolo 3, ed é parte della strategia del Punitore, descritta nel capitolo 11. La punizione altruistica permette di avere come obiettivo coloro che violano le norme e non si basa sull'aspettativa di guadagni futuri, evitando, quindi, alcuni degli svantaggi delle strategie come la strategia -Cooperare nei gruppi grandi. Ma, come ogni altra forma di altruismo, essa crea un enigma a livello di evoluzione. Né l'altruismo incondizionato né la reciprocità forte sono facilmente spiegabili come miglior risposte definite sull'insieme dei guadagni materiali del gioco. Ma se gli altruisti incondizionati e i reciprocatori forti sopportano il costo di conferire dei benefici agli altri, essi saranno sempre svantaggiati in qualsiasi processo evolutivo che favorisce coloro che hanno un guadagno maggiore. Il fatto che le persone esibiscano comunemente certi comportamenti necessita una spiegazione. Parte della risposta riguarda gli effetti della competizione tra gruppi.
LA
C O E V O L U Z IO N E D E I T R AT T I IN D IV ID U A L IS T IC I E D I G R U P P O
Le pratiche umane individuali altruistiche possono essere sorte ed avere persistito perchè gli individui dei gruppi nei quali tali pratiche erano prevalenti ne hanno tratto beneficio, anche se coloro che di fatto le mettevano in atto beneficiavano meno dei propri compagni di gruppo. Sappiamo che i tratti del comportamento individuale
10 | MICROECONOMIA
possono proliferare in una popolazione dove gli individui copiano i vicini che sembrano avere successo. Così pure le norme distributive, le convenzioni linguistiche o i comportamenti individuali che sostengono le forme di governo o i sistemi di diritti di proprietà, si diffondono o scompaiono attraverso l'emulazione delle caratteristiche dei gruppi di successo ad opera dei membri con meno successo. Questo processo spesso ha luogo come risultato di forme di competizione militare, economica o di altro tipo. Charles Darwin (1873:156), nell'epigrafe del capitolo 11, si riferisce al coraggio, alla simpatia o all'altruismo come possibili esempi: questi tratti proliferarono perchè “una tribù che possedeva tali qualità si sarebbe diffusa e sarebbe stato vittorioso sulle altre tribù”. Quindi, i tratti formalmente altruistici (costosi per l'individuo che li compie ma benefici per il gruppo), che possono proliferare sotto l'influenza della selezione del gruppo, includono i comportamenti dannosi ai membri degli altri gruppi. In effetti, il processo che modelliamo qui di seguito può esser meglio descritto dimostrando il successo evolutivo dei gruppi egoistici piuttosto che degli individui generosi5. Anche se la definizione convenzionale di altruismo si riferisce solo alle relazioni all'interno del gruppo. Gli individui dei nostri modelli interagiscono anche con i membri di altri gruppi. Nel modello, gli individui altruistici conferiscono benefici ai compagni del gruppo mentre arrecano costi o perdite materiali agli estranei. I termini “benefico al gruppo” o “egoista” si riferiscono dunque ai soli rapporti con gli altri membri dello stesso gruppo. Come é stato da lungo tempo riconosciuto, nelle popolazioni composte da gruppi caratterizzati da un maggior livello di cooperazione tra i membri stessi piuttosto che con gli estranei, i processi evolutivi possono essere distinti in effetti della selezione tra gruppi e all'interno del gruppo. Dove il grado di riproduzione dei tratti di successo dipende dalla composizione del gruppo e dove le differenze nella composizione tra i gruppi persistono attraverso il tempo, la selezione dei gruppi (a volte chiamata selezione a più livelli) contribuisce a determinare la rapidità e la direzione del cambiamento evolutivo. Il modello della prima rivoluzione dei diritti di proprietà nel capitolo 11 é un esempio di tale processo. Il classico problema della selezione dei gruppi sorge quando gli effetti tra i gruppi favoriscono la proliferazione di tratti altruistici, come, ad esempio, l'altruismo che sarebbe penalizzato dalla pura selezione individuale. La selezione di gruppo costituisce uno sbocco per l'evoluzione dell'altruismo.
5
Stiamo parafrasando Laland, Pdling-Smee e Feldman (2000:224).
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|11
Pochi studiosi delle popolazioni umane hanno messo in dubbio che le istituzioni, le nazioni, le imprese, le bande e gli altri gruppi possano essere soggetti alla pressione selettiva che opera a livello di gruppo piuttosto che a livello individuale. Ma, fino poco tempo fa, la maggior parte dei modelli formali dei processi evolutivi era stata fornita da biologi e la maggior parte di essi concluse che gli effetti a livello di gruppo non potevano essere controbilanciati dagli effetti della selezione individuale all'interno del gruppo, eccezion fatta per i casi in cui vi fossero delle circostanze particolari che incrementavano le differenze tra gruppi rispetto a quelle all'interno del gruppo. La valutazione negativa della rilevanza empirica della selezione di gruppo deriva, in primo luogo, dalla presunzione che il tasso di selezione all'interno del gruppo sia più rapido rispetto a quello della selezione tra i gruppi. Ciò deriva in parte dal fatto che le differenze tra gruppi sono soprattutto dovute al caso e quindi sono insignificanti rispetto alle differenze all'interno del gruppo. Quindi, i modelli della selezione di gruppo furono considerati come un fallimento rispetto al loro obiettivo, ovvero, quello di spiegare il successo evolutivo dei comportamenti altruistici. Come risultato, mentre la spiegazione dei comportamenti benefici per il gruppo si é focalizzata su meccanismi basati su rapporti di parentela o similarità, il notevole livello di altruismo non basato su tali rapporti era stato interpretato come altruismo reciproco o rimaneva, per la maggior parte, non spiegato6. Ma gli studi successivi (vedi le letture consigliate) suggeriscono che gli impedimenti alla selezione di gruppo possano essere meno generali di quanto affermi la critica. Inoltre, la selezione di gruppo può essere di importanza considerevolmente maggiore tra gli umani che non tra gli animali. Tra le caratteristiche della natura umana, che possono favorire la selezione tra i gruppi, vi é la nostra capacità di sopprimere le differenze fenotipiche all'interno dei gruppi attraverso la condivisione delle risorse, la mutua assicurazione, il consenso sulle decisioni da prendere, la trasmissione culturale conformista, le forme di differenziazione sociale che supportano alti livelli di interazioni distribuite in gruppi, il mantenimento della frontiere dei gruppi, ed i frequenti conflitti tra gruppi diversi. Altri animali si comportano, in parte, allo stesso modo, ma non completamente. La selezione di gruppo può funzionare sui tratti del comportamento che
6
Ovviamente, quelle descritte non esauriscono tutte le spiegazioni offerte. Simon (1990), Caporael et al. (1989), ed altri hanno proposto un meccanismo per mezzo del quale comportamenti costosi ma benefici per il gruppo esercitano free riding sui comportamenti che beneficiano l'individuo (la “docilità” per esempio) con cui essi sono pleitoricamente associati. Gintis, Smith e Bowles (2002) mostrano come un comportamento costoso per l'individuo che lo mette in atto ma benefico per il gruppo possa proliferare se esso costituisce un segnale veritiero del valore di uno come compagno o partner di coalizione.
12 | MICROECONOMIA
sono trasmessi sia geneticamente che culturalmente. Il modello dell'evoluzione dei diritti di proprietà del capitolo 11 considerava gli effetti della selezione di gruppo sui tratti trasmessi culturalmente, In questo capitolo consideriamo un modello di selezione di gruppo dei tratti trasmessi geneticamente. Affronteremo due questioni. In primo luogo, cosa contribuisce all'evoluzione delle forme, individualmente costose e benefiche al gruppo, di altruismo nei confronti delle persone non legate da rapporti di parentela? E, in secondo luogo, cosa contribuisce al successo delle strutture istituzionali comuni a livello di gruppo, che Parson (1964) ha definito “universali evolutivi” come gli Stati, la condivisione delle risorse e la monogamia, che sono emersi ed hanno proliferato ripetutamente in un'ampia varietà di circostanze durante il corso della storia umana? Il processo di coevoluzione che andremo a studiare e simulare é basato sull'idea che le due questioni di cui sopra possano essere meglio risolte congiuntamente piuttosto che singolarmente. Un esempio di certe caratteristiche strutturali a livello di gruppo é costituito dal livellamento delle istituzioni, come la monogamia e la condivisione del cibo tra i non parenti, ovvero quelle istituzioni che riducono le differenze all'interno del gruppo nella capacità riproduttiva o nel benessere materiale. Riducendo le differenze nel successo individuale all'interno del gruppo (in benessere, guadagni materiali o altre misure), certe strutture possono aver attenuato le pressioni selettive all'interno del gruppo, le quali operano contro le pratiche costose per l'individuo ma benefiche per il gruppo, dando, quindi, ai gruppi che le mettono in atto, vantaggi in termini di competizione verso gli altri gruppi7. In questo caso, la presenza diffusa di caratteristiche strutturali del gruppo, come il livellamento delle istituzioni viene spiegato dal loro contributo alla proliferazione dei tratti individuali benefici per il gruppo di appartenenza e dal contributo di questi tratti alla sopravvivenza del gruppo. L'idea secondo la quale la soppressione della competizione all'interno del gruppo può influenzare, in maniera rilevante, la dinamica evolutiva é stata ampiamente riconosciuta in alcuni insetti ed altre specie. In un articolo che esamina il caso del fungo Dictyostelium discoideum, Steven Frank (1995:520) scrive: “La teoria dell'evoluzione non ha spiegato come la competizione tra le unità di livello più basso sia soppressa nella formazione di unità evolutive di livello più alto,” aggiungendo che “il mutuo vigilare e il 7
Nel modello consideriamo la “condivisione delle risorse”. Da notare che mentre essa può essere motivata da egualitarismo, sicurezza, o altri motivi, i suoi effetti attenuano le differenze all'interno del gruppo.
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|13
rafforzamento dell’equità (fairness) evolutiva sono anche richiesti per l'evoluzione della crescente complessità sociale”. Christopher Boehm (1999:211) si é riferito al processo della sanzione irrogata dal gruppo agli agenti anti-sociali modellati nel capitolo 11 come “una 'rivoluzione politica' vissuta dagli umani del Paleolitico che crearono le condizioni sociali sotto le quali la selezione di gruppo poteva efficacemente supportare i geni altruistici”. Similmente, Irenaus Eibl-Eibesfeldt (1982:177) si riferiva all'importanza della “indottrinamento per rafforzare i valori, per obbedire all'autorità, e ... per condividere principi etici” e pensava che “attraverso tali strategie, i gruppi diventano talmente compatti da agire come unità di selezione.” Nelle pagine che seguono, presenteremo un modello del processo di selezione di gruppo basato su una semplificazione notevole dei processi evolutivi – l'equazione di Price – interpretata e corretta per affrontare le peculiarità dell'evoluzione nelle popolazioni umane. Gli effetti tra i gruppi sono basati su guerre periodiche tra i gruppi in cui i “vincitori” sostituiscono i “perdenti” occupando i loro luoghi. Le estinzioni dei gruppi quindi giocano un ruolo importante nel processo evolutivo. Anzitutto spiegheremo come l'analisi dei conflitti tra i gruppi possa illuminare l'evoluzione dei comportamenti individuali formalmente altruistici. Successivamente svilupperemo un modello di riproduzione differenziale dei tratti individuali soggetti alla selezione a più livelli attraverso i conflitti di gruppo, le estinzioni e le nascite. Questo modello degli effetti della selezione di gruppo sui tratti trasmessi geneticamente può essere usato per studiare l'evoluzione culturale8. Useremo poi una simulazione ad agenti (agent-based) per determinare le condizioni secondo le quali un tratto costoso per l'individuo portatore e benefico per il gruppo possa proliferare nella popolazione (i valori dei parametri chiave riguardano la frequenza dei conflitti nel gruppo, gli aggiornamenti degli individui, la grandezza del gruppo e la migrazione tra gruppi). La popolazione simulata viene calibrata così da riprodurre le condizioni sociali ed ecologiche dei 50.000 anni precedenti l’avvento dell'agricoltura, un periodo abbastanza lungo da modellare i processi di selezione a livello individuale e di gruppo in modo da avere i maggiori effetti sull’evoluzione genetica. Le simulazioni mostrano che in assenza di istituzioni a livello di gruppo che proteggono l'individuo altruistico dai non altruisti, le pressioni della selezione all’interno del gruppo supportano l'evoluzione dei tratti altruistici solo quando i conflitti tra i gruppi sono molto frequenti, i gruppi sono piccoli, ed i tassi di migrazione bassi. Tuttavia, quando le istituzioni a livello di gruppo vengono introdotte ed 8
Vedi Bowles (2001).
14 | MICROECONOMIA
assoggettate alle pressioni della competizione insieme ai tratti individuali, l'altruismo prolifera per un ampio insieme di parametri, che includono approssimazioni plausibili degli ambienti dei nostri antenati.
LA
L O G I C A D E L L A S E L E Z I O N E M U LT I - L I V E L L O
Molte delle organizzazioni che rivestono un ruolo importante nello studio della società umana sono aggregati di organizzazioni a livelli più bassi: le nazioni sono composte da imprese, famiglie, classi sociali che, a loro volta, sono composte da persone che a loro volta sono composte da cellule e così via. La nostra rappresentazione della struttura sociale é semplicemente la distribuzione di queste organizzazioni ai livelli più alti o più bassi e dei modi con cui esse interagiscono. Il processo di cambiamento può quindi essere considerato attraverso l’evoluzione di tali entità, con alcune di esse che si diffonderanno e diventeranno comuni, altre subiranno un declino e scompariranno con conseguenti cambiamenti nelle interrelazioni tra le varie organizzazioni. La selezione a più livelli rappresenta il processo tramite il quale l'evoluzione di una caratteristica a livello individuale viene influenzata dalle pressioni competitive che operano sia a livello individuale che ai livelli più alti. La selezione a più livelli a volte appare come un gioco di prestigio tramite il quale una caratteristica benefica per il gruppo ma apparentemente destinata a fallire dal punto di vista evolutivo potrebbe non di meno proliferare nonostante abbia tassi di riproduzione più bassi, violando le regole fondamentali dell'evoluzione. Ma, se appropriatamente modellata, la selezione di gruppo non rappresenta un'alternativa alla teoria evolutiva standard che tiene conto del cambiamento e della stabilità nella distribuzione dei tratti in una popolazione con differenti caratteristiche. Piuttosto essa rappresenta un'estensione del metodo standard che tiene conto degli effetti del gruppo sulla riproduzione. Non vi sono conigli da tirar fuori da un cappello: la selezione di gruppo é semplicemente una forma di interazione non casuale già introdotta nel capitolo 7 come segmentazione sociale. I tratti benefici per il gruppo evolvono sotto le pressioni della selezione di gruppo poiché essi beneficiano di una più alta probabilità di interazione con gli altri tratti evolutivi. Consideriamo un tratto singolo che può essere assente o presente in ciascun individuo di una popolazione sufficientemente ampia i cui membri appartengono ciascuno ad uno dei numerosi gruppi. Per concretezza, consideriamo un comportamento altruistico (A) – per esempio il coraggio nella difesa del gruppo come nell'esempio di Darwin – che comporta per l'individuo un costo e conferisce un
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
beneficio
|15
ad un qualsiasi membro del gruppo Tabella 13.1. Il gioco dell'altruismo
A N
A
N
b-c b
-c 0
Nota: i payoff appartengono ai giocatori per riga.
Indichiamo con il fatto che l'individuo del gruppo possegga il tratto, la situazione opposta (i soggetti senza il tratto sono gli N). Supponiamo che i costi e i benefici dell'altruismo vengano misurati in termini di benessere, attraverso il numero di riproduzioni (nel periodo successivo) dell'individuo portatore del tratto, cosicché un membro in un gruppo composto esclusivamente da altruisti produce b c riproduzioni in più rispetto ad un membro in un gruppo senza altruisti. Nel momento in cui assumiamo che b c > 0 , l'altruismo é benefico per il gruppo. Allo stesso tempo, se messo a confronto con gli altri membri dello stesso gruppo, il benessere dell'altruista risulterà più basso rispetto a quello dei non altruisti, cosicché la selezione all'interno del gruppo lavorerà a sfavore degli altruisti. Il punto di Darwin era che se la competizione tra gruppi influenza anche il benessere, il tratto altruista potrebbe, non di meno, proliferare. La selezione di gruppo funziona nel modo seguente. Lavorando nel tempo discreto, supponiamo che p e p' rappresentino, rispettivamente, la frazione della popolazione che possiede il tratto in un dato periodo di tempo e nel periodo successivo, e p = p' p . George Price (1970) Ha dimostrato che p può essere suddiviso tra gli effetti di gruppo e quelli individuali. Definiamo il numero delle riproduzioni nel periodo successivo di un individuo di tipo nel gruppo . Il processo di riproduzione può avvenire tramite copia culturale, eredità genetica o qualsiasi altra causa conforme con l'equazione sotto. Il modello che segue é basato sulla riproduzione differenziale dei tratti trasmessi geneticamente. ij
Supponiamo che dipenda, additivamente, dal tratto del tipo frequenza di quel tratto nel gruppo, , nel modo seguente
e dalla
(13.1) dove e rappresentano, rispettivamente, gli effetti parziali della frequenza del tratto nel gruppo su e la presenza del tratto nell'individuo (gli indici si riferiscono agli effetti di gruppo e dell'individuo), e denota il benessere di riferimento. Definiamo
16 | MICROECONOMIA
come l'effetto della frequenza del tratto nel gruppo sul numero medio delle riproduzioni (la differenza nel numero delle riproduzioni ad opera di un individuo in un gruppo composto interamente da coloro che posseggono il tratto ed un gruppo che ne é del tutto privo é data da ). Quindi, usando le definizioni sopra, e . Segue che, seguendo Price (1970) (13.2) o
dove rappresenta il numero medio di riproduzione della popolazione (normalizzate all'unità) e l'operatore indicate il valore attesa sta a significare una somma pesata tra i gruppi (i pesi sono in relazione alla grandezza del gruppo). Il primo termine cattura l'effetto di selezione di gruppo (positivo), mentre il secondo rappresenta l'effetto della selezione individuale (negativo). Tralasciando casi particolari come quello di una varianza pari a zero, ne segue che la frequenza interna di un tratto é stazionaria nel momento in cui i due termini si uguagliano in termini di grandezza assoluta (assumendo che sia i che le varianze non siano fonte di instabilità). Dato che il secondo termine é negativo, la frequenza del tratto all'interno di tutti i gruppi sopravissuti tenderà a diminuire col tempo. Ma, poiché é positivo, tale tendenza verrà controbilanciata dal benessere medio più alto per il gruppo con una maggiore frequenza degli A. Dunque, la condizione di stazionarietà per
(eq. 13.2) mostra che
quando (13.3) con
Il termine a sinistra rappresenta il rapporto costi-benefici del tratto altruistico. Il termine al lato destro descrive invece il rapporto della varianza del tratto tra i gruppi sulla somma di quella all'interno del gruppo e di quella tra i gruppi. Si può facilmente
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|17
mostrare (vedi Bowles 2001 e l'esempio illustrato sotto) che tale rapporto misura la differenza tra la probabilità che un altruista venga accoppiato con un altro altruista P(A|A) e quella secondo cui un non altruista venga a contatto con un altruista P(A|N). Quindi
Il rapporto tra le varianze rappresenta, conseguentemente, una misura del grado di segmentazione derivante non dall'accoppiamento non casuale, ma dal fatto che la popolazione é strutturata a gruppi. L'eq. 13.3 mostra che affinché un tratto altruista proliferi, maggiore é il costo del tratto (in relazione al beneficio), maggiore deve essere la varianza tra i gruppi (rispetto alla varianza all'interno del gruppo). Quando la varianza tra i valori medi del gruppo é zero, la probabilità di incontrare un altruista diventa indipendente dal tipo di ciascun individuo. La selezione di gruppo sarebbe, dunque, non operativa e solo forme non costose di benefici per il gruppo prolifererebbero. Similmente, quando
, tutti i gruppi sono omogenei e un individuo incontra solo persone del suo stesso tipo, indipendentemente dalla composizione della popolazione totale. In tal caso, la selezione all'interno del gruppo é assente e la selezione tra gruppi é l'unica forza al lavoro. In questo caso (estremo), si può dire che il gruppo rappresenti la sola unità di selezione. Quindi, la forza della selezione di gruppo dipende dalla grandezza del beneficio (per il gruppo) rispetto al costo individuale ( b e c nell'esempio) e dalla misura in cui i gruppi differiscono nella frequenza media del tratto rispetto la varianza all'interno del tratto nel gruppo. Coloro che hanno familiarità con la biologia della popolazione riconosceranno l'eq. 13.3, espressa come , come una versione della regola di Hamilton, che spiega come un tratto altruistico, anche se raro, possa proliferare. Da questo punto di vista, la selezione a più livelli non é distinguibile dai processi evolutivi basati su altre forme di distribuzione (ad esempio, selezione sulla base dei rapporti di parentela, o altre forme di segmentazione all'interno del gruppo o raggruppamenti). Un esempio chiarirà il processo. Supponiamo che una popolazione sia composta da due gruppi di uguali dimensioni, con le frazioni di individui altruistici in ciascuno pari a e , cosicché . Dalla matrice utilizzata precedentemente sappiamo che il payoff degli altruisti é minore del payoff dei non altruisti. Quindi, gli
18 | MICROECONOMIA
altruisti sono svantaggiati nel processo di riproduzione. Ciò può esser visto dalle funzioni dei payoff rappresentate nella figura 13.3: per tutti i valori di , i payoff dei non altruisti eccedono quelli degli altruisti (ignoriamo per il momento la linea tratteggiata). Ma gli effetti a livello di gruppo fanno sì che i payoff siano più alti per tutti coloro che appartengono ad un gruppo con una frazione di altruisti maggiore e che, quindi, il tratto altruistico non venga eliminato. Per trovare i valori di e tali per cui sia stazionario, dobbiamo uguagliare il benessere medio dei due tipi. Scrivendo per la frazione del gruppo di altruisti ( ), per il benessere del tipo nel gruppo ( )e per il benessere medio del tipo , usando l'equazione 13.1, ponendo e notando che e che i gruppi sono di uguali dimensioni, l'uguaglianza delle utilità dei due tipi richiede che
o, usando i dati sopra,
Probabilità di essere accoppiati con A
Figura 13.3. L'evoluzione di un tratto altruistico. Se la struttura della popolazione é tale per cui la differenza nelle probabilità condizionali di essere accoppiati con un A, P(A|A)-P(A|N), é come mostrata nella figura, é stazionario.
Risolvendo, troviamo i valori di e per i quali , ovvero, Supponendo anche che la dimensione totale della popolazione sia costante ( otteniamo e . Un
metodo
equivalente
consiste
nell'usare
semplicemente
l'eq.
. )
13.2,
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
considerando
che cosicché, usando l'eq.13.1 abbiamo
per
e
|19
che
da cui, per otteniamo come condizione per , riproducendo i risultati di cui sopra. Inoltre, riutilizzando l'eq. 13.3 ed usando i valori empirici dell'esempio abbiamo
come ci si poteva aspettare. Quindi, per i valori , la frequenza del tratto altruistico crescerà, eccedendo un mezzo nel periodo successivo. Ciò avviene perché la grandezza relativa del gruppo più altruistico cresce, controbilanciando il declino della frazione degli altruisti in ogni gruppo. La proliferazione del tratto costoso per il singolo individuo ma benefico per il gruppo viene spiegata attraverso la struttura a gruppi della popolazione, che tiene conto del fatto che gli altruisti tendono ad accoppiarsi con altri altruisti più di frequente rispetto alla media della popolazione (nonostante l'accoppiamento casuale all'interno dei gruppi). Quindi, la probabilità di incontrare un altro altruista, condizionata al fatto di essere altruisti, é data da
mentre un non altruista incontra un altruista con probabilità
La differenza tra le due probabilità condizionali - – é data dal vantaggio atteso a beneficio del tratto altruista attraverso la distribuzione favorevole tra i gruppi, risultando in un modo equivalente di rappresentare l'eq. 13.3
La figura 13.3 mostra come la struttura di gruppo della popolazione superi gli svantaggi dell'affrontare i costi derivanti dal comportamento altruistico. Mentre i payoff dei non altruisti eccedono sempre quelli degli altruisti, data una certa probabilità di incontrare
20 | MICROECONOMIA
gli altruisti, la differenza della probabilità di incontrare un altruista, dato un certo tipo, ( ) controbilancia tale svantaggio. L'esempio mostra come la selezione di gruppo possa permettere la proliferazione di un tratto altrimenti non possibile. L'analisi é comunque incompleta. L'equazione di Price fornisce una descrizione sommaria dell'equilibrio piuttosto che una descrizione completa del sistema dinamico. Da essa possiamo derivare la condizione di stazionarietà per p , ma non tiene conto dei movimenti delle varianze su cui é basato il movimento di p . Nella maggior parte dei modelli biologici, i meccanismi che incrementano la varianza tra i gruppi (ad esempio la mutazione genetica) sono deboli e tendono ad essere sommersi dagli effetti omogeneizzanti della selezione stessa, insieme alla migrazione tra i gruppi. Questa é la ragione per cui le pressioni della selezione di gruppo tra gli animali non umani vengono considerate deboli. Ma, tra gli umani, dove la dimensione effettiva del gruppo é piccola (ad esempio i membri di un gruppo nomade) e dove i gruppi di frequente si dividono sia in risposta ad un aumento di dimensione, che a causa di tensioni interpersonali all'interno del gruppo, gli errori di accoppiamento aumenteranno la varianza tra i gruppi. Per ogni modello minimamente fedele alle circostanze empiriche della natura umana, l'unico modo pratico per determinare se gli effetti che incrementano la varianza sono forti abbastanza da rendere la selezione di gruppo un'influenza importante sull'evoluzione, é quello di simulare la popolazione strutturata a gruppi con valori dei parametri ragionevoli.
UN
MODELLO DI SIMULAZIONE AD AGENTI DELLA SELEZIONE A
PIU’ LIVELLI
In assenza delle due istituzioni – distribuzione delle risorse e segmentazione all'interno del gruppo – introdotte a breve, il processo di selezione all'interno del gruppo é modellato (per l'individuo ) attraverso l'equazione dinamica di riproduzione standard (13.4) Ora, immaginiamo che il gruppo abbia adottato la pratica, comune tra i selvaggi in cerca di pascoli ed altre comunità, della condivisione delle risorse all'interno del gruppo. Una certa frazione della risorse che acquisisce un individuo – magari un tipo specifico di bene come avviene tra gli Achè (Kaplan e Hill 1985) – viene depositata in una pentola comune che viene suddivisa equamente tra tutti i membri del gruppo. Una tale istituzione di condivisione può essere modellata come una tassa lineare, t [0,1) , j
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|21
raccolta tra i payoff dei membri del gruppo dove l'ammontare totale raccolto viene poi redistribuito, in maniera uguale, a tutti i membri. L'effetto é quello di ridurre le differenze tra i payoff tra gli A e gli N, ovvero = (1 t )c . La figura 13.4 mostra i payoff attesi e l'effetto della condivisione della risorse sulle differenze dei payoff tra i due tipi, assumendo che tutti i gruppi adottino la stessa tassa, t . La differenza nella probabilità di incontrare un A (condizionata ad un particolare tipo) che uguaglia il payoff atteso non é più P( A | A) P( A | N) = r * come mostrato nella figura 13.3, ma ora diventa P ( A A ) P ( A N ) = r con r < r * . Mettendo a confronto le due figure ci si accorge che r* = c / b mentre r = c (1 t ) / b . Come risultato, se la struttura della popolazione fosse come mostrato in figura 13.3 ( r *) e se l'istituzione della condivisione delle risorse fosse presente ( t > 0), allora > e p aumenterebbe. Aj
T
T
Nj
j
T
T
T
A
N
Probabilità di essere accoppiati con A
Figura 13.4. La condivisione delle risorse indebolisce la selezione di gruppo. Le funzioni dei payoff tratteggiate indicano l'effetto dell'istituzione della condivisione delle risorse: il tratto altruistico può proliferare con condizioni meno stringenti rispetto a quelle descritte dalla figura 13.3.
Supponiamo che, in aggiunta all'istituzione della condivisione delle risorse, i gruppi siano anche segmentati, cosicché nel processo di accoppiamento all'interno dei gruppi, diviene più probabile che un A interagisca con un A e un N con un N rispetto al
22 | MICROECONOMIA
caso dell'accoppiamento casuale. Supponiamo che la probabilità che un membro A del gruppo venga accoppiato con un altro A non sia ma e che la probabilità che un membro N del gruppo sia accoppiato con un A sia . Come nel capitolo 7, definiamo il grado di segmentazione del gruppo j, o la differenza nelle probabilità condizionali che un A incontri un A e un N un A negli accoppiamenti all'interno del gruppo. Astraendo per il momento dalla tassa ( t = 0 ): = s b c . La segmentazione riduce lo svantaggio, in termini di payoff atteso, dell'altruista poiché, all'interno di un dato gruppo, diviene molto più probabile incontrare un altruista, così come diviene molto più probabile per un N incontrare un N. Se s > c / b, j gli A, nella media, avranno un payoff più alto degli N all'interno di ogni gruppo, e gli A prolifereranno come risultato della selezione sia tra i gruppi che all'interno dei gruppi. Quindi, entrambi i membri nell'equazione di Price saranno positivi. Per affrontare il classico problema di selezione di gruppo assumiamo che j
Aj
Nj
j
j
s < c / b cosicché gli A proliferano se le pressioni della selezione di gruppo sono
abbastanza forti. Come la condivisione delle risorse, la segmentazione é una convenzione e viene diffusa culturalmente. Tenendo conto sia della segmentazione che della condivisione delle risorse, le differenze tra i payoff attesi ricevuti dagli N e dagli A all'interno di un gruppo diventano (1 t )( s b c ) cosí che si ha j
j
p = p (1 p )(1 t )(s b c) j
j
j
j
(13.5)
j
da cui (mettendo a confronto le eq. 13.4 e 13.5) risulta chiaro che entrambe le istituzioni ritardano la selezione all'interno dei gruppi contro gli A. Ciò può esser visto notando che p = p (1 p )(s b c) t p = p (1 p )(1 t )b s j
j
j
j
(13.6)
j
j
j
j
Per p (0,1) entrambe le espressioni sono positive, il che implica che sia la segmentazione che la condivisione delle risorse attenuano la selezione negativa contro gli A. Da notare come l'effetto di ciascuna istituzione sia maggiore quando p é prossimo ad un mezzo e quando l'altra istituzione è ad un livello basso. Quindi, in termini dei benefici nel ritardare la selezione contro gli A, le istituzioni sono sostitute, non complementi: i loro effetti benefici sono tanto maggiori quanto minore é la presenza j
j
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|23
dell'altra istituzione. La struttura del processo di aggiornamento é descritta nella figura 13.4. La riproduzione individuale é soggetta a mutazioni cosicché, con una piccola probabilità, e , i discendenti possono essere sia A che N con uguale probabilità. Le istituzioni rappresentate da s e t differiscono tra i gruppi e anch'esse evolvono. Quando vi sono dei conflitti tra i gruppi, vince il gruppo con il payoff più alto. I membri del gruppo che perde muoiono e il gruppo vincente va a popolare il sito occupato dai perdenti insieme ai loro discendenti. I nuovi abitanti del sito adottano le istituzioni del gruppo vincente da cui discendono. Anche le istituzioni sono soggette a una variazione stocastica, che aumenta o diminuisce s e t casualmente in ogni periodo. Sia la condivisione delle risorse che la segmentazione impongono dei costi al gruppo che le adotta. I gruppi più segmentati potrebbero catturare con più difficoltà i benefici della diversità o delle economie di scala mentre la condivisione delle risorse potrebbe ridurre gli incentivi ad acquisire le risorse da condividere. Questi costi non vengono modellati formalmente, ma, per catturare il loro impatto, i benefici medi del gruppo vengono ridotti di un ammontare crescente e convesso rispetto ad e .
Tabella 13.1. Parametri chiave per la Simulazione
Valori di riferimento Intervalli considerati Dimensione media del gruppo(n/g) 20
da 7 a 47
Tasso di Migrazione (m)
0.2
da 0.1 a 0.3
Probabilitá di conflitto (k)
0.25
da 0.18 a 0.4
Tasso di Mutazione (e)
0.001
da 0.01 a 0.000001
Nota: La dimensione totale della popolazione é n e vi sono g gruppi; m, k ed e sono indicati per ogni generazione. Gli altri parametri: beneficio, b:2, costo, c:1; payoff di riferimento: 10. Abbiamo variato la dimensione del gruppo variando n. Per le ragioni spiegate nel testo, restringiamo s in modo che non ecceda mentre t [0,1] . Il costo imposto al gruppo dalle due istituzioni é pari a 1/2(s 2 + t 2 ) .
Insieme con Jung-Kyoo Choi e Astrid Hopfensitz ho simulato una popolazione artificiale strutturata in venti gruppi. I valori di riferimento dei parametri esplorati della popolazione sono descritti nella tabella 13.1. I valori chiave riguardano il tasso di migrazione tra i gruppi, la dimensione dei gruppi e la frequenza dei conflitti tra i gruppi. Dato che ogni conflitto é letale per i perdenti abbiamo deciso di utilizzare, come
24 | MICROECONOMIA
riferimento, una singola guerra ogni quattro anni. I valori di riferimento sono stati scelti sulla base di una plausibilità empirica, la cui evidenza verrà discussa nella penultima sezione. Ogni simulazione viene iniziata senza altruisti né istituzioni presenti al tempo zero, per vedere come essi possano proliferare se inizialmente rari (il processo di mutazione individuale e di gruppo introduce una certa variabilità nella popolazione). Il benessere di riferimento é posto pari a 10 e i discendenti vengono prodotti in proporzione alla quota del benessere individuale su quello totale del gruppo, cosicché, in assenza di segmentazione e condivisione delle risorse, la differenza attesa nei payoff é pari a c =1 per cui gli N producono il dieci per cento in più di discendenti rispetto agli A. Abbiamo considerato 10 simulazioni di 50.000 generazioni utilizzando diversi valori dei parametri. o
Una simulazione tipica appare nella figura 13.6. L'aumento di p viene sostenuto dall'aumento casuale sia di s che di t (tra il periodo 100 e 150). Quando p raggiunge livelli alti (dal periodo 532 a 588 per esempio) sia s che t diminuiscono, causando tipicamente una diminuzione forte in p. I successivi aumenti di t ed s avvengono casualmente. La dinamica che ne risulta emerge per le seguenti ragioni: quando la popolazione é divisa equamente tra gli A e gli N, molti gruppi sono approssimativamente suddivisi equamente. Come risultato (dall'eq. 13.6) gli effetti benefici della ritardata selezione all'interno dei gruppi, che derivano dagli alti livelli di s e t , vengono massimizzati in questa regione. Ma, se é ben superiore a 0.5, i benefici della protezione degli A offerta dalle istituzioni diventano meno importanti. Allo stesso tempo le istituzioni sono costose, per cui, quando é alto, é probabile che i gruppi con un sostanziale livello di segmentazione o di condivisione delle risorse perdano i conflitti con gli altri gruppi e i siti da loro occupati vengano popolati dai discendenti dei vincitori, che tipicamente posseggono un livello di variabili istituzionali minore. Come risultato, quando le istituzioni dei vincitori vengono imposte nei siti ripopolati, sia che diminuiscono. Tabella 13.3. Le istituzioni ritardano la selezione all'interno del gruppo contro gli altruisti.
Istituzione Nessuna
i
-0.102
t Test
8.5
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
Condivisione delle risorse
-0.08
16.6
Segmentazione
-0.063
13.4
Entrambe
-0.055
11.2
|25
Nota: La colonna i fornisce la stima dei minimi quadrati del coefficiente
(
del valore medio del gruppo di pj 1 p j
)
come valore per predire
(l'altro regressore é la varianza tra i gruppi, var ( fornisce il test t della stima.
)). L'ultima colonna
Per esplorare ulteriormente l'impatto delle istituzioni sui processi di aggiornamento, stimiamo l'equazione di Price, esplorando l'effetto di ciascuna istituzione separatamente (ovvero, restringendo s,t ad essere entrambe o nessuna pari a zero). Usando i dati da 10.000 generazioni, regrediamo i valori osservati di p sui valori del periodo precedente relativi a var( p )e a E var( p ) , dove il secondo termine rappresenta la media tra i gruppi delle varianze all'interno degli stessi. I coefficienti di queste variabili rappresentano delle stime di e tratte dall'equazione 13.2. Come mostra la tabella 13.3, l'effetto combinato della condivisione delle risorse e della segmentazione é quello di ridurre della metà l'effetto della selezione all'interno dei gruppi contro gli altruisti. Da notare come, in assenza di istituzioni, la stima di (0.102) sia molto vicina al valore
{
j
G
j
}
i
i
26 | MICROECONOMIA
gruppo i
Agenti che giocano N
1) Accoppiare e Interagire
Agenti che giocano A Agenti che cambiano per caso
gruppo i
2) I Payoff determinano il numero di figli per ogni giocatore (fra parentesi) gruppo i
3) Nuova generazione e mutazione
gruppo i Emigrazione verso il gruppo x
4) Migrazione Immigrazione dal gruppo y gruppo perdente j
gruppo vincente i
5) Competizione tra gruppi gruppo vincente i
Allargamento temporaneo
6) Il gruppo vincente ripopola il sito del gruppo perdente e si divide in due nuovi gruppi gruppo i
gruppo j
7) Nuovi gruppi
Torna al Passo (1)
Torna al Passo (1)
Figura 13.5. Le interazioni individuali e di gruppo. Assegniamo n individui ai g gruppi. Al tempo t=0 tutti sono N. (1) Accoppiamento. In ogni periodo, ogni membro del gruppo é accoppiato casualmente con un altro membro i cui payoff sono dati nel testo (in alcune simulazioni vengono modificati dalla regola di condivisione delle risorse). Con l'introduzione della segmentazione, i membri interagiscono con un tipo simile con probabilità s e vengono accoppiati casualmente con probabilità 1-s. (2) Riproduzione. Le riproduzioni delle generazioni correnti costituiscono la generazione successiva. Esse vengono prodotte estraendo (con sostituzione) alcuni individui dal gruppo di appartenenza dove la probabilità che si venga estratti é uguale alla quota del payoff dell'individuo rispetto a quella totale del gruppo. (3) Mutazione. Con probabilità e, un membro della generazione successiva non é la riproduzione dei suoi genitori, ma può essere A o N con uguale probabilità. (4) Migrazione. Con probabilità m ogni membro della nuova generazione si stabilisce in un
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|27
gruppo, scelto a caso tra gli altri. (5) Competizione di gruppo. Con probabilità k un gruppo viene selezionato e la competizione tra gruppi casualmente selezionati ha luogo. Il gruppo vincente é quello con il payoff più alto (al netto dei costi della segmentazione e della condivisione se presenti). (6) Ripopolazione e scissione. I membri del gruppo perdente vengono sostituiti dai discendenti dei membri del gruppo vincente, e il gruppo vincente che ne risulta (temporaneamente allargato) si divide tra i membri assegnati casualmente a due nuovi gruppi. (Nelle simulazioni con la condivisione delle risorse e la segmentazione, i due nuovi gruppi adottano le istituzioni del gruppo vincente).
atteso, dato che il valore di riferimento del benessere é 10 (quindi gli N hanno un dieci per cento di vantaggio in termini di benessere). La stima dell'effetto tra i gruppi, , (non mostrata) varia poco in risposta a quali sono le istituzioni che possono evolvere, e, in ogni caso, risulta di quattro volte maggiore di quella dell'effetto all'interno dei gruppi. La varianza media all'interno dei gruppi é molto maggiore della varianza tra i gruppi. G
Frazione
p medio
s medio
t medio Generazione Figura 13.6 L'interazione dinamica tra le istituzioni di gruppo e i comportamenti individuali. La figura presenta la storia di 1.000 periodi di una simulazione usando i parametri di riferimento dalla tabella 13.1. La frequenza media della popolazione degli altruisti é , mentre ed denotano la media del livello di condivisione delle risorse e segmentazione tra venti gruppi. L'altruismo ed entrambe le istituzioni a livello di gruppo sono inizialmente rari. L'intervallo di tempo é stato selezionato così da rilevare chiaramente tale dinamica, osservata su lunghi periodi di tempo in molte simulazioni.
Da notare che possiamo riscrivere l'eq. 13.2, la condizione per p = 0 , come
var( p ) = E{var( p )} i
G
j
ij
(13.2’)
28 | MICROECONOMIA
con p < 0 se il rapporto tra le varianze eccede il rapporto tra gli effetti all'interno dei gruppi e quelli tra i gruppi, e viceversa. Nella nostra simulazione osserviamo una tale relazione teorica? Usando le stime econometriche degli effetti tra i gruppi e all'interno dei gruppi descritti nella tabella 13.2, così come i rapporti tra le varianze medie osservate nelle stesse simulazioni, otteniamo i risultati della tabella 13.3. In assenza delle due istituzioni, il rapporto tra l'effetto di selezione all'interno dei gruppi e quello della selezione tra i gruppi, / , é quasi il doppio del rapporto delle varianze tra e all'interno dei gruppi. Quindi, nel caso di una popolazione con certi valori medi e stimati, p sarebbe negativo. Non ci sorprende, infatti, trovare che il valore medio di p é 0.06 nelle simulazioni su cui sono basate tali stime. Nel caso in cui entrambe le istituzioni siano presenti, invece, il rapporto delle varianze uguaglia il rapporto tra gli effetti, il che implica che gli effetti all'interno del gruppo che operano contro gli A sono esattamente controbilanciati dagli effetti tra i gruppi che ne sostengono, invece, la proliferazione. Nella simulazione su cui sono basate tali stime, il valore medio di p é 0.51. i
G
I conflitti tra i gruppi giocano un ruolo chiave nel sostenere sia le istituzioni a livello di gruppo che l'altruismo a livello individuale. Nelle simulazioni riportate, la frequenza attesa del conflitto é data da 1/ k dove k rappresenta la probabilità che un gruppo venga estratto per un conflitto in ogni generazione. Sembra probabile che, in un lungo periodo storico, la frequenza dei conflitti vari considerevolmente, forse in risposta al bisogno di emigrare in tempi di variabilità climatica. Per esplorare la sensitività della simulazione al variare della frequenza dei conflitti, abbiamo variato stocasticamente utilizzando il sistema autoregressivo descritto nelle note della figura 13.7. Durante i periodi in cui il conflitto era frequente (intorno alla 21.000-esima generazione) venivano sostenuti alti livelli di altruismo, ma gli intervalli periodici di pace relativa tra i gruppi (intorno alla 25.300-esima, 27.000-esima e 29.600-esima generazione) causavano delle riduzioni drastiche della frazione degli A nella popolazione. Abbiamo cercato di rispondere anche ad altre due domande. Nel caso in cui le istituzioni a livello di gruppo non siano coevolute con l'altruismo a livello individuale, quest'ultimo avrebbe potuto proliferare? E ancora, quanto sono sensibili le nostre simulazioni alle variazioni dei parametri chiave? Per rispondere ad entrambe le domande, abbiamo variato la dimensione del gruppo da 7 a 47, e, per ciascun valore della dimensione, sono state simulate 50.000 generazioni, lasciando gli altri parametri ai loro valori di riferimento. Lo studio é stato fatto lasciando prima coevolvere entrambe le
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|29
istituzioni, poi ciascuna singolarmente, ed infine nessuna delle due. Abbiamo seguito lo stesso procedimento variando il tasso di migrazione da 0.1 a 0.3 e la probabilità del conflitto ( ) da 0.18 a 0.51. I risultati appaiono nella figura 13.8. Tabella 13.3. Una stima dell'equazione di Price
Istituzioni Rapporto tra gli effetti Rapporto tra le varianze Nessuna
0.25
0.13
0.06
Entrambe
0.13
0.13
0.51
Nota:
Il
rapporto
tra le varianze rappresenta la media di su 10.000 generazioni simulate, mentre il rapporto tra
gli effetti é dato da i / G , stimato come descritto nella tabella 13.2. La frazione degli A nella popolazione é .
Il riquadro superiore mostra che, quando entrambe le istituzioni non vengono fatte evolvere, un gruppo di dimensione 7 sostiene alti livelli di altruismo, ma nei gruppi con dimensione maggiore di 8, la frequenza degli altruisti diviene minore di 0.3. Considerando come riferimento la dimensione del gruppo nel quale , vediamo come, in assenza di istituzioni la dimensione critica sia 8, mentre quando entrambe sono considerate, p > 0.5 si manifesta nei gruppi di dimensioni minori di 22. I risultati per il tasso di migrazione sono simili. In assenza delle istituzioni, sostenere un p > 0.5 richiede un tasso di migrazione (per generazione) di 0.13, ma se entrambe le istituzioni sono libere di evolvere, il tasso di migrazione critico é pari a 0.21. Il riquadro in fondo mostra come le istituzioni permettano anche l'evoluzione di elevati livelli di altruismo con un numero molto minore di conflitti. Anche una lettura “verticale” della figura può essere illuminante: per esempio, il riquadro in fondo mostra che per , é minore di 0.2 senza istituzioni, ma maggiore di 0.8 se entrambe le istituzioni sono libere di evolvere9.
9
Le figura 13.8 e la tabella 13.2 suggeriscono che la segregazione ha un'influenza maggiore rispetto alla condivisione delle risorse: la segmentazione, se considerata isolatamente, ha un effetto maggiore della condivisione quando anch'essa viene considerata da sola sia in ritardare la selezione all'interno del gruppo contro gli A sia in ampliare lo spazio dei parametri per i quali gli A costituiscono una notevole frazione della popolazione. Ciò é un artefatto delle nostre scelte del modello. Le funzioni di costo per e sono identiche, ma s ha un impatto maggiore nell'aggiornamento all'interno del gruppo, come può esser visto dall'eq. 13.6. Usando queste equazioni per mettere a confronto l'effetto di quando con quello di quando , vediamo come il primo sia volte il secondo, dove poiché l'azione altruistica é di beneficio al gruppo (Nella nostra simulazione e , cosicché che l'effetto di s è il doppio di quello di ). Inoltre, dall'eq.13.5 possiamo notare come, se ,
30 | MICROECONOMIA
frazione
p medio
k
generazione Figura 13.7. Elevate frequenze dei conflitti tra gruppi favoriscono l'altruismo. La figura mostra il periodo di 1.000 generazioni in una simulazione in cui entrambe le istituzioni evolvono endogenamente e in cui , la frequenza dei conflitti tra i gruppi, varia nel tempo secondo la seguente relazione kt = k0 + kt1 + t , dove = 0.99, t viene estratta casualmente da una distribuzione uniforme [-0.02,0.02] e viene scelto in modo che la media di uguagli il valore di riferimento di , ovvero 0.25.
2
5
Gli esperimenti con tassi di mutazione da 10 a 10 forniscono risultati analoghi a quelli mostrati. In assenza di istituzioni, rimane basso, mentre con entrambe le istituzioni il valore medio di in 5 simulazioni di 100.000 generazioni ciascuna (per tassi di mutazione di 10 , 10 , 10 e 10 ) eccede un mezzo. Il valore medio di per le cinque simulazioni con un tasso di mutazione pari a va da 0.75 a 0.83; in ogni caso un aumento drastico di si verifica tra la 17.150-esima e la 25.855esima generazione e per il resto della simulazione si mantiene ad alti livelli. Il tempo di attesa prima della forte crescita dipende dal tempo necessario ad un gruppo piccolo ad accumulare un numero significativo di altruisti. Tale tempo di attesa si riduce considerevolmente nel caso vi siano più di venti gruppi. Dato che abbiamo fissato 2
3
4
5
nella generazione iniziale, tassi di migrazione molto bassi (meno di bassi livelli di per periodi molto lunghi.
) determinano
, ma il valore di t richiesto per frenare la selezione all'interno del gruppo contro gli A é 1. (Nella funzione di costo quadratica che abbiamo usato, i costi a livello di sono quattro volte quello di s=1/2). gruppo di
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
Frequenza di altruisti nella popolazione
Dimensione di gruppo Entrambe le istituzioni
seg Nessun istituzione tassa
Dimensione di gruppo (n/g)
Frequenza di altruisti nella popolazione
Tasso di migrazione
seg Nessun istituzione
Entrambe le istituzioni
tassa
Tasso di migrazione (m)
Frequenza di altruisti nella popolazione
Frequenza del conflitto di gruppo Entrambe le istituzioni seg
tassa
Nessun istituzione
Probabilità del conflitto di gruppo (k) Figura 13.8. Le istituzioni a livello di gruppo aumentano la dimensione dello spazio dei parametri per i quali i comportamenti altruistici risultano prevalenti. Ogni punto rappresenta la frequenza media degli altruisti nell'intera popolazione su 10 simulazioni di 50.000 periodi, ciascuna per il valore del parametro indicato sull'asse orizzontale. In ogni riquadro gli altri parametri sono fissati ai rispettivi valori di riferimento, mostrati nella tabella 13.2. Ciascuna simulazione inizia con p,t e s fissati pari a zero. La curva 'nessuna istituzione' fornisce i risultati delle simulazioni in cui s e t sono fissati pari a zero; le altre curve indicano simulazioni in cui una o entrambe le istituzioni sono lasciate libere di evolvere. (“Tassa” si riferisce alla condivisione delle risorse). La distanza orizzontale tra le curve indica l'ampliamento dello spazio dei parametri reso possibile dalle istituzioni a livello di gruppo. La distanza verticale tra le curve mostra l'impatto delle istituzioni sul valore medio di p.
|31
32 | MICROECONOMIA
AMBIENTI EVOLUTIVI Abbiamo descritto un processo secondo cui le istituzioni come la condivisione e la segmentazione forniscono un ambiente all'interno del quale i tratti altruistici evolvono e nel quale tali istituzioni proliferano nella popolazione grazie al loro contributo al processo di evoluzione dei tratti benefici al gruppo. Questo modello fornisce anche indicazioni sul processo di evoluzione dei comportamenti altruistici e delle istituzioni a livello di gruppo? Dipende se lo spazio dei parametri in cui avviene tale processo coevolutivo approssima l’ambiente rilevante nelle nostre simulazioni, ovvero i primi 50.000 o 100.000 anni dell’esistenza umana moderna, precedente alla drammatica trasformazione della struttura sociale avvenuta con l’avvento dell’agricoltura intorno ad 11.000 anni fa. Non si sa molto del tardo Pleistocene, ed è ben conosciuta la difficoltà di fare inferenze riguardo all’organizzazione sociale dei gruppi umani durante tale periodo sulla base delle semplici società contemporanee (Foley 1987, Kelly 1995). Con una certa sicurezza possiamo dire, comunque, che le condizioni climatiche erano estremamente variabili (Richerson, Boyd e Bettinger 2001), e che bande nomadi composte da soggetti sia legati che non legati da vincoli di parentela e la mancanza di organizzazioni politiche complesse costituivano forme comuni di organizzazione sociale. La nostra dimensione di riferimento del gruppo, 20, è basata su un’approssimazione della mediana dei 235 gruppi di cacciatori descritti da Binford (2001), ovvero 19. La nostra scelta della grandezza del gruppo non è, comunque, del tutto realistica. Occorre ricordare che le piccole dimensioni contribuiscono alle pressioni della selezione aumentando la varianza tra i gruppi che aumenta quando quelli di successo raddoppiano la loro dimensione e si dividono. In realtà, la scissione del gruppo non è semplicemente l’esito di un’estrazione casuale ma piuttosto appare come un processo di risoluzione dei conflitti politici in cui è probabile che soggetti legati da vincoli di parentela e coalizioni rimangano insieme. Di conseguenza, è probabile che la scissione abbia contributo alla varianza tra i gruppi in modi che il nostro modello non può catturare. Uno studio sulla scissione tra le popolazioni amazzoni (Neves 1995:198) riporta che: La dimensione massima del villaggio è limitata dall’ammontare di relazioni di parentela e dalla solidarietà tra gli individui che deriva da tre fonti: relazioni di parentela, legami coniugali e influenza dei leader politici…La scissione nel villaggio è favorita, quindi, dall’indebolimento delle relazioni di parentela che deriva dalla crescita della popolazione; e quando avviene mantiene uniti i parenti stretti ma tende a separare quelli meno vicini…La linea potenziale della scissione è data dalla
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|33
divisione nella patrilinearitá10.
Dato che è probabile che i portatori dei tratti benefici al gruppo siano numericamente e socialmente dominanti nei gruppi vincitori, essi possono aver messo in atto ció che Hamilton (1975:137) ha chiamato assortative division, segregando i portatori degli altri tratti, fintanto che il riconoscimento dei tratti o delle caratteristiche correlate con i tratti lo permetta. In tal caso, i gruppi di dimensioni molto maggiori sosterrebbero i processi evolutivi sopra descritti. Si sa poco del conflitto di gruppo nel corso della storia umana primitiva. Sappiamo però che le morti a causa di guerre costituiscono una frazione sostanziale delle morti avvenute in molte delle societá antecedenti la nascita dello Stato delle quali si ha traccia nei registri etnografici ed archeologici. La media riportata da Keeley (1996) per gli studi etnografici delle societá pre-statali è 0.19 e per quelli archeologici è 0.16. Tali dati possono essere messi a confronto con le stime molto più basse per l’Europa e per gli Stati Uniti nel ventesimo secolo (molto inferiori a 0.1), con lo 0.03 per la Francia del diciannovesimo secolo e con lo 0.02 per l’Europa Occidentale del diciassettesimo secolo. Un registro di 200 guerre in 50 anni nel Mae-Enga nella Nuova Guinea, per esempio, ha considerato 800 persone da una popolazione di 5000 e ne è risultato un tasso di mortalitá annuale da guerre (0.0032 morti procapite per anno) che costituisce quasi il doppio di quello della Germania e della Russia nel ventesimo secolo, ma che è molto inferiore a quello medio delle società pre-statali di cui si ha testimonianza (Keeley 1996:195). È difficile dire se tali episodi straordinariamente letali fossero comuni durante il tardo Pleistocene. Ma possiamo avvalerci di alcune speculazioni basate su quanto sappiamo riguardo al cambiamento climatico e ai probabili tassi di crescita della popolazione. Christopher Boehm (2000a:19) scrive: Sembra sensato supporre che, in ambienti prosperi e stabili, la densità della popolazione cresca e che le bande inizino a competere per le risorse, e che, alla fine, questo abbia creato problemi politici letali anche se, inizialmente, le risorse erano più che adeguate….Le varie vicende dei conflitti potrebbero aver aumentato la forza della selezione naturale che operava a livello di gruppi, in quanto alcune bande vennero decimate mentre altre si riprodussero e alla fine si scissero. [In risposta alle drammatiche oscillazioni climatiche nel periodo interglaciale del tardo Pleistocene], le bande nomadi erano costrette a cambiamenti molto frequenti, che consistevano sia nell’adattamento alle caratteristiche dei gruppi limitrofi che nei cambiamenti dell’ambiente naturale.
La sua conclusione è la seguente: Verso la fine del Pleistocene, quando l’essere umano moderno cominciò ad affermarsi, il tasso di 10
Chagnon (1983:141-3) ha studiato il villaggio di Yanomamo che si suddivise e scoprí che la parentela genetica media nel villaggioprima della scissione era piú bassa di ciascuna delle nuove unitá formatisi a seguito della divisione.
34 | MICROECONOMIA
estinzione dei gruppi avrebbe potuto crescere drammaticamente in quanto bande bisognose di cacciatori ben armati, stranieri privi di interazioni politiche ben consolidate si scontrarono di frequente, sia localmente che nel corso di lunghe migrazioni.
Carol Ember (1978) ha raccolto dati sulla frequenza dei conflitti tra una cinquantina di bande nomadi nel presente o nel recente passato. Escludendo i pastori e coloro che praticavano agricoltura sedentaria, il 64% dei gruppi affrontava dei conflitti ogni due anni o piú frequentemente. Persino escludendo coloro che allevavano cavalli o pescavano (tra i quali i conflitti erano più comuni), le guerre venivano considerate “rare” solo nel 12% dei gruppi. Mentre il movimento tra le unità etno-linguistiche era probabilmente poco comune, sembra probabile che notevoli tassi di migrazione si verificavano, invece, tra le bande che componevano tali unità. Il valore medio dei tassi di migrazione per le tredici società studiate da Rogers (1990) è del 22 percento per generazione con il massimo (i !Kung) minore di un mezzo. Dato che i dati di Rogers si riferiscono a gruppi di dimensioni più ampie rispetto alle bande, essi potrebbero sottostimare in qualche modo i tassi di migrazione. Nonostante la natura di queste inferenze sia fortemente speculativa, sembra possibile che gli ambienti sociali e fisici del tardo Pleistocene possano ricadere tra lo spazio dei parametri delle traiettorie coevoluzionistiche illustrate nella figura 13.7. In tal caso, il modello della selezione a più livelli con le istituzioni endogene può fornire per lo meno una parziale descrizione di questo periodo cruciale dell’evoluzione umana.
C O N C L U S IO N E Sembra dunque probabile che la predisposizione umana verso le attività benefiche per il gruppo possa essere coevoluta con le comuni istituzioni che implementano la condivisione delle risorse e la segmentazione sociale. In tal caso, questo approccio può aiutare a capire perché gli umani siano stati portati a condividere e cooperare per il raggiungimento di obiettivi comuni e allo stesso tempo siano stati pronti ad uccidere o essere uccisi in nome di entità astratte come la nazione o la razza. Il modello fornisce anche alcuni suggerimenti per capire perché certi atteggiamenti siano meno comuni tra gli animali: la maggior parte degli animali sono incapaci di creare gli ambienti che facilitano certi atteggiamenti, ovvero quelli costituiti da gruppi ben definiti composti soggetti non legati da relazioni di parentela ma in cui vi siano dei codici di comportamento comunemente compresi. E, come abbiamo visto, senza queste peculiari
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|35
strutture umane di interazione, l’evoluzione dei comportamenti umani altruistici sarebbe stata molto improbabile. Un’implicazione ulteriore, sottolineata dalla figura 13.6, consiste nel fatto che anche l’altruismo e la guerra possano essere coevolute. I comportamenti di gruppo che rendono la cooperazione per i mutui benefici possibile tra gli umani, rendono possibili anche le guerre su larga scala. E frequenti conflitti, come abbiamo visto, possono aver costituito un contributo essenziale all’evoluzione dei tratti altruistici che li facilitano. Per esplorare tale dinamica, abbiamo considerato endogena la probabilità dei conflitti letali tra i gruppi; abbiamo assunto che k vari congiuntamente alla frequenza degli A nella popolazione. In queste simulazioni (non mostrate), la popolazione spende virtualmente tutto il tempo in uno dei due stati: alte frequenze di altruismo e conflitti molto frequenti o pochi altruisti e conflitti infrequenti (Bowles e Choi 2003). I modelli di selezione a piú livelli, simili a quello simulato in questo capitolo, hanno anche dimostrato che la punizione altruistica dei violatori delle norme può proliferare anche se rara e rimanere comune anche in gruppi abbastanza numerosi. In uno di questi modelli (Boyd, Gintis e Richerson 2003) è stato sfruttato il fatto che il costo della punizione dei violatori delle norme è piccolo quando coloro che aderiscono costituiscono la maggioranza del gruppo. (Ciò é simile alla dinamica del modello del Punitore-l’Usurpatore-Condivisore, nelle vicinanze dell’equilibrio di Rousseau). In questo caso, le pressioni relativamente deboli della selezione di gruppo che derivano dai conflitti tra i gruppi (come nel modello sopra) sono sufficienti per mantenere alte frequenze dei punitori altruistici e per sostenere alti livelli di cooperazione. Un secondo modello, che riguarda la reciprocitá forte (Bowles e Gintis 2003), considera una forma di punizione dei violatori delle norme comune tra le bande nomadi di cacciatori: l’esercizio dell’ostracismo da parte del gruppo. I conflitti di gruppo o le estinzioni di un gruppo non giocano alcun ruolo in questo modello: coloro che vengono puniti soffrono una perdita di benessere durante il periodo in cui essi non fanno parte del gruppo. I free rider che aderiscono alla norma ma non puniscono non cacciano i reciprocatori (contraccambisti) forti perché se i free rider divengono comuni in un gruppo, i violatori della norme proliferano, riducendo il benessere medio dei gruppi cui appartengono. Nell’introdurre i capitoli dal 10 al 13, ci siamo chiesti come le istituzioni possano cambiare e come le persone e le regole che governano la loro vita possano coevolvere. Abbiamo modellato tre fonti principali di cambiamento: trend secolari esogeni (soprattutto, cambiamenti tecnologici e ambientali, come nel capitolo 11), gli effetti
36 | MICROECONOMIA
congiunti del caso e dell’azione collettiva (capitolo 12) e gli effetti congiunti del caso e dei conflitti tra i gruppi (in questo capitolo). I modelli introdotti suggeriscono due modi in cui il cambiamento può essere avvenuto endogenamente, rispettivamente, con l’azione collettiva o con la competizione di gruppo. Considerati congiuntamente, i modelli catturano almeno parte dei desiderata descritti all’inizio del capitolo 11, ovvero, l’importante ruolo giocato da conflitti di interesse, caso, azione collettiva, persistenza delle istituzioni inefficienti e traiettorie altamente irregolari del cambiamento sintetizzate dal termine “equilibri punteggiati”. I modelli forniscono anche delle buone ragioni per aspettarsi che le istituzioni inefficienti, pur se persistenti per periodi lunghi, nel lungo periodo non se la passino bene quanto le altre istituzioni, identiche ma più efficienti. Abbiamo anche visto come, per ben due ragioni differenti (fornite nel capitolo 12 e 13), le istituzioni egualitarie possano essere favorite nel processo di evoluzione. Nei modelli basati sulla teoria dei giochi stocastici evolutivi, il bacino di attrazione delle istituzioni egualitarie è più ampio e, nei modelli di selezione a più livelli, le istituzioni egualitarie ritardano la selezione all’interno del gruppo contro gli altruisti e ciò aumenta la capacità del gruppo di sopravvivere nei conflitti con gli altri gruppi. Siamo stati in grado, dunque, di spiegare, in parte, non solo i meccanismi causali dell’evoluzione delle istituzioni e individuale, ma anche il concetto di Parson degli “universali evolutivi”, ovvero, le istituzioni che ci si può aspettare siano molto diffuse in ambienti differenti, emergenti in numerose occasioni e proliferanti anche se inizialmente rare. La strategia concettuale alla base di tutti i modelli presentati è stata quella di estendere un numero di approcci astratti, ispirati alla biologia – la teoria dei giochi stocastici evolutivi e la decomposizione dei processi di selezione all’interno dei-tra i gruppi dell’equazione di Price –modellando i processi distintivi delle interazioni sociali umane. Quindi, l’approccio stocastico evolutivo è stato esteso tenendo conto del perseguimento intenzionale degli interessi attraverso l’azione collettiva e il modello della selezione a più livelli è stato corretto per dare una spiegazione della condivisione delle risorse e della segmentazione sociale all’interno dei gruppi, così come delle guerre e delle altre forme di conflitto tra i gruppi. I risultati delle simulazioni suggeriscono l’utilità dell’approccio. L’orizzonte temporale in cui la storia si spiega nei più semplici dei modelli stocastici evolutivi è troppo lungo per risultare rilevante per spiegare l’evoluzione sociale, ma l’introduzione delle interazioni locali e la correlazione delle azioni idiosincratiche, attraverso le tendenze conformistiche, aumentano molto il passo del cambiamento. Similmente, in assenza di
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|37
istituzioni all’interno del gruppo quali la condivisione delle risorse e la segmentazione, le condizioni per l’evoluzione dei tratti individuali benefici al gruppo sono molto stringenti. Ma quando si permette a questi due importanti aspetti dell’interazione umana di coevolvere con i tratti individuali, il processo di coevoluzione che ne risulta appare una possibile spiegazione alla storia umana.
38 | MICROECONOMIA
Riferimenti bibliografici Alexander, R. D. (1979). Darwinism and Human Affairs. Seattle, University of Washington Press. Anderson, P. (1974). Passages from Antiquity to Feudalism. London, NLB. Boehm, C. (1999). "The Natural Selection of Altruistic Traits." Human Nature 10(3): 205-252. Boehm, C. (2000). Hierachy in the Forest. Cambridge, Harvard University Press. Bowles, S. (2001). Individual Interactions, Group Conflicts, and the Evolution of Preferences. Social Dynamics. S. Durlauf and P. Young. Cambridge, MA, MIT Press: 155-190. Bowles, S. and H. Gintis (1984). State and Class in European Feudalism. Statemaking and Social Movements: Essays in History and Theory. C. B. a. S. Harding. Ann Arbor, University of Michigan Press. Bowles, S. and H. Gintis (2003). Strong reciprocity: The origin of hunman cooperation. The Cultural and Genetic Evolution of Cooperation. P. Hammerstein. Cambrige, MIT Press. Bowles, S., J.-K. Choi, et al. (2003). "The coevolution of individual behaviors and group level institutions." Journal of Theoretical Biology 223(2): 135-147. Boyd, R. and J. Lorberbaum (1987). "No Pure Strategy Is Evolutionarily Stable in the Repeated Prisoner's Dilemma Game." Nature 327: 58-59. Boyd, R., H. Gintis, et al. (2003). "The evolution of altruistic punishment." Proceedings of the National Academy of Science (USA) 20: 123-143. Brady, T. A. (1985). Turning Swiss: Cities and Empire, 1450-1550. Cambridge, Cambridge University Press. Bright, C. and S. F. Harding (1984). Statemaking and social movements : essays in history and theory. Ann Arbor, University of Michigan Press. Caporael, L. R., R. M. Dawes, et al. (1989). "Selfishness examined: Cooperation in the Absence of Egoistic Incentives." Behavioral and Brain Sciences 12: 683-738. Chagnon, N. A. (1983). Yanomamo: The Fierce People. New York, Holt, Rhinehart and Winston. Clarke, D. E. M., Ed. (1923). The Havamal With Selections From Other Poems of the Edda, Illustrating the Wisdom of the North in Heathen Times. Cambridge, Cambridge University Press. Darwin, C. (1873). The Descent of Man. New York, D. Appleton and Company. de Tocqueville, A. (1958 [1830]). Democracy in America, Volume II. New York NY, Vintage. Eibl-Eibesfeldt, I. (1982). "Warfare, Man's Indoctrinability and Group Selection." Journal of Comparative Ethology 60(3): 177- 198. Ember, C. (1978). "Myths About Hunter-Gatherers." Ethology 17(4): 439-449. Flannery, K., J. Marcus, et al. (1989). The Flocks of the Wamani: A Study of Llama Herders on the Puntas of Ayacucho, Peru. San Diego, Academic Press. Foley, R. (1987). Another Unique Species: Patterns in Human Evolutionary Ecology. New York, John Wiley and Sons. Frank, S. A. (1995). "Mutual Policing and Repression of Competition in the Evolution of Cooperative Groups." Nature 377: 520-522.
LA COEVOLUZIONE DI ISTITUZIONI E PREFERENZE
|39
Fudenberg, D. and E. Maskin (1986). "The Folk Theorem in Repeated Games with Discounting or with Incomplete Information." Econometrica 54(3): 533-554. Fudenberg, D. and E. Maskin (1990). "Evolution and Cooperation in Noisy Repeated Games." American Economic Review 80(2): 275-279. Gellner, E. (1983). Nations and nationalism. Ithaca, Cornell University Press. Gintis, H., E. A. Smith, et al. (2002). "Costly signaling and cooperation." Journal of Theoretical Biology 213(1): 103-119. Hamilton, W. D. (1975). Innate Social Aptitudes of Man: an Approach from Evolutionary Genetics. Biosocial Anthropology. R. Fox. New York, John Wiley and Sons: 133-155. Herlihy, D. and C. Klapische-Zuber (1985). Tuscans and their Families. New Haven, Yale University Press. Joshi, N. V. (1987). "Evolution of cooperation by reciprocation within structured demes." Journal of Genetics 66(1): 69-84`. Kaplan, H. and K. Hill (1985). "Food Sharing among Ache Foragers: Tests of Explanatory Hypotheses." Current Anthropology 26(2): 223-246. Keeley, L. (1996). War Before Civilization. New York, Oxford University Press. Kelly, R. C. (1985). The Nuer Conquest: The Structure and Development of an Expansionist System. Ann Arbor, University of Michigan Press. Kelly, R. L. (1995). The foraging spectrum : diversity in hunter-gatherer lifeways. Washington, Smithsonian Institution Press. Laland, K. N., F. J. Odling-Smee, et al. (2000). "Group Selection: A Niche Construction Perspective." Journal of Conciousness Studies 7(1/2): 221-224. Levy, R. (1957). The Social Structure of Islam. Cambridge, Cambridge University Press. MacDonald, K. (1995). "The Establishment and Maintenance of Socially Imposed Monogamy in Western Europe." Politics and the Life Sciences 14(1): 3-23. Mack Smith, D. (1959). Italy: A Modern History. Ann Arbor, University of Michigan Press. Matthew, D. (1992). Atlas of Medieval Europe. Oxford, Andromeda, Ltd. Meletti, J. (2001). Difende un fornaio, assassinato. La Republica: (June 28)13. Neves, E. G. (1995). "Village Fissioning in Amazonia." Rev. do Museo de Arqueologica e Ethnologia (S. Paulo) 5: 195-209. Parsons, T. (1964). "Evolutionary Universals in Society." American Sociological Review 29(3): 339-357. Pearson, K. (1894). "Socialism and Natural Selection." Fortnightly Review 56: 1-21. Price, G. R. (1970). "Selection and Covariance." Nature 227: 520-521. Richerson, P., R. Boyd, et al. (2001). "Was Agriculture Impossible During the Pleistocene but Mandatory During the Holocene? A Climate Change Hypothesis." American Antiquity 66(3): 387-411. Rogers, A. R. (1990). "Group Selection by Selective Emigration: The Effects of Migration and Kin Structure." American Naturalist 135(3): 398-413. Simon, H. A. (1990). "A Mechanism for Social Selection and Successful Altruism." Science 250: 1665-1667. Soltis, J., R. Boyd, et al. (1995). "Can Group-Functional Behaviors Evolve by Cultural Group Selection: An Empirical Test." Current Anthropology 36(3): 473-483. Tilly, C. (1975). The Formation of National States in Western Europe. Princeton, Princeton University Press. Tilly, C. (1990). Coercion, capital, and European states, AD 990-1990. Cambridge, Mass.,
40 | MICROECONOMIA
USA, B. Blackwell. Trivers, R. L. (1971). "The Evolution of Reciprocal Altruism." Quarterly Review of Biology 46: 35-57. Wallerstein, I. (1974). The Modern World-System: Capitalist Agriculture and the Origins of the European World-Economy in the Sixteenth Century. New York, Academic Press. Weber, E. (1976). Peasants into Frenchmen: The Modernization of Rural France, 18701914. Stanford, Stanford University Press. Weinstein, D. A., H. H. Shugart, et al. (1983). "Energy Flow and the Persistence of a Human Population: A Simulation Analysis." Human Ecology 11(2): 201-223.
XIV IL GOVERNO DELL’ECONOMIA: M ERCATI , S TATI E C OMUNITÀ
Quale di questi sistemi [pianificazione centralizzata o concorrenza] è probabile che sia più efficiente dipende da quale di essi possiamo aspettarci che assicuri un uso migliore dell’informazione esistente. E questo, a sua volta, dipende da se è più probabile riuscire a mettere a disposizione di una singola autorità centrale tutta l’informazione che deve essere utilizzata e che è inizialmente dispersa fra molti individui, oppure nel mettere a disposizione degli individui l’informazione addizionale di cui hanno bisogno per adeguare i loro piani a quelli degli altri. -F.A. Hayek, “L’uso dell’informazione nella società” [1945]
Il legislatore rende buoni i cittadini inculcandogli comportamenti, e questo è l’obiettivo di ogni legislatore; se non riesce a raggiungerlo, le leggi che promulga sono un fallimento. È in questo che si distingue una buona costituzione da una cattiva. -Aristotele, Etica Nicomachea (350 a.c.)
L’uomo dei sistemi…immagina di poter sistemare i diversi membri di una estesa società con la stessa facilità con la quale la mano sistema le differenti pedine su una scacchiera; non considera…che nella grande scacchiera della società ogni singola pedina possiede un proprio principio del movimento. -Adam Smith, Teoria dei Sentimenti Morali (1759)
In qualche quartiere di Chicago gli adulti consigliano ai ragazzini di non saltare la scuola, non fare rumore o non imbrattare i muri con graffiti. Inoltre, i residenti sono disponibili ad intervenire negli incontri pubblici per il mantenimento delle strutture di quartiere, ad esempio una caserma locale dei vigili del fuoco minacciata da tagli di bilancio. Sono tutti esempi di ciò che Sampson, Raudenbush e Earls (1997) chiamano efficacia collettiva. Quando il quartiere manifesta un elevato livello di efficacia collettiva le violenze criminali sono marcatamente minori, anche facendo una verifica su un’ampia gamma di comunità e di caratteristiche individuali, incluso il passato tasso di criminalità. Sampson, Raudenbush e Earls hanno rilevato una variazione
2 | MICROECONOMIA
notevole nei livelli di efficacia collettiva di quartiere, portando esempi di quartieri ricchi o poveri, principalmente abitati da persone di colore o da bianchi, che mostrano livelli sia alti sia bassi. E’ degno di nota il fatto che l’eterogeneità etnica sia risultata molto meno importante nel prevedere una scarsa efficacia collettiva rispetto a misurazioni dello svantaggio economico, del basso tasso di abitazioni di proprietà e di altri indicatori di instabilità residenziale. I quartieri di Chicago sono un’illustrazione di enforcement informale delle norme della comunità. L’esempio delle cooperative di pescatori della baia di Toyama in Giappone chiarisce un altro aspetto della risoluzione dei problemi di una comunità (Platteau e Seki 2001). Dovendo affrontare l’alta variabilità della pesca, così come l’alto livello e la natura mutevole delle abilità richieste nell’attività, alcuni pescatori hanno scelto di condividere i profitti, le informazioni e la formazione professionale. Una cooperativa, che ha avuto grande successo sin dalla sua costituzione a metà degli anni sessanta, è composta dagli equipaggi e dai capitani di sette battelli per la pesca dei gamberi. La pesca, lo scaricamento e la vendita delle singole imbarcazioni sono sincronizzate in modo da aumentare la trasparenza del processo di divisione e da rendere facile l’individuazione di eventuali aggiramenti dell’accordo dettati dall’opportunismo. Il successo delle cooperative per la pesca dei gamberi nella baia di Toyama e l’efficacia collettiva dei quartieri di Chicago sono esempi di governo della comunità. Le cooperative del legno compensato descritte nel capitolo 10 ne sono un altro esempio. Per comunità intendo un gruppo di persone che interagiscono direttamente, frequentemente e con modalità variegate. In questo senso, le persone che lavorano assieme costituiscono di solito una comunità, così come lo sono alcuni vicini, i gruppi di amici, le reti professionali e d’affari, le gang e le federazioni sportive. La connessione, e non l’affetto, è la caratteristica che definisce una comunità. I modelli evoluzionistici nel capitolo 7 hanno mostrato come la natura variegata e ripetuta delle interazioni sociali nelle comunità, il numero relativamente basso di persone coinvolte, e, come risultato, la disponibilità di informazioni sui propri associati possano sostenere un elevato livello di ciò cui talvolta ci si riferisce come capitale sociale: fiducia, attenzione per i propri associati e desiderio di vivere secondo le norme di una comunità e di punire coloro che non lo fanno. Questi comportamenti etero-interessati furono riconosciuti come ingredienti essenziali del buon governo tra i pensatori classici da Aristotele a Tommaso d’Aquino, da Jean-Jaques Rousseau ad Edmund Burke. Il Principe di Niccolò Macchiavelli (1513) e il Leviatano di Thomas Hobbes (1651) hanno rappresentato una netta frattura con la tradizione aristotelica. Queste opere fondamentali della moderna
IL GOVERNO DELL’ECONOMIA
|3
filosofia politica presero l’interesse personale come assunzione comportamentale fondamentale e si chiesero come le conseguenze potenzialmente distruttive del perseguimento autonomo dell’utile personale potessero essere vincolate dall’autorità di un governante sovrano. La nozione più radicale che le motivazioni egoistiche potrebbero essere sfruttate per il bene pubblico fu il contributo chiave della Favola delle api di Bernard Mandeville, pubblicata per la prima volta nel 1705 (Mandeville 1924). Il sottotitolo dell’edizione del 1714 della Favola proclamava che l’opera conteneva “diversi discorsi finalizzati alla dimostrazione delle fragilità umane… che potrebbero essere ribaltati a vantaggio della società civile, e concepiti per occupare il posto delle virtù morali.” Al posto della visione Aristotelica, secondo la quale le buone leggi producono buoni cittadini, Mandeville propose la più moderna nozione che regole giuste del gioco che governa le interazioni sociali dovrebbero sfruttare le motivazioni egoistiche per promuovere il benessere generale. A questa congettura radicale fu dato contenuto economico per mezzo dell’argomentazione della mano invisibile di Adam Smith. Dunque, sin dal tardo diciottesimo secolo, la maggioranza dei teorici della politica e dei pensatori costituzionali avevano preso l’homo economicus come loro assunzione fondamentale riguardante il comportamento. Anche per questa ragione hanno enfatizzato il ruolo dei mercati competitivi, dei diritti di proprietà ben definiti, e degli stati efficienti e ben intenzionati come ingredienti critici del governo. Le buone regole del gioco dunque giunsero per prendere il posto dei buoni cittadini come sine qua non del buon governo. I partiti rivali che emersero nel diciannovesimo secolo e nel primo ventesimo secolo sostenevano l’uno il laissez faire e l’altro l’intervento generale dello stato come la forma ideale di governo economico.1 Il dibattito negli anni venti e trenta sulla realizzabilità della pianificazione centrale fu emblematico del troncamento del menu costituzionale a “stato contro laissez faire”. Ludwig von Mises e altri (Hayek 1935) proposero la loro visione secondo cui il calcolo economico-razionale richiesto dalla pianificazione richiedeva la conoscenza dei prezzi che riflettevano la vera scarsità (i.e., la misurazione dei costi e dei benefici sociali marginali) e che questa informazione poteva essere ottenuta solo tramite un uso esteso dell’allocazione decentrata attraverso i mercati. Oskar Lange (Lange e Taylor 1938), Enrico Barone (1935), Abba Lerner (1944) e altri replicarono che i prezzi sono impliciti in qualsiasi problema di ottimizzazione (che i mercati esistano o meno). Questi prezzi impliciti (o “prezzi 1
Fuori dai circoli accademici, il menu di opzioni era considerevolmente più ampio, includendo i modelli economici “misti”, di cui i socialdemocratici dei paesi nordici erano pionieri e i modelli di mercato socialista introdotti da Oskar Lange. Dahl e Lindblom (1953) sono esemplari (ma ciò accade raramente) nell’evitare la polarizzazione del dibattito come “pianificazione contro mercato”.
4 | MICROECONOMIA
ombra”), essi sostenevano, potrebbero essere calcolati direttamente o estratti dall’osservazione dei comportamenti competitivi in un’economia che utilizza i mercati per implementare le allocazioni determinate dai pianificatori centrali. Se questo fosse il caso, il pianificatore potrebbe attuare qualsiasi allocazione raggiunta per mezzo di mercati competitivi decentralizzati. Tuttavia, in confronto, il pianificatore potrebbe ottenere risultati migliori in casi in cui ostacoli alla competizione o mercati mancanti hanno provocato un aumento delle inefficienze nelle allocazioni. Negli anni quaranta il dibattito si era quasi concluso. Anche l’oppositore per eccellenza del socialismo, Joseph Schumpeter, aveva ammesso: “Il socialismo può funzionare? Certo che può… non c’è niente di sbagliato nella teoria pura del socialismo” (Schumpeter 1942:167, 172). Schumpeter riecheggiava un altro oppositore del socialismo, Vilfredo Pareto (1897), che molto prima aveva affermato l’ammissibilità del calcolo economico-razionale in ciò che chiamava “regime collettivista.” In una sezione del suo famoso Manuel d’Economie Politique intitolata “Un argomento a favore della produzione collettivista” Pareto (1909:364) aveva concluso che “l’economia pura non ci fornisce un criterio veramente decisivo per scegliere tra l’organizzazione di un società basata sulla proprietà privata ed una organizzazione socialista.” Cos’era sbagliato allora nel socialismo? E cosa era sbagliato nella teoria economica che in modo così inadeguato catturava i difetti economici delle allocazioni centralizzate e giustificava nel dibattito la pianificazione socialista? Una caratteristica notevole del dibattito era che entrambe le parti schieravano il modello walrasiano a favore delle loro argomentazioni. Hayek si accorse presto dell’errore. In “The uses of information in society” (citato sopra) reimpostò il dibattito in termini di costi e di disponibilità limitata delle informazioni, concetti assenti dal paradigma walrasiano. Il problema del socialismo, secondo Hayek, era che le informazioni necessarie al pianificatore sono possedute privatamente da milioni di attori economici, i quali non hanno né la volontà, ed in molti casi neanche il modo, di trasferirle all’autorità centrale. Al contrario, continua Hayek, i mercati decentralizzati utilizzano efficacemente le informazioni disperse, poiché ogni attore conosce le proprie preferenze e risponde al vettore dei prezzi che, in circostanze ideali, è conosciuto all’attore individuale ed è il riflesso della vera scarsità sociale dei beni in questione. Ora sappiamo (capitolo 6) che non esiste un mercato neanche remotamente realistico nel quale queste condizioni sono valide, perché molti dei prezzi rilevanti semplicemente non esistono, altri non riflettono le scarsità sociali e
IL GOVERNO DELL’ECONOMIA
|5
altri ancora (i prezzi dei beni futuri, per esempio) non sono conoscibili. Tuttavia, focalizzando l’attenzione su quali istituzioni utilizzano in modo più efficace le informazioni che sono disponibili, l’articolo di Hayek, come la Favola di Mandeville, viene considerato una pietra miliare nella teoria delle istituzioni economiche. Nel formalizzare i maggiori difetti della pianificazione centralizzata, Hayek puntualizzò anche le mancanze del paradigma walrasiano, cioè l’assunzione di informazione completa. Per Ronald Coase, il dibattito aveva rivelato un’incoerenza, quella che dovette ispirarlo allo studio della teoria dell’impresa. Al termine della sua carriera, lo richiama domandandosi: Come si possono riconciliare le visioni espresse dagli economisti sul ruolo del sistema dei prezzi e dell’impossibilità di una pianificazione centrale economica di successo con l’esistenza … di queste società ed imprese apparentemente pianificate dentro la nostra società [?] (Coase 1992:715).
Poco dopo la caduta del comunismo, Stiglitz (1994:10) osservò ironicamente che “se il modello neoclassico dell’economia fosse corretto, il socialismo di mercato sarebbe stato un successo [e] il socialismo pianificato centralmente si sarebbe imbattuto in un numero molto inferiore di problemi.” Molto prima dell’economia neoclassica o del comunismo, John Stuart Mill (1976) aveva fornito una critica ai problemi di un’ipotetica economia socialista – la motivazione dei lavoratori, la riduzione dell’innovazione, la mancanza di diritti di proprietà appropriati – molto più penetrante di qualsiasi altra prodotta all’interno del paradigma neoclassico. Commentando il ruolo dei consulenti economici degli Stati Uniti nelle economie in transizione degli ex paesi comunisti negli anni novanta, Coase osservò: “Senza le istituzioni appropriate non è possibile nessuna economia di mercato di qualche significato. Se sapessimo di più delle nostre economie, saremmo in una migliore posizione per fornire loro consiglio.” (Coase 1992:714). Assieme al suo fallimento nel chiarire i problemi del sottosviluppo, l’incapacità dell’economia walrasiana di comprendere gli handicap del Comunismo o le istituzioni idonee per la transizione ad una economia fondata sul mercato costituiscono un chiaro segnale di debolezza di questo approccio. In questo capitolo adotteremo un approccio post-walrasiano per spiegare le sfide contemporanee della governance economica. Utilizzeremo i risultati dei precedenti capitoli per esplorare le modalità con cui congiuntamente mercati, stati e comunità possono fornire una soluzione ai problemi di coordinamento studiati nei precedenti capitoli. (Non forniremo queste soluzioni dal punto di vista della giustizia distributiva ma piuttosto ci focalizzeremo sulle loro implicazioni per l’efficienza allocativa). Scegliamo tre generiche strutture di governo – le comunità, gli stati e i mercati – per i
6 | MICROECONOMIA
modi distintivi in cui coordinano le attività congiunte e allocano diritti su beni e servizi.2 Inevitabilmente, la trattazione sarà stimolante, ma non esaustiva. Tirare i fili della prospettiva post-walrasiana è un primo compito suggerito dall’uso inappropriato delle assunzioni walrasiane nei dibattiti fra pianificazione e laissez faire. E’ ciò che faremo nel prossimo paragrafo. Di seguito identificheremo le capacità distintive e i difetti di mercati, stati e comunità. Concluderemo con una riconsiderazione della congettura radicale di Mandeville.
LA
SCIENZA ECONOMICA E LE SCIENZE SOCIALI EVOLUTIVE
Il paradigma walrasiano fornisce il solo modello compiutamente elaborato per tutte le economie che spieghi come le azioni di un gran numero di attori autonomi sostengano risultati sociali aggregati. Alcuni dei difetti di questo modello sono stati identificati nelle pagine precedenti, e sono state suggerite alcune formulazioni alternative. Per sintetizzare le caratteristiche principali dell’approccio walrasiano, caratterizzeremo il paradigma walrasiano con ciò che viene insegnato agli studenti, piuttosto che con l’impossibile eterogenea unione dei distinti contributi degli studiosi rappresentativi di questo paradigma. Questo necessariamente comporterà alcune discrepanze tra la rappresentazione del paradigma e lo stato dell’arte della conoscenza del settore. Per fare un esempio, si consideri l’unicità e la stabilità dell’equilibrio generale: agli studenti si insegna regolarmente che sono verificate – si consideri il grafico standard di domanda e offerta - anche se (come è stato puntualizzato nel capitolo 6) le assunzioni richieste per dimostrare l’unicità e la stabilità sono eccezionalmente restrittive. Utilizzeremo l’espressione scienze sociali evolutive per riferirci alle alternative al paradigma caratteristico walrasiano. Non esiste un paradigma unificato con questo nome, ma insiemi di approcci abbastanza disgiunti, molti dei quali piuttosto rudimentali. La maggior parte di questi sono stati introdotti nelle precedenti pagine. Resta da vedere se negli anni a venire questi approcci saranno unificati in un sostituto coerente del paradigma walrasiano. L’intuizione sulla quale è fondato questo libro è che si unificheranno. La Tabella 14.1. riassume i due approcci contrastanti. Sarebbe ridondante commentare ciascuna riga. Tuttavia, l’ultima riga nella tabella, riguardante riduzionismo e individualismo metodologico merita un commento. Il riduzionismo è un approccio alla scienza che preferisce spiegazioni fondate su entità di livello inferiore (le cellule, ad esempio) rispetto a postulare semplicemente le entità di livello più elevato che esse compongono (organismi multicellulari, ad esempio). 2
La famiglia potrebbe essere considerata una quarta struttura di governance. Le famiglie condividono molte delle caratteristiche delle comunità ma differiscono nei ruoli che vengono assegnati per età, sesso, e parentela.
IL GOVERNO DELL’ECONOMIA
|7
L’individualismo metodologico è un’espressione del riduzionismo nelle scienze sociali che sostiene fermamente che le spiegazioni dei fenomeni a livello di gruppo, quali le istituzioni o i prodotti aggregati, devono essere sviluppate a partire dalle azioni degli individui. L’approccio scelto in questo libro è coerente con l’individualismo metodologico in quanto ci si è focalizzati sui meccanismi causali che connettono ciò che gli individui fanno per aggregare i risultati sociali. Tuttavia, come è stato chiarito dalla discussione delle preferenze endogene e dell’evoluzione culturale, l’effetto dei risultati aggregati sugli individui è non meno importante. Il concetto convenzionale di equilibrio in economia è espressione dell’individualismo metodologico della disciplina. E’ una pratica standard – e frequentemente usata nelle pagine precedenti – quella di definire un equilibrio come uno stato in cui nessuno degli individui coinvolti ha una ragione per alterare il suo comportamento. Le proprietà aggregate dell’equilibrio – un’allocazione di risorse in tutte le economie, per esempio – sono dunque derivate dall’aggregazione dei comportamenti individuali di equilibrio. Le proprietà aggregate sono stazionarie poiché i comportamenti individuali sono stazionari. Tuttavia, come dimostra il modello di equilibrio generale di Foley (1994) descritto nel capitolo 6, la stazionarietà delle proprietà aggregate non richiede la stazionarietà delle entità di livello inferiore. Il modello di Foley mostra che, affinché i prezzi medi non cambino, non è necessario che gli scambi abbiano termine. L’analisi di Brian Arthur (1994a) della frequentazione del suo bar preferito veicola un messaggio simile. Nessuno vuole andarci quando è affollato e le persone stimano quante persone ci saranno sulla base delle esperienze passate. Arthur simula un processo di apprendimento adattivo, il cui risultato è che circa sessanta persone si presentano a El Farol ogni giovedì. Tuttavia, perché ciò accada non occorre che si presentino le stesse identiche persone, o che siano accurate o stazionarie le valutazioni di coloro che arrivano riguardo a quanti altri arriveranno. Tabella 14.1. Il paradigma walrasiano e qualche alternativa.
Economia Walrasiana (come insegnata)
Scienze Sociali Evoluzionistiche (in prospettiva)
Interazioni Sociali
Diritti completi e applicabili in modo coercitivo scambiati su mercati competitivi
Sono comuni relazioni dirette (non contrattuali) in ambienti non competitivi
Tecnologia
Funzioni di produzione esogene con rendimenti non crescenti
Rendimenti crescenti generalizzati sia nella tecnologia (endogena) sia nelle interazioni sociali (feedback positivi)
Aggiornamento
Individui lungimiranti si aggiornano in modo istantaneo sulla base della
Individui che guardano al passato e sulla base dell’esperienza si aggiornano utilizzando informazioni locali
8 | MICROECONOMIA
conoscenza dell’intero sistema Risultati
Un unico equilibrio stabile basato sulla stazionarietà delle azioni degli individui
Molteplici equilibri, i risultati aggregati possono essere medie di lungo periodo di entità di livello più basso non stazionarie
Tempo
Statica comparata
Dinamica esplicita
Caso
Rilevante solo per il rischio e per le assicurazioni
Componente essenziale delle dinamiche evoluzionistiche
Dominio
L’economia come entità che si limita e si regola da sola: preferenze ed istituzioni sono esogene
L’economia è inserita in un più ampio sistema ecologico e sociale: coevoluzione di preferenze ed istituzioni
Preferenze
Preferenze auto-interessate definite sui risultati
Preferenze auto-interessate e non autointeressate definite sui risultati e sui processi
Prezzi e quantità
I prezzi decidono l’allocazione delle risorse; gli attori non sono vincolati dalla quantità
Vincoli di quantità; opportunità contrattuali dipendenti dalla ricchezza
Metodo
Riduzionista (individualismo metodologico)
Non – riduzionista; selezione sugli individui ed altre entità di ordine più elevato
In questa e in molte altre applicazioni, le entità di livello inferiore non sono stazionarie, ma in modo tale da compensarsi nella media, non producendo nessun cambiamento nelle proprietà aggregate. L’analisi evolutiva nei capitoli dall’11 al 13 ha adottato questo metodo. Gli stati stabili in senso stocastico (capitolo 12) non sono risultati stazionari; piuttosto, descrivono comportamenti medi di lungo periodo di un sistema. I modelli nei capitoli 11 e 13 hanno descritto popolazioni costantemente in movimento, spinte da azioni premeditate di risposta non ottimale da parte di collettivi di individui, da altri comportamenti idiosincratici, dalla deriva genetica, e dall’innovazione istituzionale. I risultati delle simulazioni ad agenti erano medie di lungo periodo che riflettevano tutte queste influenze. L’individualismo metodologico è anche evidente in un comune approccio all’analisi delle istituzioni economiche. Schotter (1981:20) presenta un esempio: Se la scienza economica … intende studiare l’origine e l’evoluzione delle istituzioni sociali, si suggerisce un approccio metodologico molto semplice. Dovremmo far partire la nostra analisi da uno stato di natura lockiano nel quale non esistono del tutto istituzioni sociali, solo gli agenti, le loro preferenze e la tecnologia che hanno a loro disposizione … Il passo successivo sarebbe studiare, nel corso dell’evoluzione di questa economia, quando si svilupperebbero istituzioni quali la moneta, le banche, i diritti di proprietà, i mercati competitivi, i contratti di assicurazione, e lo stato.
IL GOVERNO DELL’ECONOMIA
|9
Non c’è dubbio che il metodo di Schotter sia interessante, e che si sia dimostrato penetrante. Se invece si prendessero tecnologie e preferenze endogene, violare i principi dell’individualismo metodologico fornirebbe intuizioni altrettanto profonde. Si potrebbe, per esempio, assumere un insieme di istituzioni e quindi chiedersi che tipo di preferenze e di tecnologie si svilupperebbero. L’approccio adottato in questa sede (specialmente nei capitoli dall’11 al 13) rappresenta le preferenze individuali e le istituzioni a livello di gruppo come entità che coevolvono, quindi senza privilegiare le entità di ordine inferiore rispetto a quelle di ordine superiore. Se sia necessario formulare un modello per i processi di gruppo o individuali (o entrambi, o altri oltre a questi) dipende dal problema analitico in questione e da considerazioni pratiche di trattabilità. Se non si formula un modello delle interazioni cellulari all’interno degli individui nella maggioranza delle applicazioni nelle scienze sociali si guadagna molto in semplicità e non si perde niente. Invece, tale strategia sarebbe debole ai fini della comprensione del cancro. Quando le caratteristiche di gruppo possono essere prese come date, formulare un modello a livello individuale è un approccio ragionevole. In modo simile, se possiamo astrarre dalle variazioni all’interno del gruppo, il processo di selezione a livello di gruppo può ben essere il centro della nostra attenzione, come è nei modelli di competizione tra imprese. Richard Dawkins (1989:3), un forte sostenitore del riduzionismo in biologia, osservò giustamente che fornisce più informazioni spiegare le automobili in termini di carburatori che di quark. Da questa prospettiva, ipotizzare un ambiente originario senza istituzioni è un modo curioso di investigare l’evoluzione storica delle vere istituzioni. La ragione è che sin dall’avvento degli esseri umani biologicamente moderni, ed anche tra gli altri primati, convenzioni sociali e diritti di proprietà di vario tipo hanno quasi certamente fornito un ambiente istituzionale per le nostre interazioni. Locke, Hobbes e altri filosofi hanno usato lo stato di natura come un’ipotetica indagine su ciò che potrebbe giustificare la proprietà, l’autorità dello stato, ecc…, non come parte di una spiegazione di come queste istituzioni si sono evolute storicamente. (Si ricordi la metafora di Hobbes, deliberatamente fantasiosa, dello stato di natura nell’epigrafe del capitolo 3: “consideriamo gli uomini come se spuntassero … come funghi”). Nel prologo ho distinto il metodo evolutivo dall’approccio dell’ingegneria sociale alla politica pubblica. Con il secondo intendo la visione secondo cui i risultati sociali sono determinati da azioni autonome di funzionari con senso civico, più o meno nello stesso modo in cui le pedine degli scacchi nell’epigrafe di Smith potrebbero essere mosse sulla scacchiera. Nessuno crede alla lettera a questo (meno
10 | MICROECONOMIA
di tutti i funzionari pubblici), ma molti non riescono a stimare la misura in cui questa visione falsifica il processo con cui sono determinati i risultati. Sebbene non abbiamo prestato attenzione ai problemi della politica pubblica, i modelli sviluppati in questo libro suggeriscono un approccio abbastanza differente, ovvero applicare ai funzionari dello stato le stesse assunzioni comportamentali che abitualmente adottiamo per chi è impegnato in scambi privati: far sì che le azioni dei funzionari siano risposte ottime fondate sulle loro preferenze in condizioni di incompletezza contrattuale. Adottando una prima versione di questo approccio, Jeremy Bentham era a favore di accordi costituzionali tali da strutturare gli incentivi in modo che i “doveri” dei dipendenti pubblici coincidano con i loro “interessi”. Tuttavia, questo obiettivo raramente viene realizzato. Nella visione evolutiva, gli effetti aggregati sono il risultato delle interazioni tra le azioni dei funzionari pubblici e le risposte ottimali di tutti gli individui coinvolti. Ciò non suggerisce che gli interventi del governo siano inefficaci, ma piuttosto che per essere efficaci nei modi desiderati occorre una comprensione del sistema dinamico in cui si sta intervenendo. Per esempio, le politiche che occorrono per sostituire un equilibrio socialmente non desiderabile in favore di qualche altro risultato possono essere completamente differenti a seconda che il sistema che produce i risultati sia caratterizzato da un singolo equilibrio o da molti equilibri stabili. Il compito della politica pubblica è sostituire un equilibrio ad un altro. L’esempio del lavoro minorile che segue chiarirà questo aspetto. Infine, proponiamo un commento che non riguarda direttamente i paradigmi contrastanti, ma piuttosto è diretto alle problematiche normative, mai assenti quando si discute di alternative istituzionali. “Utilità” è un termine pesantemente caricato di significati: gli economisti di solito lo usano per riferirsi alle motivazioni, ai comportamenti e al benessere. La convenienza di far collassare questi tre distinti usi in un singolo termine è considerevole. Tuttavia, perché ciò succeda è necessario introdurre l’assunzione implicita di razionalità sostanziale, ovvero, che le persone agiscano in modo tale da ottenere ciò che vogliono, la qual cosa a sua volta contribuisce al loro benessere, determinato da una qualche valutazione indipendente dei risultati rilevanti. Al contrario, la razionalità formale, assunta dalla maggioranza degli economisti, impone ai comportamenti solo requisiti di coerenza (come la transitività), senza alcun requisito per le ragioni soggettive delle azioni dell’individuo, edonistiche o di altro tipo, per la ragionevolezza dei mezzi adottata per il perseguimento di qualche risultato, o per le conseguenze sul benessere dell’individuo. Un masochista coerente non è irrazionale.
IL GOVERNO DELL’ECONOMIA
|11
Affinché sia di rilevanza pratica o morale, il ragionamento economico sulle istituzioni e sulle politiche pubbliche richiede la nozione di razionalità sostanziale. Se, per esempio, un individuo crede che terze parti non dovrebbero intervenire in transazioni volontariamente intraprese da attori economici adulti, non è sufficiente sapere che essi hanno preferenze complete e transitive. In aggiunta dobbiamo avere la certezza che le loro scelte non saranno distruttive per il loro benessere in modo grave o irreversibile. Lo stesso vale per la comune interpretazione dell’efficienza paretiana in termini di “benessere” degli individui. La sola razionalità formale non fornisce la motivazione per preferire risultati Pareto-superiori, eccetto che nella mente dei libertari estremi. Un’allocazione preferita da due masochisti potrebbe essere approvata da altri. Tuttavia, l’assunzione di razionalità sostanziale è basata su affermazioni forti di carattere empirico riguardanti la ragione per cui le persone fanno quello che fanno e le conseguenze delle loro azioni. Queste affermazioni sono in generale false. Numerose prove empiriche suggeriscono che, se valutate sulla base dello standard del benessere, le persone sono pessime nello scegliere. Siamo privi di lungimiranza, falliamo nel prevedere le preferenze che avremo quando le conseguenze rilevanti delle nostre azioni avranno luogo, non accumuliamo informazioni accurate sugli aspetti edonistici delle esperienze passate, agiamo in modo incoerente nelle situazioni di scelta intertemporale e violiamo di frequente le ipotesi dell’utilità attesa (Kahneman 1994, Camerer 2000). I soggetti che mostrano queste caratteristiche negli esperimenti e in situazioni del mondo reale troverebbero strano sentire chiamare i loro comportamenti “irrazionali”. Tra questi soggetti ci sono studenti delle università più selettive, professori di Harvard e tassisti di New York. Se le preferenze devono spiegare i comportamenti, non possono senza altro aiuto svolgere anche il compito della valutazione dei risultati. Questo è vero perché alcune comuni ragioni del comportamento – la debolezza della volontà e le dipendenze, ad esempio – inducono comportamenti che pochi tollererebbero. La disgiunzione tra le motivazioni dei comportamenti e gli standard con cui un politico liberale e democratico dovrebbe valutare i risultati conduce a dispute profonde, tali da contrapporre i valori liberali a quelli utilitaristi e paternalisti. Per esempio, se tra le persone l’avversione alle perdite è una potente reazione soggettiva, dovrebbe essere tenuta in considerazione nel valutare le politiche pubbliche? Procedere in questo senso avrebbe l’effetto di uno spostamento sostanziale in favore dello status quo, in quando i costi sostenuti dai perdenti sarebbero ora contati due volte o più. Ma rispondere a questi problemi ci porterebbe lontano.
12 | MICROECONOMIA
M E R C AT I
E S TAT I : U N C O N F R O N TO P O S T - WA L R A S IA N O
Dato che la retorica del dibattito sulla pianificazione contro il laissez faire fu altamente polarizzata, una conclusione da sottolineare è che mercati e stati sono difficili da distinguere da un punto di vista allocativo. Nel 1928 il discorso presidenziale di F. M. Taylor all’American Economic Association si aprì con le seguenti parole: Nel caso di uno stato socialista, il metodo idoneo per determinare quali beni saranno prodotti sarebbe in generale analogo … a quello adottato nell’attuale ordinamento economico di libera impresa competitiva. (Taylor 1929:1)
Questa inattesa somiglianza nei sistemi di allocazione risulta dalle assunzioni di informazione completa e di contrattazione completa fatte dalla maggioranza dei partecipanti al dibattito. Se ognuno conoscesse le stesse cose (e se ciò che ciascuno conosce fosse proponibile in tribunale), e se non ci fossero altri impedimenti alla contrattazione, le differenze istituzionali conterebbero di meno. Abbiamo già incontrato l’affermazione di Samuelson (nell’epigrafe del capitolo 10) di equivalenza walrasiana tra imprese dirette dai lavoratori e imprese dirette dai capitalisti: se la contrattazione è completa, infatti, non conta chi è colui che assume e chi è colui che viene assunto (“who hires whom”). Questa equivalenza significa che per comprendere le differenze operazionali tra imprese convenzionali e imprese possedute dai lavoratori, come le cooperative del legno compensato menzionate nel capitolo 10, si dovrebbero analizzare i differenti problemi di incompletezza contrattuale cui vanno incontro e le differenti capacità che dimostrano nel risolverli. La stessa conclusione regge per confronti tra mercati e stati. Come risultato, le comparazioni rilevanti si verificano tra configurazioni istituzionali imperfette. Questa attenzione ai relativi vantaggi ed imperfezioni delle istituzioni difettose è segno distintivo dell’economia delle istituzioni di Ronald Coase e Oliver Williamson (1985) e risale a Pareto, che, immediatamente dopo aver mostrato l’equivalenza di allocazioni competitive e collettiviste in un modello altamente astratto, introdusse l’idea di costi di transazione: “Una seconda approssimazione terrà conto del costo di mettere in pieno funzionamento il meccanismo della libera competizione e confronterà questi costi con quelli necessari a fondare qualche altro meccanismo sociale che si potrebbe desiderare di testare” (Pareto 1896:500). Quale combinazione di mercato, stato e comunità sia di maggior successo nel rispondere a dati problemi di coordinamento dipende dalle sottostanti realtà tecnologiche e sociali che fanno sorgere l’interdipendenza tra gli attori. Per esempio, rendimenti fortemente crescenti in un processo di produzione rendono sia la
IL GOVERNO DELL’ECONOMIA
|13
produzione isolata, sia la competizione di mercato non solo inefficiente (poiché non è ammissibile fissare il prezzo pari al costo marginale), ma anche difficile da sostenere (a causa dei feedback positivi generati dai rendimenti crescenti e del risultante aspetto del processo competitivo per cui “il vincitore prende tutto” (winner-take-all)). Le istituzioni influenzano quattro aspetti delle interazioni economiche. In primo luogo, le istituzioni influenzano la distribuzione delle informazioni, il modo in cui le informazioni vengono acquisite, nascoste, condivise e usate per far rispettare i contratti. In secondo luogo, le istituzioni, in congiunzione con una data distribuzione di ricchezza, differiscono nelle modalità di assegnazione del diritto di controllo e del diritto al residuo tra coloro che partecipano ad un’interazione. In terzo luogo, istituzioni differenti e distribuzioni di ricchezza generano distinti pattern di conflitto di interesse tra i soggetti che partecipano alle transazioni. Infine, le istituzioni che governano una particolare interazione influenzeranno le preferenze e le convinzioni (belief) dei partecipanti. Una sintesi in pillole dell’argomento è la seguente: le differenze istituzionali hanno importanti conseguenze allocative quando esistono conflitti di interesse tra attori la cui interdipendenza non è governata da contratti completi. I fallimenti di coordinamento che sorgono in queste situazioni possono essere attenuati da istituzioni che realizzano uno o più dei seguenti desiderata. In primo luogo, possono allineare più attentamente i diritti di controllo e le rivendicazioni residuali in modo tale che gli individui possiedano i risultati delle loro azioni, riducendo il grado di interdipendenza effettiva. In secondo luogo, possono ridurre il conflitto di interesse riguardo agli aspetti non contrattabili di una transazione tra le parti coinvolte. In terzo luogo, possono ridurre l’entità o l’importanza delle informazioni private, consentendo la formulazione di contratti più completi e una contrattazione più efficiente. L’utilizzo di queste idee per confrontare le istituzioni (incluse le comunità) occuperà la parte rimanente del capitolo. Quali sono le distinte qualità di mercati, governi e comunità che potrebbero servire questi fini? L’apprezzamento di Adam Smith per il valore dei mercati competitivi è particolarmente moderno: i mercati rendono la collusione difficile quando la competizione è socialmente benefica. “Le persone che operano nello stesso commercio raramente” ha scritto “si incontrano anche per divertimento e distrazione, senza che la conversazione finisca in una cospirazione contro il pubblico; o in qualche raggiro per alzare i prezzi” (Smith 1937: 128). Se tali cospirazioni devono essere efficaci in una situazione di mercato, grandi numeri di partecipanti
14 | MICROECONOMIA
potenziali ed effettivi devono cooperare in ciò che è un Gioco dei Beni Pubblici. Come abbiamo visto nel capitolo 13, sostenere la cooperazione in queste situazioni per mezzo della minaccia di una successiva ritorsione e di strategie ad essa assimilabili diventa eccezionalmente difficile al crescere del numero dei partecipanti. Dunque, aumentando il numero dei “cospiratori” necessari ad influenzare i prezzi, i mercati competitivi impediscono la collusione in una situazione in cui la collusione non è socialmente benefica. La prima caratteristica interessante dei mercati è dunque un risultato delle interazioni non-cooperative che deriva dalle interazioni di grandi numeri. La competizione di mercato è il mezzo per indurre gli agenti a rendere pubbliche le informazioni private economicamente rilevanti che possiedono. Si dice spesso che nei mercati le persone votano con il loro denaro, il che è corretto se ciò che si vuol intendere non è che i mercati sono democratici, ma piuttosto che è costoso esprimere una preferenza in un sistema di mercato competitivo. Infatti, l’unico modo di manifestare una preferenza è effettuare un acquisto di mercato. Il prezzo al quale si è disposti ad acquistare il bene veicola ciò che altrimenti sarebbe un’informazione privata, ovvero che il bene vale almeno quanto il prezzo pagato. In modo simile, in una interazione di mercato è remunerativo rivelare una capacità produttiva e costoso falsificare i veri costi di produzione. In un equilibrio di mercato competitivo con rendimenti non crescenti, i produttori che massimizzano il profitto renderanno disponibili i beni al loro costo marginale di produzione, rivelando in tal modo un importante pezzo di informazione (che diversamente sarebbe privato). Chi “falsifica” le sue capacità produttive offrendo beni a prezzi non uguali al costo marginale otterrà profitti minori rispetto a chi vende ad un prezzo che veicola i veri costi. In effetti, la competizione di mercato trasforma il problema della determinazione del prezzo in un dilemma del prigioniero con n giocatori in cui n n produttori hanno un interesse comune nel ridurre il prodotto e nel “gonfiare il loro costi” fissando p > mc . Tuttavia, se n è grande, ciascuna impresa ha un incentivo a defezionare vendendo ad un prezzo migliore di quello dei suoi rivali, e rivela di conseguenza le sue vere condizioni di produzione. Al contrario dei mercati, nei sistemi centralizzati non di mercato i produttori hanno tipicamente un incentivo a non dichiarare per intero le loro capacità produttive per assicurarsi una minore quota produttiva. I consumatori in modo simile hanno un incentivo a dichiarare necessità maggiori di quelle reali per stabilire un diritto superiore su beni e servizi. La seconda caratteristica è la seguente. Quando il diritto al residuo e i diritti di
IL GOVERNO DELL’ECONOMIA
|15
controllo sono rigorosamente allineati, la competizione di mercato fornisce un meccanismo di disciplina che punisce gli inetti e ricompensa chi ha una performance elevata. I mercati sono un modo per accrescere ciò che i biologi chiamano pressione selettiva: hanno l’effetto di ridurre la varianza della performance e dunque (sotto idonee condizioni) aumentare la performance media. La differenza sostanziale osservata tra performance alte e basse (capitolo 2) suggerisce che il processo opera in modo imperfetto, ma anche che quando funziona davvero, gli effetti risultanti sulla produttività possono essere significativi. Questi handicap dei mercati sono connessi ai loro punti di forza. I mercati, si dice, impongono severi vincoli di bilancio agli attori rilevanti, ma lo fanno solo quando coloro che prendono le decisioni ne possiedono i risultati. Ad ogni modo poiché le opportunità contrattuali dipendono dalla ricchezza e per altre ragioni, diritto al residuo e diritti di controllo sono spesso disallineati; di conseguenza, il processo di disciplina non opera in modo efficace. Un lavoro ben fatto non necessariamente darà dei benefici ad un impiegato al quale è pagato un salario fisso. La chiusura di un impianto, per fare un altro esempio, eliminerà le rendite da lavoro di centinaia di lavoratori; ma non necessariamente punirà quelli responsabili delle perdite che hanno provocato la chiusura. Inoltre, anche quando il controllo sulle azioni non contrattabili e il diritto al residuo del flusso di redditi di un progetto sono unificati, le esternalità ambientali e altri effetti esterni estendono le conseguenze delle azioni prese dal soggetto che prende le decisioni ben oltre la portata dei contratti. Contrariamente ai mercati, gli stati possono attenuare i fallimenti del coordinamento per mezzo della loro abilità nel permettere agli individui di, e spesso nell’obbligarli a interagire in modo cooperativo in situazioni in cui le interazioni non cooperative sono inefficienti. Il vantaggio comparato dei governi è nella produzione di regole: solo gli stati hanno il potere di imporre l’osservanza universale delle regole che governano l’interazione degli agenti privati. Quando gli individui fronteggiano situazioni del tipo del dilemma del prigioniero o altri problemi di coordinamento in cui il perseguimento autonomo di obiettivi individuali conduce ad un risultato non desiderabile, lo stato può fornire o imporre il coordinamento necessario ad evitare questo risultato. I servizi che possono espletare i soli governi, e non invece le comunità e i mercati, includono la definizione, l’assegnazione e l’applicazione dei diritti di proprietà, la fornitura di beni pubblici, la regolamentazione degli effetti ambientali e di altri effetti esterni o spillover, la regolamentazione dei monopoli naturali, la fornitura di alcune forme di assicurazione, e la regolamentazione macroeconomica. Sono meno ovvi i casi che comportano la selezione di un equilibrio: quando esistono equilibri multipli, un singolo intervento dello stato può
16 | MICROECONOMIA
essere in grado di implementare l’equilibrio socialmente desiderabile. Basu e Van (1998), per esempio, mostrano che una singola proibizione del lavoro minorile potrebbe spostare un equilibrio che costituisce una specie di trappola della povertà e causare lo spostamento ad un altro equilibrio in cui i bambini e le loro famiglie sarebbero tutti in una condizione migliore. Lo stato affronta i dilemmi del prigioniero in maniera diametralmente opposta a quella dei mercati. I mercati competitivi ostacolano la formazione di cartelli e di altre forme di collusione fornendo incentivi alla defezione, mentre lo stato può indurre la cooperazione impedendo la defezione. Poiché sia la defezione sia la cooperazione sono desiderabili in circostanze differenti, i mercati e gli stati svolgono ruoli complementari nel risolvere i problemi di coordinamento. Gli stati prevengono la defezione obbligando alla partecipazione in quegli scambi che non sarebbero scelti volontariamente da agenti economici che agiscono separatamente – per esempio, cooperare nella situazione del dilemma del prigioniero. Questa capacità di obbligare all’obbedienza con la forza può contribuire alla soluzione dei problemi di coordinamento anche quando gli individui hanno informazioni che sono private e dunque inaccessibili allo stato. Un esempio riguardante la disponibilità di alcuni tipi di assicurazione illustra questo principio. Prima di aver appreso le posizioni, lo stato di salute e i rischi specifici che fronteggiano come individui, tutti i membri di una popolazione potrebbero preferire l’acquisto di un’assicurazione. Ma, dopo aver appreso la propria specifica posizione, quelli con una bassa probabilità di incassare dall’assicurazione non desidereranno acquistarla, poiché starebbero sovvenzionando quelli con un’alta probabilità di riscossione. Dunque le persone a basso rischio uscirebbero dal mercato e il prezzo delle assicurazioni sarebbe troppo alto per le persone ad alto rischio. Poiché prima di ottenere una specifica conoscenza della propria posizione di rischio tutti avrebbero voluto stipulare un’assicurazione, e poiché questa non è disponibile sul mercato, si verifica un chiaro fallimento del mercato. Fornendo l’assicurazione e obbligando tutti gli agenti a pagare per essa, lo stato supera questo fallimento del mercato. Altri esempi sono stati forniti nei capitoli precedenti. Nel capitolo 6 implementare il coprifuoco ottimo da un punto di vista sociale può richiedere che il decisore della città fissi un coprifuoco (e dunque lasciare che gli Zucconi (Deadhead) e i Dormiglioni (Sleepyhead) usino le loro informazioni private per mezzo di una contrattazione à la Coase al fine di attuare miglioramenti paretiani rispetto al coprifuoco imposto). Nel capitolo 9 abbiamo visto che partendo da un’assegnazione
IL GOVERNO DELL’ECONOMIA
|17
dei diritti di proprietà in un equilibrio competitivo, una redistribuzione di ricchezza imposta dallo stato potrebbe accrescere sia l’efficienza tecnica, sia quella paretiana. Si possono fare altri esempi meno ovvi: conferendo il diritto di contrattazione collettiva agli impiegati, potrebbero essere attenuati la fornitura insufficiente di comfort sul luogo di lavoro e le opportunità di utilizzo arbitrario del potere del lato corto illustrato nel capitolo 10. Lo stato, ad ogni modo, ha diverse debolezze come struttura di governance. La prima è la mancanza di accesso dei funzionari statali all’informazione privata posseduta dai produttori e dai consumatori. La seconda è l’immagine speculare della prima: la mancanza di accesso dei votanti e dei cittadini (assumendo una politica democratica) alle informazioni private possedute dai funzionari dello stato. In questo caso, l’agente (lo stato) deve render conto solo in senso debole ai principali (i cittadini). Si possono ugualmente applicare a questo caso le stesse argomentazioni che mostrano che le soluzioni di first-best sono generalmente inattuabili in relazioni del tipo principale-agente nello scambio privato. Il terzo difetto dello stato come struttura di governo è che non esiste un sistema ideale per prendere decisioni che siano vincolanti per grandi numeri di persone. Poiché non c’è nessun modo democratico coerente per aggregare le preferenze degli individui in criteri di scelta sociale coerenti, i risultati della regola della maggioranza e di altri meccanismi di voto dipendono criticamente da chi controlla l’ordine del giorno delle votazioni. Inoltre, diversamente dai mercati, gli schemi di voto hanno difficoltà nel rappresentare l’intensità delle preferenze per differenti beni o risultati sociali. Infine, quando l’intervento del governo frena i risultati di mercato, gli attori economici privilegiati dall’intervento ottengono delle rendite – i redditi al di sopra della loro miglior opportunità alternativa. Dunque i gruppi intraprenderanno un comportamento volto alla ricerca di rendite (rent-seeking), nel tentativo di indurre lo stato ad intervenire nel loro interesse piuttosto che in quello di un altro gruppo o del pubblico in generale, dunque sprecando risorse e distorcendo gli effetti delle politiche pubbliche. Come nel caso dei mercati, queste debolezze derivano dalle possibilità peculiari dello stato. Per potere esercitare azioni coercitive e allo stesso tempo prevenire l’opzione di uscita lo stato deve essere universale e indiscutibile in alcune sfere. Questa universalità dello stato rende difficile far sì che lo stato diventi responsabile costringendolo alla fornitura competitiva dei suoi servizi. Inoltre, l’incapacità degli schemi di voto di aggregare le preferenze in maniera coerente richiede che modalità non elettorali per influenzare il processo decisionale collettivo – incluse le attività dei gruppi di interesse – siano disponibili come correttivi. Tuttavia
18 | MICROECONOMIA
è difficile regolare l’attività di rent-seeking rivolta a questi processi non elettorali senza alterare le procedure democratiche. Naturalmente, gli stati possono essere resi più responsabili favorendo la competizione tra governi locali, altre agenzie pubbliche ed enti privati, assicurando la competizione tra parti autonome e le libertà civili in modo da promuovere il monitoraggio attento delle azioni dei funzionari statali, sottoponendo le posizione elettive e amministrative interne allo stato ad incentivi ben strutturati e limitando le azioni dello stato a quelle che non possono essere regolate in maniera maggiormente responsabile da qualche altra struttura di governo.
IL
GOVERNO DELLA COMUNITÀ
Per Marx ed altri modernisti del diciannovesimo secolo, la “comunità” era l’antitesi del mercato che rappresentava un residuo anacronistico dell’era feudale, destinato ad essere spazzato via dai requisiti del progresso economico o, per dirla con Marx ed Engel (1972:475), dall’“acqua fredda del calcolo egotista.” Il carattere inerziale del governo di una comunità fu confermato dagli storici dell’economia che, come Marx, hanno indicato le restrizioni poste all’iniziativa individuale e i diritti di proprietà scarsamente definiti associati al processo decisionale richiesto dal sistema agricolo dei campi aperti che prevalse in Inghilterra e in molte parti dell’Europa dell’epoca moderna. Secondo questa visione, la produttività agricola fu frenata fino a quando le terre comuni furono recintate e assegnate a proprietari privati, come nell’Inghilterra del tardo diciottesimo secolo. Tuttavia, questo principio fondamentale dell’insegnamento economico è stato superato dagli storici dell’economia della scorsa generazione che hanno applicato metodi quantitativi. Uno dei principali appartenenti a questa nuova letteratura, Robert Allen (2000:43, 50) scrive:
I campi aperti furono un’istituzione efficiente nel soddisfare i bisogni dei contadini coltivatori di grano su piccola scala. Questi bisogni includevano la diversificazione…del rischio …e una crescente produttività agricola… Le recinzioni (enclosures) non spiegano né il vantaggio di produttività di cui l’Inghilterra ha goduto rispetto ad altri paesi nel 1800 né l’aumento di efficienza che si è verificato sin dal medio evo.
Le comunità che governavano il sistema dei campi aperti usavano le informazioni locali e la pressione tra consimili per promuovere l’innovazione e risolvere i problemi allocativi che sorgevano attraverso l’inevitabile interdipendenza degli agricoltori. Al contrario degli agricoltori del Palanpur la cui incapacità di coordinare una semina ottimale anticipata del loro raccolto ha ispirato l’introduzione del capitolo 1, a Taston in Inghilterra, nel 1703 “ogni anno il primo giorno tre braccianti venivano scelti per stabilire le date in cui [il raccolto] sarebbe stato seminato, quando gli animali dovessero pascolare e l’imposizione delle scorte di mantenimento” (Allen 2000:58).
IL GOVERNO DELL’ECONOMIA
|19
Recenti ricerche storiche hanno anche dimostrato l’importanza di un governo basato sulla comunità nel gestire i problemi di incentivo associati a contratti di credito incompleti nel settore delle banche nella Germania del diciannovesimo secolo (Banerjee, Besley, e Guinnase 1994). Il governo basato sulla comunità gioca un ruolo centrale in molti settori dell’economia moderna, dallo sviluppo e distribuzione dei software open source al ruolo dei network etnici nella raccolta e nell’allocazione di credito tra i proprietari di motel negli Stati Uniti. Dunque, ben lontano dall’essere una traccia residua del passato, il governo della comunità è sopravvissuto per merito della sua capacità di attenuare i problemi di incentivo che sorgono nelle economie contemporanee. Le comunità talvolta risolvono i problemi che sia gli stati sia i mercati riescono malamente ad affrontare, specialmente quando la natura delle interazioni sociali o i beni ed i servizi scambiati precludono la completezza contrattuale. Una comunità effettiva monitora il comportamento dei suoi membri, dunque rendendoli responsabili delle loro azioni. Grazie ad informazioni private disperse che spesso non sono disponibili a stati, imprenditori, banche e altre grandi organizzazioni formali, il governo della comunità applica ai membri ricompense e punizioni a seconda della loro aderenza o della loro deviazione dalle norme sociali. Al contrario di stati e mercati, le comunità effettivamente favoriscono e utilizzano gli incentivi che le persone hanno tradizionalmente dispiegato per regolare la loro attività comune: fiducia, solidarietà, reciprocità, reputazione, orgoglio personale, rispetto, vendetta e punizione, tra gli altri. Diversi aspetti delle comunità spiegano le loro capacità peculiari quali strutture di governo. Primo, in una comunità la probabilità che i membri che interagiscono oggi interagiscano anche in futuro è elevata. Dunque c’è un forte incentivo ad agire nel presente in modi socialmente benefici per evitare ritorsioni in futuro. Secondo, la frequenza delle interazioni tra membri di una comunità diminuisce il costo e aumenta i benefici associati con la maggiore scoperta di caratteristiche, comportamenti recenti, e probabili azioni future degli altri membri. Più facilmente vengono acquisite e più ampiamente sono disperse queste informazioni, più i membri della comunità avranno un incentivo ad agire in modi che risultano in effetti collettivamente benefici. Terzo, le comunità superano i problemi di free-riding, poiché i membri puniscono direttamente i comportamenti antisociali. Nei lavori di squadra, nelle associazioni di credito, nelle partnership, nelle situazioni di beni comuni locali e nel vicinato residenziale il monitoraggio e la punizione da parte dei compagni sono spesso mezzi effettivi per attenuare i problemi di incentivo che sorgono quando le azioni individuali che influenzano il benessere degli altri non sono soggette a contratti che
20 | MICROECONOMIA
possono essere fatti rispettare. Ma come potrebbero le comunità far osservare tali norme in assenza di un apparato giuridico statale? Si ricordi che Alchian e Demsetz (1972) suggeriscono che il diritto al residuo dovrebbe essere assegnato ad un individuo incaricato di monitorare gli input dei membri del team in modo da fornire incentivi per l’attività stessa (non contrattabile) di monitoraggio, eliminando allo stesso tempo l’incentivo dei membri al free-riding per mezzo della minaccia di licenziamento da parte del monitorante. (Abbiamo spiegato nel capitolo 10 le assunzioni sottese a questo argomento). Un’altra soluzione ben conosciuta è fornita da Hölmstrom (1982), che propone un modello di relazione tra un principale e una molteplicità di agenti nel quale l’efficienza o la quasi efficienza è raggiunta per mezzo di contratti che conferiscono ai singoli membri di una squadra il diritto al residuo sugli effetti delle loro azioni senza attribuire loro la proprietà dei diritti. La soluzione di Hölmstrom non è, ad ogni modo, attuabile quando ci sono significative influenze stocastiche sul livello della performance della squadra, i membri del team si trovano in una situazione di limitata ricchezza e i mercati del capitale e delle assicurazioni sono imperfetti. Queste spiegazioni sono accomunate dal fatto che gli individui sono considerati come auto-interessati. Al contrario, molti scienziati comportamentali al di fuori dell’economia hanno cercato di spiegare le comunità come relazioni di altruismo, affetto e altre motivazioni non auto-interessate. Molti di questi approcci, ad ogni modo, hanno trattato la comunità organicamente senza investigare se le abilità nella soluzione dei problemi attribuite alle comunità sono coerenti con il fatto che i singoli membri stanno perseguendo il proprio interesse (sia esso autointeressato o no). Come risultato, alcune trattazioni – come quella di Marx – rappresentano il governo basato sulla comunità come un anacronismo fondato su abitudini comportamentali collettiviste che avrebbero subito l’erosione del tempo e sarebbero state sostituite dalla scelta individuale. Ad ogni modo abbiamo visto nei capitoli 3 e 4 che le motivazioni di reciprocità, la vergogna, la generosità e altre preferenze sociali possono fornire le fondamenta comportamentali per un modello di monitoraggio reciproco che sia esente da questi difetti. L’esperimento dei beni pubblici con punizione e il corrispondente modello indicano che sotto circostanze istituzionali favorevoli e con un numero sufficiente di membri motivati dalle preferenze sociali, possono essere sostenibili elevati livelli di fornitura di beni pubblici.
IL GOVERNO DELL’ECONOMIA
|21
Come i mercati e i governi, anche le comunità falliscono. I contatti personali e durevoli che caratterizzano le comunità richiedono che queste ultime siano di dimensione relativamente piccola. Quindi, una preferenza per trattare con i membri della propria comunità spesso limita la loro capacità di sfruttare i guadagni derivanti dal commercio su base più ampia. Inoltre, la tendenza delle comunità ad essere relativamente omogenee può rendere impossibile raccogliere i benefici della diversità economica associata con forti complementarità tra differenti abilità e altri input. Nessuna di queste limitazioni è insormontabile. Scegliendo le informazioni, l’equipaggio e le abilità, per esempio, i pescatori giapponesi (menzionati sopra) hanno sfruttato economie di scala non attuabili da gruppi meno cooperativi, e hanno raccolto benefici sostanziali dalla diversità dei talenti presente tra i membri. In modo simile, la cooperazione nel network degli affari sociali in ciò che viene definita “la terza Italia” assieme ai governi locali associati a tali network permette, in modo diversamente inattuabile, alle piccole imprese di beneficiare di economie di scala nel marketing, nella ricerca e nella formazione, permettendo la loro sopravvivenza nella competizione con imprese giganti. Tuttavia, confrontato con la burocrazia e il mercato, che si specializzano nel trattare con gli sconosciuti, il limitato raggio delle comunità spesso impone costi inevitabili. Un secondo fallimento delle comunità è meno ovvio. Quando l’appartenenza al gruppo è il risultato delle scelte degli individui anziché delle decisioni del gruppo, è probabile che la composizione del gruppo sia più omogenea culturalmente e demograficamente rispetto a quanto qualsiasi membro vorrebbe, dunque privando le persone di forme di diversità alle quali queste attribuiscono un valore. Il modello della segregazione residenziale presentato nel capitolo 2 mostrava che se gli individui si raggruppano in comunità, ci sarà una forte tendenza per le comunità alla segregazione razziale, anche se questo è un risultato che nessun individuo preferisce. In casi analoghi, le comunità integrate costituirebbero una realtà migliore per tutti, ma si dimostrerebbero insostenibili se gli individui fossero liberi di muoversi. Quando le distinzioni tra membri e non membri sono effettuate su fondamenti che creano divisioni o che sono moralmente ripugnanti quali la razza, la nazionalità, o il genere, il governo della comunità, può contribuire più a favorire una ristretta mentalità provinciale e l’ostilità etnica che a risolvere i fallimenti di stato e mercati. Il problema è endemico. Le comunità funzionano perché riescono bene ad imporre l’osservanza delle norme; se ciò sia cosa buona dipende da quali siano le norme. La recente resistenza all’integrazione razziale dei residenti bianchi di Ruyterwacht (vicino a Cape Town) è un esempio estremamente interessante di azione del capitale sociale (Jung 2001). E’ ancora più straordinario lo studio di Dov Cohen (1998) delle
22 | MICROECONOMIA
differenze regionali negli Stati Uniti riguardante la relazione tra violenza e stabilità della comunità. Nisbett e Cohen (1996) hanno descritto una “cultura dell’onore” che spesso trasforma gli insulti e le discussioni pubbliche in combattimenti mortali tra uomini bianchi nell’ovest e nel sud degli Stati Uniti, ma non nel Nord. La ricerca di Cohen conferma che nel nord gli omicidi derivanti da discussioni sono meno frequenti in aree con elevata stabilità residenziale, misurata dalla frazione di persone che vivono nella stessa casa e nella stessa contea per un periodo di più di cinque anni. Tuttavia questa relazione risulta invertita nel sud e nell’ovest, essendo la stabilità residenziale positivamente e significativamente collegata alla frequenza di questi omicidi dove la cultura dell’onore è forte. Dunque, per una qualche serie di problemi di governo, le comunità contribuiscono ai desiderata delineati sopra: allineare il controllo e il diritto al residuo per mezzo della punizione di coloro che infliggono costi ad altri membri del gruppo; rendere l’informazione meno privata per mezzo di incentivi alla formazione di una reputazione tramite un comportamento coerente; ridurre il grado di conflitto di interesse rispetto agli aspetti non contrattabili dello scambio fornendo regole di divisione e altre norme in grado di funzionare anche quando i diritti di proprietà non sono ben definiti. Queste ragioni possono spiegare perché le comunità, a lungo ignorate dagli scienziati sociali in quanto residui anacronistici di un’era passata, non sono state offuscate dai mercati e dallo stato. L’abilità delle comunità nel risolvere i problemi di coordinamento dipende dalle tipologie di diritti di proprietà in vigore e dalla loro distribuzione tra la popolazione. Quando i membri di una comunità non sono titolari del diritto al residuo dei risultati delle loro azioni, ci può essere uno scarso incentivo ad impegnarsi nelle forme di sanzione e di costruzione di una reputazione che abbiamo sottolineato. Nei quartieri di Chicago che abbiamo menzionato all’inizio, per esempio, dove la maggioranza dei residenti erano locatari piuttosto che proprietari di un appartamento, l’efficacia collettiva era significativamente inferiore. Questo può essere dovuto al fatto che, se alcuni membri di un gruppo sono molto più benestanti rispetto ad altri, le norme condivise possono essere difficili da rispettare, e la punizione di azioni non cooperative può mancare di efficacia o credibilità. Per ragioni simili, le capacità distintive delle comunità dipendono dall’assegnazione dei diritti di proprietà e dalle opzioni esterne. Le comunità non sono in questo diverse dai mercati. Il vantaggio in termini di efficienza allocativa della decentralizzazione dei diritti di controllo (l’uso estensivo dei mercati o di altri sistemi di governo fondati sulla comunità) risiede nel mettere il
IL GOVERNO DELL’ECONOMIA
|23
processo decisionale nelle mani di coloro che hanno informazioni rilevanti che altri non possiedono. Perché ciò offra dei benefici, i detentori delle informazioni private devono essere titolari del diritto al residuo dei risultati delle loro azioni. Dal punto di vista dell’efficienza, la decentralizzazione agli individui per mezzo dell’utilizzo del mercato è favorita rispetto alla decentralizzazione alle comunità nei casi in cui i contratti sono relativamente completi e possono essere fatti rispettare ad un basso costo, e dunque nei casi nei quali gli interessi possono essere in conflitto senza generare fallimenti del coordinamento. La decentralizzazione alle comunità è preferita quando la redazione di contratti completi è preclusa, ma bassi livelli di conflitto di interesse all’interno della comunità e altri aspetti della struttura della comunità facilitano la trasmissione di informazioni private e monitoraggio reciproco tra membri della comunità. William Ouchi (1980) suggerisce che, quando non sono possibili né contratti completi né un’informale osservanza delle norme fondata sulla comunità, e quando i conflitti di interesse sono significativi, si ottiene come risultato un’organizzazione burocratica, di cui le moderne imprese convenzionali sono un esempio. Thomas Schelling (1960:20) espresse la stessa idea in modo più colorito: Quando la fiducia e la buona fede mancano e non c’è nessun ricorso legale per la violazione di un contratto . . . possiamo desiderare di chiedere consiglio all’oltretomba, o all’antico dispotismo, su come funzioni il prendere accordi.
La maggioranza delle interazioni economiche sono governate da un insieme eterogeneo di regole formali ed informali che riflettono gli aspetti dei mercati, degli stati e delle comunità. Alcune combinazioni funzionano meglio di altre.
C O M P L E M E N TA R I E T À
I S T IT U Z I O N A L I
ED
E F F E T TO
DI
S P IA Z Z A M E N TO
Per concretezza inizieremo presentando due esempi. I pescatori di aragoste sulla costa del Maine hanno regolamentato per decenni la loro pesca limitando l’accesso ad un definito territorio di pesca. Solo a coloro che appartengono ad una particolare cosiddetta “gang del porto” – il gruppo di persone che sono state nominate “membri” e che pescano da un particolare porto – è concesso per costume locale di gettare le reti ad imbuto nel territorio di pesca (Acheson 1988). Chi viola i confini è facile che ritrovi le proprie boe tagliate dalle loro reti che sono dunque impossibili da localizzare. Gli invasori sono stati attaccati. La violazione dei regolamenti ambientali o la violazione delle regole della gang vengono anche sanzionate da altri membri della gang. In anni recenti, lo stato del Maine ha formalizzato il sistema delle gang riconoscendo i territori delle “gang del porto” e istituendo consigli democraticamente eletti con il potere di regolamentare il numero
24 | MICROECONOMIA
di trappole e il numero di giorni di pesca. I funzionari statali intervengono occasionalmente quando i conflitti eccedono le capacità di enforcement delle comunità locali, come fecero nel 1920 di fronte ad un semi-collasso dell’industria della pesca, o quando c’è un’escalation di violenza tra gruppi. Tuttavia, lo stato impiega solo sei funzionari per far rispettare la legislazione ambientale lungo tutte le 4342 miglia di costa e per controllare la pesca di 6800 pescatori di aragoste. In anni recenti, i rendimenti della pesca sono cresciuti e i pescatori di aragoste hanno prosperato. La relazione tra le “gang del porto” e lo stato del Maine costituisce un esempio di complementarietà istituzionale. L’efficacia dei regolamenti dello stato è enormemente incrementata dalla sorveglianza informale da parte delle gang, mentre l’efficacia delle gang è rafforzata dalla disponibilità dello stato come autorità coercitiva di ultima istanza. Un altro esempio di complementarietà istituzionale è dato dagli effetti simbiotici fra sindacati (controllo dell’impegno sul luogo di lavoro) e regolamentazione macroeconomica (che riduce la volatilità della domanda di lavoro) nel rafforzare le contrattazioni di salario ed impegno che provocano un miglioramento paretiano delle quali è stato presentato un modello nel capitolo 8. La cattiva gestione delle foreste dell’Himalaya dei distretti di Kamaun e Garhwal in Uttar Pradesh, in India, fornisce un esempio in netto contrasto con il successo delle “gang del porto”. Prima del ventesimo secolo, ampi e ben definiti tratti di foresta venivano considerati proprietà esclusiva di ciascun villaggio. L’accesso era regolamentato dai panchayats del villaggio; se stranieri non autorizzati avessero rimosso i prodotti della foresta, poteva aversi un combattimento o l’imposizione di multe. Fino a quel periodo la gestione del patrimonio boschivo è stata simile alla regolamentazione decentralizzata delle “gang del porto” del Maine. Durante la prima guerra mondiale l’amministrazione coloniale britannica prese il controllo della gestione del patrimonio boschivo, cercando di soddisfare la domanda di traversine per i binari del treno e altri prodotti del legno. L’intervento coloniale sovvertì il regolamento delle comunità locali e provocò proteste incendiarie che distrussero grandi boschi di conifere. Il governo, come ripiego, consentì l’accesso alle foreste di minor valore a “tutti i residenti in bona fide di Kumaun”, dunque cancellando i confini tradizionali delle foreste dei villaggi e rendendo la regolamentazione locale virtualmente impossibile. Per esempio, nel 1932 un gruppo di abitanti del villaggio di Papdev proibì al villaggio loro vicino, Jeet Lal, di mietere l’erba della foresta, perché non aveva contribuito alla costruzione delle recinzioni di protezione dell’erba. Jeet Lal portò in tribunale i suoi vicini e loro vennero multati. La decisione fu confermata in appello perché, secondo i nuovi regolamenti, Jeet Lal aveva un diritto incondizionato di accesso.
IL GOVERNO DELL’ECONOMIA
|25
La distruzione da parte del governo della capacità della comunità di regolamentare l’accesso è un’illustrazione dell’opposto della complementarietà istituzionale, ovvero, l’effetto di spiazzamento istituzionale (institutional crowding out). Questo si verifica quando la presenza di un’istituzione compromette il funzionamento dell’altra. Un altro esempio di spiazzamento viene dal vicino Palanpur (sempre in Uttar Pradesh) dove l’estensione del mercato del lavoro (e l’aumentata mobilità geografica) sembra aver ridotto i costi di uscita e di conseguenza il valore della reputazione individuale, con l’effetto che l’azione informale di applicazione coercitiva dei contratti di prestito è stata indebolita (Lanjouw e Stern 1998:570). L’imposizione di multe per scoraggiare i ritardi nelle scuole materne di Haifa (capitolo 3) è un altro esempio di effetto di spiazzamento: utilizzare un meccanismo di mercato (la multa) sembra aver attenuato il senso di obbligazione personale dei genitori che suggeriva di non arrecare disturbo agli insegnanti. Gli esperimenti confermano che lo spiazzamento può essere un problema comune. Per esplorare gli effetti degli incentivi espliciti, Fehr e Gaechter (2000a) hanno progettato un gioco di scambio di doni in cui il principale (il datore di lavoro) propone un’offerta salariale con un livello di impegno stipulato dalla parte dell’agente (il lavoratore). L’agente può quindi scegliere un livello di impegno, con costi crescenti nell’impegno. Nel trattamento con “fiducia”, l’interazione termina, mentre nel trattamento con “incentivo”, dopo che l’agente ha selezionato un livello di impegno, il datore di lavoro può multare il lavoratore se pensa che il livello di impegno del lavoratore sia inadeguato. Al contrario del trattamento con fiducia, il trattamento incentivante collega il pagamento alla performance e quindi rappresenta un contratto più completo. In questo esperimento, il surplus totale derivante dall’interazione è dato dai profitti del principale, più il salario dell’agente, meno il costo dell’impegno (e della multa, quando è applicabile). Nel trattamento con fiducia un individuo auto-interessato sceglierebbe il livello minimo ammissibile di impegno indipendentemente dall’offerta salariale del principale e, anticipando questo, un principale auto-interessato offrirebbe il salario minimo. I soggetti sperimentali non si sono conformati a questa aspettativa: i datori di lavoro hanno fatto offerte davvero generose e il livello di impegno dei lavoratori è stato fortemente condizionato da queste offerte, essendo gli elevati livelli salariali ricambiati con un alto livello di impegno. L’introduzione di incentivi espliciti aveva invece effetti drammatici: il livello di impegno medio degli agenti era sostanzialmente più basso. Solo per offerte salariali veramente basse gli incentivi espliciti riuscivano a ottenere livelli (marginali) più alti di impegno. Per offerte salariali relativamente generose, l’impegno profuso con incentivi espliciti era circa un terzo del livello
26 | MICROECONOMIA
presente in loro assenza. L’esperimento è stato costruito in modo tale che se i soggetti avessero risposto in modo ottimale sulla base di preferenze auto-interessate, il surplus nel trattamento incentivante sarebbe stato più di due volte superiore rispetto al trattamento con fiducia. Tuttavia, il surplus totale era del 20 percento più elevato nel trattamento con fiducia in quei casi in cui il principale offriva un contratto tale che la multa attesa nel caso in cui il lavoratore fosse sorpreso con le mani in mano eccedeva il costo del lavoro (in modo tale che la condizione di impegno del lavoratore fosse soddisfatta) e del 53 percento quando il contratto del principale non rispettava la condizione per cui il lavoratore si impegna sul lavoro. Un risultato sorprendente di questo esperimento emerge se confrontiamo la distribuzione del surplus nel trattamento con fiducia e nel trattamento incentivante. Nel trattamento incentivante (confinando la nostra attenzione ai casi in cui il contratto del principale soddisfaceva la condizione di impegno), i profitti sono più di due volte più elevati rispetto ai profitti nel trattamento fiduciario, mentre i payoff netti dell’agente sono meno della metà. Il trattamento incentivante ha permesso ai datori di lavoro di risparmiare in termini di costi salariali abbastanza da compensare le riduzioni nell’impegno sul lavoro. Riassumendo il risultato, Fehr e Gaechter (2000a: 17) scrivono, “le opportunità di incentivo nel trattamento incentivante permettono ai principali di aumentare i loro profitti relativamente al trattamento con fiducia, ma … ciò è associato ad una perdita di efficacia.” Risultati simili sono stati ottenuti in un esperimento sul campo in Colombia condotto da Juan Camino Cardenas (Cardenas, Stranlund, e Willis 2000). L’esperimento, i cui soggetti sperimentali erano dei contadini, era una variante del gioco dei beni pubblici, e catturava la logica di un problema di estrazione di risorse comuni – il degrado di una vicina foresta. In assenza di incentivi espliciti i soggetti hanno selezionato livelli di estrazione non molto lontani dall’ottimo sociale e di molto inferiori al livello associato all’equilibrio di Nash basato sull’ottimizzazione individuale con preferenze auto-interessate. Ma quando è stato introdotto il monitoraggio dei livelli di estrazione dei soggetti (da parte dello sperimentatore) e la prospettiva di una multa per eccesso di estrazione, i soggetti hanno estratto di più, anziché di meno. Dopo pochi round, i loro livelli di estrazione approssimavano quelli dell’equilibrio di Nash (tenendo conto della multa). Come la multa imposta ai genitori in ritardo di Haifa, l’effetto di un “miglioramento” della struttura degli incentivi apparentemente è stato quello di ridurre la rilevanza delle motivazioni eterointeressate che erano all’opera in assenza degli incentivi.
IL GOVERNO DELL’ECONOMIA
|27
Un ultimo esperimento può fornire qualche intuizione sul funzionamento dell’effetto di spiazzamento (Frohlich e Oppenheimer 1995). I soggetti sperimentati giocavano dei giochi dei beni pubblici con cinque persone sotto due condizioni: un gruppo ha giocato il gioco standard del contributo e l’altro ha giocato un gioco modificato (per tenere conto del “velo di ignoranza”) nel quale l’assegnazione casuale dei payoff ha reso ottimale il contributo dell’ammontare massimale di bene pubblico. A metà dei soggetti (in ciascun trattamento) fu concesso di discutere prima di ciascuna giocata (naturalmente, la discussione non avrebbe dovuto avere alcun effetto sul risultato del gioco standard, in quanto la strategia dominante è non contribuire). Dopo otto round di gioco, sono stati effettuati otto round, questa volta con gli stessi gruppi, e ciascuno ha giocato il gioco standard. Tra quelli cui era stato permesso di discutere, quelli che avevano sperimentato un gioco (del velo di ignoranza) compatibile con gli incentivi hanno contribuito in modo significativamente inferiore negli otto round finali, e (in successivi questionari) hanno espresso minori preoccupazioni rispetto a questioni di giustizia. La spiegazione degli autori è che il meccanismo compatibile con gli incentivi ha ricompensato quelli che contribuivano al bene pubblico, dunque rendendo l’interesse personale una buona guida per l’azione, mentre coloro che hanno sperimentato il gioco standard hanno guadagnato payoff elevati solo nella misura in cui hanno fatto leva su considerazioni di giustizia come motivazioni distinte tra i loro compagni di gruppo. Gli autori concludono: Il fallimento … del meccanismo [compatibile con gli incentivi] nel porre i soggetti di fronte ad un dilemma etico sembra portare ad un misero o inesistente apprendimento del comportamento etico nel periodo successivo… E’ un’istituzione, come altri meccanismi compatibili di incentivo, che può generare risultati vicini all’ottimo… Comunque, dal punto di vista etico, non è soltanto un insuccesso per quanto riguarda il comportamento che ne consegue; sembra essere effettivamente dannoso. Indebolisce il ragionamento etico e i comportamenti eticamente motivati. (Frohlich e Oppenheimer 1995:44)
Fehr e List (2004) hanno offerto una differente interpretazione degli incentivi controproducenti trovati nei loro esperimenti con gli uomini d’affari in Costa Rica. Hanno trovato che il più alto livello di affidabilità si otteneva quando al principale era permesso di multare l’agente per un comportamento non affidabile, ma questi si rifiutava di usarlo, evidentemente un segnale di un comportamento fiduciario da parte del principale che era ricambiato dall’agente. Al contrario “minacce esplicite di penalizzare la mancanza di impegno avevano l’effetto opposto, inducendo un comportamento meno affidabile”. Essi concludono che: “il messaggio psicologico veicolato dagli incentivi – siano essi percepiti come benevoli o ostili – ha importanti effetti comportamentali.”
28 | MICROECONOMIA
Esperimenti condotti da psicologi hanno dimostrato condizioni sotto le quali le ricompense estrinseche (per utilizzare la loro terminologia), quali il pagamento monetario per l’esecuzione di un compito, possono diminuire le motivazioni intrinseche individuali nel portare a termine quel compito (Deci, Koestner, e Ryan 1999). Questi effetti di spiazzamento si manifestano per compiti interessanti piuttosto che per quelli noiosi e quando la ricompensa è attesa in anticipo e strettamente legata all’esecuzione del compito. Si può concludere che il pagamento basato sulla performance nei luoghi di lavoro diminuisce le motivazioni dell’impiegato nell’esecuzione di compiti che all’inizio considera intrinsecamente interessanti o stimolanti. Tuttavia le prove sono anche coerenti con l’attribuzione di un ruolo importante degli incentivi espliciti (estrinseci) nel motivare gli individui ad eseguire compiti rispetto ai quali hanno un basso interesse intrinseco (ovvero, la maggioranza dei lavori nell’economia moderna).
C O N C L U S IO N I : L ’ E R R O R E
DI
M A N D E V IL L E
La teoria dell’implementazione è una branca dell’economia che studia i modi in cui contratti che preservano l’autonomia privata e regole di decisione – in breve, le costituzioni - possono portare gli individui con preferenze auto-interessate ad implementare (come equilibrio di Nash) un risultato che non è voluto da nessuno degli individui partecipanti, ma che in qualche misura ha un valore sociale. I metodi della teoria contemporanea dell’implementazione sono nuovi, ma l’idea risale alla congettura radicale di Mandeville (nell’epigrafe del capitolo 2) secondo cui le interazioni potrebbero essere strutturate in modo che “il peggiore di tutta la Moltitudine faccia qualcosa per il Bene Comune.” L’obiettivo di sfruttare motivazioni ordinarie per fini elevati è stato centrale nel pensiero costituzionale sin dall’epoca. Si ricordi che David Hume (nell’epigrafe del capitolo 3) ha proposto la massima “nell’architettare qualsiasi sistema di governo… si dovrebbe presupporre che ogni uomo sia un delinquente e che non abbia altro fine, in tutte le sue azioni, diverso dal suo interesse privato”. Tuttavia, gli esempi sopraesposti di complementarietà istituzionale e di
spiazzamento suggeriscono che l’efficacia delle politiche e delle leggi deve dipendere non solo dalla loro capacità di utilizzare fini egoistici per propositi sociali, ma anche dalle preferenze che inducono o richiamano. Albert Hirschman (1985: 10) ha puntualizzato che gli economisti propongono di relazionarsi con comportamenti antietici o antisociali aumentando il costo di quei comportamenti piuttosto che indicando standard e imponendo proibizioni e sanzioni. La ragione è probabilmente che pensano ai cittadini come consumatori con gusti che non cambiano o cambiano in modo arbitrario negli affari civici così come nel comportamento legato alle merci… Uno dei principali propositi di leggi e regolamenti pubblicamente
IL GOVERNO DELL’ECONOMIA
|29
proclamati è stigmatizzare i comportamenti antisociali e dunque influenzare i valori dei cittadini e i codici comportamentali.
Come abbiamo appena visto, aumentare il costo di un comportamento antisociale e altri sistemi espliciti basati sugli incentivi possono effettivamente provocare dei danni. Esiste dunque un analogo del secondo teorema dell’economia del benessere riferito alle norme: quando i contratti sono incompleti (e dunque le norme possono essere importanti nell’attenuare i fallimenti del mercato), i mercati che approssimano in maniera migliore una contrattazione completa idealizzata possono esacerbare il sottostante fallimento del mercato (indebolendo le norme di valore sociale quali la fiducia e la reciprocità) e possono risultare in una allocazione di equilibrio meno efficiente. Una costituzione per delinquenti può produrre delinquenti. Il fatto che le istituzioni e le preferenze coevolvono suggerisce un’importante (anche se difficile) estensione della teoria dell’implementazione e una modificazione della massima di Hume. Nel cercare di attuare un risultato socialmente desiderato, si dovrebbe verificare che le preferenze necessarie ad implementare tale risultato siano sostenibili in presenza delle politiche, contratti, o regole usate nell’implementazione. Il problema è più difficile di quello che Hume ha suggerito, non solo perché le preferenze sono endogene, ma anche perché, come abbiamo visto nel capitolo 3, le popolazioni sono eterogenee e gli individui versatili. Il problema, allora, non è trovare una via per indurre una popolazione omogenea con individui auto-interessati ad implementare un risultato socialmente desiderabile. Piuttosto, è ideare delle regole tali che in casi in cui la cooperazione sia socialmente desiderabile, gli individui con preferenze etero-interessate abbiano l’opportunità di esprimere la loro prosocialità con modalità che inducano tutti o la maggioranza a cooperare, come negli esperimenti sui beni pubblici con punizione discussi nel capitolo 3. E il compito è esattamente opposto in situazioni in cui la competizione piuttosto che la cooperazione è essenziale per ottenere risultati che abbiano valore sociale. Fornire una consulenza pratica sul modo in cui ciò potrebbe essere fatto è una delle sfide maggiori degli studi contemporanei sulle istituzioni e i comportamenti economici. La moderna microeconomia ha dimostrato l’importante contributo che diritti di proprietà ben definiti possono apportare nell’accogliere questa sfida. Nella sua Nobel Prize lecture Ronald Coase ha espresso questa posizione succintamente: E’ ovviamente desiderabile che questi diritti siano assegnati a coloro che li possono usare nel modo più produttivo e con incentivi che li portino a fare in questo modo e che, per scoprire (e mantenere) una tale distribuzione di diritti, i costi del loro trasferimento siano mantenuti bassi dalla trasparenza della legge e dal fatto di rendere i requisiti legali di tali trasferimenti meno onerosi. (Coase 1992:718)
Tuttavia, la moderna microeconomia mostra anche che diritti di proprietà ben
30 | MICROECONOMIA
definiti e facilmente trasferibili non sono concretamente attuabili in importanti situazioni dell’interazione economica – nei mercati del credito e del lavoro, nelle relazioni di vicinato, nell’aderenza a norme che hanno un valore sociale, incluse le prescrizioni di legge, e nella produzione e distribuzione delle informazioni, per esempio. In questi casi, il governo può contribuire alla performance economica per mezzo di un’assegnazione diretta dei diritti di proprietà, piuttosto che semplicemente facilitando lo scambio privato. La frase di Robert Frost “buone recinzioni fanno buoni vicini” è l’epigrafe del capitolo intitolato “Capitalismo Utopico”. Tuttavia la posizione del poeta del New England era abbastanza opposta, poiché egli sosteneva che l’accettazione da parte del suo vicino bisbetico di ben definiti diritti di proprietà non potesse essere garantita. Di seguito alcuni versi della poesia: Dice solamente “buone recinzioni fanno buoni vicini.” …Perché fanno buoni vicini? Non era lì Che stavano le mucche?... Prima di costruire un muro m’informerei per sapere Cosa muro dentro e cosa muro fuori, e chi probabilmente offenderei. C’è qualcosa che non ama un muro, che lo vuole abbattere. Si muove nell’oscurità così come sembra a me, non del solo bosco e dell’ombra degli alberi. E gli piace il suo pensiero così bene Dice ancora, “Buone recinzioni fanno buoni vicini.” (Frost 1915:11 – 13) Il buon vicinato può essere necessario quando le buone recinzioni falliscono. Da Mandeville ad Arrow e Debreu, i pensatori dell’economia hanno cercato di ideare diritti di proprietà e altre regole che inducano individui auto-interessati ad implementare risultati aggregati socialmente desiderabili. Di particolare interesse è stato interrogarsi sotto quali condizioni lo scambio competitivo di diritti di proprietà ben definiti tra individui auto-interessati si risolve in un risultato che è in qualche senso ottimale. Alla luce dell’importanza dell’interesse personale nelle motivazioni umane, le intuizioni prodotte da questa tradizione di tre secoli sono un importante contributo alla scienza e alla politica pubblica. Tuttavia, come ora sappiamo grazie al teorema fondamentale, la mano invisibile richiede una contrattazione completa e rendimenti non crescenti, e questi non descrivono, neanche approssimativamente, alcuna economia conosciuta. Il progetto che era iniziato con la “Favola delle Api” può essere anche di minor rilevanza pratica nel futuro. La ragione è che le tecnologie e le interazioni sociali della moderna economia si allontanano in modo crescente da queste assunzioni canoniche. Le interazioni non contrattuali dirette con feedback positivi sorgono in modo
IL GOVERNO DELL’ECONOMIA
|31
crescente nelle moderne economie, così come lavori di squadra in produzioni ad alta intensità di informazione sostituiscono le catene di montaggio e altre tecnologie più facilmente gestite dai contratti, così come servizi difficili da misurare usurpano il ruolo preminente – sia per i fattori produttivi sia per i prodotti – giocato dalle quantità misurabili quali kilowatt di energia o tonnellate di acciaio. Danny Quah (1996) chiama il moderno sistema di produzione “l’economia senza peso”. Le caratteristiche chiave di una economia ad alta intensità di informazioni sono rendimenti crescenti generalizzati, in molti casi costi marginali vicini allo zero, assieme al fatto che la maggioranza delle informazioni non è soggetta a contratti completi o che è possibile far osservare in modo coercitivo, e se anche lo è, la sua allocazione è inefficiente. Kenneth Arrow (1999:162, 156) scrive che le informazioni sono una risorsa sfuggente… stiamo solo iniziando a fronteggiare le contraddizione tra sistemi di proprietà privata e di acquisizione e diffusione delle informazioni… [dobbiamo notare] una crescente tensione tra le relazioni legali e le determinati economiche fondamentali.
L’economia ad alta intensità di informazioni del futuro può più fedelmente assomigliare all’economia delle bande nomadi che cercavano cibo nella preistoria umana, piuttosto che all’economia del grano e dell’acciaio che l’ha sostituita. Inseguire delle buone idee con applicazioni pratiche è un progetto costoso ed incerto, molto simile alla caccia di grosse prede. Il successo è raro, ma i suoi frutti hanno valore immenso. L’appropriazione privata del premio è difficile da realizzare e genera sprechi sociali, poiché i benefici previsti per coloro che sono esclusi dall’accesso al premio superano di molto i guadagni che può ottenere colui che se ne appropria individualmente escludendo gli altri. Dunque non è sorprendente che il sistema di prestigio e di norme di condivisione in alcune parti della moderna economia ad alta intensità di informazione – chi è coinvolto in un progetto open source, ad esempio – in molti modi siano paralleli alla cultura delle bande nomadi. E’ improbabile che le sfide poste da Arrow siano risolte semplicemente per mezzo di una maggiore precisione nella definizione dei diritti di proprietà privati. Sembra ugualmente utopico pensare che i governi nazionali vogliano (o addirittura possano) ideare per questi problemi soluzioni centralizzate. Una configurazione complementare del governo del mercato, degli stati e della comunità può essere la miglior speranza per movimentare le capacità eterogenee e versatili delle persone nell’affrontare questi dilemmi, per meglio sfruttare il potenziale di espansione della conoscenza con l’obiettivo del miglioramento dell’essere umano, e dunque portare adeguatamente a termine quella che Alfred Marshall un secolo fa identificò come la promessa degli studi economici.
32 | MICROECONOMIA
Riferimenti bibliografici Acheson, J. (1988). The Lobster Gangs of Maine. Hanover, N.H., New England Universities Press. Alchian, A. A. and H. Demsetz (1972). "Production, Information Costs, and Economic Organization." American Economic Review 62(5): 777-795. Allen, R. (2000). Community and market in England: Open fields and enclosures revisited. Communities and Markets in Economic Development. M. Aoki and Y. Hayami. Oxforfd, Oxford University Press: 42-68. Arrow, K. (1999). Technical information and industrial structure. Firms, Markets and Hierarchies. G. Carroll and D. Teece. Oxford, Oxford University Press: 156163. Arthur, W. B. (1994). Inductive Reseasoning, Bounded Rationality and the Bar Problem, Sante Fe Institute Economics Research Program. Banerjee, A. V., T. Besley, et al. (1994). "Thy Neighbor's Keeper: The Design of a Credit Cooperative with Theory and a Test." Quarterly Journal of Economics 109(2): 491-515. Barone, E. (1935). The Ministry of Production in the Collectivist State. Collectivist Economic Planning. F. A. v. Hayek. London, Routledge: 245-290. Basu, K. and P. H. Van (1988). "The economics of child labor." American Economic Review 88(3): 412-427. Camerer, C. (2000). Prospect theory in the wild: Evidence from the field. Choices, Values, and Frames. D. Kahneman and A. Tversky. Cambridge, Cambridge University Press: 17-43. Cardenas, J. C., J. K. Stranlund, et al. (2000). "Local Environmental Control and Institutional Crowding-out." World Development 28(10): 1719-1733. Coase, R. H. (1992). "The Institutional Structure of Production." American Economic Review 82(4): 713-719. Cohen, D. (1998). "Culture, Social Organization, and Patterns of Violence." Journal of Personality and Social Psychology 75(2): 408-419. Dahl, R. and C. Lindblom (1953). Politics, Economics and Welfare. New York, Harper & Row. Dawkins, R. (1989). The Blind Watchmaker. New York, Norton. Deci, E. L., R. Koestner, et al. (1999). "A Meta-Analytic Review of Experiments Examining the Effects of Extrinsic Rewards on Intrinsic Motivation." Psychological Bulletin 125(6): 627-668. Fehr, E. and J. List (2004). "The hidden costs and returns of incentives: Trust and trustworthiness among CEOs." Journal of The European Economic Association 2(5): 743-771. Fehr, E. and S. Gaechter (2000). "Cooperation and Punishment in Public Goods Experiments." American Economic Review 90(4): 980-994. Foley, D. (1994). "A statistical equilibrium theory of markets." Journal of Ecomonic Theory 62(2): 321-345. Frohlich, N. and J. A. Oppenheimer (1995). "The Incompatibility of Incentive Compatible Devices and Ethical Behavior: Some Experimental Results and Insights." Public Choice Studies 25: 24-51. Frost, R. (1915). North of Boston. New York, Henry Holt. Hayek, F. A. (1935). Collectivist Economic Planning: Critical Studies on the Possibilities of Socialism. London, George Routledge.
IL GOVERNO DELL’ECONOMIA
|33
Hirschman, A. O. (1985). "Against parsimony:three ways of complicating some categories of economic discourse." Economics and Philosophy 1(1): 7-21. Hobbes, T. (1651/1968). Leviathan. New York, Penguin. Holmstrom, B. (1982). "Moral Hazard in Teams." Bell Journal of Economics 13(2): 324-340. Jung, C. (2001). Collective Action and Trust Revisited: Evidence from a Small Case. New School University, Department of Political Science. Kahneman, D. (1994). "New Challenges to the Rationality Assumption." Journal of Institutional and Theoretical Economics 150(1): 18-36. Lange, O. and F. M. Taylor (1938). On the Economic Theory of Socialism. Minneapolis, University of Minnesota Press. Lanjouw, P. and N. Stern, Eds. (1998). Economic Development in Palanpur Over Five Decades. Delhi, Oxford University Press. Lerner, A. (1944). The economics of control; principles of welfare economics. New York, Macmillan. Mandeville, B. (1924). The Fable of the Bees, or Private Vices, Publick Benefits. Oxford, Clarendon Press. Marx, K. and F. Engels (1972). The Communist Manifesto. The Marx-Engels Reader, 2nd Edition. R. Tucker. New York, W. W. Norton & Company (first published in 1848). Mill, J. S. (1976). On Socialism. Buffalo, Prometheus. Nisbett, R. E. and D. Cohen (1996). Culture of Honor: The Psychology of Violence in the South. Boulder, Westview Press. Ouchi, W. (1980). "Markets Bureaucracies and Clans." Administrative Science Quarterly 25: 129-141. Pareto, V. (1897). "The New Theories of Economics." Journal of Political Economy 5(4): 485-502. Pareto, V. (1909). Manuel d'Economie Politique. Paris (First Italian edition published 1905), Giard et Briere. Platteau, J.-P. and E. Seki (2001). Community Arrangements to Overcome Market Failures: Pooling Groups in Japanese Fisheries. Communities and Markets in Economic Development. M. Aoki and Y. Hayami. Oxford, Clarendon: 344-402. Quah, D. (1996). The Invisible Hand and the Weightless Economy. London, London School of Economics Centre for Economic Performance Occasional Paper. Sampson, R. J., S. W. Raudenbush, et al. (1997). "Neighborhoods and Violent Crime: A Multilevel Study of Collective Efficacy." Science 277: 918-924. Schelling, T. (1960). The Strategy of Conflict. Cambrdige, MA, Harvard University Press. Schotter, A. (1981). Economic Theory of Social Institutions. New York, Cambridge University Press. Schumpeter, J. (1942). Capitalism, Socialism, and Democracy. New York, Harper & Row. Smith, A. (1937 [1776]). An inquiry into the nature and causes of the wealth of nations. New York, Random House. Stiglitz, J. E. (1994). Wither Socialism? Cambridge, MA, MIT Press. Taylor, F. M. (1929). "The guidance of production in a socialist stae." American Economic Review XIX(March): 1-8. Williamson, O. E. (1985). The Economic Institutions of Capitalism. New York, Free Press.