Contatti

Oltre la simmetria nelle approssimazioni di distribuzioni a posteriori bayesiane

, di Ezio Renda
Una nuova ricerca Bocconi introduce un metodo generale per migliorare le approssimazioni deterministiche della distribuzione a posteriori nell’inferenza bayesiana

La statistica bayesiana riveste un ruolo centrale nella scienza moderna, con applicazioni che spaziano dalla medicina all’economia, fino all’intelligenza artificiale. Tra le principali ragioni di tale successo vi è il fatto che il paradigma bayesiano consente di aggiornare in modo sistematico le proprie convinzioni a priori riguardo a un particolare fenomeno di interesse in presenza di nuovi dati. Il risultato di questa procedura è riassunto in un oggetto fondamentale: la distribuzione a posteriori.

Nonostante abbia solide basi teoriche, l'uso diretto dei metodi bayesiani spesso si scontra con la complessità della valutazione esatta della distribuzione a posteriori. Per questo motivo, si ricorre in genere a soluzioni approssimate, sostituendo la distribuzione a posteriori con distribuzioni più semplici e, in genere, simmetriche. Questa scelta ha un importante risvolto pratico: molte approssimazioni comunemente utilizzate, come il metodo di Laplace e variational Bayes, forniscono risultati accurati solo quando la distribuzione a posteriori ha una forma simmetrica a campana.

C'è però un problema. Nella pratica le distribuzioni a posteriori sono in genere non simmetriche.

In particolare, in molte applicazioni, è comune osservare distribuzioni posteriori asimmetriche (skewed), con una maggiore concentrazione di probabilità su un lato rispetto all'altro. Sostituirle con approssimazioni simmetriche può quindi introdurre un bias sistematico e ridurre l'accuratezza dell'inferenza statistica. Ciò è particolarmente vero quando i dati sono limitati o quando il modello è complesso e ad alta dimensionalità. Per mitigare tali problematiche, negli ultimi anni sono state sviluppate approssimazioni più flessibili in grado di includere, almeno parzialmente, tali asimmetrie. Tuttavia, queste soluzioni sono spesso computazionalmente onerose, si applicano solo a modelli specifici e, in generale, non forniscono solide garanzie teoriche.

Nel loro articolo sul Journal of the Royal Statistical Society: Series BFrancesco Pozza, Daniele Durante eBotond Szabó (tutti del Dipartimento di Scienze delle Decisioni Bocconi e del centro di ricerca Bocconi Institute for Data Science and Analytics) propongono una soluzione semplice e di ampia applicabilità. Invece di sostituire le approssimazioni simmetriche esistenti con alternative più elaborate (e computazionalmente più costose), gli autori mostrano come modificarle sistematicamente per incorporare l'asimmetria.

A partire da un'approssimazione simmetrica, il metodo produce una versione asimmetrica della stessa che rimane matematicamente trattabile e che non richiede alcuna ottimizzazione aggiuntiva. Questa metodologia è supportata da risultati teorici rigorosi, da simulazioni numeriche e da applicazioni su dati reali.

Invece di sostituire strumenti consolidati, questo lavoro propone di migliorarli attraverso una correzione semplice e generale. Integrando l'asimmetria in modo sistematico ed efficiente, è possibile modificare le approssimazioni simmetriche bayesiane per renderle più simili alle distribuzioni che intendono caratterizzare.

pozza foto

LORENZO POZZA

Università Bocconi
Dipartimento di Accounting

DANIELE DURANTE

Università Bocconi
Dipartimento di Scienze delle Decisioni
Botond Szabo

BOTOND TIBOR SZABO

Università Bocconi
Dipartimento di Scienze delle Decisioni