Un nuovo modello statistico per comprendere strutture complesse in reti multistrato
Immaginiamo una rete fatta di legami tra entità (nodi) che interagiscono. Ad esempio, persone legate da rapporti di amicizia, regioni cerebrali connesse da fibre di materia bianca, o perfino criminali che interagisco in ottica di coordinamento. Ora aggiungiamo un’ulteriore fonte di complessità. Questi nodi sono divisi in vari sottogruppi che generano diversi “strati” all’interno della rete, come, ad esempio, i lobi nel cervello o le cellule operative all’interno di un’organizzazione criminale.
Come possiamo studiare una rete così intricata, in cui i nodi non sono tutti uguali, ma appartengono a strati distinti? Come sfruttare in modo rigoroso l’informazione data da questa divisione in strati per comprendere strutture modulari inesplorate sottostanti le connessioni tra nodi dello stesso strato e di strati diversi?
È proprio questa la sfida affrontata da Daniele Durante, Antonio Lijoi e Igor Prünster (tutti del Dipartimento di Scienze delle Decisioni Bocconi) e Francesco Gaffi (ricercatore di BIDSA e precedentemente postdoc presso la University of Maryland) che hanno appena pubblicato nel prestigioso Journal of the American Statistical Association un modello innovativo che risponde alle precedenti domande. L’articolo è parte della tesi di dottorato di Francesco Gaffi, svolta durante il suo PhD in Statistics and Computer Science presso l’Università Bocconi. Con questo stesso lavoro, Francesco Gaffi ha vinto anche un premio nella Student Paper Competition dell’American Statistical Association.
Perché serve un nuovo modello?
Negli ultimi anni la scienza delle reti ha fatto passi da gigante, ma la maggior parte degli sviluppi è pensata per casi semplici in cui i nodi non sono allocati a strati diversi della rete. Quando invece ciò accade – ad esempio regioni cerebrali divise per lobi, cittadini di varie fasce sociali, o criminali affiliati a diverse cellule operative – i metodi tradizionali non riescono ad utilizzare tale informazione, e perciò forniscono risultati poco soddisfacenti. Mancava finora un approccio capace di sfruttare le peculiarità legate alla divisione in strati al fine di supervisionare la modellizzazione e la previsione di schemi modulari di connessione all’interno di complesse reti multistrato, senza sacrificare rigore matematico e coerenza probabilistica.
Una prospettiva innovativa
Una nozione chiave alla base del modello proposto è la parziale scambiabilità. In statistica, dire che dei nodi sono “scambiabili” significa sostanzialmente affermare che non conta l’ordine in cui li osserviamo. Ma nelle reti multistrato, non tutti i nodi sono equivalenti: una regione nel lobo frontale non può essere scambiata con una nel lobo temporale, e lo stesso vale per due affiliati a diverse cellule criminali. Il nuovo modello assume allora che i nodi siano scambiabili solo all’interno di ciascun strato, ma non tra strati diversi, informando quindi il modello del fatto che sia più probabile attendersi schemi modulari tra nodi dello stesso strato, senza però escludere la presenza di complesse macro-strutture che coinvolgono nodi in strati diversi. In altri termini, si tratta di un approccio rigoroso per tenere in considerazione le differenze tra strati, senza rinunciare alla possibilità di scoprire schemi trasversali ricorrenti.
Dalla teoria alla pratica: le reti criminali
Per dimostrarne l’efficacia, gli autori hanno applicato il modello ad una rete criminale reale estratta dagli atti giudiziari di un’ampia indagine condotta alcuni anni fa in Italia. In questa rete, ogni nodo è un membro dell’organizzazione criminale e gli archi indicano la co-partecipazione a summits. Gli strati (i “colori” dei nodi) corrispondono a diverse cellule operative.
Il modello ha rivelato dinamiche difficilmente individuabili con altri strumenti:
- Strutture nucleo-periferiche, in cui i capi delle diverse cellule territoriali formano complessi nuclei centrali separati da strutture modulari periferiche tra gli affiliati;
- Ruoli nascosti, come affiliati che mostrano comportamenti da veri e propri coordinatori, perfino di mediazione tra i capi delle diverse cellule;
- Frammentazioni interne, ad esempio quella di una cellula destabilizzata da precedenti conflitti di potere interni all’organizzazione criminale.
Perché è importante?
Questo nuovo modello non fornisce soltanto un importante contributo metodologico. È uno strumento per leggere la complessità delle strutture di connessione multistrato in campi diversi: neuroscienze, sociologia, scienze politiche, criminologia. Grazie alla sua costruzione rigorosa, permette non solo di studiare strutture osservate, ma anche di fare previsioni: cosa accadrà quando nuovi nodi entreranno nella rete? Quali legami è probabile che si formino?
Uno sguardo avanti
Il lavoro apre la strada ad una visione più ampia, sottolineando l’importanza di associare alle varie tipologie di reti moderne (multistrato, multilivello, reti replicate) la nozione di “scambiabilità” più adatta. Nel caso delle reti multistrato, la parziale scambiabilità diventa la chiave. Per altri tipi di rete – ad esempio quelle con i cui gli stessi nodi interagiscono rispetto a varie tipologie di relazione – serviranno concetti diversi.
Daniele Durante, Francesco Gaffi, Antonio Lijoi and Igor Prünster, “Partially Exchangeable Stochastic Block Models for (Node-Colored) Multilayer Networks”, Journal of the American Statistical Association, 1–32. https://doi.org/10.1080/01621459.2025.2507825