Metodi e modelli per decidere con i dati
Quali domande dovrebbe porre un manager ai software di machine learning? E come è possibile ottenere da questi strumenti gli insight giusti? Sono alcune delle domande intorno alle quali ruotano due progetti di ricerca che vedono coinvolto Emanuele Borgonovo, docente del Dipartimento di Scienze delle decisioni, il primo in collaborazione con Manel Baucells, (Darden Business School), Elmar Plischke (Clausthal University of Technology), John Barr e Herschel Rabitz (Princeton), il secondo con il team composto da Jan Rivkin (Harvard), Nicolaj Siggelkow (Wharton), Marco Pangallo (Sant'Anna) e Leonardo Rizzo (Università di Vienna).
"In letteratura esistono molti modelli per capire i dati e molti metodi per spiegare i modelli", riassume Borgonovo. "Entrambi i nostri studi hanno lo scopo di individuare quali metodi ci aiutano davvero a capire il funzionamento dei modelli, come questi rispondono alle domande, come reagiscono a stress negli input, e come è possibile compiere un'operazione di 'debugging' che ne possa validare i risultati".
La creazione di modelli di data science che stiano al pari con le best practice comporta un investimento oneroso in termini di tempo, fatica e risorse economiche per qualsiasi organizzazione; è fondamentale che i manager possano sfruttare l'esito di questo lavoro maturando una maggiore consapevolezza nei confronti del funzionamento degli algoritmi e trasformando rapidamente le informazioni ricevute in azioni concrete. Tuttavia, i modelli hanno mostrato punti critici ricorrenti, e la comprensione di come i modelli mettono in relazione le variabili esterne è essenziale per la corretta interpretazione dei risultati.
"È dimostrato purtroppo che metodi diversi applicati agli stessi modelli e agli stessi dati non danno le stesse risposte", conferma il docente. "Un caso classico è quello relativo alla correlazione tra i dati: spesso i modelli non sanno distinguere se la dipendenza che vediamo è funzionale o statistica, vale a dire se l'una varia in funzione dell'altra in un rapporto di causa-effetto, che quindi si ripete sempre identicamente, o se l'osservazione è frutto di una correlazione statistica. È un insight fondamentale, invece, perché significa per un manager sapere su quali elementi agire per produrre un cambiamento; e non è detto che le variabili che portano informazione siano poi quelle su cui è possibile agire. In generale, più i modelli sono spiegati e più infondono fiducia, e questo vale nel business come in altri campi. La seconda ricerca citata, per esempio, lavora sui cosiddetti modelli ad agenti utilizzati per capire fenomeni complessi, ad esempio come si diffonde una pandemia o come interagiscono le persone fra loro con fenomeni ad oggi importanti da conoscere e spiegare".