L’algoritmo che ottimizza le decisioni in tempo reale
Nel mondo dell’automazione industriale, della gestione delle reti e dei sistemi decisionali in tempo reale, le tecnologie di intelligenza artificiale e apprendimento automatico (machine learning) sono sempre più usate per prevedere eventi e suggerire azioni ottimali. Il problema? A volte abbiamo a disposizione più modelli predittivi, ciascuno specializzato in scenari diversi. Ma consultarli tutti, sempre, è troppo costoso - in termini di tempo computazionale, energia o complessità operativa.
Come decidere, allora, quale modello interrogare e quale consiglio seguire, se non possiamo sapere in anticipo quale sarà il più efficace in ogni singolo momento? A questa domanda cerca di rispondere uno studio recente firmato da Marek Eliáš, Assistant Professor presso il Dipartimento di Computing Sciences della Bocconi, e Matei Gabriel Coșa, studente del Master of Science in Artificial Intelligence.
Il lavoro affronta un problema classico dell’informatica teorica - quello dei sistemi di task metrici (Metrical Task Systems, MTS) - con una prospettiva nuova, più vicina alle sfide pratiche poste dall’uso dell’intelligenza artificiale nei sistemi complessi.
Un problema quotidiano: decidere senza sapere tutto
Immaginiamo una fabbrica automatizzata che deve decidere, ogni secondo, come configurare le sue macchine per minimizzare costi e tempi di produzione. Ha a disposizione diversi modelli predittivi: uno è molto bravo a gestire la produzione in condizioni stabili, un altro reagisce bene alle variazioni improvvise della domanda, un altro ancora è specializzato nell’ottimizzazione energetica. Tuttavia, ognuno di questi modelli è complesso da calcolare e usarli tutti simultaneamente a ogni istante non è fattibile. Questa situazione è un esempio concreto del problema che gli autori chiamano “accesso banditico a più predittori”: possiamo chiedere consiglio a uno solo tra i diversi modelli disponibili, a ogni passo. Eppure vogliamo prendere decisioni che siano quasi le migliori possibili, come se avessimo sempre consultato il modello giusto.
La sfida: imparare a scegliere il consigliere migliore
Il lavoro di Eliáš e Coșa propone un nuovo algoritmo in grado di imparare, nel tempo, quale modello seguire, pur senza avere accesso completo alle informazioni. “Il meccanismo è simile a quello del gioco d’azzardo con le “slot machine” (da cui il termine “bandit”)”, spiega Eliáš, “ogni modello è come una leva, e tirare la leva (cioè consultare quel modello) ci dà un certo risultato. Ma a differenza del casinò, in questo caso il “premio” non è noto subito, e può dipendere da cosa abbiamo fatto nei passi precedenti”. Non solo: per rendere il problema più realistico, gli autori considerano anche che per “capire” il comportamento di un certo modello predittivo dobbiamo consultarlo più volte consecutive - un po’ come con un esperto che ha bisogno di qualche minuto per studiare il contesto prima di dare un parere sensato.
Il risultato: meno sprechi, più efficienza
L’algoritmo sviluppato riesce a eguagliare asintoticamente (cioè nel lungo periodo) le performance del miglior modello disponibile, senza sapere in anticipo quale sia. “In termini pratici”, sottolinea Eliáš, “significa che un sistema automatico potrebbe adattarsi da solo a scegliere il modello più adatto per ogni situazione, riducendo al minimo sia i costi computazionali sia gli errori decisionali”. La forza del risultato sta nella robustezza: anche se uno solo tra i modelli è effettivamente buono, l’algoritmo impara a seguirlo. E nei casi in cui i modelli sono tutti imperfetti ma complementari - ciascuno efficace in un diverso sottoinsieme di situazioni - l’approccio si adatta comunque, cambiando “consigliere” quando serve.
A cosa serve davvero?
Questa linea di ricerca è particolarmente rilevante oggi, in un’epoca in cui i sistemi intelligenti vengono sempre più “potenziati” da modelli predittivi, ma dove la gestione efficiente dell’informazione diventa cruciale. Alcuni esempi applicativi includono:
- Gestione del traffico di rete: decidere come instradare i pacchetti in una rete internet, scegliendo tra più predittori del traffico.
- Sistemi di caching e memorizzazione: scegliere dinamicamente quali dati tenere in memoria, con modelli che stimano la probabilità di riuso.
- Ottimizzazione energetica in data center o edifici intelligenti, dove diversi modelli cercano di prevedere consumi, carichi o comportamenti degli utenti.
In tutti questi casi, la possibilità di consultare un solo modello per volta, ma di ottenere risultati quasi ottimali, è un vantaggio strategico: riduce i costi, aumenta l’efficienza e mantiene alte le prestazioni.
L’informatica teorica al servizio del mondo reale
Sebbene il lavoro sia teorico - con dimostrazioni matematiche e limiti formali di performance - le implicazioni sono tutt’altro che astratte. “Come spesso accade, è dalla formalizzazione di un problema che si apre la strada a soluzioni generalizzabili e applicabili in diversi contesti, anche molto lontani tra loro”, conclude Eliáš. Questo studio dimostra come la ricerca di frontiera in algoritmi e apprendimento automatico possa aiutare a costruire sistemi decisionali più intelligenti, adattivi ed efficienti, proprio là dove serve: nelle fabbriche, nei server, nei sistemi di controllo che fanno girare il mondo digitale e fisico.