Quando la diagnosi la fa l’IA

Well being


Quando la diagnosi la fa l’IA

Possiamo fidarci di un medico che fa decidere l’intelligenza artificiale? Changes ne ha parlato con Federico Cabitza, professore di interazione uomo macchina e autore con Luciano Floridi di Intelligenza Artificiale. L’uso delle nuove macchine (Bompiani)

Nel 2016 il Moorfields Eye Hospital, Ospedale oftalmico del Regno Unito, ha iniziato una collaborazione con Google DeepMind Health per esplorare come l’intelligenza artificiale (IA), allenata su migliaia di scansioni oculari anonime, possa aiutare la ricerca medica sulle malattie degli occhi. Nell’agosto 2018 i risultati hanno indicato che il sistema di intelligenza artificiale può competere con gli esperti mondiali nella diagnosi di una serie di patologie oculari, raccomandando, per oltre 50 malattie oculari, la corretta decisione con una precisione del 94%.

Lo studio che ha dato rilevanza a queste informazioni ha avuto un impatto anche su Federico Cabitza, professore di interazione uomo macchina all’Università Milano Bicocca e all’Irpss Galeazzi e autore con Luciano Floridi, di Intelligenza Artificiale. L’uso delle nuove macchine (Bompiani). I risultati hanno aumentato l’interesse dei medici verso il suo lavoro da interazionista, ovvero chi progetta le modalità in cui gli umani interagiscono con l’IA come supporto al lavoro creativo o alle decisioni in contesti professionali. Un interazionista considera tutte le modalità in cui i sistemi producono output e valuta la migliore esperienza d’uso, che non è solo la facilità d’uso, ma anche l’efficacia, l’efficienza e la soddisfazione degli utenti.

Il caso dell’ospedale Moorfield ha dimostrato che l’IA migliora le prestazioni dei medici. Secondo uno studio del 2024 addirittura li batte: un modello di LLM, tipo ChatGpt, ha infatti azzeccato la diagnosi meglio di 50 medici, con o senza ausili di IA. Dovremmo lasciar lavorare l’IA da sola?
Ho verificato in alcuni studi sperimentali condotti in diverse specialità il cosiddetto effetto di augmentazione. Ovvero: quando il medico decide su diagnosi o terapia con un supporto basato sull’IA per le sue prestazioni in media migliorano consistentemente. Stiamo indagando sul perché succeda. Ma la domanda successiva è: possiamo affidarci solo all’IA? Dipende dal compito diagnostico e dalla tipologia di medici cui viene dato il supporto. E anche se in certi compiti diagnostici la macchina è più accurata del miglior essere umano disponibile, generalizzare affermando che la macchina sia sempre meglio è molto controverso. Lo stesso team di Deep mind che ha lavorato al Moorfield ha cercato di replicare i risultati con immagini provenienti da altri ospedali e da altri stati, quali l’India e ha osservato un calo considerevole delle prestazioni perché il sistema addestrato su immagini di certi centri di ricerca non riusciva a replicare le performance quando le immagini erano fatte con altri macchinari e di qualità inferiore. E se al momento la certificazione di uno o più studi che validino la capacità di un sistema di supportare la diagnosi con dati “eterogenei” non è necessaria, sarebbe importante, invece, per accertarsi che un apparecchio sia affidabile.

Lo studio che ha visto la superiorità di ChatGpt riporta due osservazioni ulteriori. La prima è che i medici nutrivano fiducia nelle loro diagnosi anche se in contrasto con la macchina e la seconda che non capivano come l’IA fosse arrivato a certe conclusioni.
Nel rapporto uomo-macchina ci sono alcuni pregiudizi tipici. Il primo è detto automation bias ed è citato come distorsione da automazione anche nel regolamento europeo su uso dell’IA. In pratica, vuol dire che l’essere umano compie errori che non avrebbe compiuto senza il supporto tecnologico perché si fida del sistema, anche se è fallibile. Meno noto è il contrario, cioè il conservatorism bias: come nello studio citato il medico ritiene di saperne di più dell’IA perché ha più dati di quelli forniti alla macchina. Ecco perché noi ricercatori parliamo di reliance, affidamento: occorre capire quando fidarsi è appropriato. Per aumentare la reliance pensiamo a un IA che, oltre a dare un suggerimento, fornisca informazioni aggiuntive su come è arrivato a quel giudizio. In questo modo, il medico può calibrare meglio la sua fiducia nel mezzo e stabilire meglio se la macchina ha ragione o no. D’altra parte, esiste anche il white box paradox. In altre parole, se invece di restare imperscrutabile, l’IA ci spiega come ha ragionato, può convincere un medico anche se sta sbagliando. Insomma, non ci sono soluzioni facili e per ora in Usa solo 700 dispositivi medici, soprattutto di tipo radiologico, prevedono la possibilità dell’IA di fornire informazioni aggiuntive. Il mio gruppo di ricerca promuove un atteggiamento cauto verso i suggerimenti dati dall’IA, ponendo una soglia minima del 75% di certezza per fornire un suggerimento. Sotto quella soglia preferiamo che non venga dato, mentre oggi i dispositivi danno diagnosi anche con un tasso di certezza del 51%. Un po’ come tirare a testa o croce.

Un altro effetto del lasciar fare quasi tutto alla macchina sta nel crollo della motivazione degli uomini che lavorano, ognuno nel suo campo. È davvero così?
Confermo: uno studio condotto su 100 mila danesi ha evidenziato una demotivazione in chi si sente meno protagonista del suo lavoro o non trae più soddisfazione dallo svolgerlo. Noi lo chiamiamo erosione del senso di agentività e lo valutiamo con strumenti di psicologia sociale. Ma c’è un altro elemento da considerare: delegare all’IA alcuni compiti favorisce il deskilling, l’erosione di competenze tecniche. Lo verifichiamo usando il GPS: siamo meno abili a orientarci e a leggere le mappe. Noi progettiamo, per esempio, di fornire una diagnosi dell’IA solo dopo la formulazione da parte dello specialista, in modo da non ridurre le sue capacità appiattendole sulla macchina. In medicina non può che preoccupare la perdita di abilità, specie perché gli strumenti di supporto possono sempre guastarsi o mancare.

Mantovana, giornalista da oltre 15 anni in Mondadori, collabora a numerose riviste nazionali su temi di attualità e stili di vita. Ha collaborato a una monografia sul cinema di Steven Spielberg e curato la traduzione dall’inglese di un saggio sul Welfare State. ​