Gli scienziati del Dana-Farber Cancer Institute e del Weill Cornell Medical College hanno sviluppato e testato nuovi strumenti di intelligenza artificiale appositamente progettati per la patologia digitale, un campo relativamente nuovo che utilizza immagini digitali ad alta risoluzione create da campioni di tessuto per diagnosticare malattie e prendere decisioni informate sul trattamento.
Il loro giornale Pubblicato su The Lancet Digital Health Il 9 luglio 2024, uno studio ha dimostrato che ChatGPT, un modello linguistico AI sviluppato per comprendere e generare testo, può essere progettato utilizzando una tecnica di intelligenza artificiale chiamata generazione aumentata con recupero, per fornire risposte accurate a domande sulla patologia digitale e aggregare risultati dettagliati. Gli autori hanno anche scoperto che ChatGPT può aiutare i patologi, senza una vasta esperienza di codifica, a utilizzare software complessi che analizzano campioni di tessuto, contribuendo efficacemente a colmare il divario tra le competenze di patologia e le competenze di patologia digitale.
ChatGPT è un modello linguistico di grandi dimensioni (LLM), il che significa che genera testo su una vasta gamma di argomenti utilizzando enormi quantità di dati. “I modelli linguistici di grandi dimensioni sono utili per compiti generali, ma non sono gli strumenti migliori per contenere informazioni utili per campi specializzati.
Per creare strumenti di intelligenza artificiale in grado di aumentare l’efficienza e l’accuratezza della patologia digitale, l’autore corrispondente Dr. Renato Ometon, Direttore, Operazioni AI e Servizi di scienza dei dati, Divisione Informatica e Analisi presso Dana-Farber, ha guidato lo sforzo di personalizzare e migliorare le capacità di ChatGPT per questo scopo specifico.
Migliorare l’accuratezza dell’intelligenza artificiale in patologia
“Ci sono due problemi principali con i moduli LLM generali. Il primo è che spesso danno risposte lunghe e generali che, sebbene corrette, non contengono informazioni sufficientemente dettagliate”, afferma Omar. “In secondo luogo, questi modelli possono immaginare e inventare cose dal nulla, comprese le citazioni in letteratura. Ciò è particolarmente negativo in campi specializzati come la patologia digitale e la biologia del cancro, per esempio”.
Per risolvere i problemi, Umeton ha iniziato a rilasciare una versione ChatGPT sicura, privata e protetta che funziona su Dana-Farber (GPT4DFCIHanno ampliato GPT4DFCI accedendo a un database completo e curato degli ultimi progressi nella patologia digitale, composto da 650 pubblicazioni dal 2022 in poi, per un totale di oltre 10.000 pagine di letteratura. “Possiamo chiedere a questo nuovo sistema di recuperare il ritardo su molti argomenti o tecniche specifici della patologia digitale e ottenere risultati in pochi secondi, con un livello di dettaglio, profondità e sintesi che non si trova negli attuali strumenti della letteratura scientifica o nei motori di ricerca”, ha osservato Ometon migliorerà efficacemente le capacità dei ricercatori”.
Hanno utilizzato una tecnologia chiamata Retrieval Augmented Generation (RAG), che ha consentito a GPT4DFCI di accedere a documenti o informazioni rilevanti da questo database specializzato e generare risposte accurate alle richieste degli utenti sulla patologia digitale, ma nulla al di fuori di questo campo.
Omar e i suoi colleghi hanno posto domande a GPT4DFCI relative alla patologia digitale e hanno confrontato le risposte con quelle fornite da ChatGPT 4. Chiedendo a GPT4DFCI di fornire collegamenti alle pubblicazioni specifiche utilizzate per generare le risposte, hanno stabilito che le risposte erano accurate e basate sui fatti. Il modello migliorato ha fornito risposte più precise e pertinenti rispetto a ChatGPT 4 e non ha avuto allucinazioni, nemmeno una volta. “Spero che questo possa rappresentare un incentivo per strumenti più specializzati in altri settori della medicina o della ricerca medica”, ha affermato Omar.
L’intelligenza artificiale offre un aiuto nella codifica
Il secondo software AI sviluppato dal team aiuta i patologi a utilizzare PathML, una libreria software specializzata che richiede familiarità con il linguaggio di programmazione Python per analizzare set di dati di immagini patologiche grandi e complessi. “Patologi o scienziati senza precedente esperienza di codifica potrebbero avere difficoltà a utilizzare PathML per attività di analisi delle immagini”, ha affermato Omar.
I ricercatori hanno integrato PathML con ChatGPT, consentendo agli utenti di interagire con i documenti PathML tramite la funzionalità di chat. Gli utenti possono semplicemente digitare le loro domande sull’utilizzo di PathML per analizzare immagini istopatologiche (immagini multiple, microarray di tessuti o valutazioni quantitative di biomarcatori, ad esempio) e lo strumento fornirà precise istruzioni passo passo sulla codifica delle loro analisi.
“L’intelligenza artificiale generativa si è rivelata utile nel fornire una guida strutturata su quali materiali consultare e su come organizzare il percorso di apprendimento per nuovi argomenti”, ha affermato Ometon. “La nostra ricerca mostra che, se combinati con adeguate tecniche di recupero delle informazioni, ChatGPT e strumenti di intelligenza artificiale protetta, come GPT4DFCI, possono essere molto efficaci nel supportare i ricercatori di base. Questi strumenti sono utili anche su argomenti molto complessi che richiedono risposte molto precise, come il digitale patologia.”
Questo lavoro è stato sostenuto dalle sovvenzioni del National Cancer Institute P50CA211024, P01CA265768 e U54CA273956.
Questo comunicato stampa è stato modificato da un comunicato stampa emesso dal Weill Cornell Medical College.
/versione generica. Questo materiale dell’organizzazione/degli autori originali può essere di natura cronologica ed è stato modificato per motivi di chiarezza, stile e lunghezza. Mirage.News non assume posizioni aziendali o partiti e tutte le opinioni, posizioni e conclusioni qui espresse sono esclusivamente quelle degli autori. Visualizzazione completa qui.