Decodifica dei Pensieri: L’IA Traduce le Scansioni Cerebrali in Testo
Quanto sarebbe utile sapere cosa sta pensando la persona accanto a te sul treno. O cosa il tuo capo sta per offrirti come aumento di stipendio o cosa un potenziale partner pensa di te. Questa abilità è ovviamente del tutto futuristica. Ma le basi stanno già venendo gettate. Vari gruppi hanno dimostrato la capacità di decodificare certi tipi di pensieri, in particolare ciò che le persone stanno guardando, basandosi su immagini di scansioni cerebrali con risonanza magnetica funzionale (fMRI). Questo è un lavoro difficile e i risultati sono stati, beh, diciamo in fase di sviluppo.
Ma questa capacità è ora un passo più vicina grazie al lavoro di Weikang Qiu all’Università di Yale a New Haven, e colleghi, che hanno sviluppato un sistema di IA capace di decodificare le scansioni fMRI. La macchina, chiamata MindLLM, produce una descrizione testuale del processo di pensiero di un soggetto mentre guarda un’immagine.
Il lavoro apre la strada a una migliore comprensione del cervello umano e dei suoi processi di pensiero. Migliora anche sostanzialmente ciò che è stato fatto prima. “MindLLM supera le basi, migliorando i compiti a valle del 12,0%, la generalizzazione dei soggetti non visti del 16,4% e l’adattamento a nuovi compiti del 25,0%,” dicono Qiu e co.
Mappatura Mentale
La risonanza magnetica funzionale (fMRI) misura l’attività cerebrale indirettamente rilevando i cambiamenti nei livelli di ossigenazione del sangue, noti come risposta emodinamica. Questa risposta, che ritarda l’attività neurale di diversi secondi, fornisce una mappa spaziale dell’attivazione cerebrale, sebbene con una risoluzione temporale limitata. La tecnica ha fornito numerose intuizioni sul ruolo che varie parti del cervello svolgono. Ma decodificare pensieri e idee complesse da queste scansioni è stata una sfida di lunga data.
I metodi precedenti hanno avuto difficoltà con l’accuratezza, la varietà limitata dei compiti e la difficoltà di generalizzare tra individui diversi. La variabilità nelle strutture cerebrali e nei modelli di attivazione tra le persone rende difficile sviluppare un modello di decodifica universale. MindLLM affronta queste sfide direttamente. Consiste di due componenti principali: un codificatore fMRI e un grande modello linguistico (LLM). Il codificatore fMRI elabora i dati della scansione e li converte in un formato che l’LLM può comprendere. L’LLM è stato pre-addestrato su una vasta gamma di immagini con la loro descrizione testuale.
I dati fMRI consistono in scansioni cerebrali di soggetti che svolgono compiti come guardare un’immagine e rispondere a una semplice domanda su di essa. Ad esempio, data un’immagine di un orologio accanto a delle lettere, i compiti potrebbero essere determinare le lettere nell’immagine o, data un’immagine di un giocatore di baseball nell’atto di lanciare, la domanda potrebbe essere quale oggetto viene lanciato. Quindi, dati i dati fMRI, MindLLM deve generare un testo che descriva l’attività cerebrale catturata nella scansione.
Una delle innovazioni chiave di MindLLM è la sua capacità di concentrarsi sulle parti più rilevanti dei dati fMRI, migliorando la sua accuratezza ed efficienza. Un altro aspetto critico di MindLLM è una tecnica nota come Brain Instruction Tuning (BIT). Questo comporta l’addestramento del modello su un dataset diversificato di immagini e testo, permettendogli di catturare una vasta gamma di rappresentazioni dai segnali fMRI. Il dataset BIT include compiti relativi alla percezione, memoria, elaborazione del linguaggio e ragionamento complesso, garantendo che MindLLM possa decodificare vari aspetti del pensiero umano.
Le potenziali applicazioni di MindLLM sono significative. Qui e co dicono che potrebbe essere utilizzato per sviluppare interfacce cervello-computer che permettono alle persone di controllare dispositivi con i loro pensieri, rivoluzionando la tecnologia assistiva per individui con disabilità. Il modello potrebbe anche fornire intuizioni sui processi cognitivi, aiutando i ricercatori a comprendere meglio come funziona il cervello.
Inoltre, la capacità di MindLLM di decodificare i pensieri ha implicazioni etiche che la società dovrà considerare. La possibilità di decodificare pensieri privati solleva preoccupazioni riguardo alla privacy e alla sicurezza, ed è essenziale stabilire linee guida etiche per lo sviluppo e l’implementazione di tale tecnologia. Qui e co riconoscono che non sapranno necessariamente come verrà utilizzata. “È comune che gli utenti vogliano adattare MindLLM ai loro casi d’uso specifici,” dicono.
Fatto o Finzione
Nonostante le sue prestazioni impressionanti, MindLLM è ancora nelle sue fasi iniziali. Una limitazione è che l’fMRI non è una tecnica di imaging in tempo reale e richiede un tempo di elaborazione significativo oltre a costose attrezzature ingombranti. La ricerca futura potrebbe esplorare tecniche di imaging cerebrale più veloci e portatili, come l’elettroencefalografia (EEG) o la spettroscopia funzionale nel vicino infrarosso, per completare o sostituire l’fMRI nelle applicazioni pratiche. Inoltre, i ricercatori mirano a investigare la relazione tra i dati fMRI e altre modalità, come i video, per ottenere una comprensione più completa dell’attività cerebrale.
Questo è un lavoro interessante che mostra come le tecniche di lettura della mente stiano progredendo a passi da gigante. La capacità di decodificare i pensieri è stata a lungo un elemento fondamentale della fantascienza, ma potrebbe non passare molto tempo prima che acquisisca lo status di fatto scientifico.