Deepseek, una società cinese di intelligenza artificiale con sede a Hangzhou, è stata fondata nel 2023 da Liang Wenfeng. La start-up cinese di intelligenza artificiale DeepSeek ha scosso il mondo della tecnologia con il rilascio del loro nuovo modello, posizionandosi come un formidabile concorrente dei giganti tecnologici americani come OpenAI, Google e Meta. Ma cosa sta esattamente guidando tutto questo entusiasmo (e ansia)? Cos’è il nuovo modello di DeepSeek, R1?
DeepSeek sviluppa grandi modelli linguistici (LLM), lo stesso tipo di sistemi di intelligenza artificiale utilizzati da ChatGPT di OpenAI, LLaMA di Meta, Gemini di Google e così via. Questi sistemi simili a chatbot sono addestrati su enormi quantità di dati testuali – come libri, articoli di notizie e pagine web – dai quali imparano a costruire frasi. I LLM possono essere utilizzati per vari scopi, come scrivere codice informatico, risolvere problemi, generare contenuti e persino scrivere articoli di notizie (con successo variabile).
Il 20 gennaio 2025, DeepSeek ha rilasciato il suo ultimo modello di intelligenza artificiale, chiamato R1. In poche parole: è estremamente intelligente, molto efficiente e sorprendentemente a basso costo. In termini di capacità tecniche, DeepSeek afferma che R1 eguaglia o supera i suoi concorrenti, incluso l’o1 di OpenAI, in diversi parametri. Molti investitori ed esperti di tecnologia sono d’accordo.
Fondamentalmente, è in grado di eseguire questi compiti con maggiore efficienza, richiedendo meno potenza di calcolo e chip meno potenti per ottenere gli stessi (se non migliori) risultati rispetto ai modelli rivali. Un altro punto chiave: DeepSeek-R1 è open-access, il che significa che è liberamente disponibile per l’uso pubblico. Gli utenti hanno accesso al suo codice, permettendo loro di integrarlo nelle proprie applicazioni o di sperimentarlo per ricerca e sviluppo.
“DeepSeek ha dimostrato che i grandi modelli linguistici possono imparare a risolvere compiti complessi con meno risorse di calcolo e meno dati per l’addestramento. Di conseguenza, i futuri chatbot potrebbero rispondere più velocemente e essere addestrati con meno ma dati di qualità superiore, consumare meno energia e potrebbero essere meno costosi da sviluppare,” ha dichiarato Wolfgang Meyer, Professore Associato in STEM presso l’Università del South Australia, in una dichiarazione. “Sebbene non comprendiamo ancora appieno il processo di addestramento e le capacità di DeepSeek, i suoi risultati potrebbero influenzare lo sviluppo dei futuri chatbot,” ha spiegato Meyer.
Tuttavia, i critici hanno già evidenziato significativi svantaggi, inclusa la sua conformità alla censura del governo cinese. Ad esempio, DeepSeek si rifiuta di rispondere a domande sulle proteste di Piazza Tiananmen del 1989, un evento che il Partito Comunista Cinese ha costantemente cercato di minimizzare. Alcuni commentatori hanno anche notato che DeepSeek sta apparentemente inviando tonnellate di dati degli utenti dagli Stati Uniti alla Cina, sollevando grandi preoccupazioni sulla sicurezza e la privacy.
Chi c’è dietro DeepSeek? DeepSeek è una società di intelligenza artificiale con sede a Hangzhou, una città che ospita molte aziende tecnologiche cinesi, tra cui Alibaba, una sorta di equivalente cinese di Amazon. La società è stata fondata nel 2023 da Liang Wenfeng, l’imprenditore quarantenne dietro il fondo speculativo High-Flyer. Wenfeng ha acquistato migliaia di chip Nvidia prima che l’amministrazione Biden iniziasse a limitare le esportazioni di chip verso la Cina e li ha utilizzati per costruire un progetto di intelligenza artificiale, secondo il Financial Times.
“Quando lo abbiamo incontrato per la prima volta, era questo tipo molto nerd con un’acconciatura terribile che parlava di costruire un cluster di 10.000 chip per addestrare i suoi modelli. Non lo abbiamo preso sul serio,” ha detto uno dei partner commerciali di Liang al Financial Times. “Non riusciva a articolare la sua visione se non dicendo: ‘Voglio costruire questo, e sarà un cambiamento di gioco.’ Pensavamo che questo fosse possibile solo da giganti come ByteDance e Alibaba,” ha aggiunto l’associato.
DeepSeek ha dichiarato di aver speso solo 5,6 milioni di dollari per la potenza di calcolo per il suo modello base. Sebbene questo non copra il costo totale del progetto, è certamente molto più economico rispetto alle centinaia di milioni o addirittura miliardi di dollari che le aziende americane hanno allocato per lo sviluppo dell’intelligenza artificiale. Questo approccio snello ed economico è un fattore chiave del perché il nuovo modello di DeepSeek sta causando scalpore nell’industria tecnologica.
“Il modello open-source di DeepSeek è stato sviluppato a un costo molto inferiore e richiede hardware meno potente per funzionare rispetto ai leader di mercato attuali come ChatGPT,” ha dichiarato il Dr. William Darler della University of Leicester School of Business in una dichiarazione inviata a IFLScience. “Il consenso iniziale degli esperti è che i modelli di intelligenza artificiale di DeepSeek sembrano robusti ma attualmente mancano del volume di dati di addestramento per competere con i migliori modelli closed-source. Questo probabilmente spingerà le organizzazioni di intelligenza artificiale generativa a ripensare i loro modelli di business, il che potrebbe essere una buona notizia per le organizzazioni e i consumatori per i quali i costi attuali potrebbero essere proibitivi,” ha aggiunto Darler.
Qual è il grande affare su DeepSeek? Quando i mercati hanno chiuso lunedì 27 gennaio, quasi 600 miliardi di dollari sono stati tagliati dal valore del produttore americano di microchip per intelligenza artificiale Nvidia, segnando il più grande calo di valore di mercato in un solo giorno di qualsiasi azienda nella storia. Chiaramente, gli investitori negli Stati Uniti e in Europa erano spaventati.
Lo stesso giorno, DeepSeek ha superato OpenAI come l’app gratuita più scaricata negli Stati Uniti sull’App Store di Apple. L’ascesa meteoritica di DeepSeek significa che le aziende americane di intelligenza artificiale ora affrontano una significativa concorrenza globale. Improvvisamente, non sono più l’unico spettacolo in città. Alcuni sostengono che l’ascesa delle aziende cinesi di intelligenza artificiale favorirà una sana concorrenza con gli Stati Uniti, guidando i progressi e accelerando il progresso nel campo.
Il venture capitalist della Silicon Valley Marc Andreessen ha postato su X: “DeepSeek-R1 è il momento Sputnik dell’IA,” riferendosi al satellite sovietico che ha scatenato la corsa allo spazio della Guerra Fredda e ha spianato la strada agli sbarchi lunari dell’Apollo. D’altra parte, la crescente minaccia alla supremazia dell’intelligenza artificiale americana ha già sconvolto l’industria tecnologica statunitense e probabilmente alimenterà ulteriormente le tensioni geopolitiche.
“Questo è il segnale più chiaro di dove sta andando il futuro. L’intelligenza artificiale sarà la tecnologia definente del nostro tempo, e la corsa a dominarla plasmerà i mercati globali per decenni a venire,” ha dichiarato Nigel Green, CEO del gigante della consulenza finanziaria globale deVere Group, in una dichiarazione vista da IFLScience. “I progressi tecnologici della Cina, in particolare nell’intelligenza artificiale, stanno erodendo la capacità degli Stati Uniti di utilizzare le tariffe come strumento per mantenere la supremazia globale. L’equilibrio di potere sta cambiando, e Washington deve riconoscere che non può sempre dettare i termini a Pechino come una volta. Questa nuova realtà avrà conseguenze di vasta portata per investitori e politici,” ha aggiunto.