DeepSeek, startup cinese relativamente sconosciuta fino a poco tempo fa, ha recentemente fatto parlare di sé nel mondo dell’intelligenza artificiale, sfidando i giganti tecnologici occidentali con il suo modello di linguaggio avanzato.
Il 27 gennaio 2025 è avvenuto uno sconvolgimento nel settore tecnologico delle borse europee e americane dopo il lancio del nuovo chatbot di intelligenza artificiale, che gli sviluppatori affermano possa competere con OpenAI e Google, rimanendo però completamente open source e gratuito per gli utenti e riducendo significativamente i costi. I titoli nel settore tecnologico hanno subito un calo in Europa. Nel premercato statunitense, il Nasdaq ha registrato una perdita di quasi 4 punti percentuali, mentre Nvidia ha visto un calo di circa il 12%. Tuttavia, secondo gli analisti, il futuro di DeepSeek non è esente da difficoltà: le normative sulla censura in Cina limitano i suoi modelli nel trattare argomenti politicamente sensibili, ostacolandone così l’espansione nei mercati internazionali.
Come è nata e cosa fa Deepseek
La società innovativa è stata fondata nel 2023 da Liang Wenfeng e supportata dall’hedge fund High-Flyer di Hangzhou. Il suo fiore all’occhiello è il modello DeepSeek-R1, lanciato all’inizio del 2025, che ha già fatto parlare di sé grazie alla sua abilità nel risolvere problemi complessi, come il ragionamento matematico e la generazione di codice. Questo è possibile grazie all’uso di tecniche di apprendimento avanzato che permettono al modello di “ragionare” in modo autonomo.
Come funziona il modello DeepSeek-R1
Presentato il 20 gennaio 2024, ha dimostrato prestazioni paragonabili, se non superiori, a quelle dei modelli di punta di aziende come OpenAI e Google DeepMind, attirando l’attenzione di esperti del settore come Marc Andreessen, che lo ha definito “una delle più sorprendenti e impressionanti innovazioni mai viste”.
Ciò che rende particolarmente notevole il successo di DeepSeek è il contesto in cui è stato sviluppato: nonostante le restrizioni imposte dagli Stati Uniti sull’esportazione di chip avanzati verso la Cina, l’azienda è riuscita a sviluppare un modello di alto livello utilizzando risorse hardware limitate.
Secondo quanto riportato da The New York Times, gli ingegneri di DeepSeek hanno dichiarato di aver utilizzato solo 2.000 chip Nvidia per l’addestramento del loro modello, in netto contrasto con i 16.000 o più chip generalmente considerati necessari dai concorrenti statunitensi per sviluppare modelli di pari complessità. Questo risultato non solo dimostra l’ingegnosità degli sviluppatori di DeepSeek, ma solleva anche interrogativi sulla reale efficacia delle restrizioni tecnologiche imposte dagli Stati Uniti nei confronti della Cina nel campo dell’IA.
La “lean production” dietro il successo della startup cinese
Il successo di DeepSeek è il risultato di un approccio innovativo e frugale allo sviluppo dell’intelligenza artificiale, che ricorda per certi versi la rivoluzione della “lean production” introdotta da Toyota negli anni ’80 e ’90. Liang Wenfeng ha adottato una strategia basata sull’ottimizzazione delle risorse e sull’innovazione tecnica per superare le limitazioni imposte dalle restrizioni statunitensi.
L’azienda ha concentrato i suoi sforzi su tecniche avanzate come la Multi-head Latent Attention (MLA) e la Mixture of Experts (MoE), che permettono di migliorare l’efficienza dei modelli riducendo al contempo i requisiti hardware.
Secondo quanto riportato da EpochAI, il modello DeepSeek-V3 è stato addestrato utilizzando solo 2,78 milioni di ore GPU, rispetto ai 30,8 milioni richiesti da modelli simili come Llama 3. Questa drastica riduzione è stata possibile grazie all’impiego di tecnologie come il FP8 (floating point 8), che migliorano l’efficienza del calcolo. Inoltre, DeepSeek ha fatto un uso innovativo dei chip Nvidia H800, progettati specificamente per il mercato cinese e meno avanzati rispetto agli H100, ma ottimizzati per ottenere prestazioni elevate a costi inferiori.
Un altro aspetto chiave della strategia di DeepSeek è stato il focus sui giovani talenti: invece di cercare tecnici esperti, l’azienda ha reclutato principalmente neolaureati e dottorandi provenienti dalle migliori università cinesi, creando un ambiente di lavoro collaborativo e orientato alla ricerca. Questa combinazione di innovazione tecnica, ottimizzazione delle risorse e valorizzazione dei giovani talenti ha permesso a DeepSeek di sviluppare un modello di IA all’avanguardia con un investimento stimato di soli 5,6 milioni di dollari, una frazione del costo dichiarato da aziende come Anthropic per progetti simili.
Quanto è popolare DeepSeek e in quale misura è limitata dalla censura cinese?
“La popolarità di DeepSeek è esplosa” scrive Filippo Diodovich, Senior Market Strategist, IG Italia. “La sua app ha conquistato gli utenti globali, diventando l’app gratuita più scaricata sull’App Store in Cina e negli Stati Uniti, sorpassando persino ChatGPT. Tuttavia, il suo sviluppo non è privo di sfide. Le rigide leggi sulla censura in Cina limitano i suoi modelli dall’affrontare temi politicamente delicati (ad esempio l’indipendenza di Taiwan), ostacolando una piena diffusione nei mercati internazionali dove la libertà di espressione è cruciale. In poche parole, DeepSeek sta emergendo come una forza innovativa nel panorama dell’intelligenza artificiale, pronta a sfidare i giganti occidentali, ma con il peso delle regolamentazioni cinesi sulle spalle”.
Cosa succederà nel mondo, cosa succederà nella tecnologia
L’ascesa di DeepSeek nell’intelligenza artificiale ha importanti implicazioni geopolitiche e tecnologiche.
Dal punto di vista geopolitico, il successo dell’azienda cinese sfida le restrizioni tecnologiche statunitensi, dimostrando che l‘innovazione può prosperare anche con risorse limitate. Questo mette in discussione l’efficacia delle politiche USA e solleva interrogativi sulla competizione tecnologica futura tra USA e Cina, con impatti sulle politiche di esportazione e cooperazione internazionale.
Dal punto di vista tecnologico, l’approccio di DeepSeek, focalizzato sull’efficienza e l’ottimizzazione delle risorse, potrebbe influenzare le strategie globali di sviluppo dell’IA. Il successo di modelli cinesi economici rappresenta una minaccia per la leadership tecnologica americana. Inoltre, l’approccio open source di DeepSeek potrebbe accelerare la diffusione della conoscenza nel campo dell’IA, democratizzando l’accesso e riducendo il divario tra grandi aziende e startup, con potenziali ripercussioni sugli equilibri di potere e l’innovazione globale.
Deepseek: la scommessa sull’open source
Il successo di DeepSeek ha riaperto il dibattito sulla contrapposizione tra modelli di intelligenza artificiale proprietari e open source. Mentre società come OpenAI e Google scelgono un approccio chiuso e brevettato, DeepSeek punta sull’open source, rendendo i propri algoritmi accessibili e favorendo l’innovazione collaborativa. Questo solleva dubbi sull’efficacia dei modelli di business tradizionali nell’IA. Yann LeCun di Meta evidenzia che la vera sfida è tra modelli open source e proprietari, sottolineando come DeepSeek e altri benefici dell’open source possano accelerare l’innovazione. L’approccio aperto potrebbe democratizzare l’IA, rendendola accessibile a molti sviluppatori, ma solleva interrogativi sulla sostenibilità economica e la protezione della proprietà intellettuale. L’impatto di questi modelli sull’industria dell’IA resta da vedere, specialmente in termini di monetizzazione e strategie aziendali.