DeepSeek: il “cigno grigio” che costringe gli USA a innovare e l’Europa a svegliarsi
Con una perdita di valore complessiva di circa 1.000 miliardi di dollari nell’arco di poche ore e i valori azionari di Nvidia (che ha bruciato circa 600 miliardi di dollari di capitalizzazione di mercato) e Microsoft crollati, rispettivamente, del 17 e del 7%, il 27 gennaio 2024 presenta tutti i connotati di un “lunedì nero” dell’high tech.
Una settimana: tanto è bastato agli azionisti per convincersi che il lancio del nuovo modello R-1 di DeepSeek, startup cinese che sviluppa l’omonimo modello linguistico di intelligenza artificiale, rappresenti una minaccia più che concreta all’assoluta egemonia statunitense nel settore, sia lato hardware che software, con il terremoto finanziario iniziato in concomitanza con la scalata dell’app al primo posto tra quelle gratuite scaricabili dall’App Store di iPhone. Di fatti, il tratto distintivo del nuovo competitor cinese non è tanto quello di sbaragliare la concorrenza nei test di benchmark (dove raggiunge risultati simili o leggermente superiori ai modelli di punta di OpenAI e Anthropic) ma di ottenere performance analoghe in modo estremamente più efficiente dal punto di vista energetico e, di conseguenza, economico, pur offrendo un servizio completamente gratuito.
DeepSeek – sia inteso – non è perfetto, ma ai mercati, ad oggi, non importa che lo sia. Sapere che necessita di una potenza di calcolo pari a una frazione di quella che serve ai principali competitor è sufficiente a convincere i mercati finanziari che l’hardware e i capitali d’investimento diventeranno sempre meno rilevanti nella corsa all’AI – da qui, la previsione che Nvidia venderà sempre meno GPU, sufficiente a farle riportare il calo in borsa più significativo della sua storia.
Nel dettaglio, al modello DeepSeek R-1 basterebbero 2,19 dollari per elaborare un milione di token (unità di “misura” fondamentale dei modelli linguistici), mentre OpenAi, per generarne la stessa quantità con il suo o1, deve sborsare ben 60 dollari. La startup cinese, inoltre, ha dichiarato che per l’addestramento del suo modello v3 sarebbero bastati 5,58 milioni di dollari e circa due mesi di tempo: briciole, se paragonati ai 100 milioni necessari ai modelli di punta di Anthropic, con costi di sviluppo che, per alcuni progetti, possono sfiorare il miliardo di dollari. In ultimo, vi è forse l’aspetto politicamente più rilevante: DeepSeek, a detta dell’uomo del momento, il suo fondatore e CEO Liang Wenfeng, è riuscita a ottimizzare a tal punto il funzionamento dei propri modelli perché costretta a ricorrere ad hardware fortemente “castrato” nel numero di unità e nelle prestazioni, come quelle delle GPU H800, sviluppate da Nvidia appositamente per eludere il ban alla vendita dei suoi prodotti di punta alle aziende cinesi, imposto al produttore nell’estate 2022 dall’amministrazione Biden in chiave strategica per tentare, appunto, di frenare e ostacolare gli sviluppi di tecnologie cinesi di intelligenza artificiale, soprattutto in campo militare e di cybersicurezza.
Un “cigno grigio”, avvolto da miti da sfatare
Solo il tempo saprà dirci se DeepSeek aderisce, per portata e impatto, alla definizione di “cigno nero” formulata da Nassim Taleb per quegli eventi unici e imprevedibili in grado di provocare autentici terremoti finanziari o se, come già suggeriscono alcuni analisti, la sua portata sia stata ampiamente sopravvalutata dai mercati, anche e soprattutto sull’onda di informazioni inesatte – se non completamente errate – circolate in rete e puntualmente riprese, senza alcun fact checking, anche da autorevoli testate su scala internazionale.
Per mettere i puntini sulle i, DeepSeek non è davvero open source, né utilizza realmente la licenza MIT, optando, al contrario, per una soluzione ibrida e personalizzata. Su questo e su molti altri punti cardine, la comunicazione dell’azienda è particolarmente ambigua: se, da un lato, sul sito di DeepSeek è dichiarato a chiare lettere che il modello R-1 è open source, dall’altro è sufficiente chiedere al chatbot stesso la natura della sua licenza per scoprire che si tratta di un sistema “open weight, non completamente open source”: all’atto pratico, significa che non abbiamo davvero accesso al codice sorgente completo e, aspetto di importanza cruciale, non possiamo accedere ai dati e alle modalità con cui è stato addestrato. Un abbaglio non da poco, se si pensa che il modello, in questa maniera, non è realmente replicabile, né si presta all’apporto di autentiche migliorie e innovazioni da parte di sviluppatori terzi.
Altro mito da sfatare, di cui una stampa a dir poco approssimativa è complice, è il mancato ricorso ai prodotti di punta di Nvidia per alimentare l’AI cinese: se, da un lato, è vero che la startup è stata fondata appena nell’estate 2023, è altrettanto vero che Wenfeng, tramite il fondo di investimenti cinese High-Flyer, ha ricevuto già da diversi anni i capitali necessari ad acquisire una flotta intera delle più potenti GPU prodotte da Nvidia – come le A100, principale modello soggetto al ban statunitense. Come riportato da Associated Press – a cui va un plauso per aver fatto egregiamente il proprio lavoro, a differenza di tanti colleghi – alcuni media cinesi avevano dato notizia dell’acquisto di 10.000 unità di chip A100 da parte di Wenfeng nel 2022, a pochi mesi dall’entrata in vigore del ban. La vicenda, di cruciale importanza, è confermata anche dal MIT Technology Review nel suo articolo su come DeepSeek sia riuscita ad aggirare le sanzioni americane, che riporta le stime di esperti che sostengono che le unità a disposizione dell’azienda arrivino addirittura a quota 50.000. D’altronde, già a marzo 2024, un interessante approfondimento di Marco Silvestri su Tom’s Hardware illustrava in modo dettagliato come anche l’altro modello di punta di casa Nvidia, l’H100, sia assolutamente diffuso in Cina, a dispetto del divieto alle esportazioni.
Un miracolo di efficienza o uno strumento di propaganda cinese?
Dubbi e perplessità non finiscono qui, date le preoccupazioni sull’imparzialità e l’obiettività di un modello linguistico strettamente sottoposto a censura da parte del Governo di Pechino, con il chatbot che evita accuratamente di rispondere a domande su questioni politiche su cui il Partito ha posto il veto. Poco male, penserà qualcuno: di certo, sarebbe ottuso pretendere di informarsi sulla situazione di Taiwan, sul trattamento riservato agli uiguri o sui fatti di Piazza Tienanmen tramite il chatbot di un’AI cinese. Peccato, però, che il bias e la manipolazione si estendano certamente a gran parte delle risposte fornite dal bot, anche quando non lo sospetteremmo. D’altro canto, come già menzionato, non essendo DeepSeek realmente open source, non vi è modo di sapere con quali dati e in che modo è stato addestrato. Sotto questa luce, lo scenario in cui il modello linguistico in questione assume i connotati di un braccio armato di propaganda cinese è ben più che una suggestione o una preoccupazione infondata. Al contempo, vi sarebbe la questione del trattamento dei dati e della privacy: aspetto di non poco conto, visto che, nelle condizioni d’uso del servizio, è dichiarato a chiare lettere che l’AI monitora l’indirizzo IP, il modello di dispositivo utilizzato e perfino le battute dell’utente sulla tastiera – dati che non vi è modo di sapere dove e in che modo possano essere usati, con il concreto timore che finiscano direttamente nelle mani del Governo cinese.
Insomma, DeepSeek appare come un miracolo di efficienza e un’innovazione prorompente solo se si accolgono acriticamente tutte le dichiarazioni dei suoi creatori, diffuse da un Paese – è bene ricordarlo – sulle cui affermazioni è ben difficile fare fact checking per via dell’esteso e oppressivo controllo governativo su tutte le informazioni, sia internamente che esternamente. Dovremmo, in definitiva, accogliere supinamente il verbo del CEO della startup in tema di fondi necessari ad addestrare i suoi modelli di punta, senza ipotizzare ingenti e strategici finanziamenti “occultati” da parte del Governo cinese. Allo stesso modo, dovremmo credere alla versione dell’azienda sulle ragioni per cui, attualmente, sono chiuse le nuove registrazioni al servizio, adducendo come motivazione degli attacchi informatici, senza minimamente interrogarci sulla reale capacità delle infrastrutture di DeepSeek di gestire un traffico dati paragonabile a quello retto quotidianamente, senza battere ciglio, dai principali competitor statunitensi.
Comprensibilmente, al mercato, ossia agli utenti finali, di tutto questo non importa: gli individui sono costantemente mossi dalla massimizzazione della propria utilità e DeepSeek, allo stato attuale, rappresenta un risparmio di 20 dollari/euro mensili sull’abbonamento Plus e di 200 sul pacchetto Pro di ChatGPT, e questo è tutto ciò che conta. Che rappresenti un bluff o un’autentica innovazione, oggi DeepSeek incarna quel che l’economista austriaco Joseph Schumpeter definiva la “distruzione creatrice”: quel processo reso possibile solamente dal mercato e dal sistema di produzione capitalistico, ossia quella “mutazione industriale che rivoluziona incessantemente la struttura economica dall’interno, distruggendo senza sosta quella vecchia e creando sempre una nuova”. È il miracolo della concorrenza, della competizione: ora, riprendendo la differenza operata dallo stesso Schumpeter tra invenzione e innovazione, i colossi dell’AI statunitense hanno un ulteriore incentivo a inventare nuove soluzioni, sapendo che la loro posizione di dominio è minacciata da un concorrente che ha apportato un’innovazione che il mercato stima – a prescindere da come vi sia riuscito.
Ci rincresce constatare che in questa nuova frontiera – ricca di implicazioni per le relazioni internazionali – in cui l’America inventa e la Cina innova, l’Unione Europea regolamenta passivamente, senza alcuna capacità di prendere parte alla corsa con aziende proprie, in un inferno di regole e restrizioni che rendono impossibile fare impresa. Come argomentato nella nostra analisi, l’AI Act pretende di regolamentare un settore che in Europa, per colpa di policy ottuse, semplicemente non è pervenuto. Invertire la rotta prima che diventi troppo tardi, come chiesto a gran voce dalle autorità francesi a quelle di Bruxelles, è l’unica soluzione per non perdere l’ultimo treno della competitività globale, da cui il Vecchio Continente è già tagliato fuori su tanti settori: basti pensare all’automotive che, come abbiamo analizzato, giace agonizzante sotto i colpi della concorrenza tanto di Washington, quanto di Pechino.