AI, il cinese DeepSeek stravolge il mercato, forte come gli americani costa una frazione
pubblicato:Terremoto nel tech mondiale, la nuova AI cinese è riuscita a fare come i migliori di Wall Street con investimenti per meno di 6 milioni di dollari. Consumerebbe meno energia e si baserebbe su vecchi chip Nvidia. Il tech occidentale crolla, in forse gli investimenti miliardari statunitensi
Briscola cinese nell’AI. DeepSeek, la nuova intelligenza artificiale made in China sbaraglia la partita dell’hype più effervescente degli ultimi anni, quello dell’artificial intelligence made in USA.
Lunedì scorso infatti la società di intelligenza artificiale fondata da Liang Wenfeng ha lanciato la sua prima release per il mercato, la DeepSeek R1 annunciando performance e risultati capaci di scombinare le prospettive per l’intero settore e scuotere le quotazioni delle magnifiche 7 e non solo.
Il nuovo large language model (LLM) di stanza a Hangzhou sarebbe in grado di fare meglio di ChatGPT pur impiegando chip meno potenti e meno energivori di quelli richiesti dai server dell’AI più famosa del mondo. La politica internazionale, che all’intelligenza artificiale si è sempre più strettamente legata da quando gli Stati Uniti hanno avviato un bando alla vendita di tecnologie strategiche per il settore alla Cina sotto Biden, potrebbe paradossalmente avere incentivato DeepSeek a raggiungere i sorprendenti risultati annunciati.
DeepSeek, i vincoli alla Cina sull'AI l'avrebbero costretta all'efficienza
Infatti la difficoltà di ottenere i chip di Nvidia più performanti per i server avrebbe costretto il fondo High-Flyer creato da Liang già nel 2015 a cercare di consumare la minor quantità di energia possibile, di ridurre i costosi processi di calcolo all’essenziale.
Il fondo High-Flyer, un fondo "quant" creato da un trio di studenti di data science si era già fatto notare dal Wall Street Journal per una serie di interventi tramite intelligenza artificiale nel mercato dei titoli in yuan e aveva dichiarato asset in gestione per 9,4 miliardi di dollari.
L’avrebbe insomma costretta all’efficienza per la mancanza di quella materia prima che in questo ambito sono i chip. Secondo la testata cinese 36Kr specializzata in tecnologia e finanza, High-Flyer avrebbe avuto a disposizione soltanto 10 mila chip H100 di Nvidia a causa della stretta di Biden sull’esportazione delle tecnologie strategiche verso la Repubblica Popolare, ma su X Dylan Patel, il fondatore della società di ricerca indipendente SemiAnalysis, ha risposto piccato a queste voci che DeepSeek deve avere almeno 50 mila chip Hopper di Nvidia a disposizione. In particolare si tratterebbe degli H800, una versione già modificata degli H100 di Nvidia realizzata per aggirare le barriere con la Repubblica Popolare e in seguito divenuta anch'essa oggetto di bando Usa.
Così si arriva all’intervista di Alexandr Wang, CEO di Scale AI, un giovane miliardario che fornisce dati per l’addestramento dei modelli di intelligenza artificiale di colossi come OpenAI, Google e Meta al World Economic Forum di Davos. “Quello che abbiamo trovato in DeepSeek… sono le migliori performance, almeno alla pari di quelle dei migliori player statunitensi”.
Aggiungendo che c’è bisogno di liberare l’energia statunitense per diffondere davvero le potenzialità dell’intelligenza artificiale e raggiungere in un decennio l’obiettivo di un trilione di dollari di ricavi per questo mercato.
DeepSeek, meno energia, meno consumi, meno costi e investimenti
Ma la vera novità di DeepSeek sarebbe soprattutto sul fronte energetico, perché questa app riuscirebbe a raggiungere i risultati dei big Usa con molta, molta meno energia. Al punto che il Financial Times si è lanciato su una domanda particolarmente pungente: la nuova AI cinese mette in dubbio la spesa statunitense per l’AI. Dopo il recente caso di Stargate, il dubbio è più che legittimo.
Meno chip – senza neanche il nuovo Blackwell di Nvidia - e meno energia insomma per le stesse performance. Una notizia decisiva, se si considera che secondo UBS il big tech USA ha investito 224 miliardi di dollari l’anno scorso in AI ed era proiettata per spenderne almeno 280 miliardi quest’anno.
In molti ci credono già. Il venture capitalist statunitense Marc Andreessen ha affermato che Deepseek R1 è una delle più sorprendenti e impressionanti svolte che abbia mai visto e, in quanto open source, un grande regalo al mondo.
Il modello di DeepSeek sarebbe quello della “chain of thought”, letteralmente “catena di pensiero”, un approccio all’AI che, spiega un post di IBM, punta a replicare il modello di ragionamento dell’essere umano facilitando il sistema di risoluzione dei problemi (systematic problem-solving) attraverso una coerente serie di deduzioni logiche. Un sistema già visto nel settore e che rispetto al prompt chaining sarebbe meno focalizzato sull’obiettivo di fornire risposte coerenti e sensate rispetto a quello di costruire una sequenza logica di argomenti.
Di DeepSeek R1, non si sa tantissimo, oltre quel che è stato pubblicato con la release. Come la versione precedente V3 avrebbe 671 miliardi di parametri in totale, ma si sarebbe molto giovata dei meccanismi di Reinforcement Learning (RL). Su Medium Isaak Kamau fa un'analisi più approfondita.
Dimitris Papailiopoulos, ricercatore del laboratorio di Microsoft AI Frontiers, in un articolo sul tema della Mit Technology Review, spiega: “DeepSeek ha puntato a risposte accurate invece che al dettaglio di ogni passaggio logico, riducendo significativamente il tempo di calcolo, ma mantenendo un alto livello di efficacia”.
DeepSeek, l'AI dalla Cina ha già creato un terzo dei large language model del mondo
Ma questo impetuoso successo di DeepSeek non nasce dal nulla e neanche il suo modello open source, infatti la China Academy of Information and Communications Technology calcola che se sono stati ben 1.328 i large language model usciti nel mondo, il 36% è provenuto dalla Cina.
Sarebbe comunque stati appena 6 milioni di dollari, gli investimenti in DeepSeek. Roba da mal di pancia per Microsoft & Co.
Un articolo su Forbes del senior contributor per i temi del Tech e dell’AI Janakiram MSV ricostruisce la storia di DeepSeek e sottolinea la partnership strategica con il colosso dei chip AMD i cui microprocessori sono stati impiegati per la versione DeepSeek-V3 precedente all’ultima R1.
Ma sottolinea appunto anche lo scopo dell’efficienza energetica, computazionale ed economica, che ha accompagnato le varie fasi di sviluppo di questa AI, con appena 5,5 milioni di dollari investiti nel training del modello V3, una frazione appena dei costi sostenuti per esempio dai modelli di Meta e che si traduce in costi alla clientela decisamente inferiori.
La fonte dei costi da 5,6 milioni di dollari per il training dei modelli è sempre la stessa DeepSeek e al momento non si ha una grande visibilità sul prodotto, ma i risultati in pratica sembrano esserci e il mercato sta ribaltando le prospettive di costo dell’AI su vari fronti.
DeepSeek, su Apple Store la domanda dell'app supera ChatGPT e intanto il tech occidentale crolla in Borsa
La domanda dei modelli AI di DeepSeek già dilaga. Nell’App Store di Apple DeepSeek avrebbe già battuto la domanda di ChatGPT. Il terremoto sui mercati è già in corso. Stamane l’Euro Stoxx Tech cede appena lo 0,40%, ma ASML, il colosso olandese delle stampanti di chip, perde l’11,62% e torna a 619 euro ed STM segna un calo del 2,8% Prysmian, che di recente aveva guadagnato terreno dall’impegno a un maggiore commitment nelle opportunità dei server statunitensi per l’intelligenza artificiale, perde un corposo -8,08%
A Wall Street intanto si preparano sfracelli con un -3,58% del future sul Nasdaq 100 mentre in Asia i crolli di Fujikura (-10,66%) e di Sumitomo Electric (-5,35%), big dei semiconduttori in passato incoraggiati dalla domanda di server, hanno già assorbito i colpi di questa nuova partita.
Ovviamente la tempistica della nuova release cinese, subito dopo l’insediamento di Trump e nel mezzo dei primi cauti abboccamenti tra l’elite politica cinese e la nuova amministrazione Usa, non è passata inosservata e fa parte di questo nuovo scenario in cui la Cina, dopo i successi incontestati nel campo dell’auto elettrica e dei pannelli fotovoltaici, rischia di sbaragliare la concorrenza occidentale anche sul fronte dell’intelligenza artificiale.
Forse ricordando che già nel 2017 la Cina realizzò il computer più veloce del mondo, il Tianhe-1A, si sarebbe potuto immaginare questo nuovo successo, o qualcosa di simile. Di certo gli analisti adesso passeranno al vaglio non solo le performance della nuova cheap AI cinese, ma anche gli investimenti delle big tech statunitensi alla luce dei loro risultati, finalmente comparabili con un player che viene dall’altra parte del mondo.