DeepSeek R2 arriverà prima del previsto: cosa aspettarsi e i possibili effetti su ChatGPT
Lo sviluppo dell'intelligenza artificiale prosegue a ritmi vertiginosi: ora è la volta di DeepSeek, che avrebbe intenzione di lanciare il...L'articolo DeepSeek R2 arriverà prima del previsto: cosa aspettarsi e i possibili effetti su ChatGPT sembra essere il primo su Smartworld.

Lo sviluppo dell'intelligenza artificiale prosegue a ritmi vertiginosi: ora è la volta di DeepSeek, che avrebbe intenzione di lanciare il suo modello di ragionamento R2 molto prima del previsto.
Lo ha riportato ieri Reuters, che ha citato tre fonti anonime che "hanno familiarità con l'azienda". A quanto pare, DeepSeek aveva pianificato di rilasciare R2 all'inizio di maggio, ma secondo due dei contatti del portale di informazione ora lo vuole sul mercato il prima possibile.
Cosa aspettarsi, perché questa fretta e cosa comporterà per il mondo dell'IA? Difficile fare previsioni, ma cerchiamo di mettere qualche punto fermo.
Come ricorderete, il lancio di DeepSeek R1 aveva causato un vero e proprio terremoto nelle borse mondiali. Il motivo? Un'elevatissima efficienza grazie all'utilizzo di tecniche come Mixture-of-Experts (MoE) e Multihead Latent Attention (MLA), che consentono di offrire tariffe molto più basse dei concorrenti (leggasi, ChatGPT).
La spinta evolutiva per cercare la massima efficienza era stata motivata dal ban degli Stati Uniti nel 2022 sull'esportazione di tecnologia americana in Cina, che ha comportato il divieto di comprare i chip A100 di NVIDIA, necessari per l'addestramento dell'IA.
Erano sorte però anche polemiche, come quella di OpenAI che accusava l'azienda cinese di aver "distillato" i suoi modelli per addestrare DeepSeek (a proposito, leggetevi questo divertentissimo articolo di Marina Hyde del Guardian), o di Google, che aveva commentato come esageratamente basse le dichiarazioni sui costi di addestramento del modello (appena 5,6 milioni di dollari, secondo quanto dichiarato).
O come quella del CEO di Scale AI Alexandr Wang, secondo il quale DeepSeek avrebbe comunque fino a 50.000 chip NVIDIA nonostante il divieto.
Nondimeno, DeepSeek R1 ha scosso il mondo, funziona bene, e in Cina ha il supporto del presidente Xi Jinping. Tanto che almeno 13 governi cittadini e 10 società energetiche statali cinesi lo utilizzano, oltre a Lenovo, Baidu e Tencent. Senza parlare del successo in occidente, con Microsoft che ha aggiunto il modello ad Azure AI Foundry e su GitHub, e Amazon al suo catalogo degli Amazon Web Services (AWS).
Difficilmente DeepSeek R2 causerà lo stesso shock del predecessore, ma ci si aspetta che porti miglioramenti nella programmazione e dovrebbe essere in grado di ragionare in lingue diverse dall'inglese.
Sembra un aggiornamento marginale, sulla carta, ma sono funzioni importantissime. Come abbiamo visto nei recenti annunci di Anthropic e Google, l'IA sta investendo tantissimo nel settore della programmazione, e la capacità di ragionare in più lingue consentirà una maggiore diffusione di un modello già popolarissimo.
Non sappiamo i motivi di questa accelerazione da parte di DeepSeek, ma probabilmente ha a che fare con i recenti annunci di OpenAI e Anthropic. L'arrivo di ChatGPT 4.5 e 5 ha probabilmente messo fretta al gigante cinese, che adesso metterà a sua volta ancora più pressione all'avversario americano.
Con ChatGPT 4.5 atteso nelle prossime settimane e ChatGPT 5 nei prossimi mesi possiamo attenderci un'accelerazione anche da parte di OpenAI? Non è impossibile ipotizzarlo.
L'IA ormai è un diventata un fattore importantissimo anche nella geopolitica, quasi alla stregua della corsa allo spazio negli anni '60. E l'appoggio del Governo cinese a DeepSeek (la cui app è stata bannata in Italia e Corea del Sud) aggiunge ulteriore pressione agli altri Paesi, che potrebbero vederlo come un ulteriore motivo per aumentare le restrizioni sui chip AI o sulle collaborazioni software, secondo Stephen Wu dell'hedge fund Carthage Capital.
Per quanto riguarda gli Stati Uniti, la posizione dell'amministrazione Trump è chiara: Musk, Altman e gli altri big della tecnologia sono tra i favoriti e quelli su cui si punterà maggiormente.
L'articolo DeepSeek R2 arriverà prima del previsto: cosa aspettarsi e i possibili effetti su ChatGPT sembra essere il primo su Smartworld.