DeepSeek in difficoltà: R2 slitta per problemi hardware

DeepSeek
(Immagine:: Getty Images)

Il colosso cinese dell’intelligenza artificiale DeepSeek avrebbe incontrato ritardi imprevisti nel rilascio del suo nuovo modello, R2, a causa di persistenti difficoltà tecniche con i chip Ascend di Huawei.

L’azienda era stata spinta dalle autorità cinesi ad adottare processori domestici, evitando di fare affidamento sui sistemi H20 di Nvidia, considerati generalmente più maturi e affidabili.

Nonostante il supporto diretto degli ingegneri Huawei, DeepSeek non è riuscita a completare con successo una sessione di addestramento con i chip Ascend. Di conseguenza, ha scelto di utilizzare l’hardware Nvidia per la fase di training, riservando gli Ascend alle operazioni di inferenza.

Technical challenges delay R2 development

Il lancio di R2, inizialmente previsto per maggio 2025, è stato rinviato a causa di ostacoli tecnici e dei tempi più lunghi del previsto per l’etichettatura dei dati destinati al nuovo dataset di addestramento.

Il fondatore di DeepSeek, Liang Wenfeng, avrebbe espresso insoddisfazione per i progressi del modello, sottolineando la necessità di ulteriore tempo di sviluppo per realizzare un sistema in grado di mantenere il vantaggio competitivo dell’azienda.

Nel frattempo, concorrenti come Qwen3 di Alibaba hanno saputo approfittare del ritardo, integrando i principali algoritmi di training di DeepSeek e migliorandone efficienza e flessibilità. Un segnale di quanto velocemente possano evolvere gli ecosistemi di IA anche quando una singola startup incontra difficoltà.

La spinta di Pechino verso l’autosufficienza nel settore IA ha messo sotto pressione le aziende locali affinché adottino hardware domestico. Tuttavia, questa strategia ha messo in luce differenze in termini di stabilità, connettività tra chip e maturità software tra i prodotti Huawei e quelli Nvidia.

Gli sviluppatori restano una componente chiave per il successo degli ecosistemi di intelligenza artificiale. Nvidia ha ribadito quanto sia strategicamente importante mantenere l’accesso agli sviluppatori cinesi, avvertendo che limitare l’adozione delle tecnologie potrebbe danneggiare sia la sicurezza economica sia quella nazionale.

Le aziende cinesi di IA, intanto, si trovano a dover bilanciare le pressioni governative con le esigenze pratiche legate allo sviluppo e alla distribuzione dei modelli linguistici di grandi dimensioni. Nonostante le difficoltà, il modello R2 di DeepSeek potrebbe comunque essere rilasciato nelle prossime settimane. La sua performance, rispetto ai rivali addestrati su hardware più maturo, sarà probabilmente sotto stretta osservazione, offrendo un chiaro esempio della tensione tra ambizioni politiche, capacità tecniche e applicazioni reali dell’IA.

Via Arstechnica

Nato nel 1995 e cresciuto da due genitori nerd, non poteva che essere orientato fin dalla tenera età verso un mondo fatto di videogiochi e nuove tecnologie. Fin da piccolo ha sempre esplorato computer e gadget di ogni tipo, facendo crescere insieme a lui le sue passioni. Dopo aver completato gli studi, ha lavorato con diverse realtà editoriali, cercando sempre di trasmettere qualcosa in più oltre alla semplice informazione. Amante del cioccolato fondente, continua a esplorare nuove frontiere digitali, mantenendo sempre viva la sua curiosità e la sua dedizione al settore.