Microsoft svela i suoi piani per un'infrastruttura AI su scala mondiale

A digital face in profile against a digital background.
(Immagine:: Shutterstock / Ryzhi)

Microsoft ha presentato Singularity, il suo nuovo progetto per la gestione dei carichi di lavoro AI su "scala mondiale".

Come si legge nel documento tecnico , Singularity “è un nuovo sistema di pianificazione dei carichi di lavoro in grado di preimpostare in modo trasparente e scalare elasticamente i carichi di lavoro di deep learning senza impattare sulle prestazioni in una rete globale di acceleratori AI”.

In parole semplici, si tratta di un sistema pensato per accertarsi che il network globale dei server venga utilizzato in maniera ottimale in modo da ridurre i costi e i tempi associati ai carichi di lavoro AI.

Microsoft Singularity

Il progetto Singularity mira al ridimensionamento dei flussi di lavoro AI tramite la redistribuzione dei carichi su un'infrastruttura globale.

Come spiegato nel documento diffuso da Microsoft, i flussi di lavoro si possono redistribuire su diversi cluster o data center senza interruzioni, ottimizzandone ampiamente la gestione. Inoltre è possibile scalarli elasticamente per trarre vantaggio dal tipo e dal numero di acceleratori AI necessari.

La bellezza di questo approccio, dice Microsoft, è che non richiede alcun intervento aggiuntivo da parte degli sviluppatori, dato che non sono richieste modifiche nel codice necessario all'implementazione di Singularity.

Pe realizzare questo ambizioso progetto, Microsoft ha dovuto trovare un modo per separare i carichi di lavoro dalle risorse hardware. A tale scopo l'azienda ha utilizzato un "proxy" in grado di stabilire un livello di separazione che permette una distribuzione fluida delle risorse.

"Singularity rappresenta un significativo passo avanti nella programmazione dei carichi di lavoro di deep learning, convertendo le caratteristiche di nicchia come l'elasticità in caratteristiche mainstream e always-on su cui lo scheduler può fare affidamento per l'implementazione di SLA rigorosi".

"Singularity consente livelli di fungibilità del carico di lavoro mai raggiunti, consentendo di sfruttare risorse distribuite a livello globale".

Anche se il servizio di pianificazione è il punto focale del documento, gli autori affermano che il sistema è progettato per scalare su una flotta di centinaia di migliaia di GPU e altri acceleratori AI.

Al momento non ci sono notizie sulla data di inizio dei lavori, ma abbiamo chiesto un approfondimento a Microsoft e vi aggiorneremo non appena avremo certezze a riguardo.

Joel Khalili
News and Features Editor

Joel Khalili is the News and Features Editor at TechRadar Pro, covering cybersecurity, data privacy, cloud, AI, blockchain, internet infrastructure, 5G, data storage and computing. He's responsible for curating our news content, as well as commissioning and producing features on the technologies that are transforming the way the world does business.