Microsoft svela i suoi piani per un'infrastruttura AI su scala mondiale

(Immagine:: Shutterstock / Ryzhi)

Microsoft ha presentato Singularity, il suo nuovo progetto per la gestione dei carichi di lavoro AI su "scala mondiale".

Come si legge nel documento tecnico , Singularity “è un nuovo sistema di pianificazione dei carichi di lavoro in grado di preimpostare in modo trasparente e scalare elasticamente i carichi di lavoro di deep learning senza impattare sulle prestazioni in una rete globale di acceleratori AI”.

In parole semplici, si tratta di un sistema pensato per accertarsi che il network globale dei server venga utilizzato in maniera ottimale in modo da ridurre i costi e i tempi associati ai carichi di lavoro AI.

Microsoft Singularity

Il progetto Singularity mira al ridimensionamento dei flussi di lavoro AI tramite la redistribuzione dei carichi su un'infrastruttura globale.

Come spiegato nel documento diffuso da Microsoft, i flussi di lavoro si possono redistribuire su diversi cluster o data center senza interruzioni, ottimizzandone ampiamente la gestione. Inoltre è possibile scalarli elasticamente per trarre vantaggio dal tipo e dal numero di acceleratori AI necessari.

La bellezza di questo approccio, dice Microsoft, è che non richiede alcun intervento aggiuntivo da parte degli sviluppatori, dato che non sono richieste modifiche nel codice necessario all'implementazione di Singularity.

Pe realizzare questo ambizioso progetto, Microsoft ha dovuto trovare un modo per separare i carichi di lavoro dalle risorse hardware. A tale scopo l'azienda ha utilizzato un "proxy" in grado di stabilire un livello di separazione che permette una distribuzione fluida delle risorse.

"Singularity rappresenta un significativo passo avanti nella programmazione dei carichi di lavoro di deep learning, convertendo le caratteristiche di nicchia come l'elasticità in caratteristiche mainstream e always-on su cui lo scheduler può fare affidamento per l'implementazione di SLA rigorosi".

"Singularity consente livelli di fungibilità del carico di lavoro mai raggiunti, consentendo di sfruttare risorse distribuite a livello globale".

Anche se il servizio di pianificazione è il punto focale del documento, gli autori affermano che il sistema è progettato per scalare su una flotta di centinaia di migliaia di GPU e altri acceleratori AI.

Al momento non ci sono notizie sulla data di inizio dei lavori, ma abbiamo chiesto un approfondimento a Microsoft e vi aggiorneremo non appena avremo certezze a riguardo.

Marco Silvestri è un Senior Editor di Techradar Italia dal 2020. Appassionato di fotografia e gaming, ha assemblato il suo primo PC all'età di 12 anni e, da allora, ha sempre seguito con passione l'evoluzione del settore tecnologico. Quando non è impegnato a scrivere guide all'acquisto e notizie per Techradar passa il suo tempo sulla tavola da skate, dietro la lente della sua fotocamera o a scarpinare tra le vette del Gran Sasso.