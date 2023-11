Stability AI, lo sviluppatore di Stable Diffusion, presenta in anteprima una nuova AI generativa in grado di creare video di breve durata a seguito di una richiesta testuale.

Chiamata Stable Video Diffusion, è composta da due modelli di IA (SVD e SVD-XT) ed è in grado di creare clip con una risoluzione di 576 x 1.024 pixel. Gli utenti potranno personalizzare la velocità del frame rate, che può variare da 3 a 30 FPS. La lunghezza dei video dipende da quale dei due modelli viene scelto. Se si seleziona SVD, il contenuto verrà riprodotto per 14 fotogrammi, mentre SVD-XT estende la durata a 25 fotogrammi. La lunghezza non ha molta importanza, poiché i clip renderizzati vengono riprodotti solo per circa quattro secondi prima di terminare.

L'azienda ha pubblicato sul proprio canale YouTube un video che mostra ciò che Stable Video Diffusion è in grado di fare e i contenuti sono sorprendentemente di alta qualità.

Primi passi

Secondo quanto riferito, Stable Video Diffusion non è in grado di "raggiungere un fotorealismo perfetto", non può generare "testo leggibile" e ha difficoltà con i volti. Un'altra dimostrazione sul sito web di Stability AI mostra che il suo modello è in grado di renderizzare il volto di un uomo senza strani difetti, quindi potrebbe essere un caso a parte.

Tenete presente che questo progetto è ancora nelle fasi iniziali. È ovvio che il modello non è pronto per un rilascio su larga scala, né ci sono piani per farlo. Stability AI sottolinea che al momento Stable Video Diffusion non è destinato "ad applicazioni reali o commerciali". Anzi, al momento è "destinato solo a scopi di ricerca". Non ci sorprende che lo sviluppatore sia molto cauto con la sua tecnologia. L'anno scorso si è verificato un incidente in cui il modello di Stability Diffusion è trapelato online, portando a malintenzionati che lo hanno utilizzato per creare immagini falsificate.

Disponibilità

Se siete interessati a provare Stable Video Diffusion, potete entrare in lista d'attesa compilando un modulo sul sito web dell'azienda. Non si sa quando sarà possibile accedere, ma l'anteprima includerà un'interfaccia Text-To-Video. Nel frattempo, è possibile consultare il white paper dell'AI e leggere tutti i dettagli del progetto.

Una cosa che abbiamo trovato interessante dopo aver esaminato il documento è che si parla dell'utilizzo di "set di dati video pubblicamente accessibili" come parte del materiale di addestramento. Anche in questo caso, non è una sorpresa sentirlo dire, visto che all'inizio dell'anno Getty Images ha fatto causa a Stability AI per accuse di scraping di dati. Sembra che il team stia cercando di essere più attento per non farsi altri nemici.

