Stability AI ora può creare video partendo da un testo

(Immagine:: Stability AI)

Stability AI, lo sviluppatore di Stable Diffusion, presenta in anteprima una nuova AI generativa in grado di creare video di breve durata a seguito di una richiesta testuale.

Chiamata Stable Video Diffusion, è composta da due modelli di IA (SVD e SVD-XT) ed è in grado di creare clip con una risoluzione di 576 x 1.024 pixel. Gli utenti potranno personalizzare la velocità del frame rate, che può variare da 3 a 30 FPS. La lunghezza dei video dipende da quale dei due modelli viene scelto. Se si seleziona SVD, il contenuto verrà riprodotto per 14 fotogrammi, mentre SVD-XT estende la durata a 25 fotogrammi. La lunghezza non ha molta importanza, poiché i clip renderizzati vengono riprodotti solo per circa quattro secondi prima di terminare.

L'azienda ha pubblicato sul proprio canale YouTube un video che mostra ciò che Stable Video Diffusion è in grado di fare e i contenuti sono sorprendentemente di alta qualità.

Primi passi

Secondo quanto riferito, Stable Video Diffusion non è in grado di "raggiungere un fotorealismo perfetto", non può generare "testo leggibile" e ha difficoltà con i volti. Un'altra dimostrazione sul sito web di Stability AI mostra che il suo modello è in grado di renderizzare il volto di un uomo senza strani difetti, quindi potrebbe essere un caso a parte.

Tenete presente che questo progetto è ancora nelle fasi iniziali. È ovvio che il modello non è pronto per un rilascio su larga scala, né ci sono piani per farlo. Stability AI sottolinea che al momento Stable Video Diffusion non è destinato "ad applicazioni reali o commerciali". Anzi, al momento è "destinato solo a scopi di ricerca". Non ci sorprende che lo sviluppatore sia molto cauto con la sua tecnologia. L'anno scorso si è verificato un incidente in cui il modello di Stability Diffusion è trapelato online, portando a malintenzionati che lo hanno utilizzato per creare immagini falsificate.

Disponibilità

Se siete interessati a provare Stable Video Diffusion, potete entrare in lista d'attesa compilando un modulo sul sito web dell'azienda. Non si sa quando sarà possibile accedere, ma l'anteprima includerà un'interfaccia Text-To-Video. Nel frattempo, è possibile consultare il white paper dell'AI e leggere tutti i dettagli del progetto.

Una cosa che abbiamo trovato interessante dopo aver esaminato il documento è che si parla dell'utilizzo di "set di dati video pubblicamente accessibili" come parte del materiale di addestramento. Anche in questo caso, non è una sorpresa sentirlo dire, visto che all'inizio dell'anno Getty Images ha fatto causa a Stability AI per accuse di scraping di dati. Sembra che il team stia cercando di essere più attento per non farsi altri nemici.

Primi passi

Disponibilità

Get the best Black Friday deals direct to your inbox, plus news, reviews, and more.

Potrebbe interessarti anche

Più popolari