Stability AI ora può creare video partendo da un testo

Stable Video Diffusion demos
(Immagine:: Stability AI)

Stability AI, lo sviluppatore di Stable Diffusion, presenta in anteprima una nuova AI generativa in grado di creare video di breve durata a seguito di una richiesta testuale.

Chiamata Stable Video Diffusion, è composta da due modelli di IA (SVD e SVD-XT) ed è in grado di creare clip con una risoluzione di 576 x 1.024 pixel. Gli utenti potranno personalizzare la velocità del frame rate, che può variare da 3 a 30 FPS. La lunghezza dei video dipende da quale dei due modelli viene scelto. Se si seleziona SVD, il contenuto verrà riprodotto per 14 fotogrammi, mentre SVD-XT estende la durata a 25 fotogrammi. La lunghezza non ha molta importanza, poiché i clip renderizzati vengono riprodotti solo per circa quattro secondi prima di terminare.

L'azienda ha pubblicato sul proprio canale YouTube un video che mostra ciò che Stable Video Diffusion è in grado di fare e i contenuti sono sorprendentemente di alta qualità.

Primi passi

Secondo quanto riferito, Stable Video Diffusion non è in grado di "raggiungere un fotorealismo perfetto", non può generare "testo leggibile" e ha difficoltà con i volti. Un'altra dimostrazione sul sito web di Stability AI mostra che il suo modello è in grado di renderizzare il volto di un uomo senza strani difetti, quindi potrebbe essere un caso a parte.

Tenete presente che questo progetto è ancora nelle fasi iniziali. È ovvio che il modello non è pronto per un rilascio su larga scala, né ci sono piani per farlo. Stability AI sottolinea che al momento Stable Video Diffusion non è destinato "ad applicazioni reali o commerciali". Anzi, al momento è "destinato solo a scopi di ricerca". Non ci sorprende che lo sviluppatore sia molto cauto con la sua tecnologia. L'anno scorso si è verificato un incidente in cui il modello di Stability Diffusion è trapelato online, portando a malintenzionati che lo hanno utilizzato per creare immagini falsificate.

Disponibilità

Se siete interessati a provare Stable Video Diffusion, potete entrare in lista d'attesa compilando un modulo sul sito web dell'azienda. Non si sa quando sarà possibile accedere, ma l'anteprima includerà un'interfaccia Text-To-Video. Nel frattempo, è possibile consultare il white paper dell'AI e leggere tutti i dettagli del progetto. 

Una cosa che abbiamo trovato interessante dopo aver esaminato il documento è che si parla dell'utilizzo di "set di dati video pubblicamente accessibili" come parte del materiale di addestramento. Anche in questo caso, non è una sorpresa sentirlo dire, visto che all'inizio dell'anno Getty Images ha fatto causa a Stability AI per accuse di scraping di dati. Sembra che il team stia cercando di essere più attento per non farsi altri nemici.

Potrebbe interessarti anche

Giulia Di Venere è Editor Senior per TechRadar Italia e lavora con orgoglio al progetto da quando è nato.

Laureata in Lingue e Letterature Straniere all’Università Ca’ Foscari di Venezia, è una grande appassionata di cinema, libri, cucina e cinofilia.

Da sempre considera la scrittura lo strumento più efficace per comunicare, e scrivere per fare informazione, ogni giorno, è per lei motivo di grande soddisfazione.

Copre una grande varietà di tematiche, dagli smartphone ai gadget tecnologici per la casa, gestendo la pubblicazione dei contenuti editoriali e coordinando le attività della redazione.

Dalla personalità un po’ ambivalente, ama viaggiare tanto quanto passare il tempo libero nella tranquillità della propria casa, in compagnia del suo cane e di un buon libro.

Con il supporto di