Stability AI ora può creare video partendo da un testo

Stable Video Diffusion demos
(Immagine:: Stability AI)

Stability AI, lo sviluppatore di Stable Diffusion, presenta in anteprima una nuova AI generativa in grado di creare video di breve durata a seguito di una richiesta testuale.

Chiamata Stable Video Diffusion, è composta da due modelli di IA (SVD e SVD-XT) ed è in grado di creare clip con una risoluzione di 576 x 1.024 pixel. Gli utenti potranno personalizzare la velocità del frame rate, che può variare da 3 a 30 FPS. La lunghezza dei video dipende da quale dei due modelli viene scelto. Se si seleziona SVD, il contenuto verrà riprodotto per 14 fotogrammi, mentre SVD-XT estende la durata a 25 fotogrammi. La lunghezza non ha molta importanza, poiché i clip renderizzati vengono riprodotti solo per circa quattro secondi prima di terminare.

L'azienda ha pubblicato sul proprio canale YouTube un video che mostra ciò che Stable Video Diffusion è in grado di fare e i contenuti sono sorprendentemente di alta qualità.

Primi passi

Secondo quanto riferito, Stable Video Diffusion non è in grado di "raggiungere un fotorealismo perfetto", non può generare "testo leggibile" e ha difficoltà con i volti. Un'altra dimostrazione sul sito web di Stability AI mostra che il suo modello è in grado di renderizzare il volto di un uomo senza strani difetti, quindi potrebbe essere un caso a parte.

Tenete presente che questo progetto è ancora nelle fasi iniziali. È ovvio che il modello non è pronto per un rilascio su larga scala, né ci sono piani per farlo. Stability AI sottolinea che al momento Stable Video Diffusion non è destinato "ad applicazioni reali o commerciali". Anzi, al momento è "destinato solo a scopi di ricerca". Non ci sorprende che lo sviluppatore sia molto cauto con la sua tecnologia. L'anno scorso si è verificato un incidente in cui il modello di Stability Diffusion è trapelato online, portando a malintenzionati che lo hanno utilizzato per creare immagini falsificate.

Disponibilità

Se siete interessati a provare Stable Video Diffusion, potete entrare in lista d'attesa compilando un modulo sul sito web dell'azienda. Non si sa quando sarà possibile accedere, ma l'anteprima includerà un'interfaccia Text-To-Video. Nel frattempo, è possibile consultare il white paper dell'AI e leggere tutti i dettagli del progetto. 

Una cosa che abbiamo trovato interessante dopo aver esaminato il documento è che si parla dell'utilizzo di "set di dati video pubblicamente accessibili" come parte del materiale di addestramento. Anche in questo caso, non è una sorpresa sentirlo dire, visto che all'inizio dell'anno Getty Images ha fatto causa a Stability AI per accuse di scraping di dati. Sembra che il team stia cercando di essere più attento per non farsi altri nemici.

Potrebbe interessarti anche

Giulia Di Venere

Giulia Di Venere è Editor Senior per TechRadar Italia e lavora con orgoglio al progetto da quando è nato.

Laureata in Lingue e Letterature Straniere all’Università Ca’ Foscari di Venezia, è una grande appassionata di cinema, libri, cucina e cinofilia.

Da sempre considera la scrittura lo strumento più efficace per comunicare, e scrivere per fare informazione, ogni giorno, è per lei motivo di grande soddisfazione.

Copre una grande varietà di tematiche, dagli smartphone ai gadget tecnologici per la casa, gestendo la pubblicazione dei contenuti editoriali e coordinando le attività della redazione.

Dalla personalità un po’ ambivalente, ama viaggiare tanto quanto passare il tempo libero nella tranquillità della propria casa, in compagnia del suo cane e di un buon libro.

Con il supporto di