Dopo anni da protagonista nel campo della generazione di immagini con l’intelligenza artificiale, Midjourney compie un importante passo avanti nel mondo video con il lancio del suo primo modello dedicato, chiamato semplicemente V1.

Questo nuovo strumento image-to-video è già disponibile per la community di oltre 20 milioni di utenti della piattaforma. Permette di creare clip animate da 5 secondi a partire da un’immagine, con la possibilità di estenderle fino a 20 secondi in segmenti da 5 secondi ciascuno.

Nonostante si tratti del debutto assoluto nel video per Midjourney, il modello V1 ha già attirato paragoni con concorrenti del calibro di OpenAI Sora e Google Veo 3, soprattutto se si considera il prezzo competitivo.

Attualmente Midjourney V1 è disponibile in beta web: gli utenti possono spendere crediti per animare immagini generate sulla piattaforma oppure caricate manualmente. Il processo è semplice: si genera un’immagine come di consueto, si clicca su “Animate”, si scelgono le impostazioni di movimento, e il sistema genera il video.

Nel caso si carichi un’immagine propria, è sufficiente selezionarla come fotogramma iniziale e scrivere un prompt personalizzato per il movimento. È possibile lasciare che sia l’IA a decidere come animarla oppure descrivere esattamente la dinamica desiderata. Si può scegliere tra movimento leggero o intenso, a seconda che si voglia una scena calma oppure più frenetica.

I risultati finora ottenuti rispecchiano il momento attuale della generazione video tramite IA: tra limiti ancora evidenti e sorprese positive, V1 mostra già alcuni esempi interessanti, sia prodotti da Midjourney che condivisi dai primi utenti.

La sfida dei video generati con l’IA

Midjourney non punta a competere direttamente con Sora o Veo sul piano della potenza tecnica. Quei modelli offrono video in 4K con qualità cinematografica, illuminazione fotorealistica e narrazioni lunghe generate esclusivamente da testo, grazie a un addestramento su terabyte di dati e a un’attenzione maniacale per la coerenza tra fotogrammi e la stabilità temporale. Caratteristiche che Midjourney, per ora, non ha mai dichiarato di voler offrire.

L’obiettivo è un altro: offrire uno strumento semplice e creativo per artisti indipendenti e sperimentatori nel campo dei contenuti generati con l’IA. Non una pipeline da cinema, ma uno strumento accessibile e immediato.

Anche i costi vanno in questa direzione. Secondo Midjourney, creare un video costa quanto fare un upscaling, ovvero circa il costo di una singola immagine per ogni secondo di video. Questo lo rende, sempre secondo l’azienda, circa 25 volte più economico rispetto alla maggior parte dei servizi video IA attualmente in circolazione.

Una scelta comprensibile, anche alla luce delle controversie legali in corso. Midjourney è infatti coinvolta in una causa legale da parte di alcuni grandi studi di Hollywood, tra cui Disney e Universal, che accusano l’azienda di aver usato contenuti protetti da copyright per addestrare i propri modelli.

Nonostante questo, gli strumenti di generazione video e immagini restano attivi, e Midjourney ha già in cantiere sviluppi futuri: rendering 3D completi, controllo preciso delle scene e persino l’esplorazione di mondi immersivi. Questa prima versione rappresenta solo un primo passo.

Per ora, i sostenitori di Sora e Veo possono dormire sonni tranquilli, ma farebbero bene a tenere d’occhio le prossime mosse di Midjourney: mentre loro costruiscono la controparte IA di una troupe hollywoodiana, Midjourney ha messo un flipbook animato nelle mani di chiunque voglia sperimentare spendendo pochi crediti.