Ci sarà un tempo in cui i generatori AI rimpiazzeranno i fotografi, ma non è questo il giorno
Se mai arriverà...
Date una bella occhiata alla dolce signora anziana che compare nel ritratto qui sopra: vera o non vera? È difficile dirlo a un primo sguardo, non trovate?
Se avete una vaga idea di cosa siano i generatori d'arte basti sull'intelligenza artificiale, come Dall-E di openAI, probabilmente sapete che sono in grado di sfornare delle vere e proprie opere d'arte difficili (e in alcuni casi impossibili) da distinguere dal lavoro umano.
Di recente, i generatori d'arte AI si sono guadagnati gli onori della cronaca per essere riusciti a creare immagini incredibilmente fotorealistiche, come la ripresa di un drone dei di surfisti sulla spiaggia che è persino riuscita a vincere un concorso fotografico.
Tornando all'immagine di copertina: sì, quella dolce signora anziana che l'autore definisce "incredibilmente somigliante alla defunta nonna", non è reale, bensì generata da un AI.
Alla luce di questi risultati, per i fotografi si pone una domanda: i generatori d'arte artificiale potrebbero davvero sostituire gli scatti prodotti dalle fotocamere, rendendo la fotografia reale una cosa di nicchia o addirittura obsoleta? Nel tentativo di scoprirlo, il collega Timothy Coleman ha effettuato delle prove con alcuni dei migliori generatori d'arte AI esistenti.
La buona notizia per i fotografi è che, attualmente, ci sono molti più scenari che i generatori d'arte AI non sono in grado di riprodurre sufficientemente bene che il contrario. Tuttavia, questa tecnologia è solo agli inizi.
Generatori di immagini AI: come iniziare
Stando a quanto riportato da Coleman, Midjourney - che utilizza un app di messaggistica istantanea molto nota in ambito gaming chiamata Discord - è il più efficace nel generare risultati fotorealistici da subito.
Get the best Black Friday deals direct to your inbox, plus news, reviews, and more.
Sign up to be the first to know about unmissable Black Friday deals on top tech, plus get all your favorite TechRadar content.
La sovrasaturazione e l'elevata nitidezza rendono le foto poco realistiche, ma si possono comunque ottenere buoni risultati in fase di post produzione. Sia Dall-E 2 di openAI e Stable Diffusion di Stability AI seguono più fedelmente le indicazioni delle parole producendo immagini estremamente dettagliate.
Per ottenere l'immagine della signora anziana sono state utilizzate le seguenti parole: "ritratto alla luce della finestra, bianco e nero, signora anziana". Il generatore AI ha impiegato circa un minuto per offrire una selezione di 4 ritratti. Il livello delle immagini non era eccellente, ma nemmeno completamente da buttare.
Il canale Discord di Midjourney contiene delle chat room all'interno delle quali si possono creare le immagini inserendo le istruzioni di testo. I risultati appaiono sul feed e sono visibili a tutti, come anche le richieste e le immagini degli altri utenti.
Coleman dice di aver speso qualche minuto ad osservare i suggerimenti di altri utenti notando istruzioni specifiche come: "fotorealistico, obiettivo 85 mm f/1,2, obiettivo Sony" e così via, oltre alle classiche descrizioni del soggetto.
Serve una buona conoscenza in ambito fotografico se si vogliono ottenere delle immagini veramente realistiche da un generatore d'arte AI (so che sembra un controsenso detta così). Dopo aver aggiunto qualche dettaglio in più, abbiamo ottenuto l'immagine di copertina della signora anziana che potete vedere in dettaglio qui sotto. Niente male eh?
Tuttavia, va specificato che questo tipo di immagini rappresentano un'eccezione: i generatori d'arte AI falliscono spesso quando gli viene chiesto di generare risultati fotorealistici in scenari specifici.
Diamo ora un'occhiata a una serie di immagini realizzate da Coleman.
Immagini generate dall'intelligenza artificiale - primi risultati
Ritratti
Stando a quanto emerso dai test, le immagini più convincenti sono i mezzi busti con un'espressione cupa. Scordatevi di chiedere un sorriso a denti stretti, perché al loro posto troverete dei blocchi bianchi davvero raccapriccianti.
Spesso sono presenti artefatti come i blocchi di messa a fuoco nitida che si concentrano in alcune aree, come ad esempio le sopracciglia. Anche i ritratti a corpo intero sono problematici, soprattutto quando si tratta di mani e arti, la nemesi più nota delle immagini AI.
Se si vogliono ritratti credibili generati dall'IA, è necessario lavorare sui close-up, ovvero sui primi piani da vicino.
Paesaggio, astrofotografia e fotografia con drone
I paesaggi sono credibili quando le richieste restano sul vago: colline ondulate, spiaggia, cielo stellato, riprese con il drone. Quando si richiedono punti di riferimento o soggetti specifici, iniziano i problemi.
Inoltre, la fotografia di paesaggio si basa sui dettagli e i generatori d'arte dell'IA sono generalmente limitati a una risoluzione di 1024 x 1024 pixel - motivo per cui le immagini dell'IA rendono bene solo se visualizzate su display di piccole dimensioni.
L'editor di immagini di Dall E 2 consente di espandere l'immagine originale generata a una risoluzione teoricamente illimitata tramite dettagli periferici in blocchi di immagine aggiuntivi, ma ciò non migliora la risoluzione dell'immagine originale..
Faunistica
Quando si inseriscono le istruzioni è possibile specificare i tipi di obiettivo e la marca.
Detto questo, dubitiamo che i risultati rispecchino realmente alcuni parametri inseriti, come appunto le caratteristiche dell'obiettivo, comprese le aree fuori fuoco (anche se alcuni dei miei tentativi di Dall-E 2 hanno riprodotto sia le aberrazioni cromatiche che una distorsione tipica dell'obiettivo). Inoltre, è possibile ottenere una prospettiva approssimativa della lunghezza focale.
In genere, se si osservano più da vicino le immagini della fauna selvatica generate con l'AI è facile notare che si tratta di immagini artefatte.
Qui sotto trovate un esempio pratico.
Dettagli e macro
Devono esserci molte immagini macro nella banca dati dei generatori di arte AI, perché la qualità tecnica è sorprendente. Tuttavia, ci sono evidenti errori di realismo.
Ad esempio, potreste trovare una farfalla appollaiata su un fiore rivolta verso una direzione innaturale. Inoltre, se si indica una specie particolare - in questo caso la farfalla ammiraglia rossa - i dettagli sono solitamente imprecisi.
In questo campo i generatori AI hanno ancora molto da migliorare.
Azione
Scordatevi di produrre scatti sportivi fotorealistici. Anche inserendo istruzioni precise, si ottengono delle immagini che non hanno niente a che fare con il realismo, molto più simili a lavori grafici che a fotografie.
Anche in questo caso, i generatori AI sembrano ancora parecchio indietro.
Prime riflessioni
La nostra prima esperienza con i generatori AI ci ha insegnato che questi strumenti hanno ancora grandi limitazioni che condivideremo in dettaglio in un approfondimento separato: "5 cose che i generatori d'arte artificiale non possono fare".
Con una risoluzione di 1024 x 1024 pixel e una qualità dei dettagli cosi mediocre (almeno per un occhio esperto), queste immagini possono andare bene unicamente se visualizzate sui display degli smartphone.
Ma è tutto da buttare?
La maggior parte delle persone guarda le immagini principalmente sui propri smartphone, senza badare ai minimi dettagli. Questo è, probabilmente, parte del problema che i fotografi, soprattutto quelli che cercano di guadagnarsi da vivere nel settore, devono affrontare oggi con l'IA.
Questi generatori potrebbero diventare il punto di riferimento per le aziende che hanno bisogno di immagini e contenuti per il social media e il marketing. Pensate ad esempio alle foto prodotto.
Detto questo, guardando al futuro (anche partendo dal presupposto che la qualità della produzione di questi generatori d'arte AI migliorerà nel tempo), siamo convinti che la creatività umana rimarrà centrale ancora per un bel po'.
Inoltre, almeno per ora, i generatori AI dovranno far affidamento sul materiale originale prodotto da noi comuni mortali: se internet dovesse saturarsi di immagini generate dall'intelligenza artificiale, il ciclo di feedback negativo porterebbe ad un inevitabile calo della qualità.
Marco Silvestri è un Senior Editor di Techradar Italia dal 2020. Appassionato di fotografia e gaming, ha assemblato il suo primo PC all'età di 12 anni e, da allora, ha sempre seguito con passione l'evoluzione del settore tecnologico. Quando non è impegnato a scrivere guide all'acquisto e notizie per Techradar passa il suo tempo sulla tavola da skate, dietro la lente della sua fotocamera o a scarpinare tra le vette del Gran Sasso.
- Timothy ColemanCameras editor