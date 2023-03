(Immagine:: Tim Coleman via Midjourney)

Date una bella occhiata alla dolce signora anziana che compare nel ritratto qui sopra: vera o non vera? È difficile dirlo a un primo sguardo, non trovate?

Se avete una vaga idea di cosa siano i generatori d'arte basti sull'intelligenza artificiale, come Dall-E di openAI, probabilmente sapete che sono in grado di sfornare delle vere e proprie opere d'arte difficili (e in alcuni casi impossibili) da distinguere dal lavoro umano.

Di recente, i generatori d'arte AI si sono guadagnati gli onori della cronaca per essere riusciti a creare immagini incredibilmente fotorealistiche, come la ripresa di un drone dei di surfisti sulla spiaggia che è persino riuscita a vincere un concorso fotografico.

Tornando all'immagine di copertina: sì, quella dolce signora anziana che l'autore definisce "incredibilmente somigliante alla defunta nonna", non è reale, bensì generata da un AI.

Alla luce di questi risultati, per i fotografi si pone una domanda: i generatori d'arte artificiale potrebbero davvero sostituire gli scatti prodotti dalle fotocamere, rendendo la fotografia reale una cosa di nicchia o addirittura obsoleta? Nel tentativo di scoprirlo, il collega Timothy Coleman ha effettuato delle prove con alcuni dei migliori generatori d'arte AI esistenti.

La buona notizia per i fotografi è che, attualmente, ci sono molti più scenari che i generatori d'arte AI non sono in grado di riprodurre sufficientemente bene che il contrario. Tuttavia, questa tecnologia è solo agli inizi.

Generatori di immagini AI: come iniziare

Stando a quanto riportato da Coleman, Midjourney - che utilizza un app di messaggistica istantanea molto nota in ambito gaming chiamata Discord - è il più efficace nel generare risultati fotorealistici da subito.

La sovrasaturazione e l'elevata nitidezza rendono le foto poco realistiche, ma si possono comunque ottenere buoni risultati in fase di post produzione. Sia Dall-E 2 di openAI e Stable Diffusion di Stability AI seguono più fedelmente le indicazioni delle parole producendo immagini estremamente dettagliate.

Per ottenere l'immagine della signora anziana sono state utilizzate le seguenti parole: "ritratto alla luce della finestra, bianco e nero, signora anziana". Il generatore AI ha impiegato circa un minuto per offrire una selezione di 4 ritratti. Il livello delle immagini non era eccellente, ma nemmeno completamente da buttare.

Il canale Discord di Midjourney contiene delle chat room all'interno delle quali si possono creare le immagini inserendo le istruzioni di testo. I risultati appaiono sul feed e sono visibili a tutti, come anche le richieste e le immagini degli altri utenti.

Coleman dice di aver speso qualche minuto ad osservare i suggerimenti di altri utenti notando istruzioni specifiche come: "fotorealistico, obiettivo 85 mm f/1,2, obiettivo Sony" e così via, oltre alle classiche descrizioni del soggetto.

Serve una buona conoscenza in ambito fotografico se si vogliono ottenere delle immagini veramente realistiche da un generatore d'arte AI (so che sembra un controsenso detta così). Dopo aver aggiunto qualche dettaglio in più, abbiamo ottenuto l'immagine di copertina della signora anziana che potete vedere in dettaglio qui sotto. Niente male eh?

Tuttavia, va specificato che questo tipo di immagini rappresentano un'eccezione: i generatori d'arte AI falliscono spesso quando gli viene chiesto di generare risultati fotorealistici in scenari specifici.

Diamo ora un'occhiata a una serie di immagini realizzate da Coleman.

Immagini generate dall'intelligenza artificiale - primi risultati

Ritratti

Stando a quanto emerso dai test, le immagini più convincenti sono i mezzi busti con un'espressione cupa. Scordatevi di chiedere un sorriso a denti stretti, perché al loro posto troverete dei blocchi bianchi davvero raccapriccianti.

Spesso sono presenti artefatti come i blocchi di messa a fuoco nitida che si concentrano in alcune aree, come ad esempio le sopracciglia. Anche i ritratti a corpo intero sono problematici, soprattutto quando si tratta di mani e arti, la nemesi più nota delle immagini AI.

Se si vogliono ritratti credibili generati dall'IA, è necessario lavorare sui close-up, ovvero sui primi piani da vicino.

(Image credit: Tim Coleman via Midjourney)

Paesaggio, astrofotografia e fotografia con drone

I paesaggi sono credibili quando le richieste restano sul vago: colline ondulate, spiaggia, cielo stellato, riprese con il drone. Quando si richiedono punti di riferimento o soggetti specifici, iniziano i problemi.

Inoltre, la fotografia di paesaggio si basa sui dettagli e i generatori d'arte dell'IA sono generalmente limitati a una risoluzione di 1024 x 1024 pixel - motivo per cui le immagini dell'IA rendono bene solo se visualizzate su display di piccole dimensioni.

L'editor di immagini di Dall E 2 consente di espandere l'immagine originale generata a una risoluzione teoricamente illimitata tramite dettagli periferici in blocchi di immagine aggiuntivi, ma ciò non migliora la risoluzione dell'immagine originale..

Image 1 of 3 (Image credit: Tim Coleman via Midjourney) (Image credit: Tim Coleman via Midjourney) (Image credit: Tim Coleman via Stable Diffusion)

Faunistica

Quando si inseriscono le istruzioni è possibile specificare i tipi di obiettivo e la marca.

Detto questo, dubitiamo che i risultati rispecchino realmente alcuni parametri inseriti, come appunto le caratteristiche dell'obiettivo, comprese le aree fuori fuoco (anche se alcuni dei miei tentativi di Dall-E 2 hanno riprodotto sia le aberrazioni cromatiche che una distorsione tipica dell'obiettivo). Inoltre, è possibile ottenere una prospettiva approssimativa della lunghezza focale.

In genere, se si osservano più da vicino le immagini della fauna selvatica generate con l'AI è facile notare che si tratta di immagini artefatte.

Qui sotto trovate un esempio pratico.

(Image credit: Tim Coleman via Midjourney)

Dettagli e macro

Devono esserci molte immagini macro nella banca dati dei generatori di arte AI, perché la qualità tecnica è sorprendente. Tuttavia, ci sono evidenti errori di realismo.

Ad esempio, potreste trovare una farfalla appollaiata su un fiore rivolta verso una direzione innaturale. Inoltre, se si indica una specie particolare - in questo caso la farfalla ammiraglia rossa - i dettagli sono solitamente imprecisi.

In questo campo i generatori AI hanno ancora molto da migliorare.

(Image credit: Tim Coleman via Stable Diffusion)

Azione

Scordatevi di produrre scatti sportivi fotorealistici. Anche inserendo istruzioni precise, si ottengono delle immagini che non hanno niente a che fare con il realismo, molto più simili a lavori grafici che a fotografie.

Anche in questo caso, i generatori AI sembrano ancora parecchio indietro.

(Image credit: Tim Coleman via Midjourney)

Prime riflessioni

La nostra prima esperienza con i generatori AI ci ha insegnato che questi strumenti hanno ancora grandi limitazioni che condivideremo in dettaglio in un approfondimento separato: "5 cose che i generatori d'arte artificiale non possono fare".

Con una risoluzione di 1024 x 1024 pixel e una qualità dei dettagli cosi mediocre (almeno per un occhio esperto), queste immagini possono andare bene unicamente se visualizzate sui display degli smartphone.

Ma è tutto da buttare?

La maggior parte delle persone guarda le immagini principalmente sui propri smartphone, senza badare ai minimi dettagli. Questo è, probabilmente, parte del problema che i fotografi, soprattutto quelli che cercano di guadagnarsi da vivere nel settore, devono affrontare oggi con l'IA.

Questi generatori potrebbero diventare il punto di riferimento per le aziende che hanno bisogno di immagini e contenuti per il social media e il marketing. Pensate ad esempio alle foto prodotto.

Detto questo, guardando al futuro (anche partendo dal presupposto che la qualità della produzione di questi generatori d'arte AI migliorerà nel tempo), siamo convinti che la creatività umana rimarrà centrale ancora per un bel po'.

Inoltre, almeno per ora, i generatori AI dovranno far affidamento sul materiale originale prodotto da noi comuni mortali: se internet dovesse saturarsi di immagini generate dall'intelligenza artificiale, il ciclo di feedback negativo porterebbe ad un inevitabile calo della qualità.