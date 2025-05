L'intelligenza artificiale Gemini di Google riceve due aggiornamenti importanti che ampliano le sue funzionalità grafiche.

Ora è possibile modificare direttamente le immagini all'interno dell'interfaccia della chat e caricare più immagini (o altri file) contemporaneamente per l'analisi. Il nuovo editor consente di applicare modifiche a qualsiasi immagine caricata o generata da Gemini, semplicemente descrivendo a parole i cambiamenti desiderati.

Si possono cambiare sfondi, rimuovere oggetti indesiderati o aggiungere elementi divertenti, come un cappello a un animale domestico. Le modifiche si accumulano in sequenza e vengono mantenute, così non è necessario ricominciare da zero se si decide di cambiare qualcosa lungo il processo.

Nel backend, l’editor di Gemini utilizza una combinazione di strumenti pensati per evitare risultati disordinati o innaturali, mantenendo coerenza tra texture, illuminazione, prospettive e altri elementi visivi.

Secondo Google, il sistema è progettato per mantenere un aspetto realistico anche quando le richieste diventano particolarmente fantasiose. L’azienda sottolinea come l’editor possa rivelarsi utile per diversi ambiti professionali: gli insegnanti potrebbero creare storyboard illustrati in pochi minuti, i designer realizzare rapidamente un portfolio di prodotti e gli architetti visualizzare modifiche ai progetti direttamente durante una riunione.

Il nuovo editor è inoltre compatibile con un altro aggiornamento rilevante: Gemini ora consente di caricare fino a dieci immagini, PDF o altri file contemporaneamente, offrendo maggiore flessibilità nell’analisi dei contenuti.

Immagini IA

Potrebbero esserci dubbi su come l'editor di Gemini gestisca il rischio di deepfake o di usi scorretti delle immagini. Google ha voluto chiarire che la questione è stata presa seriamente in considerazione.

Per questo motivo, ogni immagine modificata con l’IA riceve due watermark: uno visibile e uno invisibile tramite SynthID, la tecnologia proprietaria che permette di rilevare le modifiche solo con software specifico.

Inoltre, sono attivi dei filtri basati sul feedback umano che bloccano automaticamente le richieste considerate eticamente discutibili.

L’editor e la possibilità di caricare più file contemporaneamente non sono rivoluzionari, ma aggiungono ulteriore versatilità all’esperienza con Gemini.

Non si tratta più solo di ricevere risposte, ma di creare contenuti con l’aiuto dell’IA.

Google sta investendo per rendere Gemini un vero strumento creativo e produttivo, pensato per affiancare le persone in compiti complessi.

L’obiettivo è superare l’idea di Gemini come semplice assistente digitale o motore di ricerca con senso dell’umorismo, per diventare un alleato nei processi di creazione e lavoro.

Non siamo ancora arrivati al punto in cui si può chiedere a Gemini di progettare un biglietto e preparare anche la torta, ma non manca molto.

Nel frattempo, poter caricare dieci file e ricevere risposte coerenti, magari con l’aggiunta di un cappello su un cane, è già un ottimo inizio.