La aplicación Gemini de Google está mejorando en la edición de fotos: esto es lo que me gustó y lo que no
Gemini sube de nivel
Google Gemini ha mejorado sus capacidades de edición de imágenes con IA en la aplicación móvil Gemini, introduciendo una serie de nuevas y entretenidas herramientas.
Las funciones adicionales son cortesía de la mejora de Gemini en cuanto a la coherencia a la hora de procesar tus imágenes, por lo que si cambias un aspecto de una imagen, es mucho menos probable que Gemini altere el resto, lo que ha sido un problema constante con las imágenes generadas por IA en el pasado.
Para utilizar las nuevas funciones no es necesario actualizar la aplicación Gemini, solo tienes que subir una foto tuya y pedirle a Gemini que haga lo que yo hice a continuación.
Cambio de estilo
The first example from Google that caught my eye was that I could reinvent my look without the result being incredibly obviously not me, or at best, a very obvious transfer of my face onto an AI setting.
So I took a headshot and a Google suggestion to ask Gemini to make me a character from a '90s sitcom. Gemini answered the challenge without changing my face or shirt, but with a big smile, acid-washed jeans, and blindingly white sneakers, not to mention a classic den of a '90s sitcom for me to stand in.
Mezclas de fotos
A continuación probé la fusión de fotos, que es muy similar, pero utiliza dos imágenes para crear una nueva escena. Decidí ver cómo quedaría al juntarme a mí con un famoso.
Subí mi foto de cara y una foto antigua de Elvis, y le pedí a Gemini que nos hiciera tocar la guitarra a los dos. Le daría una puntuación un poco más baja por hacer que ambas caras se parecieran a sus respectivas fotos originales, pero no se puede negar que, a simple vista, parece que Elvis y yo nos lo estamos pasando bien tocando juntos.
Regístrese para recibir noticias de última hora, reseñas, opiniones, ofertas de alta tecnología y más.
En varias versiones
La opción de edición multi-turn amplía la capacidad de Gemini para conservar los elementos clave de una foto, ya que permite modificar una imagen paso a paso.
Utilicé mi foto del dúo con Elvis y decidí convertir nuestra jam session privada en un concierto público pidiendo a Gemini que nos situara al aire libre rodeados de una gran multitud. Sospecho que la base de datos de la IA tiene cierta información sobre el tipo de personas que realmente amaban a Elvis, a juzgar por el hecho de que la gran mayoría parecen ser mujeres.
No está tan claro por qué la multitud está detrás de nosotros y no delante.
Transferencia de estilos
La edición multivuelta amplía la capacidad de Gemini para conservar los elementos clave de una foto.
La última función nueva que probé es «mix-up» de Gemini, que realiza una transferencia de estilo a través de imágenes. Google sugirió botas de lluvia con textura de pétalos de flores, pero yo elegí una hermosa imagen de una puesta de sol y pedí un vestido con todos los colores de ese cielo. La modelo en la pasarela era un extra, pero para mí tiene sentido.
No creo que nadie se deje engañar realmente por la edición de imágenes con IA si presta un poco de atención. Pero, por supuesto, unas indicaciones y unos experimentos mejores podrían dar lugar a ejemplos mucho mejores que realmente parecieran alterar la realidad.
Por eso, Google aplica el sistema de marcas de agua SynthID a todas las imágenes editadas o generadas por IA en Gemini. Hay una marca de agua visible y otra invisible incrustada en el archivo de imagen.
No impedirá por completo el uso indebido, pero ofrece a las personas la oportunidad de detectar imágenes creadas o modificadas por IA. Aun así, además del potencial malicioso, aquí hay algunas oportunidades creativas, solo hay que preguntarle a mi buen amigo Elvis.
También te gustará...
Editor en TechRadar España de día, guitarrista de blues y friki de los cómics de noche. ¿O era al revés?
- Eric Hal SchwartzContributor
