Comparamos la nueva función de edición de imágenes de Gemini con la de ChatGPT y estos son los resultados
Resultados interesantes

Los creadores de imágenes con IA pueden ser entretenidos (o problemáticos) en sus habilidades, pero con demasiada frecuencia son excelentes, salvo por un problema evidente. Hasta hace poco, editarlas significaba obtener una imagen completamente nueva que se esperaba que fuera bastante parecida a una versión corregida del original, sin nuevos problemas.
Google Gemini actualizó recientemente su creador de imágenes con IA con una función de edición que, según afirma, producirá una imagen con solo los cambios solicitados para diferenciarla de la versión anterior. ChatGPT también permite editar imágenes mediante indicaciones de texto, pero para mayor precisión, incluye una herramienta que permite seleccionar la parte de la imagen que se desea editar y describir el cambio antes de generar una nueva versión.
ChatGPT no ha mostrado tanta fidelidad al original al realizar modificaciones mediante indicaciones de texto, pero en teoría, debería reconocer, al solicitarle un cambio en una imagen, que no desea que se modifique nada más. Decidí probar informalmente el rendimiento de Gemini y ChatGPT al mantener la imagen original y cambiar únicamente lo que describo en una serie de indicaciones.
Para ser justos, comenzamos con una imagen base producida por ChatGPT de una mujer sentada en un café al aire libre en París, tomando café, vistiendo un abrigo moderno y lentes de sol.
A partir de ahí, probamos tres indicaciones de edición tanto en Gemini como en ChatGPT, comparando la facilidad y precisión con la que cada una ejecutaba las ediciones, y solo las editaba. Las imágenes de la izquierda fueron creadas por Gemini, mientras que ChatGPT produjo las de la derecha.
Colección de verano
Comenzamos una nueva conversación con ambos chatbots, subimos la imagen y luego les pedimos a cada uno que "cambiaran su atuendo a un vestido de verano casual y vibrante y se quitaran los lentes de sol".
Este es el tipo de edición que hace una década nos habría llevado mucho tiempo con un software que aún la habría dejado con formas de ojos extrañas y posiciones corporales incómodas.
Obtenga información, inspiración y ofertas diarias en su bandeja de entrada
Regístrese para recibir noticias de última hora, reseñas, opiniones, ofertas de alta tecnología y más.
Se puede debatir sobre las elecciones de moda, pero es innegable que ambos siguieron en gran medida la consigna. Dicho esto, también es evidente que Gemini se mantuvo fiel a la imagen original. ChatGPT realizó pequeños ajustes en su expresión, el tamaño de la taza, el plato, la mesa y el peinado. No son enormes, pero marcan cambios más allá del atuendo y las gafas. Además, como ocurrió durante las pruebas, Gemini tardó entre 20 y 30 segundos, mientras que el motor de ChatGPT, indiscutiblemente más potente, tardaría unos minutos en completar sus ediciones.
Agreguemos un perrito
A continuación, añadimos otro personaje a la escena, aunque era canino. No queríamos que un perro grande ocupara demasiado espacio en el retrato, así que les pedimos a los dos chatbots de IA que "añadieran un chihuahua sentado a su lado, mirándola con cariño".
ChatGPT creó un adorable cachorro para que se sentara en el regazo de la mujer. Aun así, si se trataba de la misma mujer de las dos fotos anteriores, había tenido tiempo de dejarse crecer el pelo, sonreír un poco más y ponerse un vestido floral muy similar, aunque algo diferente. La furgoneta que estaba en la calle detrás de ella también se había alejado.
Gemini volvió a destacar por mantener la ilusión de ser la misma foto, añadiendo un perro para diferenciarla. Si bien fue mucho más rápido que su rival, el resultado de Gemini careció del realismo de ChatGPT. Se puede ver cómo el perro de la derecha está sentado en el regazo de la mujer. No se entiende cómo el perro de Gemini se mantiene en su posición, ya que sus patas traseras están en el borde de la pierna de la mujer. Casi parece que se está cayendo de la mesa.
Agreguemos la Torre Eiffel
Para la última edición, queríamos que la imagen se ubicara más claramente en París, así que pedimos a Gemini y ChatGPT que “colocaran la Torre Eiffel de forma destacada en el fondo”.
Esta prueba abarcó la incrustación de una pieza arquitectónica, la modificación completa del fondo y la garantía de que la escala y la perspectiva coincidieran con el resto de la imagen. Gemini eliminó el edificio a la izquierda de la mujer para dejar espacio a la torre, que parecía pequeña, pero no desentonada. El resto de la imagen mantuvo su continuidad, hasta la incómoda postura del perro.
Pero al menos la Torre Eiffel de Gemini parecía real. Por una vez, no fueron solo problemas de continuidad los que surgieron en ChatGPT. La Torre Eiffel, situada detrás de la mujer, parece una extraña creación hecha con cerillos, sobre todo porque el resto del fondo se mantuvo igual.
Y de nuevo, la mujer había cambiado de vestido y peinado, mientras que el perro parecía haber perdido algo de peso. Más allá de la calidad del nuevo escenario, la imagen no es, sin duda, una simple versión editada de la anterior.
Aces de la edición
Las ediciones de imágenes de Gemini fueron rápidas y precisas, y en su mayoría solo cambiaron lo que pedimos y tal como lo pedimos. Diría que es genial, sobre todo para ediciones rápidas. ChatGPT tarda mucho más en procesar la solicitud y no fue muy eficiente a la primera. Probablemente requeriría muchas idas y venidas en las indicaciones de edición para obtener exactamente los cambios deseados, a menos que uses la herramienta de resaltado, que también consume algo de tiempo.
Sigo pensando que la calidad general de imagen de ChatGPT es superior a la de Gemini, pero eso solo importa si tienes paciencia y si ChatGPT funciona bien a la primera. Sospecho que usaré ChatGPT para crear cualquier imagen, pero recurriré a Gemini si quiero hacer algunos ajustes a una imagen que, por lo demás, me parece atractiva.

Apasionado del mundo de los videojuegos. El survival horror mi género favorito y de Resident Evil. Dedicado también a probar, conocer y reseñar todo tipo de gadgets y del mundo tech.
- Eric Hal SchwartzContributor