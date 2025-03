La generación de arte mediante IA ha ido evolucionando a un ritmo vertiginoso, y Google acaba de lanzar otro gran contendiente a la mezcla a través de su Gemini Flash 2.0. Puedes jugar con la nueva herramienta de creación de imágenes en AI Studio de Google.

Gemini Flash es, como su nombre indica, muy rápido, notablemente más rápido que DALL-E 3 y otros creadores de imágenes. Esa velocidad podría significar imágenes de menor calidad, pero no es el caso aquí, sobre todo por todos los cambios y mejoras en la capacidad de producción de imágenes del modelo. Aun así, si quieres obtener resultados realmente buenos, debes saber cómo hablar con la IA. Después de muchas pruebas y errores, he reunido cinco consejos para obtener el mejor arte de Gemini Flash 2.0. Algunos de estos consejos pueden parecer similares a los de otros creadores de arte con IA, porque lo son, pero eso no los hace menos útiles en este contexto.

Cuéntame un cuento

La novedad más interesante de la creación de imágenes de Gemini Flash es que no sólo sirve para ilustraciones puntuales, sino que puede ayudarte a crear una historia visual generando una serie de imágenes relacionadas con un estilo, unos escenarios y unos estados de ánimo coherentes.

Para empezar, sólo tienes que pedirle que te cuente una historia y la frecuencia con la que quieres que una ilustración acompañe a la acción. El resultado incluirá esas imágenes acompañando al texto.

Para mi proyecto, le pedí a la IA que «Generara una historia de un bebé dragón heroico que protegía a una reina de las hadas de un malvado mago en un estilo de animación de dibujos animados en 3D. Para cada escena, genera una imagen». Vi que empezaba a aparecer lo anterior. Y, si hay algún problema, puedes reescribir cualquiera de los fragmentos de la historia y el modelo regenerará la imagen en consecuencia.

Sé muy específico

Si le dices a Géminis que haga «un perro en un parque», es posible que obtengas un golden retriever borroso sentado en algún lugar un poco verde. Pero si le dices: «Un golden retriever esponjoso sentado en un banco de madera en Central Park durante el otoño, con hojas rojas y naranjas esparcidas por el suelo», obtendrás exactamente lo que estás imaginando.

A los modelos de IA les encantan los detalles. Cuantos más detalles les proporciones, mejor será tu imagen. Así que para la imagen de arriba, en lugar de pedir una ciudad de aspecto futurista, pedí «Un paisaje urbano retrofuturista al atardecer, con letreros de neón que brillan en rosa y azul, coches voladores en el cielo y gente caminando con ropa de estilo también retrofuturista». Siete segundos después, llegó el resultado.

Comenta la jugada

Una de las cosas que más me gustan del nuevo Gemini Flash es que puedes ponerte a conversar con él sin perder gran parte de la velocidad. Eso significa que no tienes que hacerlo todo bien de una sola vez. Después de generar una imagen, puedes chatear literalmente con la IA para hacer ediciones. ¿Quieres cambiar los colores? ¿Añadir un personaje? ¿Aumentar la iluminación? Pídelo.

En la imagen de arriba, empecé pidiendo «Un rincón de lectura acogedor con chimenea, estanterías llenas de novelas y un sillón grande y cómodo». Después lo refiné pidiéndole que «lo hiciera nocturno con una iluminación suave y cálida», seguí pidiéndole que «añadiera un gato durmiendo en el sillón» y terminé pidiéndole a la IA que «diera a la habitación una estética vintage y victoriana». El resultado final de la izquierda se parece casi exactamente a lo que imaginé, y hace que Gemini se sienta como un asistente artístico, capaz de adaptarse a lo que quiero sin tener que empezar de cero cada vez.

Gemini Flash está a la altura de ChatGPT

Google ha presumido de que Gemini está lleno de conocimientos del mundo real, lo que significa que puedes obtener precisión histórica, detalles culturales realistas e imágenes de la vida real si lo pides. Por supuesto, eso requiere ser específico. Por ejemplo, si le pides «un guerrero vikingo», puede que obtengas algo que se parezca más a un personaje de Juego de Tronos. Pero si le dices: «Un guerrero vikingo del siglo IX con una armadura de cota de malla detallada, un escudo redondo de madera y un casco nórdico tradicional», obtendrás algo mucho más preciso.

Como prueba, le pedí a la IA que creara «Una antigua ciudad maya al amanecer, con imponentes pirámides de piedra, un exuberante entorno selvático y gente vestida con trajes mayas tradicionales». No es perfecto, pero se parece mucho más a la realidad que las versiones anteriores, que a veces volvían con casi una pirámide egipcia.

Escribe deprisa

La mayoría de los modelos de imagen de IA han tenido problemas durante mucho tiempo con la representación de texto, convirtiendo las palabras en garabatos ilegibles. Incluso los mejores modelos actuales que pueden hacerlo tardan un poco en conseguirlo y hacerlo bien puede llevar varios intentos. Sin embargo, Gemini Flash es sorprendentemente bueno integrando texto en imágenes de forma rápida y legible. Aunque ser muy específico puede ayudar.

Así es como generé la imagen de arriba pidiéndole a la IA que «hiciera un póster de viajes de estilo vintage que dijera “Visite Londres” en tipografía atrevida y retro, con una ilustración estilizada de la ciudad».