No cometas estos 3 errores si quieres hacer una gran imagen con ChatGPT: prueba estos 3 consejos en su lugar

ChatGPT Image Tips
(Crédito de imagen: ChatGPT)

Los generadores de imágenes de IA como ChatGPT pueden hacer algunos trucos ingeniosos y producir imágenes que van desde paisajes de ensueño hasta robots futuristas. Pero por muy potentes que sean los modelos de imagen de IA, la herramienta sólo es tan buena como las instrucciones que se le den. No se trata de un artista capaz de interpretar las cosas por sí mismo, sino más bien de un genio muy literal con un acervo de referencias limitado. Pensar de antemano en el tema que se va a presentar puede mejorar mucho el resultado.

A veces, eso significa pensar tanto en lo que no hay que hacer como en lo que hay que incluir. He aquí tres de los errores más comunes que se cometen al intentar crear imágenes ChatGPT, y lo que deberías hacer en su lugar.

No sobrecargues tu prompt

ChatGPT Image Tips

(Image credit: ChatGPT)

Cuando intentamos generar imágenes por primera vez, tendemos a meter todas las ideas en un solo prompt. Digamos que quieres construir una escena de fantasía y tienes muchos conceptos que quieres incluir. Podrías escribir: «Un bosque mágico al atardecer con setas brillantes, un hada sentada en una roca, un búho volando por encima, farolillos flotantes, un río de cristal, ruinas antiguas, un portal a otro reino y un unicornio bebiendo té».

El resultado lo puedes ver arriba a la izquierda. El mensaje sobrecargado tiene sentido por escrito, y el resultado técnicamente cubre todas las bases, pero incluso los modelos de imagen avanzados pueden tener problemas con tanta complejidad visual. Cuantos más elementos distintos sumes, más probable es que la IA omita algunos, los mezcle de forma extraña o tenga una imagen de menor calidad en su conjunto. No siempre pueden equilibrar muchos elementos en una composición, sobre todo si esos elementos requieren diferentes iluminaciones, escalas o ubicaciones en la escena. La forma en que el unicornio está bebiendo té y los colores ligeramente turbios dan fe de ello.

Es mejor elegir uno o dos temas y un entorno que los realce. Intenta limitarte a tres ideas visuales distintas por tema y describe la atmósfera en lugar de enumerar cada objeto. Así, podrías escribir: «Un hada sentada en una seta brillante en un bosque tranquilo al atardecer, con suaves luciérnagas a su alrededor y un tenue resplandor mágico de fondo, ilustrado con un estilo onírico y pictórico».

Puedes ver el resultado arriba a la derecha. Esta versión tiene un tema claro (el hada), un detalle secundario (las setas y las luciérnagas que brillan) y una fuerte referencia estilística. Mantiene la escena visualmente manejable y evocadora sin abrumar a la modelo. Si quieres una escena más compleja, puedes dividirla en una secuencia de instrucciones y montar después una imagen más grande. Piensa en cada indicación como si fuera una página de un libro de cuentos visual, en lugar de la novela entera.

No te contradigas en tus indicaciones

ChatGPT Image Tips

(Image credit: ChatGPT)

Una de las formas más fáciles de confundir a un modelo de imagen es incluir accidentalmente información contradictoria o imprecisa en la solicitud. A diferencia de un artista humano, el modelo no puede adivinar lo que querías decir si le pides algo como «un hombre calvo con el pelo largo y suelto». Intentará hacer las dos cosas a la vez, lo que dará lugar a una mezcla incómoda, como cuando pedí «Un retrato hiperrealista de estilo cartoon de un robot vestido con armadura medieval, con piel cromada brillante y pecas naturales, sosteniendo un pergamino holográfico».

Como puedes ver arriba, ese lío de señales confusas dio lugar más bien a una armadura animada con una extraña cara sonriente y un pergamino que es mitad pergamino y mitad holograma. Es como un iPad tallado en madera; que técnicamente sea una tablet no significa que sea lo que querías decir con el término. Si tu mensaje incluye contradicciones, el modelo las mezclará en algo extraño o ignorará partes del mensaje por completo.

Elimina frases que se contradigan entre sí o que combinen mal. Elige una única lógica visual coherente. Puedes fusionar estilos, pero ayuda usar un lenguaje puente como "inspirado en" o "que recuerda a". Para conseguir una imagen menos estrambótica, pedí «Una ilustración digital detallada de un elegante robot con una armadura de inspiración medieval con detalles cromados, sosteniendo un pergamino holográfico brillante, en un estilizado estilo de arte conceptual de ciencia ficción». Ahora todo tiene sentido. Es un robot con una armadura de inspiración medieval, pero futurista. El pergamino es de alta tecnología, totalmente holográfico.

No te olvides de utilizar indicaciones negativas

ChatGPT Image Tips

(Image credit: ChatGPT)

La instrucción negativa es una herramienta que se pasa por alto. Puedes decirle explícitamente al modelo lo que debe evitar, lo que es especialmente importante cuando se trata de ajustar o eliminar elementos como logotipos y palabras. Eso no significa que la imagen en sí no tenga sentido, sino que no es lo que quieres. Por ejemplo, yo pedí «Un póster de viajes vintage de la costa de Amalfi al atardecer, con acantilados, edificios de colores y veleros».

El resultado es exactamente ese, incluido "Visite Amalfi" escrito en el cartel. Sin exclusiones específicas, el modelo rellena los espacios en blanco utilizando patrones de su entrenamiento. Puede suponer que se quiere el texto del título, pero si quiero ese tipo de imagen de póster sin palabras, tengo que decirlo. Así que le pedí «Un póster de viajes de estilo vintage de la costa de Amalfi al atardecer, con acantilados y edificios de colores, con una composición limpia, sin texto, sin logotipos, sin marcas de agua».

Las frases negativas filtran las partes que no quiero, y ya ves que eso es lo que me ha salido. Es especialmente útil utilizar frases negativas en posts, retratos de personajes e imágenes con el cielo abierto o superficies planas, donde podrías ver aparecer texto en determinadas condiciones. También es bueno usar indicaciones negativas cuando se trata de una imagen de un animal o humano, es decir, pedir «sin extremidades de más», «sin caras duplicadas» y «sin anatomía distorsionada».

También te gusatará...

TOPICS
Antonio Romero

Editor en TechRadar España de día, guitarrista de blues y friki de los cómics de noche. ¿O era al revés?

Aportaciones de