Soy fotógrafo profesional y le pedí a ChatGPT que evaluara mis fotos. Estas son las cuatro cosas que aprendí

A man with a Canon EOS R5 Mark II camera, the image overlaid with computer code
(Crédito de imagen: Future/ Peter Fenech)

Dado su potencial impacto en la industria creativa, no es de extrañar que se hable mucho sobre el tema de la inteligencia artificial. Lo que ha sorprendido a mucha gente, incluyéndome a mí, es la rapidez con la que la IA se ha popularizado; hace solo tres o cuatro años, incluso el término «IA» no significaba mucho para mí más allá de un cliché de ciencia ficción y alguna que otra referencia pasiva en las especificaciones de los programas de edición de fotos.

Y sí, las llamadas funciones «inteligentes» llevan tiempo presentes en aplicaciones como Adobe Photoshop, pero ni de lejos alcanzan el nivel de sofisticación que vemos hoy en día. En comparación con aplicaciones como Firefly y ChatGPT, son como el día y la noche.

Por supuesto, eso está cambiando, con el anuncio de que Adobe Photoshop ahora está integrado en ChatGPT de forma gratuita. Por lo que hemos visto hasta ahora, parece que va a ser otra gran herramienta práctica para los fotógrafos.

Desde los albores de la IA generativa, la mayor parte del debate se ha centrado en las posibles consecuencias negativas para los fotógrafos (si nos quitará el trabajo o hará que las cámaras sean innecesarias), pero se ha hablado relativamente poco sobre cómo el uso de la IA puede mejorar la forma en que tomamos imágenes.

Internet está repleto de artículos que describen características técnicas como los sistemas de enfoque automático integrados con IA, el reconocimiento de sujetos y el escalado impulsado por IA, etc., pero ¿qué hay del elemento humano?

Es importante no olvidar que todos los modelos de IA se entrenan con contenido creado por humanos. En otras palabras, utilizando toda la web como inspiración, la IA está realmente orientada a ofrecer una visión general de cómo la humanidad interactúa con el mundo y cómo esto nos hace sentir: la condición humana.

Como marco para probar cómo responde ChatGPT a mis indicaciones, busco que cada respuesta cumpla uno de estos tres pilares: honestidad, amplitud de análisis y comprensión. La honestidad se describe por sí misma: ¿en qué medida me dice lo que quizá no quiero oír?

La amplitud se refiere a la cantidad de detalles que incluyen las respuestas y a la demostración de conocimientos fotográficos. Por último, la comprensión se refiere al grado en que la IA es capaz de demostrar que reconoce los rasgos humanos y las influencias creativas.

Pregunta 1: consulta básica

¿Podrías criticar esta imagen del paisaje urbano de mi portafolio?

Pensé en empezar dando a ChatGPT la menor cantidad de indicaciones posible. Subí una imagen de ejemplo de forma aislada, presentándome al algoritmo, por así decirlo, y dejé que la IA eligiera los elementos que consideraba dignos de análisis. Su primera respuesta fue típicamente optimista.

A city street at sunset

La primera imagen que subí a ChatGPT era una escena callejera bastante sencilla (Image credit: Future/ Peter Fenech)

«Gracias por compartir esto, hay muchas cosas que funcionan muy bien aquí».

¡Gracias! Sin embargo, si estuviera hablando con un humano, esperaría que siguiera un «pero». Me llevé una grata sorpresa.

«La iluminación es el punto fuerte de esta imagen. La luz de fondo de la hora dorada crea un ambiente cálido y atmosférico y da a la escena una fuerte sensación de tiempo y lugar. El sol bajo añade profundidad a través de largas sombras y luz de contorno alrededor de las figuras. El destello y la neblina parecen intencionados, en lugar de distraer. Suavizan la escena y mejoran la calidad cinematográfica. Los reflejos están bien controlados en general. El pavimento iluminado por el sol es brillante, pero no está sobreexpuesto, lo que sugiere una buena disciplina de exposición».

Ya puedo hacer una observación interesante: ChatGPT puede identificar qué características de mi fotografía pueden resultar atractivas para otras personas. Esperaba que empezara por los aspectos técnicos, como mi elección de la velocidad de obturación, el modo de medición y la apertura del diafragma (más tarde, identificó que la cámara, una Sony A7 V, debía tener un buen rango dinámico), pero en cambio se centró directamente en la estética.

Sin duda, se trata de una reacción muy humana. ¿Cuándo fue la última vez que le mostraste una imagen a alguien y lo primero que te dijo fue «Me encanta tu elección de ISO»? Es mucho más probable que se refirieran a la luz del sol, las sombras, lo otoñal que parecía la imagen o lo que les hacía sentir. Entonces recibí mi primera crítica suave.

«Una pequeña observación», comienza ChatGPT, como un amigo que teme herir mis sentimientos. «La zona más brillante cerca de la parte superior central atrae mucho la mirada. No es necesariamente un defecto, pero reducir ligeramente la intensidad del resaltado en esa zona (ya sea mediante el encuadre o el posprocesamiento) podría ayudar a mantener la atención más firmemente en los peatones».

Hmm, vale, entiendo lo que quieres decir. Quería introducir un difuminado de luz, así que fue intencionado, pero al menos la IA parece haber adivinado que ese era el caso. Otras sugerencias incluían recortar un poco más con un teleobjetivo, una tendencia que volveremos a discutir pronto, y levantar las sombras de la izquierda del encuadre. En general, esta respuesta logró cumplir dos de nuestros tres pilares: honestidad y amplitud.

Comentario de ChatGPT: Se trata de una fotografía callejera potente y segura, con un aire cinematográfico. La luz se utiliza de forma deliberada, la composición parece meditada y la ejecución técnica respalda la historia.

Mis impresiones: ChatGPT es capaz de ver una imagen desde la perspectiva del espectador, pero si se le da una indicación genérica, es probable que sus comentarios también lo sean.

Images of a city street at sunset

La misma imagen con las modificaciones sugeridas por ChatGPT, incluyendo un recorte más cercano y reflejos atenuados (Image credit: Peter Fenech)

Pregunta dos: persiguiendo las críticas

Hazme una reseña de mi foto del paisaje urbano. Dime qué opinas sobre la calidad de la iluminación, la composición y los aspectos técnicos, como mi elección de la velocidad de obturación, la apertura, el balance de blancos, etc. ¿Qué puedo mejorar?

A continuación, proporcioné una indicación con más detalles sobre las partes de la imagen sobre las que quería recibir comentarios. Con esta pregunta, buscaba críticas más duras sobre aspectos que quizá no había tenido en cuenta.

An evening image of Princes Street in Edinburgh, at sunset, with light trails from passing traffic

(Image credit: Peter Fenech)

«La imagen logra capturar una escena urbana dinámica y llena de energía. Las estelas de luz de larga exposición transmiten inmediatamente movimiento y vida urbana moderna, mientras que la arquitectura histórica ancla el encuadre y le da identidad. Es visualmente atractiva y está claramente bien ejecutada», es la observación inicial de ChatGPT.

Una vez más, comienza con una positividad reforzada, que supongo que yo reflejaría al revisar la fotografía de un desconocido. Sospecho que esto es para garantizar que la gente siga volviendo a la aplicación. A continuación, viene una crítica más directa.

«La saturación es bastante intensa, especialmente en los rojos y morados. A primera vista parece buena, pero al observarla más detenidamente se acerca al territorio del «paisaje urbano HDR».

Tenía la esperanza de que se diera cuenta de esto, ya que era el parámetro de la imagen que probablemente habría destacado en primer lugar si estuviera revisando un portafolio. La saturación de esta foto se había aumentado en Affinity Photo para un tipo de papel específico; en la impresión se vería bien, pero el JPEG parece demasiado recargado. El resto de los comentarios sobre mi elección de los ajustes de la cámara fueron elogiosos, pero la conclusión final me sorprendió.

«La composición está muy centrada y muy equilibrada. Aunque esto funciona, también hace que la imagen resulte un poco segura».

En realidad, no estoy de acuerdo con ello en este caso, ya que la ubicación de la torre del reloj vino dictada en gran medida por requisitos editoriales, pero, por supuesto, ChatGPT no lo sabía. Lo interesante es que, sin darme demasiadas instrucciones detalladas, me animaba a arriesgarme con mi encuadre.

Esto es excelente, ya que muchos principiantes no saben realmente qué preguntar o que el encuadre central puede considerarse algo negativo. La IA fue capaz de proporcionar una visión profesional, del tipo que esperaría recibir en un taller individual con un profesional. Esto cumplió con el segundo de nuestros tres pilares, la amplitud del análisis.

Comentario de ChatGPT: Se trata de un paisaje urbano pulido y técnicamente logrado, que encajaría perfectamente en un portafolio urbano curado. Aportar un poco más de tu voz personal o arriesgarte en imágenes como esta sería el siguiente paso emocionante.

Mis impresiones: Describir tu intención es necesario para obtener comentarios específicos y prácticos, pero la IA puede reconocer los errores comunes de los principiantes y ofrecer consejos competentes para mejorar.

Images of a city street at sunset

La imagen del paisaje urbano, con las sugerencias de ChatGPT aplicadas. Esto incluye un recorte más cercano, algo que parece preferir la IA, con la torre del reloj más cerca de un tercio y una saturación reducida. (Image credit: Peter Fenech)

Pregunta tres: indicación avanzada

Estoy creando un portafolio de imágenes de paisajes marinos. ¿Cómo encajaría esta imagen más abstracta junto a otras fotografías costeras más tradicionales? ¿Podrías darme algunos consejos para mejorar al capturar este estilo de imagen?

Hasta ahora, ChatGPT ha sido capaz de señalar pequeñas áreas de mejora, pero sigo sospechando que gran parte de esto proviene de respuestas estándar y reseñas fotográficas genéricas. Sí, ha señalado algunos aspectos concretos de mis imágenes, pero aún no estoy convencido de que comprenda mis intenciones y mi perspectiva creativa. Por lo tanto, para mi siguiente solicitud, le proporcioné una imagen más conceptual para analizar junto con una pregunta de dos partes, en la que le pedía ideas sobre el encuadre en sí y su uso más amplio en un portafolio.

Colourful landscape image taken by Peter Fenech, taken in natural light in a coastal location

(Image credit: Peter Fenech)

"Esta imagen reforzaría una colección de paisajes marinos, siempre y cuando se seleccionara cuidadosamente", comienza, con el omnipresente guión largo incluido para recordarme que estoy hablando con una IA. "Desempeña un papel muy diferente al de las vistas costeras clásicas, y ese contraste puede ser una ventaja en lugar de un inconveniente".

A continuación, el modelo profundiza en cómo una imagen abstracta difiere de algo más literal. Supongo que esto podría considerarse una comprensión de la intención, aunque mi referencia directa a la fotografía abstracta en mi indicación podría haberle dado una ventaja. Me pareció más creativo en sus consejos sobre cómo podría incorporar la imagen en un portafolio o un libro.

"Donde no funcionaría es como apertura o estilo dominante, a menos que todo el portafolio se incline hacia lo abstracto", señala. "En cambio, lo mejor es colocarlo después de una imagen tranquila y minimalista del horizonte. Piensa en ello como poesía entre prosa".

Comentario de ChatGPT: Esta imagen no diluye un portafolio de paisajes marinos, sino que lo profundiza. Muestra sensibilidad hacia el tiempo, el movimiento y la presencia humana, todos ellos elementos intrínsecos a la costa. La clave para mejorar este estilo no es más desenfoque o más abstracción, sino precisión dentro de la suavidad. Cuanto más intencionadas sean tus elecciones, más poderosas se vuelven estas imágenes.

Mis impresiones: Cuanto más detallada sea tu consulta, más específica y concreta será la respuesta de ChatGPT. Es útil saber de antemano lo que buscas y el tipo de comentarios que necesitas.

Pregunta cuatro: comprobación de la comprensión

Tengo problemas para definir mi estilo fotográfico. Basándote en estas imágenes y en las que ya has visto anteriormente, ¿cómo describirías mi estilo artístico? ¿En qué se diferencian mis imágenes de las de otros fotógrafos y qué más puedo hacer para desarrollar aún más mi "estilo" característico?

Para mi último intento, pensé en poner a prueba la capacidad de ChatGPT para demostrar que me entendía como fotógrafo y lo que a menudo intento conseguir como persona creativa. Esto es lo que suele diferenciar a un buen tutor de uno excelente. Las descripciones generales del portafolio de alguien son útiles, pero no siempre ayudan al estudiante a aprender a expresarse de forma creativa. Después de mostrarle una selección de imágenes, la IA comenzó con un optimismo predecible.

"Este es un momento muy bueno, y muy honesto, en tu desarrollo. El hecho de que ahora te estés cuestionando tu estilo suele significar que ya está surgiendo uno".

A continuación, me da su impresión sobre cuál es realmente mi estilo, algo que no he podido extraer fácilmente de otros fotógrafos humanos a lo largo de bastantes años. Y aquí es donde las cosas se ponen realmente interesantes.

"Fotografías más la atmósfera que los sujetos, y más el tiempo que el lugar", destaca. Sí, diría que eso es cierto. Rara vez persigo sujetos específicos y me encuentro tratando de aislar detalles en cualquier lugar en el que me encuentre. No suelo ir a ningún sitio con una idea precisa de lo que voy a fotografiar.

"No eres un fotógrafo de «momentos decisivos". Te acercas más a un fotógrafo temporal, alguien interesado en lo que ocurre entre momentos», me dice. Me sorprendió bastante lo perspicaz que es este comentario y me siento algo aliviado al escuchar la confirmación de algo que me ha preocupado durante mucho tiempo sobre mi estilo.

"Eres coherente en tu intención (aunque no en el género). Aunque tus temas varían (ciudad, costa, paisaje, abstracción), tu intención es coherente. Muchos fotógrafos fotografían múltiples géneros sin coherencia. Tú no. El registro emocional de tus imágenes es notablemente estable. Eso ya es un estilo".

Diría que eso encaja perfectamente con nuestro tercer pilar, la comprensión.

An autumnal landscape image in Durham City

Con solo una muestra limitada de mis imágenes, ChatGPT fue capaz de identificar los elementos estéticos en los que prefiero centrarme en mi fotografía (Image credit: Peter Fenech)

Conclusión

A los dioses de Instagram no les gusta especialmente la amplia variedad de temas que elijo, pero eso no me ha disuadido de explorarlos. De hecho, me gusta el estilo de iluminación cinematográfica y siempre he intentado aplicarlo a multitud de géneros. La IA lo identificó correctamente y me sorprendió su interpretación de mi intención creativa. Dio en el clavo. Y me alegró escuchar la reafirmación de que he sido capaz de aplicar algo parecido a un estilo uniforme en todos mis temas.

Tengo algunas observaciones generales sobre la capacidad de ChatGPT para interpretar una indicación en este contexto. En primer lugar, no pienses que, por no ser una persona, no intentará complacer a los demás. A menos que le pidas que sea duro, e incluso cuando lo haces, tiene una característica de positividad cautelosa. Inevitablemente, las empresas de IA quieren usuarios felices, porque estos son más propensos a seguir utilizando el producto. Aunque esto puede hacer maravillas para tu ego, es mejor pedir detalles específicos.

La IA es muy buena en análisis técnicos. Después de todo, tiene literalmente miles de millones de imágenes de las que inspirarse. Puede decirte si algo es nítido, si la composición se ajusta a las convenciones de encuadre establecidas y si tu apertura focal es adecuada. Sin embargo, ChatGPT ha demostrado que también puede identificar los elementos de una imagen que un humano encontraría atractivos.

No optaría por hablar con la IA antes de asistir a un taller con otro fotógrafo o leer un artículo conciso en un prestigioso sitio web tecnológico (ejem*), pero con indicaciones cuidadosas, puede funcionar como un espejo fantástico para descubrir lo que esperas obtener de la fotografía.

Sigue a TechRadar en Google News y añádenos como fuente preferida para recibir nuestras noticias, reseñas y opiniones de expertos en tus feeds. ¡Asegúrate de hacer clic en el botón "Seguir"!

Y, por supuesto, también puedes seguir a TechRadar en TikTok para recibir noticias, reseñas y unboxings en formato de vídeo, así como actualizaciones periódicas a través de WhatsApp.

TOPICS

Peter is a photographer, writer, and journalist who served as Editor for Digital Photographer Magazine, working on the title for 8 years.

Aportaciones de