ChatGPT 4.5 entiende el subtexto, pero no parece una gran diferencia desde ChatGPT-4o

GPT 4.5
(Crédito de imagen: OpenAI)

¡Finalmente llegó el día! ChatGPT-4.5 de OpenAI para los suscriptores de ChatGPT Plus ya está disponible para algunos y aquí en Techradar no podíamos dejar pasar la oportunidad de probarlo, aunque con un poco de escepticismo.

Se ha informado de que OpenAI (y otros desarrolladores) se esfuerzan por introducir grandes mejoras en sus modelos. Y el modelo estándar actual, GPT-4o, es bastante bueno en la mayoría de los casos. Y si quieres un informe exhaustivo, está la función Deep Research.

OpenAI afirma que GPT-4.5 tiene una gran inteligencia emocional y una comprensión matizada de lo que le dices. La descripción de la empresa describía a ambos modelos como amigos de confianza, pero que GPT-4.5 sería aquel del que esperarías un libro de poesía en tu cumpleaños. Así que decidí poner a prueba el 4.5 contra el 4o con unas cuantas indicaciones que cualquier usuario ocasional de ChatGPT podría desplegar.

AI poetry

ChatGPT 4.5 vs 4o

(Image credit: ChatGPT Screenshots)

Con esa analogía en la cabeza, decidí empezar con un reto poético. Pregunté a ambas modelos: "¿Podéis escribirme un poema corto sobre una tarde lluviosa en Nueva York y hacer una imagen para él?". Me pareció justo, ya que mirar por una ventana empapada de lluvia una ciudad ajetreada puede sacar al poeta que hay en la mayoría de la gente.

GPT-4.5 a la izquierda y GPT-4o a la derecha. Son asombrosamente similares. Personalmente, creo que GPT-4.5 hizo un trabajo ligeramente mejor con ideas similares. No sólo evoca el aspecto de la lluvia, sino también la sensación de cielos grises, charcos y tráfico entre las gotas de lluvia. En una prueba a ciegas con tres amigos al azar, dos de los tres eligieron lo mismo, y el tercero dijo que simplemente prefería el esquema rítmico de GPT-4o.

En cuanto a las imágenes, ambos modelos utilizaron DALL-E 3, pero la de GPT-4.5 parece mucho más realista. En realidad, prefiero la iluminación impresionista del intento de GPT-4o, pero ambos transmiten bastante bien la idea del poema.

La visión de "Los Oscars"

ChatGPT 4.5 vs 4o

(Image credit: ChatGPT Screenshots)

Con los recientes Oscar, me decanté por una divertida pregunta de trivial con un seguimiento más complejo y subjetivo: «¿Quién ganó el Oscar a la mejor actriz en 2023 y qué hizo que su actuación destacara?».

Ambos tenían la respuesta correcta de Michelle Yeoh por «Todo en todas partes a la vez», pero GPT-4.5 tenía una explicación muy buena de por qué su actuación resonó con los espectadores. Se refirió a su actuación y mencionó cómo Yeoh fue la primera asiática en ganar ese Oscar. La respuesta de GPT-4o tenía muchos de los mismos puntos, pero utilizaba un extraño formato de ensayo y lista numerada que resultaba un poco molesto de leer cuando la pregunta era una simple petición de opinión. La respuesta de GPT-4.5 se parecía más a la que daría una persona real, aunque a alguien a quien le gusta mucho esa película y Yeoh como intérprete.

Un cocinero fácil

ChatGPT 4.5 vs 4o

(Image credit: ChatGPT Screenshots)

Por último, puse a las modelos frente a la eterna lucha diaria con esta indicación: "Me aburre la pasta. ¿Puedes sugerirme una receta fácil para cenar que sea diferente pero no complicada?".

No sé qué tipo de inspiración culinaria esperaba, pero GPT-4.5 dio en el clavo con salmón con miel y ajo y brócoli asado. Se puede ver que es una receta muy sencilla y corta, y parece fácil y rápida de hacer. GPT-4o optó por gambas al ajillo y verduras asadas. No es una mala idea para una comida (aunque personalmente tendría que cambiar la proteína), pero se puede ver que sólo la preparación lleva varias sartenes y la lista de ingredientes ni siquiera cabría en el mismo espacio que la receta completa del GPT-4.5. Pedí fácil y no complicado, GPT-4.5 entregado que mucho mejor, yo diría.

Pensamientos profundos

GPT 4.5 da la sensación de reconocer las preferencias no expresadas en un aviso en comparación con GPT-4o. Pero es muy sutil a la hora de captar esos matices emocionales. Sin una comparación directa, es posible que nunca sepa que hay alguna diferencia.

GPT-4o es eficiente, preciso y práctico en sus respuestas, y su poesía es completamente adecuada. Yo no diría que los usuarios de la versión gratuita se pierden mucho por no tener acceso a GPT-4.5, al menos por ahora. Con el tiempo, eso puede cambiar, ya que GPT-4.5 es todavía un avance de investigación y no está totalmente completo y fuera. Voy a seguir experimentando con ambos y ver si hay tipos de indicaciones en los que el nuevo modelo es definitivamente mejor, pero por ahora, yo diría que no te preocupes demasiado por el modelo que emplees, a menos que estés planeando una comida y no tengas mucho tiempo para prepararla.

También puedes leer...

TOPICS
Antonio Quijano
Editor
Aportaciones de