Más realista que nunca, así es el nuevo GPT-4o de ChatGPT

A close up of ChatGPT on a phone, with the OpenAI logo in the background of the photo
(Crédito de imagen: Shutterstock/Daniel Chetroni)

Entonces no, OpenAI no lanzó un motor de búsqueda competidor para enfrentarse a Google en su evento de actualización de primavera de hoy13 de mayo de 2024. En cambio, OpenAI presentó GPT-4 Omni (o GPT-4o para abreviar) con capacidades de conversación similares a las humanas, y es realmente impresionante. 

Más allá de hacer que esta versión de ChatGPT sea más rápida y gratuita para más personas, GPT-4o amplía la forma en que puede interactuar con él, incluida la posibilidad de tener conversaciones naturales a través de la aplicación móvil o de escritorio. Teniendo en cuenta que llegará a iPhone, Android y aplicaciones de escritorio, podría allanar el camino para convertirse en el asistente que todos siempre hemos querido (o temido). 

ChatGPT-4o de OpenAI es ahora más "humano" y sensible

OpenAI demoing GPT-4o on an iPhone during the Spring Update event.

OpenAI demoing GPT-4o on an iPhone during the Spring Update event. (Image credit: OpenAI)

GPT-4o ha dado un paso importante hacia la comprensión de la comunicación humana en el sentido de que se puede conversar de forma casi natural. Se completa con todo el desorden de las tendencias del mundo real, como interrumpir, comprender el tono e incluso darse cuenta de que se ha cometido un error.

Durante la primera demostración en vivo, el presentador pidió comentarios sobre su técnica de respiración. Respiró profundamente en su teléfono y ChatGPT respondió con la ingeniosa broma: "No eres una aspiradora". Aconsejó una técnica más lenta, demostrando su capacidad para comprender y responder a los matices humanos.

Entonces, sí, ChatGPT tiene sentido del humor pero también cambia el tono de las respuestas, con diferentes inflexiones mientras transmite un "pensamiento". Al igual que las conversaciones humanas, puedes interrumpir al asistente y corregirlo, haciéndolo reaccionar o dejar de hablar. Incluso puedes pedirle que hable en un determinado tono, estilo o voz robótica. Además, incluso puede proporcionar traducciones.

En una demostración en vivo sugerida por un usuario de X (antes Twitter), dos presentadores en el escenario, uno que hablaba inglés y otro que hablaba italiano, mantuvieron una conversación con Chat GPT-4o que se encargaba de la traducción. Podría entregar rápidamente la traducción del italiano al inglés y luego traducir sin problemas la respuesta del inglés al italiano.

Sin embargo, con GPT-4o no se trata sólo de comprensión de voz; también puede comprender imágenes como una ecuación lineal escrita y luego guiarlo sobre cómo resolverla, además de mirar una selfie en vivo y proporcionar una descripción. Podría ser lo que llevas puesto o tus emociones. 

En esta demostración, GPT dijo que el presentador parecía feliz y alegre. Sin embargo, no está exento de peculiaridades. En un momento, ChatGPT dijo que vio la imagen de la ecuación incluso antes de que estuviera escrita, refiriéndose a una imagen anterior de solo una mesa de madera.

A lo largo de la demostración, ChatGPT trabajó rápidamente y no tuvo dificultades para comprender el problema ni preguntar al respecto. GPT-4o también es más natural que escribir una consulta, ya que puede hablar naturalmente con su teléfono y obtener la respuesta deseada, no una que le indique que la busque en Google.  

Un poco como "Samantha" en la película "Her"

Si estás pensando en "Her" u otra película futurista-distópica con IA, no eres el único. Hablar con ChatGPT de una manera tan natural es esencialmente su momento para OpenAI. Teniendo en cuenta que se implementará en la aplicación móvil y como aplicación de escritorio de forma gratuita, es posible que muchas personas pronto tengan sus propios momentos Her .

Es posible que las impresionantes demostraciones que abarcan el habla y la sensación visual solo estén arañando la superficie de lo que es posible. Queda por ver el rendimiento general y qué tan bien se desempeña GPT-4o en el día a día en diversos entornos, y una vez que esté disponible, TechRadar lo pondrá a prueba. Aún así, después de este vistazo, está claro que GPT-4o se está preparando para asumir lo mejor que Google y Apple tienen para ofrecer en sus tan esperadas revelaciones de inteligencia artificial.

Las perspectivas sobre GPT-4o

Sin embargo, al anunciar esto el día antes de que comience Google I/O y solo unas semanas después de que vimos aparecer nuevos dispositivos de IA, como el Rabbit R1, OpenAI nos está dando una muestra de las experiencias de IA verdaderamente útiles que queremos. Si esta supuesta asociación con Apple se hace realidad, Siri podría potenciarse y es casi seguro que Google mostrará sus últimos trucos de inteligencia artificial en I/O el 14 de mayo de 2024. Pero, ¿serán suficientes?

Deseamos que OpenAI muestre un poco más de demostraciones en vivo con el último ChatGPT-4o en lo que resultó ser una conferencia magistral repleta de duración de menos de 30 minutos. Afortunadamente, se lanzará para los usuarios la próxima semana y no tendrás que pagar para probarlo.

Jorge Covarrubias
Editor

Apasionado del mundo de los videojuegos. El survival horror mi género favorito y de Resident Evil. Dedicado también a probar, conocer y reseñar todo tipo de gadgets y del mundo tech.

Aportaciones de