Seis importantes actualizaciones de ChatGPT que OpenAI desveló en su actualización de primavera
La GPT-4o de OpenAI podría redefinir la interacción de la IA tal y como la conocemos
OpenAI acaba de celebrar su esperado evento de actualización de primavera, en el que ha hecho una serie de anuncios interesantes y ha demostrado las capacidades de sus nuevos modelos de IA GPT. Hubo cambios en la disponibilidad de los modelos para todos los usuarios, y en el centro del revuelo y la atención: GPT-4o.
Este lanzamiento, que se produce apenas 24 horas antes de Google I/O, sitúa a los Gemini de Google en una nueva perspectiva. Si GPT-4o es tan impresionante como parecía, más vale que Google y su esperada actualización de Gemini sean alucinantes.
¿A qué se debe todo este alboroto? Profundicemos en todos los detalles de lo anunciado por OpenAI.
1. El anuncio y la demostración de GPT-4o, y qué estará disponible para todos los usuarios de forma gratuita
El anuncio más importante de la retransmisión fue la presentación de GPT-4o (la "o" significa "omni"), que combina el procesamiento de audio, vídeo y texto en tiempo real. Con el tiempo, esta versión de la tecnología GPT de OpenAI se pondrá a disposición de todos los usuarios de forma gratuita, con límites de uso.
Por ahora, sin embargo, se está poniendo a disposición de los usuarios ChatGPT Plus, que obtendrán hasta cinco veces más límites de mensajería que los usuarios gratuitos. Los usuarios de Team y Enterprise también dispondrán de límites más altos y tendrán acceso antes.
GPT-4o tendrá la inteligencia de GPT-4, pero será más rápido y responderá mejor en el uso diario. Además, podrás proporcionarle o pedirle que genere cualquier combinación de texto, imagen y audio.
En la retransmisión, Mira Murati, Directora de Tecnología de OpenAI, y dos investigadores, Mark Chen y Barret Zoph, demostraron la capacidad de respuesta en tiempo real de GPT-4o en una conversación utilizando su funcionalidad de voz.
Get the best Black Friday deals direct to your inbox, plus news, reviews, and more.
Sign up to be the first to know about unmissable Black Friday deals on top tech, plus get all your favorite TechRadar content.
La demostración comenzó con una conversación sobre el estado mental de Chan, en la que GPT-4o escuchaba y respondía a su respiración. A continuación, le contó un cuento a Barret con un tono de voz cada vez más dramático, e incluso se le pidió que hablara como un robot.
Continuó con una demostración en la que Barret "mostraba" a GPT-4o un problema matemático y el modelo guiaba a Barret en su resolución dándole pistas y ánimos. Chan le preguntó por qué era útil ese concepto matemático concreto, a lo que respondió largamente.
A continuación, mostraron a GPT-4o un código, que explicó en inglés sencillo, y le proporcionaron información sobre el gráfico que generaba el código. El modelo hablaba de eventos notables, de las etiquetas de los ejes y de una serie de entradas. De este modo, OpenAI demostraba su convicción de seguir mejorando la interacción de los modelos GPT con las bases de código y la mejora de sus capacidades matemáticas.
La penúltima demostración fue un impresionante despliegue de las capacidades lingüísticas de GPT-4o, que tradujo simultáneamente dos idiomas -inglés e italiano- en voz alta.
Por último, OpenAI hizo una breve demostración de la capacidad de GPT-4o para identificar emociones a partir de un selfie enviado por Barret, y observó que parecía feliz y alegre.
Si el modelo de IA funciona como se ha demostrado, podrás hablarle con más naturalidad que a muchos modelos de voz de IA generativa y otros asistentes digitales. Podrás interrumpirla en lugar de mantener una conversación por turnos, y ella seguirá procesando y respondiendo, de forma similar a como hablamos entre nosotros de forma natural. Además, el retardo entre consulta y respuesta, que antes era de unos dos o tres segundos, se ha reducido drásticamente.
ChatGPT equipado con GPT-4o se desplegará en las próximas semanas, de forma gratuita. Esto ocurre unas semanas después de que Open AI pusiera ChatGPT a disposición de los usuarios sin necesidad de registrarse.
2. Los usuarios gratuitos tendrán acceso al almacén GPT, la función de memoria, la función de exploración y el análisis avanzado de datos
Los GPT son chatbots personalizados creados por usuarios de OpenAI y ChatGPT Plus para ayudar a habilitar conversaciones y tareas más específicas. Ahora, muchos más usuarios pueden acceder a ellos en la Tienda GPT.
Además, los usuarios gratuitos podrán utilizar la funcionalidad de memoria de ChatGPT, lo que la convierte en una herramienta más útil y provechosa al darle un sentido de continuidad. También se añaden al plan gratuito las funciones de visión de ChatGPT, que permiten conversar con el bot sobre elementos cargados como imágenes y documentos. La función de exploración permite buscar en conversaciones anteriores con mayor facilidad.
Las capacidades de ChatGPT han mejorado en calidad y velocidad en 50 idiomas, apoyando el objetivo de OpenAI de llevar sus poderes al mayor número de personas posible.
3. GPT-4o estará disponible en la API para desarrolladores
El último modelo de OpenAI estará disponible para que los desarrolladores lo incorporen a sus aplicaciones de IA como modelo de texto y visión. La compatibilidad con las capacidades de vídeo y audio de GPT-4o se lanzará en breve y se ofrecerá a un pequeño grupo de socios de confianza en la API.
4. La nueva aplicación de escritorio ChatGPT
OpenAI lanza una aplicación de escritorio para macOS para avanzar en su misión de hacer que sus productos sean lo más fáciles y fluidos posible, estés donde estés y utilices el modelo que utilices, incluido el nuevo GPT-4o. Podrás asignar atajos de teclado para realizar procesos aún más rápidamente.
Según OpenAI, la aplicación de escritorio ya está disponible para los usuarios de ChatGPT Plus y lo estará para más usuarios en las próximas semanas. Su diseño es similar al de la interfaz actualizada de la aplicación móvil.
5. Una interfaz de usuario ChatGPT renovada
ChatGPT está recibiendo una interfaz de usuario más natural e intuitiva, renovada para que la interacción con el modelo sea más fácil y menos brusca. OpenAI quiere llegar al punto en el que la gente apenas se centre en la IA y que sientas que ChatGPT es más amigable. Esto significa una nueva pantalla de inicio, diseño de mensajes y otros cambios.
OpenAI no ha terminado todavía
La misión es audaz, ya que OpenAI pretende desmitificar la tecnología al tiempo que crea algunas de las tecnologías más complejas a las que la mayoría de la gente puede acceder. Murati concluyó afirmando que pronto nos pondrán al día de lo que OpenAI se dispone a mostrarnos a continuación y agradeciendo a Nvidia que haya proporcionado las GPU más avanzadas para hacer posible la demostración.
OpenAI está decidida a dar forma a nuestra interacción con los dispositivos, estudiando de cerca cómo interactúan los humanos entre sí e intentando aplicar sus aprendizajes a sus productos. La latencia de procesamiento de todos los matices de la interacción es parte de lo que dicta cómo nos comportamos con productos como ChatGPT, y OpenAI ha estado trabajando duro para reducirla. En palabras de Murati, sus capacidades seguirán evolucionando y mejorarán aún más a la hora de ayudarte exactamente con lo que estás haciendo o preguntando en el momento preciso.
Más sobre ChatGPT...
Editor en TechRadar España de día, guitarrista de blues y friki de los cómics de noche. ¿O era al revés?
- Kristina TerechComputing Writer