La nueva integración de voz de ChatGPT parece ser la pieza que faltaba en el chat con IA. La he probado y es casi perfecta

Sam Altman talking
(Crédito de imagen: Getty Images / Tomohiro Ohsumi / Stringer)

¡La espera terminó! Pero, ¿de qué? OpenAI lanzó una de las mejores actualizaciones de ChatGPT de los últimos meses. Se trata de la integración del chat de voz en el chat normal.

No hubo ningún tuit grandilocuente de Sam Altman ni ningún anuncio importante. En su lugar, la cuenta de OpenAI simplemente tuiteó: «Ahora puedes usar ChatGPT Voice directamente en el chat, sin necesidad de un modo separado», y compartió un video, que puedes ver aquí:

Y así, sin más, todo lo relacionado con ChatGPT ha cambiado. Antes, cuando activabas el modo de voz, salías del chat en el que estabas y toda la pantalla se transformaba en un orbe flotante que pulsaba mientras hablaba, lo que siempre me recordaba un poco a hablar con el siniestro ojo de HAL 9000 de 2001: Una odisea del espacio, o cuando Dorothy y sus amigos se encontraron con la cabeza flotante de Oz el Poderoso en El mago de Oz.

El modo de voz daba la sensación de que te arrancaban del resto de tu experiencia con ChatGPT y te llevaban a un lugar especial donde las palabras escritas ya no existían y se te prohibía usar los dedos para escribir. En su lugar, tenías que escuchar con atención y esperar con reverencia sus respuestas.

Ahora, el modo de voz está integrado en la dinámica habitual del chat y se ha vuelto diez veces más fácil de usar. Ahora puedes activar y desactivar el modo de voz sin salir del entorno de chat de texto, cambiando entre voz y texto según sea necesario. Solo tienes que tocar el botón del modo de voz y empezar a hablar.

ChatGPT responde a todo lo que dices y, al mismo tiempo, te ofrece una transcripción en directo en el chat. Prefiero esta opción, ya que ahora puedes elegir entre escribir una respuesta de texto o responder hablando, lo que prefieras. Y cuando no quieras que ChatGPT escuche tu voz, solo tienes que tocar el botón «Finalizar». Aún puedes «transmitir en vivo» en el modo de voz tocando el botón de video, lo que permite a ChatGPT «ver» a través de tu cámara y responder preguntas sobre lo que está viendo.

También puedes usar el nuevo modo de voz integrado para mostrar información como mapas y el tiempo en tiempo real.

Nuevos trucos

Weather in ChatGPT Voice

Un informe meteorológico generado desde el modo de voz de ChatGPT. (Image credit: OpenAI)

Ahora, consultar el tiempo en modo voz es realmente genial. Cuando preguntas qué tiempo hace, suena una extraña melodía, una especie de redoble de tambor moderno, antes de ofrecerte un resumen con su voz y una práctica tabla con la previsión para los próximos siete días.

Si te da el tiempo de un lugar en el que no te encuentras, solo tienes que decir: «¿Recuerdas que vivo en...?» y actualizará su memoria guardada.

El modo de voz de ChatGPT es mucho mejor que la experiencia a la que muchos estamos acostumbrados con asistentes digitales como Alexa (no la nueva Alexa+) o Siri. Es mucho más fácil hablar con ChatGPT: es rápido y receptivo, y si te aburres escuchando una respuesta, o se desvía hacia algo que no te interesa, puedes interrumpir y hacer otra pregunta. Gemini Live es igual de bueno, pero la integración de ChatGPT con el chat de texto lo sitúa definitivamente por encima de Gemini en este momento.

Lo bueno es que puedes preguntarle a ChatGPT qué hay en las noticias de hoy utilizando el modo de voz, y te lo dirá mientras te muestra enlaces en el chat a las propias noticias.

También te mostrará mapas de los lugares, aunque solo son gráficos, ya que no está integrado con Apple Maps ni Google Maps, lo cual es un poco decepcionante.

Y lo que es aún mejor, ahora puedes utilizar el modo de voz para crear imágenes. Solo tienes que decir: «¿Puedes conjurar una rana en un patineta para mí?», y en aproximadamente un minuto, tu imagen debería estar lista. O al menos eso es lo que dice... En realidad, no conseguí que funcionara en absoluto. Lo intenté varias veces y, a pesar de que ChatGPT me aseguraba que mi imagen estaba en camino, nunca se materializó. ChatGPT no dejaba de disculparse por la espera y me decía que generaría la imagen «en un momento», pero no pasaba nada.

Así que está claro que el nuevo modo de voz aún tiene algunos problemas que resolver, pero si aún no lo has probado, anímate a hacerlo. La actualización del modo de voz se describe como «disponible para todos los usuarios a nivel mundial en la aplicación móvil ChatGPT y en chatgpt.com». Si prefieres la experiencia original del modo de voz con el orbe flotante, puedes volver a ella en cualquier momento yendo a Configuración y activando el modo Separado en Modo de voz.

El futuro de las interfaces de IA

Dicen que, a medida que la tecnología evoluciona, pasa a un segundo plano y ya ni siquiera la notamos. Antes, poder acceder a Internet era una novedad reservada a los geeks, que requería conocimientos especializados y la capacidad de configurar con pericia dispositivos de hardware inexplicables. Ahora se espera que el wifi esté disponible en todas partes y en todo momento, y solo lo notamos cuando no funciona.

Lo mismo acaba de ocurrir con el modo de voz en ChatGPT. Tengo la sensación de que voy a dejarlo activado todo el tiempo mientras trabajo, para poder hacerle preguntas a ChatGPT cuando quiera: ha dejado de ser una función especial y ha pasado a un segundo plano. Me he dado cuenta de que ya lo estoy usando mucho más que antes, sobre todo cuando estoy fuera de casa. Escribir en un dispositivo móvil sigue sin ser fácil, por lo que usar la voz tiene mucho más sentido.

Y para mí, esa es la verdadera historia aquí. El modo de voz ya no es una novedad, se está convirtiendo en la forma predeterminada en la que uso ChatGPT, y cuanto más se integra en segundo plano, más natural se siente. Si esta es la dirección que están tomando las interfaces de IA, entonces esta podría ser la actualización más significativa de OpenAI en meses.

Sigue a TechRadar en Google News y añádenos como fuente preferida para recibir nuestras noticias, reseñas y opiniones de expertos en tus feeds. ¡Asegúrate de hacer clic en el botón "Seguir"!

Y, por supuesto, también puedes seguir a TechRadar en TikTok para recibir noticias, reseñas y unboxings en formato de vídeo, así como actualizaciones periódicas a través de WhatsApp.

TOPICS
Graham Barlow
Senior Editor, AI

Graham is the Senior Editor for AI at TechRadar. With over 25 years of experience in both online and print journalism, Graham has worked for various market-leading tech brands including Computeractive, PC Pro, iMore, MacFormat, Mac|Life, Maximum PC, and more. He specializes in reporting on everything to do with AI and has appeared on BBC TV shows like BBC One Breakfast and on Radio 4 commenting on the latest trends in tech. Graham has an honors degree in Computer Science and spends his spare time podcasting and blogging.

Aportaciones de