ChatGPT ahora puede ver fotos y contarte un cuento para dormir con cinco voces diferentes

Robot hablando por teléfono
(Crédito de imagen: Bas Nastassia via Shutterstock)

Ahora ChatGPT puede oír, ver y hablar, lo que abre todo un nuevo mundo de posibilidades para interactuar con los chatbots de inteligencia artificial. Las nuevas capacidades abren la posibilidad de mantener una conversación de voz con ChatGPT, o de mostrar físicamente al bot de qué se está hablando. 

Según la entrada del blog oficial de OpenAI, pronto podrás enseñarle al bot fotos de un monumento mientras estás de vacaciones y mantener una conversación sobre la historia que hay detrás de esa estructura. También podrás enviarle una foto del contenido de tu frigorífico para que te prepare una posible receta.  

Las nuevas funciones llegarán primero a los usuarios de ChatGPT Plus y Enterprise en las próximas semanas. La voz llegará a las aplicaciones de iOS y Android, y las imágenes estarán disponibles en todas las plataformas. Como ocurre con la mayoría de las funciones de ChatGPT, los usuarios que no estén suscritos a la plataforma Plus probablemente las verán un poco más tarde.

ChatGPT responde

La entrada del blog señala que ahora podrás entablar conversaciones de ida y vuelta con tu asistente de IA sobre la marcha a través de la aplicación del teléfono. Por lo que parece, será una experiencia similar a la de hablar con Siri o Amazon Alexa. 

El vídeo de ejemplo que aparece en la entrada del blog (abajo) muestra una elegante interfaz de usuario con una voz que le pide a ChatGPT que le cuente un cuento antes de dormir, con el usuario interrumpiendo de vez en cuando para hacer preguntas.

Independientemente de lo que pienses de la tecnología, es impresionante. Tendremos que esperar para ver si las conversaciones reales coinciden con el ejemplo fluido del vídeo, pero si es así, Siri y Amazon Alexa tienen mucho de qué preocuparse. Si puedo acceder a un chatbot parlanchín e inteligente como ChatGPT, que mira fotos y puede profundizar en temas sin pausa, ¿por qué iba a utilizar otros asistentes virtuales? 

Si eres suscriptor de Plus, ve a Ajustes, haz clic en "Nuevas funciones" en la aplicación móvil y opta por las conversaciones de voz. Podrás elegir tu voz favorita entre cinco opciones diferentes: Sky, Cove, Ember, Breeze y Juniper, y puedes escuchar cada una de ellas en la web oficial.

Un regalo para la vista

Ahora ChatGPT también puede ver más de una imagen. Puedes mostrarle gráficos que necesites analizar, pedirle ayuda con los deberes o simplemente mostrarle el borrador de un trabajo sobre el que te gustaría recibir comentarios, pero no puedes molestarte en escribirlo. 

Si quieres que se centre en algo concreto de la foto, puedes utilizar la nueva herramienta de dibujo de la aplicación ChatGPT y rodear con un círculo exactamente aquello en lo que quieres que se concentre el bot. 

Aunque todo esto es impresionante para un chatbot de inteligencia artificial generativa, hay algunas preocupaciones que surgen inmediatamente al oír hablar de las nuevas funciones.

OpenAI sí reconoce estas preocupaciones en la parte inferior del anuncio, afirmando que con las nuevas características vienen nuevos retos, incluyendo alucinaciones - básicamente una respuesta incorrecta dada por un bot de IA pero entregada con confianza - y la posibilidad de que las capacidades de voz que suplanten a figuras públicas o cometan fraude. 

Para combatir esto, OpenAI afirma que Voice Chat se creó con actores de voz reales, y la función de entrada de imágenes se probó con dominios rosh en extremismo y competencia científica, para "alinear las características clave para un uso responsable".  

Estamos deseando probar las nuevas funciones, sobre todo la posibilidad de chatear directamente con ChatGPT y sondear su mente. También estamos impacientes por ver cómo esto se extenderá a otros productos como Bing AI, Google Bard e incluso el incipiente proyecto de IA de Meta. Dado que ChatGPT es un pionero de la IA, la introducción de nuevas funciones como ésta significará que todos los demás tendrán que ponerse al día.

Antonio Romero

Editor en TechRadar España de día, guitarrista de blues y friki de los cómics de noche. ¿O era al revés?

Aportaciones de