La próxima Alexa te dejará boquiabierto
Vimos y oímos la próxima gran actualización de Alexa
Amazon está a punto de cumplir la promesa de Alexa casi una década después de que pronunciáramos nuestro primer "Alexa, ¿qué tiempo hace?", y se trata de una relación humano-asistente digital que hasta ahora solo habíamos imaginado.
También es algo chocante. Prepárate para un mundo en el que Alexa no necesite una consigna para activarse y pueda mantener una conversación tan bien como tu compañero de trabajo, amigo o conocido ocasional.
La verdadera asistencia de voz en conversación está a punto de convertirse en algo real. No hoy, pero sí en un futuro muy próximo gracias, naturalmente, a la IA generativa y a los grandes modelos de lenguaje (LLM). Amazon nos mostró el miércoles (20 de septiembre) una nueva Alexa experimental que va mucho más allá de sus primeros días de respuestas rebuscadas y supera fácilmente a la Alexa del 2023.
Es cierto que mi experiencia con esta nueva y potente Alexa se limitó a lo que pude ver y oír tanto en un vídeo enlatado como en una demostración en directo que nos mostró Dame Limp, vicepresidenta saliente de Dispositivos de Amazon.
Aun así, esta no es la Alexa que tú o yo conocemos. Habla con claridad y sin ese tono entrecortado al que nos hemos acostumbrado y que aceptamos a regañadientes. Conoce el contexto y tiene memoria.
Para habilitar la nueva Alexa, Dave Limp empezó con "Alexa, vamos a conversar", y a partir de ese momento, Limp mantenía una conversación abierta con Alexa en la que no tenía que repetir "Alexa".
Alexa respondió: "Vale, ¿en qué puedo ayudarte?
Obtenga información, inspiración y ofertas diarias en su bandeja de entrada
Regístrese para recibir noticias de última hora, reseñas, opiniones, ofertas de alta tecnología y más.
Limp redirigió un poco y dijo: "¿Cómo estás?".
Ese es el tipo de respuesta que normalmente podría despistar a Alexa, enviando al asistente de voz a un callejón sin salida de confusión.
Esta vez, sin embargo, la Alexa experimental respondió de inmediato: "Estoy bien, estoy muy contenta de poder ayudar a tanta gente cada día hablando con ellos".
La conversación continuó así durante unos instantes más, con Limp preguntando por su equipo de fútbol favorito y por cómo había jugado su delantero favorito. Fue un toma y daca nada excepcional, una conversación normal con una conversadora absolutamente nada normal llamada Alexa.
La voz de Alexa suena, bueno, no del todo humana, pero ya se va acercando. Piensa en la película Her, pero sin insinuaciones sexuales. Esa película, que ya tiene una década, se estrenó un año antes que Alexa y cuenta la inquietante historia de un hombre interpretado por Joaquin Phoenix que se enamora de una IA a la que pone voz Scarlett Johansson. Es un romance perturbador que probablemente pintaba un panorama demasiado oscuro de un futuro que ahora se parece más a nuestra realidad.
Para ser claros, ni siquiera esta Alexa experimental está a ese nivel, todavía.
Aun así, como Limp no tenía que repetir la consigna, el flujo de la conversación continuó como si Alexa fuera casi humana. La mejora de la síntesis de voz está llamada a cambiar radicalmente la calidad de la voz de Alexa. En última instancia, apuesto a que engañará a mucha gente en pruebas de audio a ciegas.
La humanidad no solo viene del sonido de la voz de Alexa, sino de la emoción. Alexa suena ahora conectada al momento.
No fue una demostración perfecta. Limp tuvo que repetirse unas cuantas veces para que Alexa respondiera, que es más o menos lo que cabría esperar de una tecnología experimental.
La voz con más personalidad de Alexa y el conocimiento del contexto son solo una parte de esta próxima transformación. Alexa acabará reconociéndote cuando te acerques a un Echo Show y retomará la conversación donde la dejaste.
Vale, lo sé, suena excelente y quizá un poco espeluznante. Sí, para que esto funcione tendrías que optar por la identificación visual para que la cámara del Echo Show pueda verte llegar y, básicamente, acceder a los datos de tu última conversación.
La verdad es que me gusta esta idea, ya que no es muy diferente de cuando mi mujer empieza a hablarme de algo de lo que estuvimos charlando ayer. Su expectativa razonable es que me acuerde y que pueda continuar la conversación. Es cierto que a veces fallo en este aspecto, pero ¿por qué iba a fallar así un ordenador?
El escenario es que te acercas a la Eco y empiezas a hablar. Si dices "¿A qué hora es el partido?". Alexa recordará qué equipo te gusta y que probablemente esté relacionado con el partido de hoy y no con uno de la semana que viene. La conversación podría fluir a partir de ahí.
No sabemos mucho sobre cómo ha entrenado Amazon a su LLM, aunque menciona la "IA responsable". Esperemos que sea algo más que palabrería y que Amazon haya entrenado la IA con voces diversas y tampoco con fragmentos de expresiones grabadas de clientes.
No veremos esta nueva Alexa hasta probablemente el 2024, que no por casualidad marcará el 10º aniversario de Alexa y el Echo. ¿Qué mejor momento para lanzar un Echo completamente nuevo y este asistente de voz Alexa que cambiará las reglas del juego?
Tengo la sensación de que esta es la actualización que pone a Siri y a Google Assistant sobre aviso. Puede que Google esté más avanzado en este campo, pero Apple está muy por detrás a la hora de hacer que Siri sea realmente conversacional. Si la próxima Alexa es tan buena como espero, puede que Apple tenga que someter a Siri a una cirugía cerebral de urgencia.
Incluso si la primera impresión de esta Alexa impulsada por LLM no cumple la promesa de hoy, no me cabe duda de que pronto lo hará. Por supuesto, nuestro entusiasmo por la IA Generativa y el LLM está mezclado con generosas dosis de miedo por lo que pueda depararnos el futuro, pero esto no es más que otra señal de que el tren de la IA se acerca rápidamente y nunca se detendrá.
Editor en TechRadar España de día, guitarrista de blues y friki de los cómics de noche. ¿O era al revés?
- Lance UlanoffEditor At Large