Se espera que OpenAI lance pronto el modelo de vídeo de IA Sora 2

Sora 2 tendrá que hacer frente a la dura competencia del modelo Veo 3 de Google

Veo 3 ya ofrece funciones que Sora no ofrece, y OpenAI tendrá que mejorar tanto lo que Sora puede hacer como su facilidad de uso para atraer a posibles clientes.

¡Atención! OpenAI parece estar en la recta final para el lanzamiento de Sora 2, la nueva versión de su popular modelo de video.

Esto de acuerdo con referencias detectadas en los servidores de la propia compañía.

Nada ha sido confirmado oficialmente, pero hay indicios de que Sora 2 será una actualización importante, dirigida directamente al modelo de video con IA Veo 3 de Google. Y no se trata solo de generar imágenes más bonitas; el verdadero enfoque está en el sonido y en lograr una experiencia que realmente reproduzca lo que el usuario imagina al escribir un prompt.

El modelo original de Sora impresionó cuando debutó gracias a la alta calidad de sus imágenes. Sin embargo, eran videos mudos. Cuando Veo 3 se presentó este año, mostró clips cortos con voz y sonidos ambientales integrados y sincronizados. No solo podías ver a un hombre sirviendo café en cámara lenta, también podías escuchar el suave chapoteo del líquido, el tintinear de la cerámica y hasta el zumbido de una cafetería alrededor del personaje digital.

Para que Sora 2 destaque y no se perciba como una opción menor frente a Veo 3, OpenAI tendrá que encontrar la manera de integrar voces creíbles, efectos de sonido y ruido ambiental en versiones aún mejores de sus videos. Lograr un audio convincente, especialmente con sincronización labial, es complicado. La mayoría de los modelos de video con IA pueden mostrarte una cara diciendo palabras. El verdadero truco está en hacer que parezca que esas palabras realmente salen de esa cara.

No es que Veo 3 sea perfecto en la sincronización de audio e imagen, pero ya hay ejemplos de videos con una sorprendente coordinación entre labios y sonido, música de fondo que se adapta al estado de ánimo, y efectos que encajan con la intención del video.

Claro, el límite actual de ocho segundos por video restringe el margen de éxito o fracaso, pero lograr fidelidad con la escena es necesario antes de pensar en aumentar la duración. Y es difícil negar que Veo 3 ya puede crear videos que se ven y suenan como gatos reales saltando desde trampolines hacia una alberca. Pero si Sora 2 logra llegar a los 30 segundos o más con calidad constante, es fácil imaginar que atraerá a usuarios que buscan mayor libertad creativa al hacer videos con IA.

La misión de Sora 2

Sora de OpenAI puede extenderse hasta 20 segundos o más de video en alta calidad. Y al estar integrado en ChatGPT, puedes hacerlo parte de un proyecto más amplio. Esta flexibilidad es clave para que Sora destaque, aunque la ausencia de audio es notable. Para competir directamente con Veo 3, Sora 2 tendrá que encontrar su voz. No solo encontrarla, sino integrarla de forma fluida en los videos que genera. Sora 2 podría tener un gran sistema de audio, pero si no logra superar la manera tan natural en que el audio de Veo 3 se conecta con sus imágenes, podría no ser suficiente.

Al mismo tiempo, hacer que Sora 2 sea demasiado bueno también puede traer problemas. Con cada nueva generación de modelos de video con IA, crece la preocupación por difuminar la línea entre lo real y lo generado. Tanto Sora como Veo 3 prohíben prompts relacionados con personas reales, violencia o contenido con derechos de autor, pero el agregar audio abre una dimensión completamente nueva de escrutinio sobre el origen y uso de voces realistas.

Otra gran interrogante es el precio. Google tiene a Veo 3 detrás del muro de pago de Gemini Advanced, y si realmente quieres usarlo sin restricciones, necesitas una suscripción al nivel AI Ultra, que cuesta $250 USD al mes. Es posible que OpenAI incluya el acceso a Sora 2 dentro de los planes ChatGPT Plus y Pro de manera similar, pero si logra ofrecer más dentro del plan más barato, podría expandir rápidamente su base de usuarios.

Para la mayoría de las personas, la herramienta de video con IA que elijan dependerá del precio, así como de la facilidad de uso, tanto como de las funciones y la calidad del video. OpenAI aún tiene mucho por hacer si quiere que Sora 2 sea más que un destello silencioso en la carrera de la IA, pero todo indica que pronto descubriremos qué tan bien puede competir.