La nueva IA Gemini Omni de Google puede convertir casi cualquier cosa en un video

Goole IO 2026 screenshot
(Crédito de imagen: Google)

  • Google presentó Gemini Omni Flash
  • Su objetivo es facilitar la creación de videos al permitir que los usuarios perfeccionen sus proyectos de forma natural, en lugar de utilizar software de edición
  • Hace hincapié en la transparencia y la seguridad mediante marcas de agua generadas por IA y medidas de protección de la identidad

La próxima gran apuesta de Google en materia de IA se centra directamente en la creatividad. La empresa ha presentado Gemini Omni en Google I/O 2026 como parte de su amplia gama de nuevas funciones de Gemini.

Se espera que Omni combine las capacidades de razonamiento de Gemini con herramientas de creación multimedia capaces de generar y editar contenido en diferentes formatos.

La primera versión, Gemini Omni Flash, se centra en el video y llega con un objetivo inusualmente ambicioso. Google quiere que las personas creen contenido a partir de casi cualquier tipo de entrada, ya sea texto, imágenes, audio o video existente.

Latest Videos From

Gemini Omni Flash se está lanzando a través de la aplicación Gemini, Google Flow, YouTube Shorts y YouTube Create, con una expansión más amplia prevista para más adelante para desarrolladores y clientes empresariales.

Introducing Gemini Omni: Create Anything from Anything - YouTube Introducing Gemini Omni: Create Anything from Anything - YouTube
Watch On

El anuncio se basa en el trabajo que Google ya ha estado realizando con imágenes generadas por IA. En 2025, Nano Banana amplió las capacidades de imagen de Gemini y se convirtió en una herramienta sorprendentemente práctica para todo, desde restaurar fotografías antiguas hasta convertir bocetos preliminares en conceptos pulidos.

Gemini Omni es el intento de Google de llevar esa idea mucho más allá. La empresa describió Gemini Omni como una forma de sustituir el software de edición tradicional por una conversación capaz de perfeccionar un video de forma continua.

Edición coloquial

Una de las principales innovaciones de Gemini Omni es eliminar la complejidad de la edición. Google afirma que los usuarios pueden modificar los videos mediante lenguaje natural, al tiempo que se mantiene la coherencia entre los cambios.

Los personajes siguen siendo reconocibles. Las escenas conservan su continuidad. El movimiento sigue siendo coherente, en lugar de reiniciarse cada vez que cambia la indicación. El sistema también está diseñado para comprender mejor cómo se comportan los objetos en el mundo físico, incorporando un manejo mejorado del movimiento, la gravedad y la dinámica de los movimientos.

Así es como el espejo de arriba se ondula como un líquido cuando alguien lo toca, o cómo se puede crear una escultura a partir de burbujas. Google está tratando de posicionar a Gemini Omni como algo más que un generador de videos.

Esto sitúa a Google en medio de una competencia cada vez más intensa en torno a las herramientas multimedia basadas en IA. Pero, sobre todo, se trata de una carrera para ver quién consigue que las herramientas de vídeo con IA resulten lo suficientemente intuitivas como para que la gente común quiera utilizarlas. La respuesta de Google parece ser apostar por el enfoque conversacional.

Según Google, con el tiempo, Gemini Omni irá más allá del vídeo. Se espera que las versiones futuras permitan combinar fotos, indicaciones, música y material de referencia en un solo proyecto.

Confiar en las creaciones de la IA

La potente IA creativa plantea un desafío en materia de confianza, algo que Google ha reconocido. La empresa se apresura a destacar que los videos creados con Gemini Omni incluyen la tecnología de marca de agua SynthID, diseñada para identificar los contenidos generados por IA. La empresa también afirma que las herramientas de verificación funcionarán en Gemini, Chrome y la Búsqueda, como parte de una iniciativa más amplia en pro de la transparencia.

Inicialmente, los usuarios podrán crear avatares de video basados en ellos mismos, incluyendo su propia voz. Sin embargo, las capacidades más avanzadas relacionadas con la modificación del habla siguen en fase de evaluación mientras Google trabaja en cuestiones de seguridad.

Ese enfoque cauteloso refleja el equilibrio cada vez más complicado al que se enfrentan todas las grandes empresas de IA. Construir sistemas más capaces no significa que la confianza en ellos se construya al mismo tiempo.


Google logo on a black background next to text reading 'Click to follow TechRadar'

Sigue a TechRadar en Google Noticias y añádenos como fuente preferida para recibir nuestras noticias, reseñas y opiniones de expertos en tus feeds.


Purple circle with the words Best business laptops in white
Las mejores laptops para negocios para todos los presupuestos

Categorías
Antonio Quijano
Editor
Aportaciones de