Google anuncia Gemini Omni como su nuevo modelo multimodal para crear y editar video con IA en el I/O 2026

En el contexto del I/O 2026, Google anunció Gemini Omni Flash, un nuevo modelo multimodal diseñado para generar y modificar contenido audiovisual de alta calidad.

Sigue el Google I/O 2026 con nosotros

Gemini Omni: Creación multimodal, edición conversacional y avatares digitales

El sistema permite a los usuarios generar secuencias de video inéditas combinando distintas fuentes de entrada, con instrucciones escritas y referencias de imágenes, clips o audio. En esta etapa inicial de despliegue, el ingreso de audio solo admitirá referencias de voz para guiar la creación, mientras que otros tipos de entrada sonora quedarán para futuras actualizaciones del modelo.

Gemini Omni anima a un personaje ilustrado utilizando el movimiento de un video de referencia y el estilo de una segunda imagen.

El modelo altera el estilo visual de un entorno de forma progresiva, sincronizando el metraje con una pista de audio retrofuturista.

Además de la generación inicial, este modelo destaca por su capacidad para modificar videos preexistentes mediante un formato de edición conversacional que no requiere experiencia técnica en posproducción. Los creadores pueden solicitar cambios específicos en el entorno o transformar elementos del encuadre mediante comandos escritos, mientras el sistema procesa la instrucción sin perder la coherencia física y visual del metraje original.

Alteración de un escenario real donde la inteligencia artificial transforma la materialidad de una estructura en burbujas.

Edición iterativa: la secuencia de la violinista

Para potenciar este formato, la herramienta permite refinar las piezas a través de múltiples interacciones continuas sin perder el hilo de la escena base. De esta manera, el creador puede establecer una toma inicial y aplicar alteraciones sucesivas sobre los objetos o la posición de la cámara.

La Secuencia 1/3: Generación del metraje base a partir de una simple instrucción de texto.

Secuencia 2/3: Primera modificación conversacional, cambiando el ángulo de la cámara sobre el hombro de la protagonista.

Secuencia 3/3: Edición final que elimina el instrumento musical de las manos, manteniendo intacto el movimiento y la continuidad.

La función de avatares digitales permite a los usuarios generar videos sintéticos que se ven y suenan de manera similar al creador original. Sin embargo, las opciones más avanzadas de modificación de habla y clonación de audio permanecen bajo evaluación interna, respondiendo a las políticas de seguridad de la empresa para evitar usos indebidos de la voz.

Integración móvil en YouTube Shorts y doble sistema de verificación

La llegada de Omni Flash a YouTube acercará estas capacidades directamente al consumo masivo, permitiendo a los creadores generar o remezclar Shorts desde YouTube Shorts y YouTube Create. Esta integración facilita la creación de contenido audiovisual enriquecido sobre la marcha, reduciendo la fricción de recurrir a software de edición externo antes de subir el material.

Para asegurar la trazabilidad del contenido, el material generado incorpora la tecnología SynthID, la cual aplica marcas de agua digitales imperceptibles que pueden ser verificadas a través de Gemini, Chrome y el buscador de Google. De manera paralela, cuando estos videos sintéticos sean remezclados y publicados en YouTube, el servicio aplicará sus propios metadatos de identificación visual y añadirá enlaces directos que apunten hacia el material original.

¿Galaxy New Fold? el peculiar nombre que podría tener el nuevo plegable de Samsung

Motorola Moto Pad 70 Pro debuta con Snapdragon 8s Gen 4, pantalla de 13 pulgadas y batería de 10.200 mAh

WhatsApp comienza a desplegar nombres de usuario: así podrás reservar tu usuario

Primeras impresiones Dreame X60 Ultra Complete

Unboxing aspiradora robot Dreame X60 Ultra Complete

[Video] Unboxing y primeras impresiones HONOR 600 Pro

Samsung Galaxy Tab S12 Ultra puede que abandone la muesca para adoptar una cámara frontal integrada en una perforación en pantalla

Apple pide 9 veces menos paneles de pantalla para el iPhone Ultra plegable que para el iPhone 18 Pro

El nuevo teléfono Trump Mobile T1 estaría disponible muy pronto

Francisca Florenzano de Entel: “La brecha digital no puede ser el factor que aparte a las personas mayores”

[Parte 1] Danilo Musa de Samsung Chile: “La tecnología Micro RGB busca mostrar la imagen como fue concebida”

Carlo Dubón de Dreame Technology: “El consumidor chileno puede pagar por un producto, pero exige calidad”

Tecnología Micro RGB: ¿Qué es y cómo funciona el sistema de retroiluminación?

Mini LED, Micro LED, Micro RGB y OLED: ¿qué son y en qué se diferencian?

Apple libera firmware beta para los AirPods que habilita el ecualizador en iOS 27 y acá te explicamos cómo obtenerlo

Nintendo anuncia un Direct especial de Splatoon Raiders para mañana 30 de junio

Grand Theft Auto VI inicia su preventa este 25 de junio y Rockstar asegura que “se juega mejor en PS5”

Rockstar activa la actualización gratis de GTA V mientras arranca el marketing de GTA 6

Google anuncia Gemini Omni como su nuevo modelo multimodal para crear y editar video con IA en el I/O 2026

Gemini Omni: Creación multimodal, edición conversacional y avatares digitales

Edición iterativa: la secuencia de la violinista

Integración móvil en YouTube Shorts y doble sistema de verificación

Lenovo Tab Plus Gen 2 es oficial, y llega con 9 altavoces JBL y pantalla 12,1 pulgadas

Review Motorola Razr Fold edición FIFA World Cup 2026

Mini LED, Micro LED, Micro RGB y OLED: ¿qué son y en qué se diferencian?

Apple libera nuevo firmware estable para los AirPods Pro 2 y Pro 3

Android 17 estable ya está disponible para los teléfonos Google Pixel

Google anuncia Gemini Omni como su nuevo modelo multimodal para crear y editar video con IA en el I/O 2026

Gemini Omni: Creación multimodal, edición conversacional y avatares digitales

Edición iterativa: la secuencia de la violinista

Integración móvil en YouTube Shorts y doble sistema de verificación

Suscríbete