Google lanzó Gemini Omni Flash, un modelo de inteligencia artificial multimodal que transforma la producción y edición de videos en un proceso accesible y conversacional. Esta tecnología, presentada en Google I/O 2026, permite generar contenido audiovisual de calidad cinematográfica combinando diferentes tipos de entradas como texto, imágenes, audio y video.

A través de Gemini Omni Flash, los usuarios pueden simplemente describir lo que desean modificar o crear en un video sin necesidad de manejar herramientas de edición tradicionales. La IA entiende instrucciones naturales y permite transformar elementos visuales, por ejemplo, convertir esculturas en burbujas o cambiar superficies como espejos por fluidos, manteniendo la coherencia física y la continuidad en múltiples ediciones sucesivas.

El sistema integra la capacidad de procesar simultáneamente diversas fuentes: fotografías, clips existentes, dibujos y referencias de voz. Así, es posible aplicar estilos visuales de una imagen a un video, sincronizar imágenes con música o crear secuencias animadas a partir de borradores y textos. Google destaca que Gemini Omni posee un entendimiento avanzado sobre movimiento, iluminación, gravedad y dinámicas de fluidos, lo que mejora la verosimilitud de las escenas generadas.

Además, este modelo busca conectar la generación visual con narrativas significativas, apoyándose en el amplio conocimiento de Gemini sobre ciencia, historia y cultura para enriquecer el contenido. Como parte de estas innovaciones, Google incorpora avatares de IA que pueden replicar la apariencia y voz del usuario para crear videos personalizados, aunque este desarrollo se implementa con precaución frente a riesgos de uso indebido, como los deepfakes.

Por el momento, la función inicial permite generar avatares basados en la voz, mientras que herramientas adicionales para editar audio y manipular el habla permanecen en fase de pruebas. Los videos producidos con Gemini Omni incluyen una marca de agua digital invisible llamada SynthID, que ayuda a verificar la autenticidad y origen del contenido.