Sora es un impresionante -- pero a la vez espeluznante -- modelo capaz de generar videos de hasta 60 segundos de duración.
OpenAI ha presentado su nuevo modelo de inteligencia artificial: Sora, el cual es tan impresionante como espeluznante.
Se trata de un modelo multimodal (texto a video), que entrega videos de hasta un minuto a partir de un simple prompt entregado por el usuario. También puede generar videos a partir de una imagen, e incluso extender uno ya existente y/o generar nuevos cuadros para este.
Según la empresa, Sora es capaz de generar escenas complejas con múltiples personajes, con tipos específicos de movimiento y detalles precisos del sujeto y el fondo, y que no solo es capaz de entender lo que usuario consulta con el prompt, sino que también «el cómo las cosas existen en el mundo real».
Si bien no hay un paper asociado a este trabajo, la compañía entregó un par de detalles sobre su funcionamiento. Sora es un modelo de difusión basado en el uso de transformers, que genera un video de manera iterativa, partiendo por una base de ruido que se va deshaciendo hasta tener una imagen clara.
Obviamente que OpenAI no es la primera empresa en hacer este tipo de modelos, de hecho Google y Meta ya se han aventurado en este campo (con Lumiere y Make-A-Video, respectivamente). No obstante, la calidad de los videos entregados por Sora parecen ser de mucha mayor calidad, y porqué no, más realistas.
Y es que ahí entra la parte espeluznante de esto: Sora puede entregar videos extremadamente realistas, y que salvo por algunos detalles en los movimientos de los sujetos o de objetos en la generación de ciertos frames, viendo los videos a simple vista fácilmente pueden pasar como verdaderos.
¿Qué hay de la disponibilidad? Por ahora, Sora solo estará disponible para un grupo cerrado de personas que están evaluando los potenciales riesgos que pueda tener esta herramienta. También será disponiblizado para un selecto grupo de artistas y diseñadores quienes evaluarán las maneras de hacer esta herramienta más útil para su trabajo.
No se menciona cuándo podría integrarse a la suite de herramientas de OpenAI ni a ChatGPT, pero de seguro tendremos novedades sobre eso en unos cuantos meses más.