Sora 2 llega para impulsar la creación de video con inteligencia artificial generativa. El nuevo modelo promete simulaciones más realistas.

Imagen vía Flickr (Focal Foto)
OpenAI anunció el lanzamiento de Sora 2, su nuevo modelo insignia para la generación de video y audio. La tecnológica también presentó una aplicación social para dispositivos iPhone. El Sora original fue un momento fundamental para el video en 2024. Dicho sistema demostró por primera vez la generación de video en funcionamiento. El primer Sora incluso demostró comportamientos simples, como la permanencia de objetos en escena.
El equipo detrás de Sora se enfocó en entrenar softwares con mejores capacidades de simulación. Estas herramientas serían esenciales para la formación de programas de inteligencia artificial (IA) que entiendan el mundo físico. Un gran avance es dominar el preentrenamiento y posentrenamiento con datos de video a gran escala.
Sora 2 representa un salto importante para la compañía. Ellos lo ven como el momento “GPT-3.5 para el video”. Este servicio puede hacer cosas muy difíciles para las plataformas de generación de video anteriores. Un ejemplo es simular con precisión las dinámicas de flotación y rigidez. La opción anterior era muy optimista. Podía deformar la realidad para ejecutar con éxito una indicación de texto. Supongamos, si un jugador de baloncesto erraba un tiro, la pelota podía teletransportarse al aro. En Sora 2, si el jugador falla el tiro, la pelota rebota en el tablero.
Los errores que comete Sora 2 suelen ser fallos del agente interno que la plataforma simula de forma implícita. El sistema obedece mejor las leyes de la física comparado con otros anteriores, aunque todavía tiene imperfecciones. Esto es importante para un simulador de mundo útil. Debe poder modelar el fracaso y no solo el éxito.
El nuevo desarrollo incluso ha avanzado en control. Es capaz de seguir instrucciones intrincadas de varias tomas. Destaca en estilos realistas, cinemáticos y animé. Como un generador de video y audio de propósito general, crea paisajes sonoros de fondo, voz y efectos de sonido. Lo hace con un alto grado de realismo.
Como dijimos al inicio, OpenAI lanzó una nueva aplicación social para iOS llamada simplemente Sora. Esta app es impulsada por Sora 2. Permite a los usuarios crear, remezclar generaciones ajenas y descubrir nuevos videos.
Asimismo, anexa una característica denominada “cameos”. Con la misma, tienes la alternativa de inyectar elementos del mundo real en Sora 2. Es decir, puedes incluirte o sumar a tus amigos en cualquier entorno generado por la plataforma. Ello funciona para cualquier persona, animal u objeto. La aplicación social está pensada para usarse con amigos. La empresa considera que los cameos refuerzan el sentido de comunidad.
Sam Altman, director ejecutivo de OpenAI, mencionó: «Esto se siente, para muchos de nosotros, como el momento ‘ChatGPT para la creatividad’”. Agregó que la capacidad de ponerse a uno mismo y a los amigos en un video resulta “una forma nueva y sorprendentemente convincente de conectar”.
La aplicación Sora ya se puede descargar para iOS. El lanzamiento inicial es solo para Estados Unidos y Canadá. Luego, se expandirá con rapidez a otros países. Al recibir una invitación, será posible acceder a Sora 2 mediante el sitio web sora.com.
La herramienta estará disponible de forma gratuita al principio. Contará con límites generosos para que la gente explore sus capacidades. Los usuarios de ChatGPT Pro tendrán posibilidad de usar una versión experimental de mayor calidad, llamada Sora 2 Pro, en sora.com. Pronto llegará también a la aplicación Sora.
Los usuarios de Android podrán acceder a Sora 2 mediante sora.com una vez que tengan un código de invitación. OpenAI planea habilitarlo en la interfaz de programación de aplicaciones (API, por sus siglas en inglés). La versión Sora 1 Turbo seguirá disponible.
Fuentes: OpenAI – OpenAI en X– Sam Altman en X