Inteligencia artificial

Sora: El Nuevo Modelo de IA de OpenAI para Crear Videos a Partir de Texto

Gábor Bíró • 16 de febrero de 2024

2 min de lectura

OpenAI ha presentado Sora, un nuevo modelo de IA que permite a los usuarios crear videos basados en instrucciones textuales, lo que representa un avance significativo en la generación de contenido impulsada por la IA.

OpenAI presentó Sora, un novedoso modelo de IA generativa capaz de crear videos a partir de indicaciones de texto. Sora utiliza un modelo de difusión combinado con una arquitectura Transformer, similar a la tecnología detrás de los modelos GPT, para generar escenas realistas e imaginativas. Puede manejar escenarios complejos con múltiples personajes, tipos específicos de movimiento y detalles precisos de sujetos y fondos. El modelo también es capaz de animar imágenes fijas, extender videos existentes o rellenar fotogramas faltantes, produciendo videos de hasta un minuto de duración en varios estilos, incluyendo fotorrealista, animado o en blanco y negro.

A pesar de sus impresionantes capacidades, Sora actualmente tiene limitaciones. Le cuesta simular con precisión la física de escenas complejas, comprender las relaciones de causa y efecto y mantener detalles espaciales precisos a lo largo del tiempo. Por ejemplo, un personaje podría morder una galleta, pero es posible que la galleta no muestre una marca de mordisco después, o el modelo podría confundir las direcciones izquierda y derecha dentro de una escena.

OpenAI está actuando con cautela antes de que Sora esté ampliamente disponible. Están trabajando activamente con equipos rojos (expertos que prueban sistemas en busca de fallos) para evaluar posibles daños y riesgos, como la generación de desinformación, contenido de odio o sesgos. Además, se están desarrollando clasificadores de detección para identificar contenido engañoso generado por Sora, y la empresa planea incluir metadatos C2PA en el futuro para garantizar la procedencia de los videos generados por Sora.

Actualmente, Sora está disponible para un grupo limitado de equipos rojos y un número selecto de artistas visuales, diseñadores y cineastas para recopilar comentarios sobre cómo hacer que el modelo sea más útil para los profesionales creativos. OpenAI se está relacionando con legisladores, educadores y artistas de todo el mundo para comprender las preocupaciones e identificar casos de uso positivos para esta tecnología. Destacan que aprender del uso en el mundo real es crucial para crear y lanzar sistemas de IA cada vez más seguros con el tiempo.

La presentación de Sora sigue el patrón de OpenAI de desarrollar rápidamente herramientas avanzadas de IA generativa, incluyendo ChatGPT para texto y DALL-E 3 para imágenes. Sora marca un avance significativo en las capacidades de la IA para la generación de contenido de video, acelerando aún más la competencia y la innovación en este campo en rápida evolución.

Artículos relacionados

Los Robots Humanoides

Reinterpretación del Experimento del Marshmallow

Investigadores de Google Simulan una Sopa Primordial Digital

Trampa 22: la paradoja que atrapa al pensamiento racional

El Futuro de los Robots Humanoides

Cómo los humanoides están moldeando el futuro del trabajo