Sora : Le nouveau modèle d'IA d'OpenAI pour créer des vidéos à partir de texte

Gábor Bíró 16 février 2024
2 min de lecture

OpenAI a dévoilé Sora, un nouveau modèle d'IA qui permet aux utilisateurs de créer des vidéos à partir d'instructions textuelles, représentant un bond en avant significatif dans la génération de contenu pilotée par l'IA.

Sora : Le nouveau modèle d'IA d'OpenAI pour créer des vidéos à partir de texte
Source: OpenAI

OpenAI a présenté Sora, un nouveau modèle d'IA générative capable de créer des vidéos à partir d'instructions textuelles. Sora utilise un modèle de diffusion combiné à une architecture de transformeurs, similaire à la technologie derrière les modèles GPT, pour générer des scènes réalistes et imaginatives. Il peut gérer des scénarios complexes avec de multiples personnages, des types de mouvements spécifiques et des détails précis des sujets et des arrière-plans. Le modèle est également capable d'animer des images fixes, d'étendre des vidéos existantes ou de combler les images manquantes, produisant des vidéos d'une durée maximale d'une minute dans différents styles, y compris photoréalistes, animés ou en noir et blanc.

Malgré ses capacités impressionnantes, Sora présente actuellement des limitations. Il a du mal à simuler avec précision la physique de scènes complexes, à comprendre les relations de cause à effet et à maintenir des détails spatiaux précis au fil du temps. Par exemple, un personnage peut mordre dans un biscuit, mais le biscuit peut ne pas montrer de marque de morsure par la suite, ou le modèle peut confondre les directions gauche et droite dans une scène.

OpenAI fait preuve de prudence avant de rendre Sora largement disponible. Ils travaillent activement avec des équipes de test (experts qui testent les systèmes pour détecter les failles) afin d'évaluer les préjudices et les risques potentiels, tels que la génération de désinformation, de contenu haineux ou de biais. De plus, des classificateurs de détection sont en cours de développement pour identifier les contenus trompeurs générés par Sora, et l'entreprise prévoit d'inclure à l'avenir des métadonnées C2PA afin de garantir la provenance des vidéos générées par Sora.

Actuellement, Sora est disponible pour un groupe limité d'équipes de test et un nombre restreint d'artistes visuels, de designers et de cinéastes afin de recueillir des commentaires sur la manière de rendre le modèle le plus utile possible pour les professionnels de la création. OpenAI collabore avec des décideurs politiques, des éducateurs et des artistes du monde entier afin de comprendre les préoccupations et d'identifier les cas d'utilisation positifs de cette technologie. Ils soulignent que l'apprentissage de l'utilisation dans le monde réel est crucial pour créer et diffuser des systèmes d'IA de plus en plus sûrs au fil du temps.

L'introduction de Sora s'inscrit dans la continuité de la stratégie d'OpenAI de développement rapide d'outils d'IA générative avancés, notamment ChatGPT pour le texte et DALL-E 3 pour les images. Sora marque une avancée significative dans les capacités de l'IA pour la génération de contenu vidéo, accélérant encore la concurrence et l'innovation dans ce domaine en évolution rapide.

Gábor Bíró 16 février 2024