Sora: OpenAI's neues KI-Modell zur Videoerstellung aus Text

Gábor Bíró 16. Februar 2024
2 Min. Lesezeit

OpenAI hat Sora vorgestellt, ein neues KI-Modell, das es Nutzern ermöglicht, Videos basierend auf Textanweisungen zu erstellen. Dies stellt einen bedeutenden Fortschritt in der KI-gestützten Inhaltserzeugung dar.

Sora: OpenAI's neues KI-Modell zur Videoerstellung aus Text
Quelle: OpenAI

OpenAI hat Sora vorgestellt, ein neuartiges generatives KI-Modell, das Videos aus Textaufforderungen erstellen kann. Sora nutzt ein Diffusionsmodell in Kombination mit einer Transformer-Architektur, ähnlich der Technologie hinter GPT-Modellen, um realistische und fantasievolle Szenen zu generieren. Es kann komplexe Szenarien mit mehreren Charakteren, spezifischen Bewegungsarten und genauen Details von Objekten und Hintergründen verarbeiten. Das Modell ist auch in der Lage, Standbilder zu animieren, bestehende Videos zu erweitern oder fehlende Frames auszufüllen und Videos von bis zu einer Minute Länge in verschiedenen Stilen zu produzieren, darunter fotorealistisch, animiert oder schwarz-weiß.

Trotz seiner beeindruckenden Fähigkeiten hat Sora derzeit noch Einschränkungen. Es hat Schwierigkeiten, die Physik komplexer Szenen akkurat zu simulieren, Ursache-Wirkungs-Beziehungen zu verstehen und präzise räumliche Details über die Zeit hinweg aufrechtzuerhalten. Beispielsweise könnte eine Figur in einen Keks beißen, aber der Keks zeigt danach möglicherweise keinen Bissabdruck, oder das Modell könnte linke und rechte Richtungen innerhalb einer Szene verwechseln.

OpenAI lässt Vorsicht walten, bevor Sora allgemein verfügbar gemacht wird. Sie arbeiten aktiv mit Red Teamern (Experten, die Systeme auf Fehler testen) zusammen, um potenzielle Schäden und Risiken zu bewerten, wie z. B. die Erzeugung von Fehlinformationen, hasserfüllten Inhalten oder Voreingenommenheit. Darüber hinaus werden Erkennungsklassifikatoren entwickelt, um irreführende Inhalte zu identifizieren, die von Sora generiert wurden, und das Unternehmen plant, in Zukunft C2PA-Metadaten einzubinden, um die Herkunft von Sora-generierten Videos sicherzustellen.

Derzeit ist Sora einer begrenzten Gruppe von Red Teamern und einer ausgewählten Anzahl von bildenden Künstlern, Designern und Filmemachern zugänglich, um Feedback darüber zu sammeln, wie das Modell für Kreativprofis am hilfreichsten gestaltet werden kann. OpenAI arbeitet weltweit mit politischen Entscheidungsträgern, Pädagogen und Künstlern zusammen, um Bedenken zu verstehen und positive Anwendungsfälle für diese Technologie zu identifizieren. Sie betonen, dass das Lernen aus der realen Anwendung entscheidend ist, um im Laufe der Zeit zunehmend sichere KI-Systeme zu entwickeln und zu veröffentlichen.

Die Einführung von Sora folgt OpenAIs Muster der schnellen Entwicklung fortschrittlicher generativer KI-Tools, darunter ChatGPT für Text und DALL-E 3 für Bilder. Sora markiert einen bedeutenden Fortschritt in den Fähigkeiten von KI für die Videocontenterstellung und beschleunigt den Wettbewerb und die Innovation in diesem sich schnell entwickelnden Bereich weiter.

Gábor Bíró 16. Februar 2024