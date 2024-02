Hättet ihr gedacht, dass dieser süße Hund aus einem KI-generierten Video stammt? (Bild: OpenAI)

OpenAI , die Entwickler hinter ChatGPT, schlafen nicht und arbeiten an immer mehr KI-Tools. Jetzt haben sie das neue Text-to-Video-Modell Sora vorgestellt.

Laut der offiziellen Webseite soll Sora »realistische und fantasievolle Szenen« aus einem einzelnen Prompt erzeugen.

Der größte Unterschied zu anderen Text-to-Video-Modellen liegt eindeutig in der präzisen Darstellung der Inhalte, die bei den meisten KI-Videos bisher in stetigem Wandel war.

Sora: Realistische Videos im Handumdrehen

Was kann Sora? Die neueste KI-Errungenschaft von OpenAI, Sora, verspricht, die Art und Weise, wie künstliche Intelligenz die physische Welt versteht, zu revolutionieren - oder zumindest einen ganzen Schritt nach vorne zu bringen.

Mit der Fähigkeit, Szenen mit mehreren Personen, unterschiedlichen Bewegungsarten und detaillierten Objekten zu erstellen, hebt sich Sora von anderen KI-Plattformen ab.

Nicht nur Prompts: Nutzer können neben Prompts auch Standbilder hochladen, vorhandene Videos erweitern oder fehlende Frames ergänzen lassen. Die generierten Videos zeichnen sich durch eine bemerkenswert natürliche Darstellung aus, auch wenn bei genauerem Hinsehen immer noch eine gewisse Falschheit erkennbar ist.

Nicht perfekt: OpenAI geht offen auf einige Probleme ein, die Sora noch hat. Dementsprechend könne die KI Links und Rechts verwechseln, die Physik mancher Gegenstände nicht richtig simulieren und manche Reaktionsabfolgen nicht korrekt darstellen.

Ein gutes Beispiel, in dem die Text-zu-Video-Funktion weniger gut funktioniert hat, seht ihr hier:

OpenAI nimmt diese Herausforderungen ernst und plant, mit einem Team von Branchenexperten ( Red Teamers ) zusammenzuarbeiten, um potenzielle Risiken zu bewerten. Ihr Fokus liegt darauf, sicherzustellen, dass Sora keine falschen Informationen generiert und frei von Hassinhalten oder Voreingenommenheit ist. Dementsprechend wird eine Textklassifikation eingeführt, um Anfragen abzulehnen, die gegen die Richtlinien verstoßen.

Wann kann ich Sora nutzen? Bisher gibt es noch keinen Starttermin für die Text–to-Video-KI. Sobald wir etwas erfahren, werden wir euch davon berichten.

