»Etwas, das ihr nie hättet filmen können«: Google will Videos revolutionieren

Das neue Modell steht zahlenden Gemini-Abonnenten weltweit zur Verfügung. (Bildquelle: Google)

Stundenlanges Herumprobieren für den perfekten Schnitt und das Eintippen komplizierter Befehle in überladener Software könnten schon bald der Vergangenheit angehören.

Google hat gestern sein neuestes KI-Modell Omni Flash vorgestellt, das die Erstellung von Content von Grund auf verändern soll.

Ziel sei es, den oft mühseligen Bearbeitungsprozess bei der Erstellung und dem Schnitt von Videos zu erleichtern. Ganz ohne Maus und Tastatur sollen kreative Köpfe, allein mit natürlichen Sprachbefehlen und im Dialog mit der KI, Projekte anpassen und neu gestalten können.

1:18 Alexa+: Das bietet die neue KI-Sprachassistenz von Amazon

Autoplay

Eine multi-modale KI, die alle Formate unterstützt

Der Kern von Googles neuster KI-Errungenschaft ist die Unterstützung des gesamten Bearbeitungsprozesses. Die KI ist in der Lage, »aus allen möglichen Eingaben vielfältige Ausgaben [zu] erzeugen«, so Google in der Ankündigung.

Das bedeutet multimodale KI: Die künstliche Intelligenz ist in der Lage, verschiedene Arten von Informationen, etwa Text, Bild, Audio oder Video, zu verarbeiten und zu kombinieren. Traditionelle Modelle sind oft auf ein einziges Format beschränkt.

Für die Praxis bedeutet dies: Mit nur einem Arbeitsschritt kann ein Video hochgeladen und Regieanweisungen per Sprachnotiz gegeben werden. Die KI wird damit angeleitet, eigenständig den Clip an die Anweisungen anzupassen.

In einem Video stellt Google das neue Modell vor:

Empfohlener redaktioneller Inhalt

An dieser Stelle findest du einen externen Inhalt von YouTube, der den Artikel ergänzt.
Du kannst ihn dir mit einem Klick anzeigen lassen und wieder ausblenden.

YouTube-Inhalte erlauben

Ich bin damit einverstanden, dass mir Inhalte von YouTube angezeigt werden.

Personenbezogene Daten können an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Link zum YouTube-Inhalt

Im Dialog Schritt für Schritt zum fertigen Clip

Die Zeiten langer Text-Prompts scheinen mit der Einführung von Omni Flash gezählt. Die Arbeitsschritte gleichen vielmehr einem Gespräch mit einem menschlichen Editor am Schneidepult.

Da »jede Anweisung auf der vorherigen aufbaut« entsteht ein Prozess, der jederzeit durch weitere Anweisungen verändert werden kann. Die KI passt anhand der gegebenen Anweisungen das Video an, ohne dass es andere Auswirkungen hat, so Google.

Grenzenloses Storytelling

Das Entwicklerteam hebt besonders die kreativen Freiräume hervor, die das neue KI-Modell bietet. Es gehe nicht mehr ausschließlich darum, die Realität möglichst perfekt nachzubilden, sondern eine »Brücke zwischen Fotorealismus und bedeutungsvollem Storytelling« zu bauen.

Nutzer würden so Werkzeuge erhalten, um Welten zu erschaffen, die in der Realität schlichtweg unmöglich oder kostspielig wären. Das Modell verwandelt alltägliche Aufnahmen in etwas, das ihr nie hättet filmen können.

Mehr zum Thema: Google hat Gemini noch einen Schritt weiterentwickelt: Jetzt erstellt es Excel-Dateien, PDFs und vieles mehr

Verfügbarkeit und Rollout: Wer Omni Flash wann nutzen kann

Auch wenn die gezeigten Beispiele beeindruckend aussehen, wird das neue KI-Werkzeug nicht direkt für die breite Masse freigeschaltet.

Wie bei vielen großen KI-Updates geht Google bei der Veröffentlichung schrittweise vor: Im ersten Schritt erhalten Google AI Plus, Pro und Ultra-Abonnenten weltweiten Zugriff über die Gemini-App und Google Flow.

Ab dieser Woche soll Gemini Omni Flash auch auf YouTube für YouTube Shorts und in YouTube Create eingeführt werden.

»Etwas, das ihr nie hättet filmen können«: Google will Videos revolutionieren

Eine multi-modale KI, die alle Formate unterstützt

Im Dialog Schritt für Schritt zum fertigen Clip

Grenzenloses Storytelling

Verfügbarkeit und Rollout: Wer Omni Flash wann nutzen kann

Willkommen bei GameStar!

Weiter mit Werbung

Werbefrei mit GameStar Plus