Stundenlanges Herumprobieren für den perfekten Schnitt und das Eintippen komplizierter Befehle in überladener Software könnten schon bald der Vergangenheit angehören.
Google hat gestern sein neuestes KI-Modell Omni Flash vorgestellt, das die Erstellung von Content von Grund auf verändern soll.
Ziel sei es, den oft mühseligen Bearbeitungsprozess bei der Erstellung und dem Schnitt von Videos zu erleichtern. Ganz ohne Maus und Tastatur sollen kreative Köpfe, allein mit natürlichen Sprachbefehlen und im Dialog mit der KI, Projekte anpassen und neu gestalten können.
1:18
Alexa+: Das bietet die neue KI-Sprachassistenz von Amazon
Eine multi-modale KI, die alle Formate unterstützt
Der Kern von Googles neuster KI-Errungenschaft ist die Unterstützung des gesamten Bearbeitungsprozesses. Die KI ist in der Lage, »aus allen möglichen Eingaben vielfältige Ausgaben [zu] erzeugen«, so Google in der Ankündigung.
Das bedeutet multimodale KI: Die künstliche Intelligenz ist in der Lage, verschiedene Arten von Informationen, etwa Text, Bild, Audio oder Video, zu verarbeiten und zu kombinieren. Traditionelle Modelle sind oft auf ein einziges Format beschränkt.
Für die Praxis bedeutet dies: Mit nur einem Arbeitsschritt kann ein Video hochgeladen und Regieanweisungen per Sprachnotiz gegeben werden. Die KI wird damit angeleitet, eigenständig den Clip an die Anweisungen anzupassen.
In einem Video stellt Google das neue Modell vor:
Link zum YouTube-Inhalt
Im Dialog Schritt für Schritt zum fertigen Clip
Die Zeiten langer Text-Prompts scheinen mit der Einführung von Omni Flash gezählt. Die Arbeitsschritte gleichen vielmehr einem Gespräch mit einem menschlichen Editor am Schneidepult.
Da »jede Anweisung auf der vorherigen aufbaut« entsteht ein Prozess, der jederzeit durch weitere Anweisungen verändert werden kann. Die KI passt anhand der gegebenen Anweisungen das Video an, ohne dass es andere Auswirkungen hat, so Google.
Grenzenloses Storytelling
Das Entwicklerteam hebt besonders die kreativen Freiräume hervor, die das neue KI-Modell bietet. Es gehe nicht mehr ausschließlich darum, die Realität möglichst perfekt nachzubilden, sondern eine »Brücke zwischen Fotorealismus und bedeutungsvollem Storytelling« zu bauen.
Nutzer würden so Werkzeuge erhalten, um Welten zu erschaffen, die in der Realität schlichtweg unmöglich oder kostspielig wären. Das Modell verwandelt alltägliche Aufnahmen in etwas, das ihr nie hättet filmen können
.
Mehr zum Thema: Google hat Gemini noch einen Schritt weiterentwickelt: Jetzt erstellt es Excel-Dateien, PDFs und vieles mehr
Verfügbarkeit und Rollout: Wer Omni Flash wann nutzen kann
Auch wenn die gezeigten Beispiele beeindruckend aussehen, wird das neue KI-Werkzeug nicht direkt für die breite Masse freigeschaltet.
Wie bei vielen großen KI-Updates geht Google bei der Veröffentlichung schrittweise vor: Im ersten Schritt erhalten Google AI Plus, Pro und Ultra-Abonnenten weltweiten Zugriff über die Gemini-App und Google Flow.
Ab dieser Woche soll Gemini Omni Flash auch auf YouTube für YouTube Shorts und in YouTube Create eingeführt werden.
Nur angemeldete Benutzer können kommentieren und bewerten.
Dein Kommentar wurde nicht gespeichert. Dies kann folgende Ursachen haben:
1. Der Kommentar ist länger als 4000 Zeichen.
2. Du hast versucht, einen Kommentar innerhalb der 10-Sekunden-Schreibsperre zu senden.
3. Dein Kommentar wurde als Spam identifiziert. Bitte beachte unsere Richtlinien zum Erstellen von Kommentaren.
4. Du verfügst nicht über die nötigen Schreibrechte bzw. wurdest gebannt.
Bei Fragen oder Problemen nutze bitte das Kontakt-Formular.
Nur angemeldete Benutzer können kommentieren und bewerten.
Nur angemeldete Plus-Mitglieder können Plus-Inhalte kommentieren und bewerten.