Noch zu mächtig für uns alle: Microsoft stellt Software vor, doch veröffentlicht sie nicht – Ein Video zeigt wieso

Habt ihr die Mona Lisa schonmal rappen sehen? Wahrscheinlich nicht, doch das kann sich in wenigen Sekunden ändern.

Microsoft findet: Dieses Tool sollten wir noch nicht nutzen, doch ergibt das Sinn? (Bild: Wikipedia | Adobe Stock - deagreez) Microsoft findet: Dieses Tool sollten wir noch nicht nutzen, doch ergibt das Sinn? (Bild: Wikipedia | Adobe Stock - deagreez)

Microsoft arbeitet neben Copilot natürlich auch an anderen KI-Projekten, wie es so viele andere Tech-Unternehmen gerade auch tun.

Doch es hätte wahrscheinlich niemand erwartet, dass sie ein Tool vorstellen und im gleichen Zug behaupten, dass wir es noch eine ganze Weile nicht nutzen dürfen. 

Genau das ist jetzt mit VASA-1 geschehen, einer Software, die ein Foto eines Menschen und einen kurzen Ausschnitt seiner Stimme in ein realistisches Video verwandeln kann, in dem die Person alles sagt, was man ihr vorgibt.

Warum ist das wichtig? Es werden momentan viele KI-Tools auf den Markt gebracht, die Bilder oder Videos bearbeiten, manipulieren, animieren oder generieren. Dazu gehören OpenAIs Sora, Adobes Firefly oder Midjourney.

Microsoft ist das erste Unternehmen, dass eine solche Software vorstellt und gleichzeitig behauptet, dass sie mit der Veröffentlichung warten wollen, bis sie »verantwortungsbewusst« genutzt werden kann. 

Samsung Galaxy S24 Ultra
Samsung Galaxy S24 Ultra
mit praktischen Galaxy AI-Funktionen
Circle to Search, Live-Übersetzung bei Anrufen und generative Bildbearbeitung
Ab 1569 €
Google Pixel 8 Pro
Google Pixel 8 Pro
Google KI für brillante Aufnahmen
Magischer Bild-Editor, Echtzeit-Anrufübersetzung und Geräuschfilter bei Videoaufnahmen
Ab 889 €
Xiaomi 14 Ultra
Xiaomi 14 Ultra
Künstliche Intelligenz dank HyperOS
Geräuschunterdrückung bei Anrufen, KI-Kamerafeatures und Generieren von Texten
Ab 1419 €

Mona Lisa als Rapperin

Im Detail: Das Team von Microsoft Research Asia hat VASA-1 selbst als Technologie bezeichnet, die »hyperrealistische sprechende Gesichtsvideos mit präziser Lippen-Audio-Synchronisation, lebensechtem Gesichtsverhalten und naturalistischen Kopfbewegungen« erstellt.

Sie zeigen in mehreren Beispielen, die Bilder, die sie genutzt haben und die Videos, die daraus entstanden sind.

Rappende Gemälde: Unter anderem zeigt Microsoft auf der Ankündigungswebseite ein Video der Mona Lisa, wie sie einen Rap performt, der ursprünglich von Anne Hathaway im Jahr 2011 aufgeführt wurde, als sie bei Conan zu Gast war.

Microsoft lässt Mona Lisa mit neuem KI-Tool rappen Video starten 0:22 Microsoft lässt Mona Lisa mit neuem KI-Tool rappen

Ganz perfekt ist anders: Im Video der rappenden Mona Lisa und auch bei den anderen Beispielen von Microsoft wird klar, dass man durchaus erkennen kann, dass es sich ursprünglich um statische Bilder gehandelt hat.

In den Videos sieht man einige Verformungen im Gesicht, die es eigentlich nicht geben sollte. Hier und da fallen auch Bildfragmente auf.

Microsoft ist sich laut eigenen Angaben allerdings im Klaren darüber und stellt klar, dass die Technik noch nicht ganz ausgereift ist.

Wann können wir das KI-Tool nutzen? Während sich das Team hinter VASA-1 nach eigenen Angaben auf die positiven Anwendungsmöglichkeiten konzentriert, ist Microsoft der Meinung, dass die Software zu leicht missbraucht werden kann. 

»Vor diesem Hintergrund haben wir keine Pläne, eine Online-Demo, eine API, ein Produkt, zusätzliche Implementierungsdetails oder damit zusammenhängende Angebote zu veröffentlichen, solange wir nicht sicher sind, dass die Technologie verantwortungsvoll und in Übereinstimmung mit den entsprechenden Vorschriften eingesetzt wird.«

Meinung der Redaktion

Jan Stahnke: Ich bin zwiegespalten.

Einerseits finde ich einen verantwortungsvollen Umgang mit immer schneller, immer mächtiger werdenden KI-Tools für durchaus sinnvoll und wichtig. Immerhin gibt es schon jetzt diverse Menschen, die solche Technologien für weniger gute, bis boshafte Zwecke einsetzen. 

Microsoft setzt hier also ein Zeichen und sagt: Wir haben zwar die Technologie, doch der richtige Zeitpunkt ist noch nicht gekommen.

Andererseits stellt sich mir eine entscheidende Frage: Warum wird VASA-1 vorgestellt, wenn es angeblich noch nicht bereit für die Öffentlichkeit ist? Ich vermute dahinter eine Art Marketingstrategie, die nur eins tun soll: Aufmerksamkeit generieren. 

Doch ganz so leicht ist es doch nicht. Immerhin ist der schnelle Fortschritt von KI-Technologien beachtlich und wird uns in Zukunft eventuell vor Probleme stellen. Ob nun durch Unternehmen oder Nutzer, die die Technologien der Firmen nutzen, um anderen Menschen zu schaden.

Hier kommen im Normalfall Gesetzgeber daher und regeln, wie man mit der Technik umzugehen hat, wie zum Beispiel beim AI-Act der EU

Doch wenn ich mir bei einem sicher bin, dann dass die Technik sich schon jetzt deutlich schneller entwickelt, als Gesetzgeber reagieren können. 

Somit wird der verantwortungsvolle Umgang mit diesen Technologien immer wichtiger und Unternehmen tun wahrscheinlich gut daran, genau darüber nachzudenken, welche Tools sie wann veröffentlichen.

Will Microsoft also nur mit gutem Beispiel vorangehen? Oder einfach Aufmerksamkeit in einem Markt generieren, der gefühlt jeden Tag das nächste neue große Ding ankündigt?

Wenn ich mir die Leistung von VASA-1 so anschaue, vermute ich eher letzteres, da mich die Technik persönlich nicht so vom Hocker gehauen hat, wie es zum Beispiel bei OpenAIs Sora der Fall war.

Dennoch: Ein vernünftiger Umgang mit KI-Technologien wird in Zukunft unabdingbar.

zu den Kommentaren (3)

Kommentare(3)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.