Nutzt KI ungefragt Gaming-Content zum Training? Aufregung um OpenAIs Sora und Twitch

OpenAI hat sich für die Entwicklung von Sora offensichtlich an Gaming-Streams von Twitch bedient. Die KI-Firma sieht sich jetzt mit Anschuldigungen des Copyright-Missbrauchs konfrontiert. Was passiert ist und warum das für die Zukunft von KI wichtig ist, erfahrt ihr hier.

OpenAI hat sich für das Training der Video-KI Sora offensichtlich auf Twitch bedient. (Quelle: Adobe Stock) OpenAI hat sich für das Training der Video-KI Sora offensichtlich auf Twitch bedient. (Quelle: Adobe Stock)

Generative KI braucht für das Training Daten. Viele Daten. Welche dafür verwendet wurden, ist im Nachhinein schwer herauszufinden. Und was ist, wenn es sich um urheberrechtlich geschütztes Material handelt? Eine Spurensuche mit der Video-KI Sora fördert Erstaunliches zutage und sorgt für eine Diskussion um Copyright.

Kyle Wiggers von TechCrunch wollte wissen, an welchen Quellen sich OpenAI so bedient hat, um die frisch veröffentlichte Video-KI Sora zu trainieren. Der genaue Inhalt der Datensets bleibt aber unter Verschluss. Deswegen musste er sich mit Ergebnisse verschiedener Prompts behelfen und hat ein sehr genaues Wissen über Videospiele bei Sora gefunden.

Sora kennt sich mit Videospielen frappierend gut aus

Eine Suche nach Mortal Kombat 1 gameplay brachte kein Ergebnis. Gibt man der KI jedoch einen Prompt, der den Titel des Games nicht direkt enthält, fördert die KI bekanntes zutage. So generiert der Prompt Italian plumber game ein Video, das erstaunlich an Super Mario Bros erinnert.

Viele User teilen mittlerweile in den sozialen Medien ihre Sora-Videos und entdecken dabei große Ähnlichkeiten zu bekannten Videospielen:

Empfohlener redaktioneller Inhalt

An dieser Stelle findest du einen externen Inhalt von Twitter, der den Artikel ergänzt.
Du kannst ihn dir mit einem Klick anzeigen lassen und wieder ausblenden.

Ich bin damit einverstanden, dass mir Inhalte von Twitter angezeigt werden.

Personenbezogene Daten können an Drittplattformen übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Link zum Twitter-Inhalt

Schon aus diesen Beispielen lassen sich zwei Schlüsse ziehen:

  • OpenAI bedient sich wohl an Material aus Videospielen.
  • OpenAI bemüht sich, offensichtliche Urheberrechtsverletzungen zu verschleiern.

Sora hat wohl auch einige Twitch-Streams gesehen

Sora kann auch das Twitch-Interface ziemlich treffend reproduzieren. Aber nicht nur das: Enthält der Prompt den Namen des bekannten Streamers Auronplay, generiert die KI das Bild einer Person, die dem Spanier bis auf die markanten Unterarm-Tattoos ähnelt.

Aufnahme aus dem KI-generierten Video von Sora (Quelle: TechCrunch.com) Foto des Streamers Auronplay (Quelle: flooxernow.com) Aufnahme aus dem KI-generierten Video von Sora (Quelle: TechCrunch.com) Foto des Streamers Auronplay (Quelle: flooxernow.com)

Das Problem ist, so Patentanwalt Joshua Weigensberg zu TechCrunch, dass das Training mit solchen Daten das Herunterladen des Materials erfordert. Und dieses enthält mit größter Wahrscheinlichkeit urheberrechtlich geschütztes Material. Im Falle von Videospiel-Streams aus dem Internet können drei verschiedene eventuell geschützte Quellen ausgemacht werden:

  1. Bildmaterial aus den Spielen selbst, das den Entwicklerstudios gehört.
  2. Streaming-Videos, die den Content-Erstellern gehören.
  3. Benutzerdefinierte Inhalte, wie selbst erstellte Karten in Fortnite.

Video starten 44:19 »Künstliche Intelligenz ist die neue Elektrizität« - Wir busten mit einem Experten 5 Mythen zu KI

Die Anschuldigungen sind nicht neu

OpenAI selbst gibt an, frei verfügbares Material aus dem Internet zu verwenden. Auf die Veröffentlichung von Wiggers Artikel gibt sich die Firma recht wortkarg, man werde die Behauptungen team-intern prüfen. Es sind nicht die ersten Urheberrechtsansprüche, mit denen sich OpenAI konfrontiert sieht.

Erst Anfang des Jahres wurde das Unternehmen von der New York Times verklagt. Auch die Zeitung beklagt die unerlaubte Nutzung von Artikeln zum Training von ChatGPT. Solche Gerichtsverfahren könnten wegweisend sein für die Zukunft von generativer KI und der Bedeutung von Urheberrecht.

Was denkt ihr darüber? Ist das Urheberrecht eine Gefahr für die Fortentwicklung von generativer KI? Oder gefährdet »Künstliche Intelligenz« eher das geistige Eigentum von Menschen? Schreibt es uns in die Kommentare!

zu den Kommentaren (82)

Kommentare(82)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.