Generative KI braucht für das Training Daten. Viele Daten. Welche dafür verwendet wurden, ist im Nachhinein schwer herauszufinden. Und was ist, wenn es sich um urheberrechtlich geschütztes Material handelt? Eine Spurensuche mit der Video-KI Sora fördert Erstaunliches zutage und sorgt für eine Diskussion um Copyright.
Kyle Wiggers von TechCrunch wollte wissen, an welchen Quellen sich OpenAI so bedient hat, um die frisch veröffentlichte Video-KI Sora zu trainieren. Der genaue Inhalt der Datensets bleibt aber unter Verschluss. Deswegen musste er sich mit Ergebnisse verschiedener Prompts behelfen und hat ein sehr genaues Wissen über Videospiele bei Sora gefunden.
Sora kennt sich mit Videospielen frappierend gut aus
Eine Suche nach Mortal Kombat 1 gameplay
brachte kein Ergebnis. Gibt man der KI jedoch einen Prompt, der den Titel des Games nicht direkt enthält, fördert die KI bekanntes zutage. So generiert der Prompt Italian plumber game
ein Video, das erstaunlich an Super Mario Bros erinnert.
Viele User teilen mittlerweile in den sozialen Medien ihre Sora-Videos und entdecken dabei große Ähnlichkeiten zu bekannten Videospielen:
Link zum Twitter-Inhalt
Schon aus diesen Beispielen lassen sich zwei Schlüsse ziehen:
- OpenAI bedient sich wohl an Material aus Videospielen.
- OpenAI bemüht sich, offensichtliche Urheberrechtsverletzungen zu verschleiern.
Sora hat wohl auch einige Twitch-Streams gesehen
Sora kann auch das Twitch-Interface ziemlich treffend reproduzieren. Aber nicht nur das: Enthält der Prompt den Namen des bekannten Streamers Auronplay, generiert die KI das Bild einer Person, die dem Spanier bis auf die markanten Unterarm-Tattoos ähnelt.
Das Problem ist, so Patentanwalt Joshua Weigensberg zu TechCrunch, dass das Training mit solchen Daten das Herunterladen des Materials erfordert. Und dieses enthält mit größter Wahrscheinlichkeit urheberrechtlich geschütztes Material. Im Falle von Videospiel-Streams aus dem Internet können drei verschiedene eventuell geschützte Quellen ausgemacht werden:
- Bildmaterial aus den Spielen selbst, das den Entwicklerstudios gehört.
- Streaming-Videos, die den Content-Erstellern gehören.
- Benutzerdefinierte Inhalte, wie selbst erstellte Karten in Fortnite.
44:19
»Künstliche Intelligenz ist die neue Elektrizität« - Wir busten mit einem Experten 5 Mythen zu KI
Die Anschuldigungen sind nicht neu
OpenAI selbst gibt an, frei verfügbares Material aus dem Internet zu verwenden. Auf die Veröffentlichung von Wiggers Artikel gibt sich die Firma recht wortkarg, man werde die Behauptungen team-intern prüfen
. Es sind nicht die ersten Urheberrechtsansprüche, mit denen sich OpenAI konfrontiert sieht.
Erst Anfang des Jahres wurde das Unternehmen von der New York Times verklagt. Auch die Zeitung beklagt die unerlaubte Nutzung von Artikeln zum Training von ChatGPT. Solche Gerichtsverfahren könnten wegweisend sein für die Zukunft von generativer KI und der Bedeutung von Urheberrecht.
Was denkt ihr darüber? Ist das Urheberrecht eine Gefahr für die Fortentwicklung von generativer KI? Oder gefährdet »Künstliche Intelligenz« eher das geistige Eigentum von Menschen? Schreibt es uns in die Kommentare!
Nur angemeldete Benutzer können kommentieren und bewerten.
Dein Kommentar wurde nicht gespeichert. Dies kann folgende Ursachen haben:
1. Der Kommentar ist länger als 4000 Zeichen.
2. Du hast versucht, einen Kommentar innerhalb der 10-Sekunden-Schreibsperre zu senden.
3. Dein Kommentar wurde als Spam identifiziert. Bitte beachte unsere Richtlinien zum Erstellen von Kommentaren.
4. Du verfügst nicht über die nötigen Schreibrechte bzw. wurdest gebannt.
Bei Fragen oder Problemen nutze bitte das Kontakt-Formular.
Nur angemeldete Benutzer können kommentieren und bewerten.
Nur angemeldete Plus-Mitglieder können Plus-Inhalte kommentieren und bewerten.