Einer der größten KI-Entwickler der Welt wird gerade von Reddit verklagt

Reddit hat Klage gegen Anthropic eingereicht. Die Entwickler hinter dem »Claude«-Chatbot sollen unerlaubt Daten von der Social-Media-Plattform gesammelt haben.

Reddit hat Klage gegen das KI-Unternehmen Anthropic eingereicht - den Machern hinter »Claude«. (Bildquelle: Reddit, Anthropic) Reddit hat Klage gegen das KI-Unternehmen Anthropic eingereicht - den Machern hinter »Claude«. (Bildquelle: Reddit, Anthropic)

Die Social-Media-Plattform hat Klage gegen das KI-Unternehmen Anthropic eingereicht. Der Vorwurf: Das Unternehmen, das unter anderem durch den Chatbot »Claude« globale Bekanntheit erlangt hat, habe systematisch und ohne Erlaubnis Inhalte von der Reddit-Plattform gesammelt, um Claude zu trainieren.

Anthropic, das 2021 von ehemaligen OpenAI-Führungskräften gegründet wurde und mittlerweile mit 61,5 Milliarden US-Dollar bewertet wird, positioniert sich öffentlich als ethischer Akteur in der KI-Branche.

Reddit wirft dem Unternehmen jedoch vor, diese Selbstdarstellung sei pure Marketing-Rhetorik: »Anthropic ist keineswegs der weiße Ritter der KI-Industrie, als der es sich bewirbt«, heißt es in der Klageschrift.

  • Laut Reddit nutzt das Unternehmen bereits seit Dezember 2021 Inhalte der Plattform für das Training seines Claude-Systems.
  • Trotz öffentlicher Zusicherungen im Juli 2024, dass man seine Bots gestoppt habe, wurden zudem über 100.000 weitere Zugriffe auf Reddit-Server durchgeführt.

Video starten 39:20 So teuer war Nintendo noch nie – Ist die Switch 2 ihr Geld wert?

Die Reddit-Klage im Detail

Reddit führt in der Klage mehrere spezifische Rechtsverletzungen an:

  • Kommerzielle Ausbeutung: Anthropic profitiert finanziell von den gesammelten Daten, ohne Reddit oder deren Nutzer zu entschädigen.
  • Datenschutzverletzungen: Die Nutzung persönlicher Daten von Reddit-Nutzern erfolgte ohne deren Zustimmung.
  • Vertragsbruch: Anthropic habe sowohl die Nutzervereinbarung als auch die Entwickler-Nutzungsbedingungen von Reddit verletzt, die kommerzielles Scraping explizit untersagen.
  • Ignorieren technischer Schutzmaßnahmen: Das Unternehmen missachtete das Robots Exclusion Protocol (robots.txt), das Webseiten-Betreiber verwenden, um automatisierte Crawler zu blockieren.

Beim Scraping verwenden Unternehmen automatisierte Programme, um systematisch Webseiten zu durchsuchen und Inhalte zu extrahieren. Diese Daten werden anschließend in strukturierte Datensätze umgewandelt, die als Trainingsmaterial für KI-Modelle dienen.

Anthropics ClaudeBot, der offizielle Crawler des Unternehmens, wurde entwickelt, um öffentlich zugängliche Internetinhalte für das Training der Claude-Sprachmodelle zu sammeln. Während dies grundsätzlich legal sein kann, entstehen Probleme, wenn Webseiten-Betreiber explizit ihre Ablehnung ausdrücken – etwa über das Robots Exclusion Protocol.

Die Geschäftsdimension: Milliardeninvestitionen und Marktmacht

Ein entscheidender Aspekt der Klage betrifft die enormen kommerziellen Dimensionen. Amazon hat seit 2023 insgesamt 8 Milliarden US-Dollar in Anthropic investiert (via Heise) und ist damit zu einem strategischen Partner geworden.

Reddit argumentiert, dass Anthropics Geschäftsmodell darauf basiere, kostenlos verfügbare Inhalte zu nutzen, während andere Unternehmen wie Google und OpenAI bereits Lizenzvereinbarungen mit der Plattform abgeschlossen haben (via Reuters).

  • Die Deals, die Reddit über 100 Millionen US-Dollar eingebracht haben, beinhalten wichtige Schutzmaßnahmen für Nutzer, einschließlich des Rechts auf Löschung von Inhalten und Privatsphäre-Schutz.

KI-Unternehmen sollten nicht berechtigt sein, Informationen und Inhalte von Menschen ohne klare Beschränkungen zur Nutzung dieser Daten zu sammeln.

Reddit-Chefanwalt Ben Lee via AP News

Anthropics Reaktion und Verteidigung

Anthropic hat die Vorwürfe gegenüber Ars Technica vehement bestritten. »Wir sind mit Reddits Behauptungen nicht einverstanden und werden uns energisch verteidigen«, erklärte ein Unternehmenssprecher. Das Unternehmen verweist auf seine FAQ-Seite, die besagt, dass der Crawler nur durch robots.txt-Dateien blockiert werden könne.

Reddit antwortete hierauf allerdings, dass man auch in den darauffolgenden Monaten Anthropic beim Scraping erwischt habe. Bis zu einer Entscheidung in diesem Rechtsstreit kann es aufgrund der komplexen Natur allerdings noch Jahre dauern.

zu den Kommentaren (2)

Kommentare(2)
Kommentar-Regeln von GameStar
Bitte lies unsere Kommentar-Regeln, bevor Du einen Kommentar verfasst.

Nur angemeldete Benutzer können kommentieren und bewerten.