Eine KI-Firma hat Millionen gedruckte Bücher gekauft und anschließend zerstört, nur um ihr KI-Modell zu trainieren

Benedikt Schlotmann 29. Juni 2025 Lesezeit 2 Minuten

Die KI-Firma Anthropic steht vor Gericht, weil sie fremde Inhalte für das Training der eigenen KI Claude einsetzt. Dabei geht es unter anderem um Millionen Bücher, die Anthropic gekauft haben will.

Am Montag, dem 23. Juni 2025, enthüllten Gerichtsdokumente, dass das KI-Unternehmen Anthropic Millionen von Dollar für das Einscannen von gedruckten Büchern ausgegeben hat, um Claude zu entwickeln, einen KI-Assistenten ähnlich wie ChatGPT.

Ein besonderes Detail: Das Unternehmen kaufte gebrauchte, gedruckte Bücher, schnitt Millionen von ihnen aus ihren Einbänden, scannte sie in digitale Dateien und warf die Originale weg, nur um die KI zu trainieren. Davon berichtet das englischsprachige Magazin ArsTechnica.

Video starten

In Deutschland gibt es über 400 USB-Sticks, die aus Wänden herausragen – Was ist das „Dead Drops“-Projekt?

Autoplay

Firma kauft gedruckte Bücher, um Schwierigkeiten der Lizenzierung zu umgehen

Warum macht Anthropic das? Das Problem ist generell, dass es vor allem um die rechtliche Kontrolle der Inhalte geht. Firmen und Verlage sind grundsätzlich der Ansicht, dass digitale Inhalte ihnen gehören und KI diese erst einmal nicht verwenden dürfe, wenn sie nicht dafür zahlt. Und KI-Firmen sind nicht immer bereit, eine Lizenz dafür auszuhandeln.

Der Ausweg aus der Misere: Wer ein physisches Buch kauft, kann damit mehr oder weniger machen, was er will und das selbst gekaufte Buch am Ende auch zerstören. Und genau diesen Vorteil nutzte Anthropic dann aus.

Denn der Kauf gebrauchter physischer Bücher umging das Problem mit der Lizenzierung vollständig und lieferte gleichzeitig den hochwertigen, professionell redigierten Text, den KI-Modelle benötigen, und destruktives Scannen war einfach der schnellste Weg, um Millionen von Bänden zu digitalisieren.

Das Unternehmen gab laut Gerichtsunterlagen „viele Millionen Dollar“ für den Kauf und das Scannen aus und kaufte gebrauchte Bücher oft in großen Mengen. Anschließend wurden die Bücher aus den Einbänden genommen, die Seiten auf ein brauchbares Maß zugeschnitten, als Seitenstapel in PDF-Dateien mit maschinenlesbarem Text einschließlich der Einbände gescannt und dann alle Papieroriginale weggeworfen.

Wie entschied der Richter? Für die KI-Firma: Richter William Alsup erklärte, dass dieser zerstörerische Scanvorgang als faire Nutzung zu werten sei. Allerdings nur, weil Anthropic die Bücher zuerst legal erworben, jedes gedruckte Exemplar nach dem Scannen vernichtet und die digitalen Dateien intern aufbewahrt hatte, anstatt sie zu verteilen. Hätte die Firma die Scans verteilt, hätte es juristische Probleme geben können.

Der Richter verglich das Verfahren mit der „Erhaltung des Weltraums.“ Viel genauer wurde er jedoch nicht.

Deine Meinung ist uns wichtig!

Gefällt dir der Artikel? Hast du irgendwelche Kommentare? Sag uns, was du denkst!

Kommentieren

Bitte lies unsere Kommentarregeln, bevor du kommentierst.

6 Kommentare

Neueste

Älteste Meisten Abstimmungen

Inline Feedback

Alle Kommentare anzeigen

Dude(@thedude)

vor 9 Monaten

#1243116

Sind wir ehrlich, jeder Mensch lernt aus dem was um ihn herum passiert, in der Schule, aus Büchern oder dem TV. Nichts anderes machen Computer seit Anbeginn, man füttert sie und sie verarbeiten diese Informationen. Jeder der eine Form von Computer hat, profitiert und arbeitet mit dem Wissen welches sich über die Jahrhunderte angesammelt hat, seien es PCs, Smartphones, sogar moderne Fernseher sind Archive von Wissen welches Menschen erlangt haben. Moderne Computer sind jetzt allerdings in der Lage, aus diesen ganzen Schnipzeln in einer Art Kreativität funktionierende neue Dinge zu erzeugen, rein aus der Verarbeitung des “Gelernten” heraus. Bisher konnten Computer uns beim Finden helfen und Schlüsse ziehen, jetzt können sie sogar ganze Projekte umsetzen, bzw. Beinahe schon selbsttätig erstellen, wenn man nur die richtige Frage stellt. Die nächste Generation wird sein, dass sie selbst die Fragen stellen, z.B. ob der Mensch eigentlich noch sinnvoll ist und er hat ja zuvor schon Mittel und Wege erlernt Dinge umzusetzen…
Die Software-Entwickler schaffen sich als erstes selbst ab, bis sie Geräte entwickeln die das Entwickeln besser können. Irgendwann stellt der Angestellte fest, dass er selbst viel besser als der Chef geeignet ist und auch die Mittel dazu hat…

Zuletzt bearbeitet vor 9 Monaten von Dude

HiveTyrant(@hivetyrant)

Antwort an Dude

vor 9 Monaten

#1243119

Bibliothek? Erfordert MEISTENS eine Mitgliedschaft. Schule? Sollte durch die Allgemeinheit bezahlt werden, manchmal auch als Privatschule. TV/Internet? Man zahlt normalerweise auf irgendeine Weise auch dort, entweder Werbeunterbrechungen, Fernsehgebür oder im Netz mittlerweile durch Tracking.

Die Firma soll durchaus Geld machen, aber für das Training eine Lizenz kaufen. Und nicht nur ‘Bücher kaufen, Trainieren, Bücher vernichten’.

Entweder mit einer vernünftigen Lizenz, die einen normalen Einmalbetrag und anschließend einen eher symbolischen Betrag beinhaltet, 1 Euro für 100000 Aufrufe oder so.
Oder garnicht, und sollte ein Gericht entscheiden, das die Verwendung illegal war, sollte es keine Geldstrafe geben – sondern alle Daten die aus den Büchern entstanden sind, sowie die Datenträger auf denen diese Daten sich befinden, müssten vernichtet werden.

vulperabeste(@vulperabeste)

Antwort an HiveTyrant

vor 9 Monaten

#1243243

ich verstehe das problem nicht, die haben die bücher halt gekauft und eingescannt statt eine lizenz zu kaufen. ich find das ehrlich gesagt ultra smart.

HiveTyrant(@hivetyrant)

Antwort an vulperabeste

vor 9 Monaten

#1243321

Die Lizenz zur Nutzung für KI bedeutet meist einen höheren Kaufpreis oder einen fortlaufenden Prozentsatz des Umsatzes der mit der bezahlten Verwendung der KI generiert wird.
Prinzipiell auf jeden Fall schonmal besser, als wenn man die Bücher einfach irgendwie im Netz beschafft und dann ohne zu zahlen genommen hätte.
Aber eine Lizenz und damit verbunden eine Nachfrage (vielleicht will der Autor nicht, das KI mit seinem Buch trainiert wird?) wäre der rechtlich richtige Weg gewesen.

vulperabeste(@vulperabeste)

Antwort an HiveTyrant

vor 9 Monaten

#1243668

Ich verstehe deinen Punkt, muss aber erwähnen, dass der Richter FÜR die KI-Firma geurteilt hat. Also ist das, was die gemacht haben rechtlich nicht der falsche Weg gewesen.

Winter(@winter)

Antwort an HiveTyrant

vor 9 Monaten

#1243318

Das ist leider das traurige an den meisten AI Programmen – das Training besteht zum Großteil wirklich aus Dateien für die keine Rechte existieren.
Das sieht man ja auch besonders gerne bei AI Art, wo Bilder genommen werden, ohne zu fragen – nur weil man somit eine Datenbank anlegen kann, die groß genug ist um so eine AI zu trainieren.
Gleichzeitig verdienen diese Firmen sicher genug durch die Leute, die so etwas nutzen.

Es muss unbedingt ein Gesetz her, das Erschaffer von Werken, vor dieser Art von Diebstahl schützt.

	Beleidigung/Streit/Spam
	Copyright-Verletzungen
	Anstößige Inhalte (Bilder oder Text)
	Illegale Inhalte (Extremismus, Pornografie, Raubkopien)
	Sonstige Probleme

Eine KI-Firma hat Millionen gedruckte Bücher gekauft und anschließend zerstört, nur um ihr KI-Modell zu trainieren

Firma kauft gedruckte Bücher, um Schwierigkeiten der Lizenzierung zu umgehen

Deine Meinung ist uns wichtig!

Wann können wir mit GTA 6 Online rechnen? Ein Leaker will Rockstars Pläne kennen

Diablo hat einen eigenen Jesus, der in Lord of Hatred zurückkehrt, doch er verbreitet keine Nächstenliebe

YouTuber wird wegen eines „Streichs“ festgenommen, macht sich nochmal strafbar, indem er das Video hochlädt

MMO-Shooter verlor 98% seiner Spieler auf Steam trotz Bikinis und viel Haut, will sich jetzt retten

Knossi kehrt zu 7 vs. Wild zurück, kritisiert Fritz Meinecke: „Spinnst du?“