US-Urteil zu Anthropic und urheberrechtlich geschützten Büchern – Was bedeutet das für Deutschland?

Die Entwicklung Künstlicher Intelligenz (KI) erfordert enorme Datenmengen – oft in Form urheberrechtlich geschützter Texte. Doch was darf verwendet werden? Wann ist eine Nutzung rechtlich zulässig? Ein aktuelles Urteil aus den USA gibt darauf teils überraschende Antworten – mit wichtigen Implikationen für den deutschen Rechtsraum.

Der Fall: Anthropic und das KI-Training mit Millionen Büchern

Das US-Unternehmen Anthropic, Betreiber des LLM-Systems „Claude“, hatte Millionen Bücher zum Training seines Sprachmodells genutzt – teils aus legalen, teils aus illegalen Quellen. Drei Autoren klagten wegen Urheberrechtsverletzung. Das zuständige Bundesgericht (Northern District of California, Urteil vom 23.06.2025 – Az. C 24-05417 WHA) entschied differenziert:

  • Erlaubt: Training mit rechtmäßig gekauften und digitalisierten Büchern – die Nutzung sei „transformativ“ und falle unter „Fair Use“.
  • Erlaubt: Digitalisierung von Printbüchern zur internen Nutzung – als zulässiger Formatwechsel.
  • Nicht erlaubt: Aufbau einer digitalen Bibliothek mit Pirateriekopien – hierfür gebe es keine rechtliche Grundlage.

Fair Use – die US-Schranke im Überblick

Das US-Recht kennt eine offene Schranke namens „Fair Use“. Ob eine Nutzung erlaubt ist, wird anhand dieser vier Kriterien bewertet:

  1. Zweck der Nutzung (kommerziell oder gemeinnützig; transformativ?)
  2. Art des Werkes (Sachbuch oder Fiktion?)
  3. Umfang der Nutzung
  4. Auswirkungen auf den Marktwert des Originals

Diese Bewertung erfolgt stets im Einzelfall und lässt dem Gerichtsspielraum – das unterscheidet das US-System deutlich vom deutschen.

Und wie ist die Rechtslage in Deutschland?

Das deutsche Urheberrecht enthält keine offene Fair-Use-Klausel, sondern streng definierte gesetzliche Ausnahmen:

§ 44a UrhG – Technisch bedingte Vervielfältigungen

Erlaubt sind nur flüchtige Kopien, etwa beim Streaming oder Caching. Gezielte Speicherung zur Analyse (z. B. für KI) ist davon nicht erfasst – das hat zuletzt auch das LG Hamburg (Urt. v. 27.09.2024 – 310 O 227/23) bestätigt.

§ 60d UrhG – Data Mining für wissenschaftliche Zwecke

Diese Vorschrift erlaubt Text- und Data-Mining – jedoch ausschließlich für nicht-kommerzielle Forschungseinrichtungen. Unternehmen können sich hierauf nicht berufen.

§ 44b UrhG – Kommerzielles Data Mining mit Opt-Out-Möglichkeit

Erlaubt automatisiertes Auslesen (TDM) durch Unternehmen – sofern der Rechteinhaber dem nicht widersprochen hat (z. B. durch maschinenlesbaren Hinweis). Wichtig: Die verwendeten Daten dürfen nicht dauerhaft gespeichert werden.

Was bedeutet das für Unternehmen, die LLMs trainieren möchten?

  • Der Einsatz von urheberrechtlich geschützten Texten bedarf einer sorgfältigen Prüfung.
  • Pirateriequellen sind rechtlich ausgeschlossen – unabhängig vom Verwendungszweck.
  • Für kommerzielle TDM-Prozesse kann § 44b UrhG einen rechtlichen Rahmen bieten – vorausgesetzt, die rechtlichen Voraussetzungen (kein Widerspruch, spätere Löschung) werden eingehalten.
  • Eine pauschale Ausnahme wie im US-amerikanischen „Fair Use“ existiert nicht.

Fazit

Die Entscheidung aus den USA zeigt: KI-Training mit urheberrechtlich geschützten Inhalten kann zulässig sein – aber es kommt auf den Zweck, die Herkunft der Daten und die Nutzungsart an. In Deutschland gelten klare Regeln: Wer mit urheberrechtlich geschützten Werken arbeitet, braucht entweder eine Lizenz oder muss sich genau innerhalb der gesetzlichen Schranken bewegen.

Verarbeitung von Nutzerdaten für KI-Training: OLG Köln weist Verfügungsantrag gegen Meta-Tochter ab

Nachdem Meta im April 2025 ankündigte, öffentlich zugängliche Inhalte von Facebook- und Instagram-Nutzern für das Training eines KI-Modells verwenden zu wollen, wurde dies bereits breit diskutiert. Nun liegt die vollständige Entscheidung des OLG Köln vor.

Ein Verbraucherschutzverband beantragte im Eilverfahren:

  1. Untersagung des KI-Trainings mit öffentlich zugänglichen personenbezogenen Daten aus Facebook und Instagram – gestützt auf berechtigtes Interesse (Art. 6 Abs. 1 lit. f DSGVO).
  2. Hilfsweise Verbot der Zusammenführung solcher Daten aus beiden Diensten ohne Einwilligung – gemäß Art. 5 Abs. 2 DMA.

Der „Digital Markets Act“ (DMA) ist eine EU-Verordnung, die faire Wettbewerbsbedingungen auf digitalen Plattformmärkten schaffen soll. Sie richtet sich an besonders mächtige Internetunternehmen (sog. „Torwächter“) und legt ihnen spezifische Verhaltenspflichten auf. Unter anderem verbietet der DMA das Zusammenführen personenbezogener Daten aus verschiedenen Plattformdiensten, wenn keine wirksame Einwilligung der Nutzer vorliegt.

OLG Köln: Gesamtabweisung der Anträge

Das Gericht lehnte beide Anträge ab:

  • Kein DMA-Verstoß: Eine rein unspezifische Einbindung in einen KI-Datensatz stellt keine „gezielte Zusammenführung“ im Sinne des DMA dar.
  • DSGVO – berechtigtes Interesse bejaht: Meta verfolge legitime Zwecke beim KI-Training; die Mittel seien angemessen und keine mildere Alternative gegeben.
  • Transparenz & Opt-out: Ab 26. Juni 2024 sei die Nutzung öffentlich bewusst erfolgt und Nutzer konnten per Widerspruch oder Profiländerung aktiv intervenieren.

Gerichtliche Schwerpunktsetzung

  • Sensible Daten: Selbst sensible Infos aus öffentlichen Beiträgen könne nach Art. 9 Abs. 2 lit. e DSGVO zulässig sein – sofern solche Daten aktiv veröffentlicht wurden.
  • Rolle der Aufsichtsbehörden: Im Verfahren wurden die irische Datenschutzaufsicht, der Hamburgische Beauftragte für Datenschutz und Informationsfreiheit sowie der Europäische Datenschutzausschuss angehört. Keine dieser Behörden hatte Einwände gegen das aktualisierte Konzept von Meta.

Bewertung für Unternehmer & Plattformbetreiber

  • Leitlinie für KI-Projekte: Öffentlich zugängliche Inhalte dürfen – unter Bedingungen – auch ohne Einwilligung genutzt werden.
  • Erforderliche Voraussetzungen: Vollständige Transparenz, leicht umsetzbares Opt-out, technische Maßnahmen zur De-Identifikation.
  • Rechtliche Grenzen: Das Urteil ist einstweilig; im Hauptsacheverfahren könnten strengere Anforderungen folgen, besonders bei sensiblen Informationen oder Profilbildung.
  • DMA bleibt im Fokus: Höhere instanzliche Klärung nötig, wenn Gerätearten aus verschiedenen Plattformen individuell personalisiert zusammengeführt werden.

Fazit

Das OLG Köln stärkt temporär die Position von KI-Anbietern, indem es öffentlich verwendete Nutzer-Daten unter klaren Bedingungen erlaubt. Dennoch bleibt Wachsamkeit geboten: Hauptsacheverfahren, künftige Gesetzgebung (s. AI-VO) und mögliche Entwicklungen in Bezug auf sensible Daten oder Profiling können die Rechtslage erneut verschärfen. Dieses Urteil liefert einen plausiblen Rahmen – aber keine umfassende Legalisierung.

Es ist zudem wichtig zu beachten, dass sich das Gericht in dieser Entscheidung ausschließlich mit datenschutzrechtlichen und DMA-rechtlichen Fragen befasst hat. Urheberrechtliche Aspekte – etwa ob die Verwendung von Fotos, Texten oder Videos für KI-Training zulässig ist – waren nicht Gegenstand der Entscheidung und bleiben daher unbeantwortet. Das OLG Köln stärkt temporär die Position von KI-Anbietern, indem es öffentlich verwendete Nutzer-Daten unter klaren Bedingungen erlaubt. Dennoch bleibt Wachsamkeit geboten: Hauptsacheverfahren, künftige Gesetzgebung (s. AI-VO) und mögliche Entwicklungen in Bezug auf sensible Daten oder Profiling können die Rechtslage erneut verschärfen. Dieses Urteil liefert einen plausiblen Rahmen – aber keine umfassende Legalisierung.