KI-Anbieter Archive - Wolfgang Riegger

Die Entwicklung Künstlicher Intelligenz (KI) erfordert enorme Datenmengen – oft in Form urheberrechtlich geschützter Texte. Doch was darf verwendet werden? Wann ist eine Nutzung rechtlich zulässig? Ein aktuelles Urteil aus den USA gibt darauf teils überraschende Antworten – mit wichtigen Implikationen für den deutschen Rechtsraum.

Der Fall: Anthropic und das KI-Training mit Millionen Büchern

Das US-Unternehmen Anthropic, Betreiber des LLM-Systems „Claude“, hatte Millionen Bücher zum Training seines Sprachmodells genutzt – teils aus legalen, teils aus illegalen Quellen. Drei Autoren klagten wegen Urheberrechtsverletzung. Das zuständige Bundesgericht (Northern District of California, Urteil vom 23.06.2025 – Az. C 24-05417 WHA) entschied differenziert:

Erlaubt: Training mit rechtmäßig gekauften und digitalisierten Büchern – die Nutzung sei „transformativ“ und falle unter „Fair Use“.
Erlaubt: Digitalisierung von Printbüchern zur internen Nutzung – als zulässiger Formatwechsel.
Nicht erlaubt: Aufbau einer digitalen Bibliothek mit Pirateriekopien – hierfür gebe es keine rechtliche Grundlage.

Fair Use – die US-Schranke im Überblick

Das US-Recht kennt eine offene Schranke namens „Fair Use“. Ob eine Nutzung erlaubt ist, wird anhand dieser vier Kriterien bewertet:

Zweck der Nutzung (kommerziell oder gemeinnützig; transformativ?)
Art des Werkes (Sachbuch oder Fiktion?)
Umfang der Nutzung
Auswirkungen auf den Marktwert des Originals

Diese Bewertung erfolgt stets im Einzelfall und lässt dem Gerichtsspielraum – das unterscheidet das US-System deutlich vom deutschen.

Und wie ist die Rechtslage in Deutschland?

Das deutsche Urheberrecht enthält keine offene Fair-Use-Klausel, sondern streng definierte gesetzliche Ausnahmen:

§ 44a UrhG – Technisch bedingte Vervielfältigungen

Erlaubt sind nur flüchtige Kopien, etwa beim Streaming oder Caching. Gezielte Speicherung zur Analyse (z. B. für KI) ist davon nicht erfasst – das hat zuletzt auch das LG Hamburg (Urt. v. 27.09.2024 – 310 O 227/23) bestätigt.

§ 60d UrhG – Data Mining für wissenschaftliche Zwecke

Diese Vorschrift erlaubt Text- und Data-Mining – jedoch ausschließlich für nicht-kommerzielle Forschungseinrichtungen. Unternehmen können sich hierauf nicht berufen.

§ 44b UrhG – Kommerzielles Data Mining mit Opt-Out-Möglichkeit

Erlaubt automatisiertes Auslesen (TDM) durch Unternehmen – sofern der Rechteinhaber dem nicht widersprochen hat (z. B. durch maschinenlesbaren Hinweis). Wichtig: Die verwendeten Daten dürfen nicht dauerhaft gespeichert werden.

Was bedeutet das für Unternehmen, die LLMs trainieren möchten?

Der Einsatz von urheberrechtlich geschützten Texten bedarf einer sorgfältigen Prüfung.
Pirateriequellen sind rechtlich ausgeschlossen – unabhängig vom Verwendungszweck.
Für kommerzielle TDM-Prozesse kann § 44b UrhG einen rechtlichen Rahmen bieten – vorausgesetzt, die rechtlichen Voraussetzungen (kein Widerspruch, spätere Löschung) werden eingehalten.
Eine pauschale Ausnahme wie im US-amerikanischen „Fair Use“ existiert nicht.

Fazit

Die Entscheidung aus den USA zeigt: KI-Training mit urheberrechtlich geschützten Inhalten kann zulässig sein – aber es kommt auf den Zweck, die Herkunft der Daten und die Nutzungsart an. In Deutschland gelten klare Regeln: Wer mit urheberrechtlich geschützten Werken arbeitet, braucht entweder eine Lizenz oder muss sich genau innerhalb der gesetzlichen Schranken bewegen.

Die GEMA (Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte) hat Klage gegen das US-amerikanische KI-Unternehmen Suno Inc. eingereicht. Suno bietet ein KI-Tool an, das mithilfe von einfachen Anweisungen (sogenannten Prompts) Audioinhalte erzeugen kann. Die GEMA wirft Suno vor, geschützte Aufnahmen aus ihrem Repertoire ohne Lizenz verwendet zu haben, was eine Urheberrechtsverletzung darstelle. Konkret geht es darum, dass die KI Audioinhalte generiere, die bekannten Songs wie „Forever Young“, „Atemlos“ oder „Daddy Cool“ zum Verwechseln ähnlich sein sollen.

Was sind die Vorwürfe der GEMA?

Urheberrechtsverletzung: Die GEMA argumentiert, dass Suno durch die Nutzung der Werke ihrer Mitglieder das Urheberrecht verletze. Dies betreffe sowohl die Erstellung der Aufnahmen in den Systemen von Suno als auch die Nutzung der Originalwerke zum Trainieren der KI.
Fehlende Vergütung: Die GEMA kritisiert, dass Suno das Repertoire der GEMA systematisch für das Training ihres Musiktools genutzt und dieses nun kommerziell verwertet habe, ohne die Urheber finanziell zu beteiligen.
Forderung nach einem fairen Miteinander: Die GEMA betont, dass eine partnerschaftliche Lösung mit KI-Unternehmen nur mit der Einhaltung von Grundregeln eines fairen Miteinanders möglich sei, einschließlich des Erwerbs von Lizenzen.

Was fordert die GEMA?

Die GEMA fordert eine faire Vergütung für die Nutzung der Werke ihrer Mitglieder. Sie schlägt ein „Zwei-Säulen“-Lizenzmodell vor:

Vergütung für das KI-Training: Die GEMA verlangt, dass 30 Prozent der Netto-Einnahmen von Suno an die Urheber fließen, inklusive einer Mindestvergütung.
Beteiligung an generierten Werken: Die GEMA ist der Ansicht, dass die generierten Werke so stark auf den Originalwerken basieren, dass die Urheber auch an deren Nutzung beteiligt werden müssen.

Rechtliche Herausforderungen

Das Verfahren wirft wichtige Fragen in Bezug auf das Urheberrecht auf:

Rechtmäßigkeit des KI-Trainings: War das Training der Suno-KI mit urheberrechtlich geschützten Werken rechtmäßig? Das Urheberrechtsgesetz erlaubt in bestimmten Fällen das „Text- und Data Mining“ (§§ 44b, 60d UrhG), also die automatisierte Analyse digitaler Werke zur Mustererkennung. Allerdings gibt es hier Einschränkungen, insbesondere wenn die Urheber der Nutzung ihrer Werke für das KI-Training widersprochen haben.
Nutzungsvorbehalt: Entscheidend ist, ob die GEMA einen wirksamen Nutzungsvorbehalt erklärt hat. Seit 2021 erlaubt § 44b UrhG Text- und Data Mining, es sei denn, die Urheber haben dem „maschinenlesbar“ widersprochen. Ob ein solcher Widerspruch in maschinenlesbarer Form vorliegt, ist jedoch umstritten.
Verletzung des Rechts der öffentlichen Wiedergabe: Die GEMA argumentiert, dass bereits die Generierung der KI-Songs eine Verletzung des Rechts der öffentlichen Wiedergabe darstellt. KI-Systeme arbeiten jedoch nicht mit exakten Kopien, sondern mit statistischen Mustern.
Pflichten der KI-Anbieter: Nach dem AI Act müssen Anbieter von Mehrzweck-KI-Systemen wie Suno eine Strategie zur Einhaltung des EU-Urheberrechts vorlegen.

LG Hamburg: Nutzung von Bildern für KI-Training

Das Landgericht Hamburg hat sich in einem Urteil vom 27.09.2024 (Az. 310 O 227/23) mit der Frage auseinandergesetzt, ob die Nutzung von urheberrechtlich geschützten Werken für das Training von KI-Systemen zulässig ist. Das Gericht hat entschieden, dass die Schrankenregelung des § 44a UrhG (vorübergehende Vervielfältigungshandlungen) für Trainingszwecke von KI nicht anwendbar ist.

Keine Flüchtigkeit: Das Gericht argumentierte, dass die Speicherung der Werke auf den Servern des KI-Herstellers nicht „flüchtig“ im Sinne des Gesetzes sei.
Keine Begleitfunktion: Das Herunterladen der Bilddateien zur Analyse sei kein bloß begleitender Prozess, sondern ein bewusster Beschaffungsprozess.

Allerdings tendierte das LG Hamburg in seiner Entscheidung dazu, dass ein Nutzungsvorbehalt in natürlicher Sprache (z.B. in AGB) genügen müsse, um die Nutzung eines Werkes für KI-Training zu untersagen. Dies könnte auch für die Klage der GEMA relevant sein, da es fraglich ist, ob die GEMA bzw. ihre Mitglieder einen solchen maschinenlesbaren Nutzungsvorbehalt rechtzeitig erklärt haben.

Was bedeutet das für die Zukunft?

Die Klage der GEMA gegen Suno ist ein Präzedenzfall. Es ist noch unklar, wie die Gerichte die Nutzungsvorbehalte der Urheber bewerten werden. Das Urteil könnte richtungsweisende Antworten auf die Frage geben, wie mit KI-generierter Musik und dem Urheberrecht umzugehen ist.

Parallele in den USA

Auch in den USA gibt es ähnliche Rechtsstreitigkeiten im Zusammenhang mit KI-Training und Urheberrecht.

Ein US-Gericht, der District Court of Delaware, hat im Fall Thomson Reuters ./. Ross Intelligence entschieden, dass die Nutzung urheberrechtlich geschützter Inhalte zum Training einer KI nicht unter die „Fair Use“-Doktrin fällt, wenn das KI-Training kommerziellen Zwecken dient und sich negativ auf den Wert des geschützten Werks auswirkt.
Dieses Urteil könnte Auswirkungen auf KI-Anbieter haben, die in den USA tätig sind. Bemerkenswert ist, dass das Gericht die meisten Gerichtsentscheidungen, auf die sich KI-Unternehmen bislang berufen haben, als „irrelevant“ abgelehnt hat.
Die Entscheidung des US-Gerichts betraf einen Fall, in dem eine KI-Suchmaschine mit urheberrechtlich geschützten Headnotes trainiert wurde. Das Gericht argumentierte, dass die Nutzung nicht „transformierend“ sei, da die KI lediglich ein Konkurrenzprodukt erstellen sollte. Dies könnte ein wichtiger Unterschied zur generativen KI sein, die neue und transformative Werke schaffen kann. Das Gericht betonte, dass Ross mit seiner KI direkt mit Westlaw konkurrieren wollte, was ausreiche, um eine Marktbeeinträchtigung festzustellen. Es sei unerheblich, ob Reuters bereits KI-Trainingsdaten vermarkte – die Möglichkeit, dies zu tun, sei rechtlich schutzwürdig.

Auswirkungen für Deutschland

Es bleibt abzuwarten, wie sich die Rechtslage im Bereich der KI-generierten Musik, aber auch bei Texten, Grafiken etc., entwickeln wird.

Die mit der Nutzung von urheberrechtlichen Inhalten zu Trainingszwecken verbundenen urheberrechtlichen Fragen werden vermutlich erst in einigen Jahren höchstrichterlich geklärt werden. Es könnte sein, dass sich bis dahin entweder der Gesetzgeber entschließt, das Thema neu zu regeln (und dann, so ist meine Vermutung, eine „KI-Abgabe“ einführt, die an Verwertungsgesellschaften wie die GEMA zu zahlen ist) oder es zu Vereinbarungen zwischen Anbietern von KI und Verwertungsgesellschaften kommen wird.

Wolfgang Riegger

KI-Anbieter

US-Urteil zu Anthropic und urheberrechtlich geschützten Büchern – Was bedeutet das für Deutschland?