GEMA vs OpenAI: Volltextveröffentlichung des Urteils und meine Bewertung

Am 11.11.2025 hat das LG München I der Klage der GEMA gegen OpenAI im Wesentlichen stattgegeben. An diesem Tag lag lediglich eine Pressemitteilung des Gerichts vor, die bereits an diesem Tag „heiß diskutiert“ worden ist. Nun wurde das Urteil im Volltext veröffentlicht, so dass man jetzt auch die Gründe, die zur Verurteilung führten, nachlesen kann. Da es hier auf auch juristische Feinheiten ankommt, heute mal ein Blogbeitrag, der etwas mehr an „Juristendeutsch“ enthält als üblich.

Das Gericht bejaht in dem Streitfall zwischen der GEMA und OpenAI weitreichende Unterlassungs- und Schadensersatzansprüche wegen Urheberrechtsverletzungen an Liedtexten. Die Entscheidung ist wegweisend, da sie erstmals die technische Realität einer vom Gericht angeführten Memorisierung urheberrechtlich geschützter Werke im Modell juristisch einordnet.

I. Die Memorisierung als Vervielfältigung im Modell

Das LG München I unterscheidet mehrere Phasen beim Einsatz generativer Sprachmodelle:

Pre-Training

In dieser Phase wird das Modell mit großen Mengen an Texten trainiert. Die Texte werden in Token umgewandelt und in numerische Vektoren transformiert. Das neuronale Netz passt seine Gewichte an, um semantische und syntaktische Zusammenhänge zu lernen. Die Inhalte aus den Trainingsdaten – darunter auch Liedtexte – fließen dabei direkt in die Modellstruktur ein.

Memorisierung

Das Gericht sieht die Memorisierung als Ergebnis der Pre-Training-Phase: Inhalte, die häufig oder stabil in den Trainingsdaten vorkamen, werden so verinnerlicht, dass sie mit hoher Wahrscheinlichkeit bei passenden Prompts reproduziert werden können. Die Inhalte sind somit „im Modell gespeichert“. Das Modell funktioniert in diesen Fällen wie eine Datenbank – Inhalte sind fixiert und jederzeit abrufbar.

Decoding und Ausgabe (Output)

In dieser Phase wird der deterministische Softmax-Output des Modells durch sogenannte Decoding-Strategien (z. B. Sampling, Temperature-Parameter) in menschlich lesbare Texte überführt. Zwar können hier Varianzen auftreten, doch bei memorisierten Inhalten ist der Output laut Gericht meist stabil und konsistent. Die Zufälligkeit betreffe in der Regel nur Einleitung oder Kontext, nicht den memorisierten Kerninhalt.

Das Gericht macht also klar: Bereits in der Pre-Training-Phase erfolgt die urheberrechtlich relevante Nutzung in Form einer Vervielfältigung. Die spätere Ausgabe belege nur, was im Modell zuvor gespeichert wurde.

Das Gericht qualifiziert sodann die Memorisierung urheberrechtlich geschützter Liedtexte in den Parametern der Large Language Models (LLMs) als eine (dann wohl weitere) urheberrechtlich relevante Vervielfältigung im Sinne von § 16 Abs. 1 UrhG:

„Memorisierung liegt vor, wenn sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten findet.“

Die Memorisierung stelle eine körperliche Festlegung des Werks dar, auch wenn die Daten in Form von Wahrscheinlichkeitswerten und Vektoren zerlegt sind. Eine Vervielfältigung gemäß § 16 UrhG erfasse jede körperliche Festlegung eines Werks, die geeignet ist, das Werk den menschlichen Sinnen auf irgendeine Art mittelbar oder unmittelbar wahrnehmbar zu machen.

Die Reproduzierbarkeit der Texte durch einfache Prompts (sog. Regurgitation) beweise, dass die Texte im Modell fixiert und mittelbar wahrnehmbar seien. Der technische Vorgang sei dabei aufgrund der technologieneutralen Auslegung des Vervielfältigungsrechts unerheblich.

II. Abgrenzung zur Text- und Data-Mining-Schranke

Das Gericht verneint eine Rechtfertigung dieser Memorisierung durch die Schrankenbestimmung des § 44b UrhG (Text- und Data-Mining, sog. TDM-Schranke). Hierzu nimmt das Gericht eine strikte Unterscheidung zwischen den verschiedenen Phasen des Trainingsprozesses vor.

1. Reichweite der TDM-Schranke

Die TDM-Schranke deckt nach Auffassung des Gerichts lediglich solche Vervielfältigungen ab, die zur Vorbereitung und Durchführung der Datenanalyse selbst erforderlich sind. Diese erste Phase, das Extrahieren und die Überführung des Materials in einen Trainingskorpus, ist vom Zweck des TDM gedeckt, da hier lediglich nicht-schöpferische Informationen (Muster, Trends, Korrelationen) gewonnen werden.

Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus in Phase 1 (s.o.), nicht aber weitergehende Vervielfältigungen im Modell in Phase 2. Werden wie vorliegend beim Training in Phase 2 nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies kein Text und Data Mining dar.

2. Memorisierung als Zwecküberschreitung

Die Memorisierung in der zweiten Phase (dem Training) überschreitet den von § 44b Abs. 2 UrhG geforderten Zweck:

„Die Memorisierung der streitgegenständlichen Liedtexte überschreitet hingegen eine solche Auswertung und ist daher kein bloßes Text- und Data-Mining.“

Die Vervielfältigungen im Modell, die zur Memorisierung führen, dienen nicht der weiteren Datenanalyse, sondern manifestieren sich als eine Verwertungshandlung des Werkes selbst, da das Werk in den Modellparametern vollständig übernommen wird. Damit entfällt die Prämisse der TDM-Schranke, dass die Verwertungsinteressen des Urhebers nicht berührt werden. Eine analoge Anwendung der Schranke verbietet sich, da hierdurch die berechtigten Interessen der Rechteinhaber verletzt und der durch die europarechtliche InfoSoc-Richtlinie geforderte hohe Schutzstandard unterlaufen würde.

III. Meine Kritik vor allem an der Auslegung der TDM-Schranke

Meiner Meinung nach legt das Gericht § 44b UrhG in einer Weise zu eng aus, die den technischen Realitäten des KI-Trainings nicht gerecht wird.

Das Gericht nimmt eine künstliche Trennung zwischen der zulässigen Vervielfältigung zur Datenanalyse und der unzulässigen Memorisierung im trainierten Modell vor. Für mich stellt der Vorgang des Trainings eines LLM einen untrennbaren, komplexen Akt des Text- und Data-Mining dar, der in seiner Gesamtheit auf die Extraktion von Mustern und Korrelationen gerichtet ist. Die Memorisierung ist keine eigenständige, beabsichtigte Verwertungshandlung, sondern ein unvermeidlicher oder zumindest schwer vermeidbarer technischer Nebeneffekt des an sich gestatteten TDM-Prozesses.

Die restriktive Qualifizierung der Memorisierung als vom TDM-Zweck nicht gedeckte Vervielfältigung macht die Schrankenbestimmung für die Anwendung auf moderne, generative KI-Modelle praktisch wertlos. Dies konterkariert den eigentlich gewünschten europarechtlichen Zweck, die Entwicklung von KI in der EU zu fördern. Ich halte es für wenig überzeugend, dass der Betreiber die Texte im Modell vervielfältigt habe, um sie später wieder wahrnehmbar zu machen. Der primäre Zweck ist die Generierung neuer Inhalte, nicht die Reproduktion der Inputs. Diese Auslegung droht, die Wirtschaftlichkeit des gesamten LLM-Trainings unter Verwendung urheberrechtlich geschützter Daten zu stark zu beschränken.

Zudem stellt sich die Frage, was mit der Verurteilung überhaupt erreicht wurde:

Das Landgericht München I hat die Beklagten bezüglich der Memorisierung unter anderem zu folgender Unterlassung verurteilt:

Die Beklagten werden verurteilt, es zu unterlassen, die im Tenor näher bezeichneten Werke (die neun Liedtexte) in ihren Large Language Model-Modellen zu vervielfältigen und/oder diese der Öffentlichkeit zugänglich zu machen und/oder auf sonstigem Wege zu verwerten, soweit keine Lizenzierung vorliegt.

Was hat die Klägerseite durch diesen Unterlassungstenor gewonnen?

Der Klägerseite ist durch die Feststellung der Täterhaftung und des grundsätzlichen Schadensersatzanspruchs sicherlich ein wichtiger Erfolg gelungen.

Allerdings wirft die Formulierung des Unterlassungstenors die Frage nach ihrer Reichweite auf.

Die Verurteilung zur Unterlassung der Vervielfältigung zielt auf die Zukunft und soll die Wiederholungsgefahr (die Vervielfältigung von Neuem) verhindern. Die Memorisierung (die Vervielfältigung in das Modell) hat aber bereits stattgefunden.

Verpflichtet dieser Unterlassungstenor die Beklagte überhaupt dazu, ein „Machine Unlearning“ durchzuführen?

Diese Frage ist juristisch strittig. Ein Unterlassungsanspruch richtet sich primär auf die Beendigung der Wiederholungsgefahr. Die Entfernung der memorisierten Werke aus den Modellparametern – das sogenannte „Machine Unlearning“ – ist jedoch eine aktive, technisch aufwendige Handlung. Sie würde dem Beseitigungsanspruch zuzuordnen sein, der von der Klägerseite nach dem Tenor nicht ausdrücklich zugesprochen wurde.

Zwar könnte man argumentieren, dass die Beibehaltung der rechtswidrigen Vervielfältigung (Memorisierung) eine fortdauernde Begehung darstellt, deren Beendigung die Beseitigung implizieren könnte. Die herrschende Meinung neigt jedoch dazu, eine so weitreichende, aktive Eingriffspflicht in das Produkt des Verletzers nur bei einem explizit titulierten Beseitigungsanspruch anzunehmen. Die Beklagten könnten argumentieren, lediglich die erneute Vervielfältigung und die Regurgitation unterbinden zu müssen, nicht jedoch die aufwendige Korrektur des bereits existierenden, trainierten Modells. Ohne einen expliziten Beseitigungstenor bleibt die Verpflichtung zum „Machine Unlearning“ fraglich.


Gericht: LG München I (42. Zivilkammer)

Datum: 11.11.2025

Aktenzeichen: 42 O 14139/24

Fundstelle: GRUR-RS 2025, 30204

GEMA klagt gegen Suno: Was bedeutet das für KI-generierte Musik und das Urheberrecht?

Die GEMA (Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte) hat Klage gegen das US-amerikanische KI-Unternehmen Suno Inc. eingereicht. Suno bietet ein KI-Tool an, das mithilfe von einfachen Anweisungen (sogenannten Prompts) Audioinhalte erzeugen kann. Die GEMA wirft Suno vor, geschützte Aufnahmen aus ihrem Repertoire ohne Lizenz verwendet zu haben, was eine Urheberrechtsverletzung darstelle. Konkret geht es darum, dass die KI Audioinhalte generiere, die bekannten Songs wie „Forever Young“, „Atemlos“ oder „Daddy Cool“ zum Verwechseln ähnlich sein sollen.

Was sind die Vorwürfe der GEMA?

  • Urheberrechtsverletzung: Die GEMA argumentiert, dass Suno durch die Nutzung der Werke ihrer Mitglieder das Urheberrecht verletze. Dies betreffe sowohl die Erstellung der Aufnahmen in den Systemen von Suno als auch die Nutzung der Originalwerke zum Trainieren der KI.
  • Fehlende Vergütung: Die GEMA kritisiert, dass Suno das Repertoire der GEMA systematisch für das Training ihres Musiktools genutzt und dieses nun kommerziell verwertet habe, ohne die Urheber finanziell zu beteiligen.
  • Forderung nach einem fairen Miteinander: Die GEMA betont, dass eine partnerschaftliche Lösung mit KI-Unternehmen nur mit der Einhaltung von Grundregeln eines fairen Miteinanders möglich sei, einschließlich des Erwerbs von Lizenzen.

Was fordert die GEMA?

Die GEMA fordert eine faire Vergütung für die Nutzung der Werke ihrer Mitglieder. Sie schlägt ein „Zwei-Säulen“-Lizenzmodell vor:

  • Vergütung für das KI-Training: Die GEMA verlangt, dass 30 Prozent der Netto-Einnahmen von Suno an die Urheber fließen, inklusive einer Mindestvergütung.
  • Beteiligung an generierten Werken: Die GEMA ist der Ansicht, dass die generierten Werke so stark auf den Originalwerken basieren, dass die Urheber auch an deren Nutzung beteiligt werden müssen.

Rechtliche Herausforderungen

Das Verfahren wirft wichtige Fragen in Bezug auf das Urheberrecht auf:

  • Rechtmäßigkeit des KI-Trainings: War das Training der Suno-KI mit urheberrechtlich geschützten Werken rechtmäßig? Das Urheberrechtsgesetz erlaubt in bestimmten Fällen das „Text- und Data Mining“ (§§ 44b, 60d UrhG), also die automatisierte Analyse digitaler Werke zur Mustererkennung. Allerdings gibt es hier Einschränkungen, insbesondere wenn die Urheber der Nutzung ihrer Werke für das KI-Training widersprochen haben.
  • Nutzungsvorbehalt: Entscheidend ist, ob die GEMA einen wirksamen Nutzungsvorbehalt erklärt hat. Seit 2021 erlaubt § 44b UrhG Text- und Data Mining, es sei denn, die Urheber haben dem „maschinenlesbar“ widersprochen. Ob ein solcher Widerspruch in maschinenlesbarer Form vorliegt, ist jedoch umstritten.
  • Verletzung des Rechts der öffentlichen Wiedergabe: Die GEMA argumentiert, dass bereits die Generierung der KI-Songs eine Verletzung des Rechts der öffentlichen Wiedergabe darstellt. KI-Systeme arbeiten jedoch nicht mit exakten Kopien, sondern mit statistischen Mustern.
  • Pflichten der KI-Anbieter: Nach dem AI Act müssen Anbieter von Mehrzweck-KI-Systemen wie Suno eine Strategie zur Einhaltung des EU-Urheberrechts vorlegen.

LG Hamburg: Nutzung von Bildern für KI-Training

Das Landgericht Hamburg hat sich in einem Urteil vom 27.09.2024 (Az. 310 O 227/23) mit der Frage auseinandergesetzt, ob die Nutzung von urheberrechtlich geschützten Werken für das Training von KI-Systemen zulässig ist. Das Gericht hat entschieden, dass die Schrankenregelung des § 44a UrhG (vorübergehende Vervielfältigungshandlungen) für Trainingszwecke von KI nicht anwendbar ist.

  • Keine Flüchtigkeit: Das Gericht argumentierte, dass die Speicherung der Werke auf den Servern des KI-Herstellers nicht „flüchtig“ im Sinne des Gesetzes sei.
  • Keine Begleitfunktion: Das Herunterladen der Bilddateien zur Analyse sei kein bloß begleitender Prozess, sondern ein bewusster Beschaffungsprozess.

Allerdings tendierte das LG Hamburg in seiner Entscheidung dazu, dass ein Nutzungsvorbehalt in natürlicher Sprache (z.B. in AGB) genügen müsse, um die Nutzung eines Werkes für KI-Training zu untersagen. Dies könnte auch für die Klage der GEMA relevant sein, da es fraglich ist, ob die GEMA bzw. ihre Mitglieder einen solchen maschinenlesbaren Nutzungsvorbehalt rechtzeitig erklärt haben.

Was bedeutet das für die Zukunft?

Die Klage der GEMA gegen Suno ist ein Präzedenzfall. Es ist noch unklar, wie die Gerichte die Nutzungsvorbehalte der Urheber bewerten werden. Das Urteil könnte richtungsweisende Antworten auf die Frage geben, wie mit KI-generierter Musik und dem Urheberrecht umzugehen ist.

Parallele in den USA

Auch in den USA gibt es ähnliche Rechtsstreitigkeiten im Zusammenhang mit KI-Training und Urheberrecht.

  • Ein US-Gericht, der District Court of Delaware, hat im Fall Thomson Reuters ./. Ross Intelligence entschieden, dass die Nutzung urheberrechtlich geschützter Inhalte zum Training einer KI nicht unter die „Fair Use“-Doktrin fällt, wenn das KI-Training kommerziellen Zwecken dient und sich negativ auf den Wert des geschützten Werks auswirkt.
  • Dieses Urteil könnte Auswirkungen auf KI-Anbieter haben, die in den USA tätig sind. Bemerkenswert ist, dass das Gericht die meisten Gerichtsentscheidungen, auf die sich KI-Unternehmen bislang berufen haben, als „irrelevant“ abgelehnt hat.
  • Die Entscheidung des US-Gerichts betraf einen Fall, in dem eine KI-Suchmaschine mit urheberrechtlich geschützten Headnotes trainiert wurde. Das Gericht argumentierte, dass die Nutzung nicht „transformierend“ sei, da die KI lediglich ein Konkurrenzprodukt erstellen sollte. Dies könnte ein wichtiger Unterschied zur generativen KI sein, die neue und transformative Werke schaffen kann. Das Gericht betonte, dass Ross mit seiner KI direkt mit Westlaw konkurrieren wollte, was ausreiche, um eine Marktbeeinträchtigung festzustellen. Es sei unerheblich, ob Reuters bereits KI-Trainingsdaten vermarkte – die Möglichkeit, dies zu tun, sei rechtlich schutzwürdig.

Auswirkungen für Deutschland

Es bleibt abzuwarten, wie sich die Rechtslage im Bereich der KI-generierten Musik, aber auch bei Texten, Grafiken etc., entwickeln wird.

Die mit der Nutzung von urheberrechtlichen Inhalten zu Trainingszwecken verbundenen urheberrechtlichen Fragen werden vermutlich erst in einigen Jahren höchstrichterlich geklärt werden. Es könnte sein, dass sich bis dahin entweder der Gesetzgeber entschließt, das Thema neu zu regeln (und dann, so ist meine Vermutung, eine „KI-Abgabe“ einführt, die an Verwertungsgesellschaften wie die GEMA zu zahlen ist) oder es zu Vereinbarungen zwischen Anbietern von KI und Verwertungsgesellschaften kommen wird.