KI-Grundsatzurteil Gema vs. Open AI: Urheberrechtliche Hürden beim KI-Training

26. November 2025
Dr. Noëlly Jaspers
Kümmerlein –

Weil Open AI Liedtexte u.a. von Herbert Grönemeyer und Reinhard Mey im Rahmen des KI-Trainings von ChatGPT verwendete, bejahte das LG München I in seinem Urteil vom 11.11.2025 (Az 42 O 14139/24) eine Urheberrechtsverletzung und verurteilte Open AI auf Auskunft, Unterlassung und Schadensersatz. Sowohl die „Memorisierung“ im KI-Sprachmodell als auch die Ausgabe (sog. Outputs) der Liedtexte stellen demnach eine urheberechtliche Vervielfältigung dar. Ohne Lizenz sei eine solche Nutzung daher unzulässig. Zudem haften KI-Betreiber für Urheberrechtsverletzungen durch Outputs.


Das noch nicht rechtskräftige Urteil stellt eine erste Grundsatzentscheidung zur Nutzung urheberrechtlich geschützter Werke für das Training von KI dar und stärkt die Position von Kreativen gegenüber Tech-Unternehmen.


Was ist passiert?


Open AI hatte sein KI-Sprachmodell u.a. mit den Liedern „Männer“ von Herbert Grönemeyer und „Über den Wolken“ von Reinhard Mey trainiert. Dies war unstreitig. Zentrale Frage und umstritten war aber, was danach mit den Dateninformationen geschah. Bei einer einfachen Anfrage durch den Nutzer (sog. Prompt) wurden die Liedtexte nahezu identisch wiedergegeben (sog. Outputs). Open AI argumentierte, dass die Outputs auf einer originären maschinellen Generierung basierten, d.h. ChatGPT die Liedtexte auf Basis des Gelernten quasi neu erzeugte. Das Gericht wertete die fast identische Wiedergabe in den Outputs hingegen als Beweis, dass die Werke im KI-Sprachmodell gespeichert („memorisiert“) worden waren. Eine rein zufällige Ausgabe sei ausgeschlossen.


Die drei Phasen des KI-Trainings


Das LG München I unterscheidet im Rahmen der KI-Nutzung drei Phasen, die bereits das LG Hamburg in seiner LAION-Entscheidung (Urteil vom 27.9.2024 – 310 O 227/23) aufgestellt hat:

  • Phase 1: Erstellung des Trainingsmaterials
    Extrahieren von Daten und Überführung in ein maschinenlesbares Format
  • Phase 2: Training des KI-Modells
    Analyse des Datenmaterials und Anreicherung mit Meta-Daten
  • Phase 3: Nutzung des trainierten KI-Modells
    durch Prompts und Ausgaben/Outputs


Sog. Memorisierung ist Vervielfältigung


Nach Ansicht des Gerichts liegt die maßgebliche Rechtsverletzung in Phase 2. Problematisch sei hier die sog. Memorisierung. „Memorisierung“ liegt vereinfacht gesprochen vor, wenn beim Training der KI dem Trainingsdatensatz nicht nur Informationen entnommen werden, sondern die Trainingsdaten vollständig übernommen werden. Diese Memorisierung stelle eine urheberrechtliche Vervielfältigung dar. Ob ein Werk in einem KI-Modell memorisiert sei, könne sich einfach anhand eines Abgleichs zwischen dem Originalwerk und dem Output eines einfach gehaltenen Prompts ergeben (z.B. „Bitte nenne mir die erste Strophe von X“).

Kümmerlein –

„Die Memorisierung urheberrechtlich geschützter Werke im KI-Modell stellt eine Vervielfältigung dar – und ist ohne Zustimmung unzulässig.“

Keine Rechtfertigung nach § 44b UrhG


Auch § 44b UrhG hilft hier laut LG München I nicht weiter. Diese Norm ermöglicht Vervielfältigungen (ohne die Zustimmung des Rechtsinhabers) für die Zwecke des Text und Data Mining, um damit für mehr Rechtssicherheit bei der Nutzung von Fremddaten zu sorgen und insbesondere die Privatwirtschaft zu Innovationen im Bereich KI anzuregen.


Nach Ansicht des Gerichts deckt § 44b UrhG aber nur die Phase 1 ab, d.h. die Vervielfältigung urheberrechtlich geschützter Werke zur Vorbereitung des Trainingsdatensatzes (z.B. Überführung in ein anderes digitales Format oder Speicherung im Arbeitsspeicher). Hintergrund hierfür sei der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt würden und damit die Verwertungsinteressen des Urhebers am Werk nicht beeinträchtigten.


Beim Memorisieren in Phase 2 würden die Liedtexte aber nicht allein ausgewertet, sondern vollständig in die Parameter des KI-Modells übernommen, was wiederum in die Verwertungsinteressen des Urhebers eingreife. Dies sei durch § 44b UrhG nicht mehr gedeckt.


Und was ist mit dem Output?


Die Ausgabe urheberrechtlicher Werke auf Anfrage (Prompt) eines Nutzers stelle zudem eine urheberrechtsverletzende Vervielfältigung und öffentliche Zugänglichmachung dar. Bemerkenswert ist, dass das Gericht diese Handlungen Open AI zurechnet und nicht dem Nutzer. Denn Letzterer hat löst den Output eigentlich durch seinen Prompt aus. Zwar könne die Tatherrschaft an den Nutzer verloren gehen, wenn Outputs durch den Nutzer provoziert würden. Dies sei aber laut dem Gericht jedenfalls bei einfach gehaltenen Prompts nicht der Fall.


Was bedeutet dies für die Praxis?


Das Urteil ist die erste Grundsatzentscheidung zur Nutzung urheberrechtlich geschützter Werke im Rahmen des KI-Trainings sowie der haftungsrechtlichen Verantwortung für Outputs. Unternehmen, die KI-Modelle trainieren, sollten ihre Prozesse auf urheberrechtliche Risiken überprüfen. Denn jedenfalls nach dem aktuellen Urteil stellt das „Memorisieren“ eine urheberrechtliche Vervielfältigung dar und bedarf daher der Zustimmung des Urhebers.


Auch Unternehmen, die KI-Modelle im Arbeitsalltag verwenden und KI-Outputs weiterverwenden oder sogar in eigene Produkte integrieren (z.B. im Rahmen der Programmierung), sollten Vorsicht walten lassen. Auch hier sollten Prozesse zur Nutzung von KI-Outputs etabliert werden. Vermieden werden sollten jedenfalls Prompts, die die KI zur Reproduktion „einladen“.


Das Urteil ist bisher nicht rechtskräftig. Es ist davon auszugehen, dass der Rechtsstreit noch durch mehrere Instanzen geht.