ITMR KI Training Gericht Entscheidung

KI-Training: Erstes deutsches Gericht entscheidet

Domnik Skornia Datenschutz

Dominik Skornia

Author
Urteilsbesprechung
14.10.2024KI-RechtUrheberrechtText & Data MiningLG Hamburg

Der Beitrag ordnet eine frühe deutsche Leitentscheidung zur Nutzung urheberrechtlich geschützter Werke für KI-Trainingsdatensätze ein. Für die übergreifende rechtliche Einordnung von Trainingsdaten, Modellnutzung und regulatorischem Umfeld ist KI-Recht für Unternehmen die fachlich passende Vertiefung. Zugleich bleibt dieser Artikel als Fallbesprechung relevant, weil die Hamburger Linie später in der Berufung bestätigt wurde.

Worum es gehtNutzung eines Fotos zur Erstellung eines Datensatzes für das Training generativer KI.
KernfrageTragen § 44b UrhG und § 60d UrhG die Vervielfältigung im konkreten Trainingsdaten-Kontext?
Für wen relevantUnternehmen, Agenturen, Plattformen, Modellanbieter, Rechteinhaber und Projektverantwortliche.
Was Sie mitnehmenDie Entscheidung ist kein Freibrief für jedes KI-Training, aber ein wichtiger Maßstab für Schranken, Nutzungsvorbehalte und Daten-Governance.

Das Wichtigste in Kürze

Die Hamburger Entscheidungen erlauben nicht pauschal jedes KI-Training mit fremden Werken.Entscheidend bleiben die konkrete Nutzungshandlung, die Reichweite der TDM-Schranken und ein wirksamer Rechtevorbehalt.
Für den konkreten Datensatz-Fall hat das OLG Hamburg die Klageabweisung bestätigt.Nach der Berufungsentscheidung trug im Streitfall insbesondere § 44b UrhG, weil der Nutzungsvorbehalt nicht in der gesetzlich geforderten maschinenlesbaren Form vorlag.
Auch § 60d UrhG bleibt in der Hamburger Linie bedeutsam.Das Gericht sah die Erstellung des Datensatzes zudem als der wissenschaftlichen Forschung zurechenbaren Arbeitsschritt an.
Seit dem 2. August 2025 kommt für Anbieter von General-Purpose-AI-Modellen ein zusätzlicher Compliance-Rahmen hinzu.Art. 53 KI-VO verlangt unter anderem eine urheberrechtsbezogene Policy und eine hinreichend detaillierte Zusammenfassung der für das Training verwendeten Inhalte.

Update

Stand April 2026. Die erstinstanzliche Abweisung der Klage ist nicht der letzte Stand geblieben. Das Hanseatische Oberlandesgericht Hamburg hat die Berufung des Fotografen mit Urteil vom 10.12.2025 (Az. 5 U 104/24) zurückgewiesen. Nach der Pressemitteilung des Gerichts konnte sich der beklagte Verein im konkreten Fall auf die Schrankenregelung des § 44b UrhG berufen, weil der Nutzungsvorbehalt auf der Website der Bildagentur nicht in der gesetzlich geforderten maschinenlesbaren Form vorlag. Zusätzlich hielt der Senat die Nutzung im Ergebnis auch unter dem Blick von § 60d UrhG für gerechtfertigt. Die Revision wurde zugelassen; eine rechtskräftige höchstrichterliche Klärung ist auf diesem Stand nicht ersichtlich.

Was die Entscheidung heute trägt

  • Die Erstellung eines Trainingsdatensatzes ist urheberrechtlich gesondert zu prüfen und nicht erst die spätere Modellausgabe.
  • Rechtevorbehalte nach § 44b Abs. 3 UrhG sind praktisch zentral, müssen aber die gesetzliche Form einhalten.
  • Die Forschungs-Schranke des § 60d UrhG kann im Einzelfall zusätzlich Bedeutung gewinnen.

Wovon der Fall nicht automatisch handelt

  • Nicht jedes kommerzielle KI-Training fällt unter dieselben Voraussetzungen.
  • Nicht jeder in natürlicher Sprache formulierte Hinweis genügt ohne Weiteres als wirksamer maschinenlesbarer Vorbehalt.
  • Die Entscheidung klärt nicht abschließend alle urheberrechtlichen Fragen rund um spätere Modelloutputs oder andere Trainingsarchitekturen.

KI Trainingsdaten: Landgericht Hamburg entscheidet

KI-Recht. Die Vervielfältigung urheberrechtlich geschützter Werke im Rahmen von Text und Data Mining im Sinne von § 44b Abs. 1 UrhG zum Zweck des Trainings einer Künstlichen Intelligenz (KI) kann nach Auffassung des Landgerichts (LG) Hamburg durch die Schrankenbestimmung des § 60d UrhG abgedeckt sein.

Das LG Hamburg hat mit Urteil vom 27.09.2024, Az. 319 O 227/23, erstinstanzlich die Klage eines Fotografen abgewiesen, der gegen die Vervielfältigung im Sinne von § 16 Abs. 1 UrhG eines Lichtbildes (§ 72 UrhG) zur Erstellung von KI-Trainingsdatensätzen gegen einen Verein vorgegangen ist und insoweit auf Unterlassung geklagt hatte.

Der Beklagte als Verein stellt ein Dataset für Bild-Text-Paare öffentlich zur Verfügung, welches Hyperlinks zu im Internet abrufbaren Bildern und weitere, textförmliche Informationen zum Inhalt des Bildes enthält und zum Training von KI genutzt werden kann. Hierbei wurde auch das streitgegenständliche Lichtbild, welches von einer Werbeagentur mit Wasserzeichen auf ihrer Internetseite eingestellt wurde, zunächst heruntergeladen und nach Prüfung letztlich in das Set aufgenommen. Das heruntergeladene Bild wurde danach von der Beklagten wieder gelöscht.

Nach Inaugenscheinnahme der Rohdaten des Lichtbildes auf dem Laptop bestünden nach den Ausführungen des Gerichts keine Zweifel an der bestrittenen Lichtbildnereigenschaft des Klägers und mangels entgegenstehenden Vortrags des Beklagten sei von einem einfachen Nutzungsrecht der Werbeagentur an dem Lichtbildnis auszugehen, weshalb auch der Kläger aktivlegitimiert sei (§ 97 UrhG). Die Überdeckung des Bildes mit Wasserzeichen sei als unfreie Umgestaltung (§ 23 Abs. 1 UrhG) anzusehen, weshalb eine Verwertung grundsätzlich weiterhin der Zustimmung des Klägers bedurft habe.

Die Vervielfältigung des Bildes sei im Rahmen des Downloads durch die Beklagte erfolgt, im vorliegenden Fall allerdings nach Maßgabe der Schrankenbestimmung gemäß § 60d UrhG in zulässiger Weise. Demnach sind Vervielfältigungen für Text und Data Mining unter anderem zulässig, wenn diese für Zwecke der wissenschaftlichen Forschung durch Forschungsorganisationen vorgenommen werden, die keine kommerziellen Zwecke verfolgen (Abs. 2).

Der Download sei hier zum Zwecke des Text und Data Mining erfolgt, denn er habe mittels der dafür genutzten Analysesoftware der automatisierten Analyse eines digitalen Werks, um daraus Informationen insbesondere über Korrelationen – nämlich der Übereinstimmung des Bildes mit der Beschreibung – zu gewinnen, gedient (§ 44b Abs. 1 UrhG).

Daneben sei die Vervielfältigung zum Zweck der wissenschaftlichen Forschung erfolgt. Ein solcher liege vor, wenn der in Rede stehende Arbeitsschritt auf einen (späteren) Erkenntnisgewinn gerichtet ist. Ein tatsächlicher Forschungserfolg sei hingegen nicht Voraussetzung. Nach Auffassung des Landgerichts erfolgt die Erstellung des Datasets zu diesem Zweck, denn sie sei grundlegender Arbeitsschritt mit dem Ziel, den Datensatz zum späteren Erkenntnisgewinn einzusetzen. Ungeachtet des Umstands, dass das Set auch von kommerziellen Unternehmen entsprechend genutzt wird, genüge hierfür dessen kostenfreie Veröffentlichung. Hieraus folge weiterhin, dass die Beklagte keine kommerziellen Zwecke verfolge.

Obiter dictum

Wenngleich weitere Erwägungen für das Urteil nicht maßgeblich waren, äußerte sich das LG Hamburg auf Grundlage des Vorbringens der Parteien daneben umfassend im Rahmen eines obiter dicti zu den Schrankenbestimmungen gemäß § 44a und § 44b Abs. 2 UrhG.

Zunächst greife § 44a UrhG im Hinblick auf die gegenständliche Vervielfältigung nicht durch. Demnach sind vorübergehende Vervielfältigungshandlungen zulässig, die flüchtig oder begleitend sind und einen integralen und wesentlichen Teil eines technischen Verfahrens darstellen und deren alleiniger Zweck es ist, eine Übertragung in einem Netz zwischen Dritten durch einen Vermittler oder eine rechtmäßige Nutzung eines Werkes oder sonstigen Schutzgegenstands zu ermöglichen, die keine eigenständige wirtschaftliche Bedeutung haben. Es fehle insoweit bereits an einer „flüchtigen“ oder „begleitenden“ Vervielfältigung.

Ohne sich festzulegen, zweifelte das Landgericht daneben die Anwendung von § 44b Abs. 2 UrhG als Schrankenbestimmung im konkreten Fall an. Dagegen könne ein Nutzungsvorbehalt im Sinne von § 44b Abs. 3 UrhG sprechen. Der Anwendungsbereich sei zunächst eröffnet, denn die Vervielfältigungshandlung erfolgte zum Zweck des Text und Data Mining im Sinne von 44b Abs. 1 UrhG (s.o.).

Eine teleologische Reduktion der Schrankenbestimmung im Hinblick auf die Vervielfältigung von Daten zum Zweck des KI-Trainings mit der Begründung, § 44b UrhG solle nur die „Erschließung in den Daten verborgener Informationen“, nicht die Nutzung „des Inhalts der geistigen Schöpfung“ erfassen, zog das Gericht daneben in Zweifel, weil gerade bei digitalisierten Werken die Unterscheidung dieser Merkmale nicht deutlich werde. Ferner spreche auch der womöglich bestehende Hintergedanke, eine trainierte KI in Zukunft für die Erstellung inhaltsgleicher oder ähnlicher Bildinhalte zu nutzen, nicht für eine teleologische Reduktion der Vorschrift, weil von der Erstellung des Datensatzes bis hin zur finalen Nutzung der trainierten KI zur Erstellung neuer Inhalte nicht absehbar sei, ob das Training überhaupt erfolgreich sein wird, noch welche Inhalte womöglich letztlich generiert werden können. Letztlich sei in der KI-Verordnung (Verordnung 20024/1689 vom 13.06.2024) klar verankert, dass auch die Erstellung von zum Training von künstlichen neuronalen Netzen bestimmten Datensätzen der Schrankenregelung des Art. 4 DSM-RL unterfällt, welcher die Mitgliedsstaaten zum Treffen von Ausnahmeregelungen bzw. Schranken hinsichtlich des Text und Data Mining verpflichtet.

Dem spreche auch Art. 5 Abs. 4 InfoSoc-RL nicht entgegen, wonach die Ausnahmeregelungen nur angewandt werden dürfen, wenn die normale Verwertung des Werks oder des sonstigen Schutzgegenstands nicht beeinträchtigt wird und die berechtigten Interessen des Rechtsinhabers nicht ungebührlich verletzt werden. Eine Beeinträchtigung der Verwertung sei hier weder vorgetragen noch ersichtlich. Allein der Umstand, dass eine künftig womöglich fertig trainierte KI-Inhalte in Konkurrenz zu den Werken des Klägers erstellen könnte, rechtfertige noch nicht die Annahme einer solchen Verletzung. Andernfalls müsse das Text und Data Mining gänzlich untersagt werden, weil dann eine Beeinträchtigung nie ausgeschlossen werden könnte. Dies wiederum stünde im klaren Widerspruch zu den nationalen und europäischen Bestimmungen.

Dennoch sprach laut dem LG Hamburg gegen das Eingreifen der Schrankenregelung nach § 44b Abs. 2 UrhG das Vorliegen eines Nutzungsvorbehalts im Sinne von Abs. 3.

Gemäß Abs. 3 kann der „Rechteinhaber“ den Vorbehalt aussprechen, weshalb auch nachfolgende Rechteinhaber – hier die Agentur mittels Lizenz – den Vorbehalt erklären können. Es spreche daneben vieles dafür, dass sich der Kläger hier auf den Vorbehalt berufen kann, wenn die konkrete Entscheidung, welcher Dritte die Berechtigung zu welcher Nutzung erhalten soll, bei der Agentur lag.

Letztlich spreche vieles dafür, dass der Nutzungsvorbehalt auch die Anforderungen an die Maschinenlesbarkeit gemäß § 44b Abs. 3 S. 2 UrhG erfüllte. Die Kammer legte dabei zu Grunde, dass auch in natürlicher Sprache verfasste Nutzungsvorbehalte – wie es hier der Fall war - als „maschinenverständlich“ anzusehen seien. Dies sei stets in Abhängigkeit von der technischen Entwicklung zu beantworten. Im Rahmen der KI-Verordnung würden Anbieter von KI-Modellen verpflichtet, etwaige Rechtsvorbehalte „auch durch modernste Technologien“ vorzuhalten (vgl. Art. 53 Abs. 1 lit. c KI-VO). Dieser Wortlaut zeige nach Auffassung des Gerichts, dass der Gesetzgeber gerade auch solche Technologien miterfassen wollte, die in natürlicher Sprache geschriebenes inhaltlich erfassen können.

Einordnung

Für Unternehmen zeigt der Fall vor allem eines: Die urheberrechtliche Prüfung beginnt nicht erst beim späteren KI-Output. Bereits das Herunterladen, Aufbereiten, Labeln und Strukturieren von Trainingsdaten kann eigenständig relevant sein. Wer Datensätze erstellt, einkauft oder für Modelltraining einsetzt, sollte die Herkunft der Inhalte, die Lizenzkette, mögliche Rechtevorbehalte und die Rolle des konkreten Akteurs dokumentierbar erfassen.

Ebenso wichtig ist die Negativabgrenzung. Die Hamburger Entscheidungen tragen keine pauschale Aussage des Inhalts, dass jedes Training mit frei zugänglichen Internetinhalten zulässig wäre. Sie betreffen einen sehr konkreten Ablauf, einen konkreten Datensatz und konkrete Schrankenfragen.

Worauf es praktisch ankommt

Schritt

Datenquelle und Nutzungsweg

Warum relevant

Schon der Download und die Datensatz-Erstellung können urheberrechtlich erheblich sein.

Praktische Folge

Prozess und Herkunft der Trainingsdaten sauber dokumentieren.

Schritt

Rechtevorbehalte prüfen

Warum relevant

Bei § 44b UrhG kann die Form des Vorbehalts entscheidend sein.

Praktische Folge

Robuste Prüfpfade für maschinenlesbare Opt-outs und Lizenzbedingungen vorhalten.

Schritt

Modell- und Anbieterrolle trennen

Warum relevant

Datensatz-Ersteller, Modellanbieter und nutzendes Unternehmen können rechtlich unterschiedlich stehen.

Praktische Folge

Verträge, Verantwortlichkeiten und Compliance-Anforderungen getrennt prüfen.

Zuständiger Rechtsanwalt bei ITMR

Wenn es um Trainingsdaten, Rechtevorbehalte, Lizenzketten und die Schnittstelle zwischen KI-Recht und Urheberrecht geht, ist Jean Paul P. Bohne, LL.M., MM ein fachlich passender Ansprechpartner bei ITMR. Er ist bei ITMR insbesondere im KI-Recht, Urheberrecht und IT-Recht tätig und führt als Fachanwalt für Urheber- und Medienrecht sowie Fachanwalt für IT-Recht genau die Perspektiven zusammen, die dieser Fall verlangt.

FAQ

Erlaubt die Hamburger Rechtsprechung nun jedes KI-Training mit urheberrechtlich geschützten Werken?

Nein. Die Entscheidungen tragen eine konkrete Fallkonstellation. Maßgeblich bleiben insbesondere die konkrete Nutzungshandlung, die Voraussetzungen der TDM-Schranken, ein wirksamer Rechtevorbehalt und die tatsächliche Rolle des jeweiligen Akteurs.

Warum ist die Frage der Maschinenlesbarkeit so wichtig?

Weil § 44b Abs. 3 UrhG Rechtevorbehalte nicht nur inhaltlich, sondern auch formal relevant macht. Nach der Hamburger Berufungsentscheidung kann ein inhaltlich gemeinter Vorbehalt wirkungslos bleiben, wenn er nicht in der gesetzlich geforderten maschinenlesbaren Form vorliegt.

Warum ist dieser ältere Beitrag weiterhin lesenswert?

Weil er den Ausgangspunkt der deutschen Rechtsprechung zu KI-Trainingsdatensätzen dokumentiert. Seit dem OLG-Urteil vom 10.12.2025 muss der Fall allerdings zusammen mit der Berufungsentscheidung und dem inzwischen geltenden europäischen KI-Regulierungsrahmen gelesen werden.

Offizielle Quellen und Hinweise

Die OLG-Pressemitteilung bezeichnet die LG-Vorinstanz mit Az. 310 O 227/23. Für vor dem 2. August 2025 auf den Markt gebrachte GPAI-Modelle sind Übergangs- und Anpassungsfragen gesondert zu prüfen.

Weiterführende Einordnung

Die praktische Anschlussfrage lautet oft nicht nur, ob ein Datensatz erstellt werden durfte, sondern welche Rechte- und Haftungsfolgen sich beim Einsatz, bei der Vermarktung oder beim Output eines KI-Systems anschließen.


„KI-Training: Erstes deutsches Gericht entscheidet“

von Dominik Skornia, wissenschaftlicher Mitarbeiter

Artikel teilen

Teilen Sie diesen Artikel mit Ihrem Netzwerk