KI-Training: Erstes deutsches Gericht entscheidet

Die Vervielfältigung urheberrechtlich geschützter Werke im Rahmen von Text und Data Mining im Sinne von § 44b Abs. 1 UrhG zum Zweck des Trainings einer Künstlichen Intelligenz (KI) kann nach Auffassung des Landgerichts (LG) Hamburg durch die Schrankenbestimmung des § 60d UrhG abgedeckt sein.

 

Das LG Hamburg hat mit Urteil vom 27.09.2024, Az. 319 O 227/23, erstinstanzlich die Klage eines Fotografen abgewiesen, der gegen die Vervielfältigung im Sinne von § 16 Abs. 1 UrhG eines Lichtbildes (§ 72 UrhG) zur Erstellung von KI-Trainingsdatensätzen gegen einen Verein vorgegangen ist und insoweit auf Unterlassung geklagt hatte.

 

Der Beklagte als Verein stellt ein Dataset für Bild-Text-Paare öffentlich zur Verfügung, welches Hyperlinks zu im Internet abrufbaren Bildern und weitere, textförmliche Informationen zum Inhalt des Bildes enthält und zum Training von KI genutzt werden kann. Hierbei wurde auch das streitgegenständliche Lichtbild, welches von einer Werbeagentur mit Wasserzeichen auf ihrer Internetseite eingestellt wurde, zunächst heruntergeladen und nach Prüfung letztlich in das Set aufgenommen. Das heruntergeladene Bild wurde danach von der Beklagten wieder gelöscht.

 

Nach Inaugenscheinnahme der Rohdaten des Lichtbildes auf dem Laptop bestünden nach den Ausführungen des Gerichts keine Zweifel an der bestrittenen Lichtbildnereigenschaft des Klägers und mangels entgegenstehenden Vortrags des Beklagten sei von einem einfachen Nutzungsrecht der Werbeagentur an dem Lichtbildnis auszugehen, weshalb auch der Kläger aktivlegitimiert sei (§ 97 UrhG). Die Überdeckung des Bildes mit Wasserzeichen sei als unfreie Umgestaltung (§ 23 Abs. 1 UrhG) anzusehen, weshalb eine Verwertung grundsätzlich weiterhin der Zustimmung des Klägers bedurft habe. 

 

Die Vervielfältigung des Bildes sei im Rahmen des Downloads durch die Beklagte erfolgt, im vorliegenden Fall allerdings nach Maßgabe der Schrankenbestimmung gemäß § 60d UrhG in zulässiger Weise. Demnach sind Vervielfältigungen für Text und Data Mining unter anderem zulässig, wenn diese für Zwecke der wissenschaftlichen Forschung durch Forschungsorganisationen vorgenommen werden, die keine kommerziellen Zwecke verfolgen (Abs. 2).

 

Der Download sei hier zum Zwecke des Text und Data Mining erfolgt, denn er habe mittels der dafür genutzten Analysesoftware der automatisierten Analyse eines digitalen Werks, um daraus Informationen insbesondere über Korrelationen – nämlich der Übereinstimmung des Bildes mit der Beschreibung – zu gewinnen, gedient (§ 44b Abs. 1 UrhG).

 

Daneben sei die Vervielfältigung zum Zweck der wissenschaftlichen Forschung erfolgt. Ein solcher liege vor, wenn der in Rede stehende Arbeitsschritt auf einen (späteren) Erkenntnisgewinn gerichtet ist. Ein tatsächlicher Forschungserfolg sei hingegen nicht Voraussetzung. Nach Auffassung des Landgerichts erfolgt die Erstellung des Datasets zu diesem Zweck, denn sie sei grundlegender Arbeitsschritt mit dem Ziel, den Datensatz zum späteren Erkenntnisgewinn einzusetzen. Ungeachtet des Umstands, dass das Set auch von kommerziellen Unternehmen entsprechend genutzt wird, genüge hierfür dessen kostenfreie Veröffentlichung. Hieraus folge weiterhin, dass die Beklagte keine kommerziellen Zwecke verfolge.

 

Obiter dictum

Wenngleich weitere Erwägungen für das Urteil nicht maßgeblich waren, äußerte sich das LG Hamburg auf Grundlage des Vorbringens der Parteien daneben umfassend im Rahmen eines obiter dicti zu den Schrankenbestimmungen gemäß § 44a und § 44b Abs. 2 UrhG.

 

Zunächst greife § 44a UrhG im Hinblick auf die gegenständliche Vervielfältigung nicht durch. Demnach sind vorübergehende Vervielfältigungshandlungen zulässig, die flüchtig oder begleitend sind und einen integralen und wesentlichen Teil eines technischen Verfahrens darstellen und deren alleiniger Zweck es ist, eine Übertragung in einem Netz zwischen Dritten durch einen Vermittler oder eine rechtmäßige Nutzung eines Werkes oder sonstigen Schutzgegenstands zu ermöglichen, die keine eigenständige wirtschaftliche Bedeutung haben. Es fehle insoweit bereits an einer „flüchtigen“ oder „begleitenden“ Vervielfältigung.

 

Ohne sich festzulegen, zweifelte das Landgericht daneben die Anwendung von § 44b Abs. 2 UrhG als Schrankenbestimmung im konkreten Fall an. Dagegen könne ein Nutzungsvorbehalt im Sinne von § 44b Abs. 3 UrhG sprechen. Der Anwendungsbereich sei zunächst eröffnet, denn die Vervielfältigungshandlung erfolgte zum Zweck des Text und Data Mining im Sinne von 44b Abs. 1 UrhG (s.o.).

 

Eine teleologische Reduktion der Schrankenbestimmung im Hinblick auf die Vervielfältigung von Daten zum Zweck des KI-Trainings mit der Begründung, § 44b UrhG solle nur die „Erschließung in den Daten verborgener Informationen“, nicht die Nutzung „des Inhalts der geistigen Schöpfung“ erfassen, zog das Gericht daneben in Zweifel, weil gerade bei digitalisierten Werken die Unterscheidung dieser Merkmale nicht deutlich werde. Ferner spreche auch der womöglich bestehende Hintergedanke, eine trainierte KI in Zukunft für die Erstellung inhaltsgleicher oder ähnlicher Bildinhalte zu nutzen, nicht für eine teleologische Reduktion der Vorschrift, weil von der Erstellung des Datensatzes bis hin zur finalen Nutzung der trainierten KI zur Erstellung neuer Inhalte nicht absehbar sei, ob das Training überhaupt erfolgreich sein wird, noch welche Inhalte womöglich letztlich generiert werden können. Letztlich sei in der KI-Verordnung (Verordnung 20024/1689 vom 13.06.2024) klar verankert, dass auch die Erstellung von zum Training von künstlichen neuronalen Netzen bestimmten Datensätzen der Schrankenregelung des Art. 4 DSM-RL unterfällt, welcher die Mitgliedsstaaten zum Treffen von Ausnahmeregelungen bzw. Schranken hinsichtlich des Text und Data Mining verpflichtet.

 

Dem spreche auch Art. 5 Abs. 4 InfoSoc-RL nicht entgegen, wonach die Ausnahmeregelungen nur angewandt werden dürfen, wenn die normale Verwertung des Werks oder des sonstigen Schutzgegenstands nicht beeinträchtigt wird und die berechtigten Interessen des Rechtsinhabers nicht ungebührlich verletzt werden. Eine Beeinträchtigung der Verwertung sei hier weder vorgetragen noch ersichtlich. Allein der Umstand, dass eine künftig womöglich fertig trainierte KI-Inhalte in Konkurrenz zu den Werken des Klägers erstellen könnte, rechtfertige noch nicht die Annahme einer solchen Verletzung. Andernfalls müsse das Text und Data Mining gänzlich untersagt werden, weil dann eine Beeinträchtigung nie ausgeschlossen werden könnte. Dies wiederum stünde im klaren Widerspruch zu den nationalen und europäischen Bestimmungen.

 

Dennoch sprach laut dem LG Hamburg gegen das Eingreifen der Schrankenregelung nach § 44b Abs. 2 UrhG das Vorliegen eines Nutzungsvorbehalts im Sinne von Abs. 3. 

 

Gemäß Abs. 3 kann der „Rechteinhaber“ den Vorbehalt aussprechen, weshalb auch nachfolgende Rechteinhaber – hier die Agentur mittels Lizenz – den Vorbehalt erklären können. Es spreche daneben vieles dafür, dass sich der Kläger hier auf den Vorbehalt berufen kann, wenn die konkrete Entscheidung, welcher Dritte die Berechtigung zu welcher Nutzung erhalten soll, bei der Agentur lag.

 

Letztlich spreche vieles dafür, dass der Nutzungsvorbehalt auch die Anforderungen an die Maschinenlesbarkeit gemäß § 44b Abs. 3 S. 2 UrhG erfüllte. Die Kammer legte dabei zu Grunde, dass auch in natürlicher Sprache verfasste Nutzungsvorbehalte – wie es hier der Fall war - als „maschinenverständlich“ anzusehen seien. Dies sei stets in Abhängigkeit von der technischen Entwicklung zu beantworten. Im Rahmen der KI-Verordnung würden Anbieter von KI-Modellen verpflichtet, etwaige Rechtsvorbehalte „auch durch modernste Technologien“ vorzuhalten (vgl. Art. 53 Abs. 1 lit. c KI-VO). Dieser Wortlaut zeige nach Auffassung des Gerichts, dass der Gesetzgeber gerade auch solche Technologien miterfassen wollte, die in natürlicher Sprache geschriebenes inhaltlich erfassen können.

 

"KI-Training: Erstes deutsches Gericht entscheidet"

von Dominik Skornia, wissenschaftlicher Mitarbeiter