Eine neue Gerichtsentscheidung in den USA macht die KI-Branche nervös. Bekanntlich laufen mehrere Verfahren gegen Entwickler und Betreiber von (generativen) KI-Diensten, denen vorgeworfen wird, einerseits Copyright-geschützte Werke ohne Erlaubnis für das Training ihrer Systeme genutzt zu haben, deren Output andererseits dem Trainingsmaterial teilweise so ähnlich sei, dass dadurch eine Konkurrenz entsteht, die wirtschaftlichen Schaden für die Urheber verursacht.

Die KI-Unternehmen berufen sich in ihrer Verteidigung unter anderem gerne auf die amerikanische Fair-Use-Doktrin, welche besagt, dass es in manchen Fällen vertretbar sei, urheberrechtlich geschütztes Material ohne Erlaubnis zu verwenden, etwa im Rahmen von Berichterstattung, Wissenschaft u.ä. Beispielsweise bei der groß angelegten Klage der amerikanischen Musikindustrie gegen die KI-Musikgeneratoren Suno und Udio verweisen die Angeklagten u. a. auf Fair Use.
Inwieweit eine unerlaubte Nutzung unter Fair Use zu tolerieren ist (in Amerika; in Deutschland haben wir dazu kein Pendant), hängt von verschiedenen Faktoren ab und wird von Fall zu Fall entschieden. Wichtig sind bei der Abwägung die Fragen, inwieweit eine Nutzung kommerziell ist oder nicht, ob sie transformativ ist und ob durch sie der Wert der geschützten Werke beeinträchtigt wird.
Nun hat in einem bereits seit 2020 laufenden Copyright-Verfahren ein Richter in Delaware entgegen seiner ursprünglichen Auffassung entschieden, die Verwendung von urheberrechtlich geschütztem Material (kurze Zusammenfassungen von juristischen Texten, die von der Westlaw Plattform stammen) als Basis für eine KI-basierte Suchmaschine fiele im zu prüfenden Fall nicht unter Fair Use, da letztlich ein Konkurrenzprodukt entwickelt wurde, von dem potentiell wirtschaftlicher Schaden für die ursprünglichen Rechteinhaber ausgehe. Geklagt hatte damals Rechteinhaber Thomson Reuters gegen KI-Startup Ross Intelligence (genauer zum Fall siehe bei Heise, oder hier den Gerichtsbeschluss).
Zwar kam in diesem Fall bei der unerlaubten Nutzung noch gar keine generative KI zum Einsatz; soweit wir nachvollziehen können, sind die im Hintergrund werkelnden KI-Algorithmen bei der Kernproblematik eigentlich zweitrangig. Dennoch ist nun die große Frage, ob andere Gerichte der ablehnenden Argumentation bezüglich Fair Use folgen werden, sofern zuvor eine Copyright-Verletzung festgestellt wird bei den Verfahren gegen die einschlägigen KI-Dienste.
Dass die meisten großen, generativen KI-Modelle mit wenig Rücksicht auf eine korrekte Lizenzierung der genutzten Werke trainiert werden, ist ein offenes Geheimnis. Kürzlich kam etwa im Rahmen eines anderen Gerichtsverfahrens ans Licht, dass Meta sein Large-Language-Modell Llama unter anderem mit dem raubkopierten LibGen Dataset trainiert hatte, und zwar mit ausdrücklicher Billigung von Zuckerberg.