Künstliche Intelligenz (KI) und Copyright wird uns als Thema mit Sicherheit noch die nächsten Jahre beschäftigen. Dabei geht es jedoch nicht nur um die Frage, ob  mit KI geschaffene Werke dem Copyright oder dem Urheberrecht unterworfen sein können. Die  Nutzung von urheberrechtlich geschützten Daten für das KI-Training ist ebenso zu hinterfragen wie auch die daraus resultierenden weiteren Werke.  
Keiko Nagaoka, die japanische Ministerin für Bildung, Kultur, Sport, Wissenschaft und Technologie, hat laut The Decoder in einer Anhörung mit dem japanischen Politiker Takashi Kii im April die bestehende japanische Gesetzgebung bekräftigt, wonach die Nutzung von im Internet gesammelten Daten für nicht-kommerzielle und kommerzielle Zwecke auch im Kontext der generativen KI gilt.
Die Politik erlaubt es somit nach aktueller Rechtslage, nahezu beliebige Daten zu nutzen, "unabhängig davon, ob sie für gemeinnützige oder kommerzielle Zwecke verwendet werden, ob es sich um eine andere Handlung als die Reproduktion handelt oder ob es sich um Inhalte handelt, die von illegalen Seiten oder auf andere Weise bezogen wurden."
Kurz gesagt, in Japan dürfen zum Training von generativen KI-Modellen auch Datensätze genutzt werden, die einem Copyright-Schutz unterliegen. Dies stellt aktuell eine der extremsten "Pro-KI Positionen" dar, die in letzter Zeit von öffentlichen Institutionen verlautbart wurden.

Eine fast ebenso liberale KI-Position bezüglich der Urheberrechte vertritt aktuell Israel:
// Top-News auf einen Blick:
- Graphite - kostenloser Grafik-Editor von Photoshop bis Motion
 - Affinity Photo, Designer und Publisher ab sofort in einer kostenlosen App
 - DJI Neo 2 bringt Rundum-Hinderniserkennung samt LiDAR
 - Künftige Xbox Next: Vollwertiger Windows-PC mit Potenzial für Videobearbeitung
 - LG UltraFine 40U990A-W - 40 5K2K Monitor mit Thunderbolt 5
 
Ausgenommen seien Datensätze, die gezielt mit Werken einzelner Urheber trainiert werden, um anschließend mit diesen in Wettbewerb zu treten. Also mit der Möglichkeit und/oder Absicht, den Stil eines Urhebers direkt zu kopieren. Zudem könne der Output der Systeme unabhängig vom Trainingsprozess Urheberrechte verletzen.
Da die zugrundeliegenden Daten nach dem Training in eine einzige große Gewichtsmatrix (dem sogenannten Latent Space) transformiert wurden, lassen sich diese nicht mehr gezielt aus dem Modell löschen.
Solange es einzelne Länder der Welt es legal erlauben, urheberrechtlich geschütztes Material in den Latent Space eines Modells einzubringen, müssten andere Länder der Welt die grenzüberschreitende Anwendung dieser Modelle im eigenen Land entsprechend kontrollieren. Was faktisch schwer möglich erscheint.
Zudem muss grundsätzlich geklärt werden, ob der Output von KI-Systemen überhaupt als Plagiat gewertet werden kann.
Unsere persönliche Auffassung ist: Wir werden nicht um ein neues Urheberrecht herumkommen, das die Besonderheiten von KI-trainierten Modellen berücksichtigt. Und das wird noch eine ganze Weile dauern...


















