In einer neuen Version der Datenschutz-Richtlinie und Nutzungsbedingungen macht Google klar, alles Greifbare für das Training seiner KI-Modelle zu nutzen.
Jedenfalls auf urheberrechtlicher Ebene ist das in Art. 3, 4 der EU-DSM (RL 2019/790) bereits geregelt und dort werden explizit Ausnahmen für Text- und Data Mining gemacht, die wohl auch auf KI-Training anwendbar sind.
Nein. Das Ganze ist in Art. 3, 4 der EU-DSM (RL 2019/790) bereits geregelt und dort werden explizit Ausnahmen für Text- und Data Mining gemacht, die wohl auch auf KI-Training anwendbar sind.
Hier geht es natürlich um Urheberrechte - wenn es um Datenschutz o.ä. geht, kann sich das anders darstellen.
Respektiert der KI Crawler dann überhaupt Robots.txt?
Letzter Absatz im Artikel:
An dem Absatz ist allerdings auch spannend, dass Google keine Ausnahme zu kennen scheint. Während man verhindern kann, dass Google Webseiten und Inhalte indexiert, sieht zumindest die Datenschutzerklärung das nicht für potenzielle KI-Trainingsdaten vor. Datenschutzrechtlich dürfte das schwierig sein – als würde es eine Einwilligung zu Googles Datenschutzerklärung geben, wenn man das Internet nutzt. Urheberrechtlich scheint das Vorgehen keine Schwierigkeiten zu machen. Es sind öffentlich zugängliche Daten, die zwar genutzt werden, aber nicht gespeichert.