ChatGPT hat sich YouTube-Videos ungefragt einverleibt
- OpenAI nutzte Millionen Stunden YouTube-Videos für KI-Training
- Mögliche Verletzung von Urheberrechten
- Die Rechtslage um KI-Training mit urheberrechtlichem Material ist unsicher.
OpenAI hat sich durch die Nutzung von Whisper, einem Programm zur automatisierten Transkription, Zugang zu einer beeindruckenden Menge von Trainingsdaten verschafft: rund eine Million Stunden an YouTube-Videos.
Dieser Schritt erfolgte, nachdem das Unternehmen alle öffentlich verfügbaren Texte in englischer Sprache bereits in seine Trainingsdaten integriert hatte. Obwohl dies möglicherweise Urheberrechte verletzt hat, griff Google nicht ein, erläutert Nico Ernst bei Heise, da es selbst ähnliche Praktiken bei der Nutzung von YouTube-Inhalten für das Training eigener KI-Modelle verfolgt.
Die Zunahme von Klagen und Beschwerden im Zusammenhang mit der Nutzung urheberrechtlich geschützten Materials für KI-Training ohne entsprechende Lizenzvereinbarungen zeigt jedoch, dass solche Praktiken zunehmend in Frage gestellt werden.
Tech-Unternehmen wie Google und Facebook haben daher ihre Nutzungsbedingungen geändert, um eine solche Verwendung einzuschränken. OpenAI hat sich offenbar auf das US-amerikanische Rechtskonstrukt des "fair use" berufen, um seine Handlungen zu rechtfertigen.
Unternehmen beginnen auch zunehmend, explizite Lizenzvereinbarungen mit Datenquellen abzuschließen, um rechtliche Grenzen im Bereich der KI zu berücksichtigen. Obwohl eine Million Stunden YouTube-Video als Trainingsmaterial beeindruckend erscheinen mögen, relativiert sich diese Zahl angesichts des rasanten Wachstums der Plattform.