Populaire LAION-5B kunstmatige intelligentie trainingsdataset bevat beelden van seksueel misbruik van kinderen - onderzoek

Via: Bohdan Kaminskyi | 21.12.2023, 14:19
Populaire LAION-5B kunstmatige intelligentie trainingsdataset bevat beelden van seksueel misbruik van kinderen - onderzoek
LAION

De LAION-5B kunstmatige intelligentie training dataset bevat ten minste 1679 referenties van seksueel misbruik van kinderen (CSAM).

Dit is wat we weten

Onderzoekers van het Stanford Internet Observatory begonnen in september 2023 met het analyseren van de LAION-datasets - ze controleerden de hashes van afbeeldingen met behulp van gespecialiseerde platforms om CSAM te detecteren. Er was ook een controle door het Canadese centrum voor kinderbescherming.

Volgens de beschrijving op de website is LAION een index van afbeeldingen van het internet, geen opslagplaats. Desalniettemin wijzen experts op het potentiële gevaar van de aanwezigheid van CSAM-materiaal - AI-modellen die getraind zijn op dergelijke gegevens kunnen leren om kwaadaardige inhoud te creëren.

De onderzoekers adviseren om geen AI-modellen meer te gebruiken die zijn getraind op LAION-5B. Met name het Stable Diffusion model van Stability AI was gedeeltelijk getraind op deze data.

Google gebruikte ook een eerdere versie van LAION voor Imagen, maar heeft die data later losgelaten.

Bron: The Verge