Meta випустила набір даних FACET для дослідження моделей комп'ютерного зору на предмет упередженості
Компанія Meta представила новий інструмент FACET для оцінювання справедливості штучного інтелекту, який класифікує і розпізнає об'єкти на фото і відео, включно з людьми.
Що відомо
FACET складається з 32 000 зображень 50 000 людей, розмічених людськими анотаторами. Інструмент враховує різні класи, пов'язані з професіями та діяльністю, а також демографічні та фізичні характеристики.
Meta застосувала FACET до свого власного алгоритму комп'ютерного зору DINOv2. Інструмент виявив кілька упереджень у моделі, зокрема проти людей із певними гендерними особливостями. Також виявилося, що DINOv2 схильний стереотипно визначати жінок як "медсестер".
Meta визнає, що FACET може недостатньо відображати реальні поняття і демографічні групи. Крім того, багато зображень професій у наборі даних могли змінитися від моменту створення інструменту.
Наприклад, більшість лікарів і медсестер на фото, зроблених під час пандемії COVID-19, носять більше засобів індивідуального захисту, ніж до пандемії.
Крім самого набору даних, Meta також надала інструмент для вивчення даних. Щоб ним користуватися, розробники мають погодитися не навчати моделі комп'ютерного зору на FACET, а лише оцінювати, тестувати та перевіряти їх.
Джерело: TechCrunch