Исследователи предлагают новый двумерный подход к определению цвета кожи.
Исследователи из Sony, Уильям Тонг, Алиса Сян и программист Пшемыслав Йоньяк, недавно опубликовали исследование , подчёркивающее одномерность в компьютерном зрении при работе с цветами кожи. На данный момент используется градация цвета от светлого к тёмному. Исследователи предложили добавить диапазон от красного до жёлтого для большей точности.
В прошлом для проверки предвзятости алгоритмов по цвету кожи использовалась шкала Фитцпатрика из шести оттенков, от самого светлого до самого тёмного. Изначально этот способ был разработан дерматологами для оценки реакции кожи на ультрафиолетовое излучение. Однако Google недавно внедрила новую шкалу Эллиса Монка с 10 оттенками.
Как отмечено в Wired , когда было обнаружено, что алгоритмы распознавания лиц работают менее точно для людей с более тёмной кожей, крупные компании, такие как Google и Meta, начали оптимизацию своего ПО. Однако исследование Sony показывает, что многие ИИ-разработчики всё ещё упускают нюансы цвета кожи, особенно для людей с жёлтыми оттенками кожи.
На конференции в Париже исследователи Sony представили свою работу, в которой использовали международный стандарт цвета CIELAB, используемый при редактировании и производстве фотографий. Анализ с помощью CIELAB показал, что кожа на фотографиях отличается не только по тону (глубине цвета), но также по оттенку или по градации цвета.
Команда Sony протестировала системы искусственного интеллекта с открытым кодом, включая программу обрезки фотографий от Twitter и два алгоритма генерации изображений. Во всех случаях системы давали преимущество людям с кожей более красных оттенков, что может быть несправедливо по отношению к представителям Азии, Латинской Америки и Ближнего Востока.
Авторы работы предложили новый метод для описания цвета человеческой кожи, используя две координаты: по шкале от светлого до темного и по шкале от желтого до красного оттенков.
Когда команда Sony применила свой метод, она выявила предвзятость как в генеративных моделях, так и в обучающих данных. CelebAMask-HQ, популярный набор данных, используемый для обучения программ компьютерного зрения, содержал 82% изображений людей с перекосом в сторону красных оттенков кожи. В наборе данных FFHQ от Nvidia этот показатель составил 66%. Кроме того, две модели ИИ, обученные на базе FFHQ, проявляли предвзятость, создавая изображения с преобладанием красных оттенков кожи.
AI-платформы, такие как ArcFace, FaceNet и Dlib, лучше работали с изображениями людей с более красной кожей, когда их просили определить, соответствуют ли два портрета одному и тому же человеку. Облачные сервисы искусственного интеллекта от Microsoft Azure и Amazon Web Services для определения улыбок также лучше работали с красными оттенками.
Тем не менее, не все эксперты одобряют выводы исследования. Социолог из Гарварда Эллис Монк в комментарии для Wired заявил, что его шкала Monk Skin Tone не является одномерной. Кроме того, Монк высказал критику по поводу подхода исследователей Sony, который полностью автоматизирован и не учитывает человеческое мнение. Он беспокоится, что объективные меры, подобные тем, что предложили исследователи Sony, могут привести к упрощению или игнорированию других сложных аспектов человеческого разнообразия.
Ладно, не доказали. Но мы работаем над этим