Борьба с предвзятостью угрожает конфиденциальности

Проблемы с фальшивыми лицами настолько сложны, что некоторые решения создают ещё больше проблем.

Исследователи из Швейцарии, например, считают, что они нашли способ обойти обучающие наборы данных, которые недостаточно представляют не белых мужчин в инструментах распознавания лиц.

Учёные исследовательского института Idiap собираются создать синтетические лица, представляющие остальную часть населения, для обучения биометрических алгоритмов.

Исследователи будут курировать так называемый более безопасный проект вместе с партнерами из Цюрихского университета и швейцарской фирмы Sicpa, создающей защитные ссылки для конфиденциальных документов.

Необъективные наборы данных стали третьим этапом создания инструмента распознавания лиц. Они являются лёгкой мишенью для политиков и регулирующих органов, и, по словам Idiap, технологические компании отказываются от возможности быть привязанными к чему-либо, названному предвзятым.

Idiap не упоминает, есть ли проблема в этом решении. По определению синтетические лица не идеальны. Приведут ли несовершенства в наборе данных в конечном итоге к неожиданным и значительным отклонениям среди групп населения, которым разработчики надеялись помочь?

Затем есть подготовленная к публикации исследовательская статья под названием «Этот человек (вероятно) существует», в которой ставится под сомнение одно из фундаментальных предположений нейронных сетей чёрного ящика – что нет способа узнать информацию, которая в них поступает.

В соответствии с этим принципом, наборы данных лиц защищены, а значит, и конфиденциальность владельцев этих лиц защищена.

Но ученые из Университета Кан-Нормандия и ENSI Caen говорят, что они обнаружили, что генеративные состязательные сети «сливают информацию о своих тренировочных данных» посредством новой экспериментальной атаки.

Атака позволила исследователям «различать образцы, имеющие ту же идентичность, что и обучающие образцы, но не являющиеся одними и теми же образцами». Это работало с несколькими популярными наборами данных о лицах и процедурами сетевого обучения.

В статье MIT Technology Review, анализирующей этот документ, отмечалось, что медицинские записи о человеке, использованные для обучения модели, ориентированной на заболевание, могут пролить свет на этого человека благодаря фальшивому лицу, которое очень похоже на пациента.

Это означает, что теоретически идея Idiap – создание лиц для повышения инклюзивности модели, может в конечном итоге привести к выявлению реальных субъектов, используемых для создания синтетических объектов для наборов данных лиц.

По материалам Biometrics Research Group. Автор Jim Nash

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *