Борьба с предвзятостью угрожает конфиденциальности

Проблемы с фальшивыми лицами настолько сложны, что некоторые решения создают ещё больше проблем.

Исследователи из Швейцарии, например, считают, что они нашли способ обойти обучающие наборы данных, которые недостаточно представляют не белых мужчин в инструментах распознавания лиц.

Учёные исследовательского института Idiap собираются создать синтетические лица, представляющие остальную часть населения, для обучения биометрических алгоритмов.

Исследователи будут курировать так называемый более безопасный проект вместе с партнерами из Цюрихского университета и швейцарской фирмы Sicpa, создающей защитные ссылки для конфиденциальных документов.

Необъективные наборы данных стали третьим этапом создания инструмента распознавания лиц. Они являются лёгкой мишенью для политиков и регулирующих органов, и, по словам Idiap, технологические компании отказываются от возможности быть привязанными к чему-либо, названному предвзятым.

Idiap не упоминает, есть ли проблема в этом решении. По определению синтетические лица не идеальны. Приведут ли несовершенства в наборе данных в конечном итоге к неожиданным и значительным отклонениям среди групп населения, которым разработчики надеялись помочь?

Затем есть подготовленная к публикации исследовательская статья под названием «Этот человек (вероятно) существует», в которой ставится под сомнение одно из фундаментальных предположений нейронных сетей чёрного ящика – что нет способа узнать информацию, которая в них поступает.

В соответствии с этим принципом, наборы данных лиц защищены, а значит, и конфиденциальность владельцев этих лиц защищена.

Но ученые из Университета Кан-Нормандия и ENSI Caen говорят, что они обнаружили, что генеративные состязательные сети «сливают информацию о своих тренировочных данных» посредством новой экспериментальной атаки.

Атака позволила исследователям «различать образцы, имеющие ту же идентичность, что и обучающие образцы, но не являющиеся одними и теми же образцами». Это работало с несколькими популярными наборами данных о лицах и процедурами сетевого обучения.

В статье MIT Technology Review, анализирующей этот документ, отмечалось, что медицинские записи о человеке, использованные для обучения модели, ориентированной на заболевание, могут пролить свет на этого человека благодаря фальшивому лицу, которое очень похоже на пациента.

Это означает, что теоретически идея Idiap – создание лиц для повышения инклюзивности модели, может в конечном итоге привести к выявлению реальных субъектов, используемых для создания синтетических объектов для наборов данных лиц.

По материалам Biometrics Research Group. Автор Jim Nash

Добавить комментарий

Ваш адрес email не будет опубликован.