Проблемы с фальшивыми лицами настолько сложны, что некоторые решения создают ещё больше проблем.
Исследователи из Швейцарии, например, считают, что они нашли способ обойти обучающие наборы данных, которые недостаточно представляют не белых мужчин в инструментах распознавания лиц.
Учёные исследовательского института Idiap собираются создать синтетические лица, представляющие остальную часть населения, для обучения биометрических алгоритмов.
Исследователи будут курировать так называемый более безопасный проект вместе с партнерами из Цюрихского университета и швейцарской фирмы Sicpa, создающей защитные ссылки для конфиденциальных документов.
Необъективные наборы данных стали третьим этапом создания инструмента распознавания лиц. Они являются лёгкой мишенью для политиков и регулирующих органов, и, по словам Idiap, технологические компании отказываются от возможности быть привязанными к чему-либо, названному предвзятым.
Idiap не упоминает, есть ли проблема в этом решении. По определению синтетические лица не идеальны. Приведут ли несовершенства в наборе данных в конечном итоге к неожиданным и значительным отклонениям среди групп населения, которым разработчики надеялись помочь?
Затем есть подготовленная к публикации исследовательская статья под названием «Этот человек (вероятно) существует», в которой ставится под сомнение одно из фундаментальных предположений нейронных сетей чёрного ящика – что нет способа узнать информацию, которая в них поступает.
В соответствии с этим принципом, наборы данных лиц защищены, а значит, и конфиденциальность владельцев этих лиц защищена.
Но ученые из Университета Кан-Нормандия и ENSI Caen говорят, что они обнаружили, что генеративные состязательные сети «сливают информацию о своих тренировочных данных» посредством новой экспериментальной атаки.
Атака позволила исследователям «различать образцы, имеющие ту же идентичность, что и обучающие образцы, но не являющиеся одними и теми же образцами». Это работало с несколькими популярными наборами данных о лицах и процедурами сетевого обучения.
В статье MIT Technology Review, анализирующей этот документ, отмечалось, что медицинские записи о человеке, использованные для обучения модели, ориентированной на заболевание, могут пролить свет на этого человека благодаря фальшивому лицу, которое очень похоже на пациента.
Это означает, что теоретически идея Idiap – создание лиц для повышения инклюзивности модели, может в конечном итоге привести к выявлению реальных субъектов, используемых для создания синтетических объектов для наборов данных лиц.
По материалам Biometrics Research Group. Автор Jim Nash