Clearview раскрывает функцию обнаружения атак презентации

Новая функция обнаружения атак презентации была добавлена в Clearview Consent API от Clearview AI, чтобы позволить разработчикам встроить обнаружение подделки в решения для проверки личности.

Clearview Consent был запущен всего несколько месяцев назад, чтобы применить алгоритмы распознавания лиц компании к совершенно новому набору вариантов использования в качестве инструмента биометрии селфи, а добавление возможностей обнаружения атак презентации является следующим шагом в его развитии, по словам тех, кто его создал.

Clearview рассмотрел ряд подходов, и генеральный директор Хоан Тон-Тхат (Hoan Ton-That) отмечает, что разработчики обычно не имеют доступа к специализированному оборудованию, стоящему за 3D-биометрическими системами на основе устройств.

Раннее взаимодействие с клиентами Clearview Consent дало некоторое представление о том, как предприятия и разработчики планируют его использовать, что не только убедило компанию в необходимости определения живости на основе 2D-изображений, но и представило целый ряд приложений.

Мы также рассматриваем видео с пассивным liveness, но некоторые поставщики сказали нам: «У нас есть эти старые профили, и мы хотим выяснить, сколько из них являются глубокими подделками, а сколько – презентационными атаками»

Говорит Тон-Тхат в интервью

Он рассказывает историю о криптоплатформе, которая просматривала изображения, принятые её провайдером KYC, и нашла фотографии и распечатки лиц.

Технология Clearview фокусируется на отдельных изображениях из коммерческих изображений RGB, сообщил вице-президент по исследованиям Теренс Лю (Terence Liu) во время того же видеозвонка.

По словам Лю, Clearview использует комплексный подход, комбинируя модели, которые ищут разные вещи.

Он поделился демонстрацией программного обеспечения, которое ищет повторные атаки и маски отдельно. В нескольких случаях из многих, показанных в демонстрации, программа обнаружила и то, и другое в изображении, которое на человеческий взгляд явно было повтором. Это, как объясняет Тон-Тхат, связано с настройками порога.

Настройки могут быть настроены для различных приложений из API, а Clearview предоставляет рекомендуемые настройки.

Под капотом

Когда Лю спросили о признаках того, что подделки низкого качества и глубокие подделки могут лучше уклоняться от обнаружения некоторыми системами, предназначенными для их выявления, у него есть готовое техническое объяснение этих причин.

«Если вы разрабатываете свою модель, ориентируясь на очень тонкое различие между реальным лицом и очень хорошей маской, ваша модель будет специализироваться в этой категории, но, вероятно, упустит другие моменты. Таким образом, вы хотите использовать подход, основанный на ансамбле моделей. У вас есть один грубый фильтр, чтобы просто избавиться от всех крайних случаев, другой, который увеличивает масштаб конкретных случаев, а затем вы можете ограничить тип обучающих данных, которые вы подаёте каждой из моделей»

Объясняет он

«Многие из этих коммерческих масок имеют очень странный рисунок морщин», – отмечает Лю.

Тон-Тхат подчеркивает важность объёма обучающих данных и отмечает относительно скромный размер обучающих наборов данных, которые Clearview имел для алгоритмов PAD, когда он начал работать над решением.

«Как ни странно, мы смогли расширить обучающие наборы, поместив фотографии масок в Clearview и найдя гораздо больше примеров масок». Одним из примеров является маска главного героя из телешоу «Во все тяжкие», которая была обнаружена на изображениях под разными углами и в широком диапазоне условий освещения.

Лю говорит, что постоянное расширение более крупных и глубоких нейронных сетей способствовало тому, что во многих областях применение ИИ превзошло ручной подбор признаков.

«Я вижу, что аналогичная тенденция наблюдается и в такой давней области, как обнаружение презентационных атак», – говорит он.

Область биометрических PAD прошла долгий путь от методов, сфокусированных на определенных признаках в прошлом, таких как сосудистые узоры. Теперь обучение нейронных сетей сводится к простому вопросу, объясняет Лю: «Оценивается ли эта сеть выше с точки зрения точности на моём наборе данных, и является ли мой набор данных ближе к истине для интересующего меня приложения».

ACLU продолжает выражать обеспокоенность по поводу источника данных, которые Clearview использует для обучения своих алгоритмов, но Тон-Тхат сообщил, что компания «не ожидает каких-либо проблем» на этом фронте.

Проблемы масштабирования при разработке биометрических систем, как для обучающих данных, так и для самих объемов, хорошо знакомы, и они помогают объяснить пробелы в производительности некоторых алгоритмов.

«Модели очень умны, но они не так умны, если вы не видите данных для конкретной задачи», – говорит Лю. «Индустрия, вся индустрия компьютерного зрения, а не только биометрия, знает об этом. Вот почему все эти большие модели предварительно обучены. Я ожидаю революции, подобной той, которую совершили языковые модели в этой области».

По словам Тон-Тхат, взаимодействие клиентов с Clearview Consent до сих пор было сильным, а среди первых пользователей – платформа KYC, поставщик BNPL и приложение для школьной безопасности. До сих пор рост был полностью органическим, а для корпоративных пользователей всегда требуется больше времени. Он оптимистично настроен в отношении того, что варианты развертывания в облаке и Docker, а также цены за каждый запрос помогут привлечь больше клиентов.

Компания с нетерпением ждёт запланированных NIST тестов PAD, и Тон-Тхат говорит, что рассматривает все варианты тестирования.

«Чем больше тестов, тем лучше, и чем больше у нас стандартизации, тем лучше», – говорит он.

Взгляды Тон-Тата и Лю на тестирование совпадают с их взглядами на обучающие данные, при этом Лю отмечает, что тестирование должно быть как можно более широким, «чтобы избежать этого разрыва в предметной области».

Функция PAD от Clearview Consent теперь доступна через API.

По материалам Biometrics Research Group. Автор Chris Burt

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *