Видение общей картины полезно при выполнении некоторых задач, но оно привносит посторонние детали, которые могут запутать ситуацию на местах. По-видимому, то же самое относится и к обнаружению атак презентации для биометрической верификации.
Финансируемое промышленностью исследование в Турции показывает, что может быть более эффективно обучать модели обнаружения атак на основе глубокого обучения, используя только небольшие квадратные участки из живых и поддельных изображений лиц.
Это означает плотное кадрирование изображений лиц, реальных или поддельных, чтобы удалить как можно больше биометрических данных, не относящихся к лицу, а затем разбить это изображение на участки размером 32 x 32 пикселя. Эти квадраты сшиваются в более крупные наборы изображений, включающие как подлинные изделия, так и изображения поддельных лиц.
В экспериментах патчи собирались случайным образом или по схеме, и случайные схемы работали лучше.
Двое из трёх исследователей, работавших над проектом, были сотрудниками кафедры компьютерной инженерии Стамбульского технического университета. Третий работает в компании Sodec Technologies, стамбульской фирме по разработке программного обеспечения KYC.
В своём исследовании команда использовала четыре набора данных, один из которых был реальным, разработанным компанией Sodec, которая предоставила исследовательский грант и помогла собрать изображения. Совет по технологическим исследованиям Турции также поддержал эту работу.
Сверточные нейронные сети обычно используются в обучающих моделях для обнаружения атак презентации, пишут исследователи, но, по крайней мере, в этой области они действительно хорошо работают только с внутренними наборами данных.
Они принимают тонкие сигналы от коллективной фоновой информации в наборе данных, что может создать динамику, подобную той, когда кажется, что лошадь умеет считать, но на самом деле она лишь считывает тонкие сигналы от своего тренера.
Добавьте новый биометрический тренажёр или, в данном случае, данные в реальном времени, и результаты станут менее интересными.
Обрезка изображений лиц настолько плотно, насколько это возможно, чтобы свести к минимуму другие данные, а затем их разбиение заставляет модель полностью сосредоточиться на самых важных деталях. Это также означает, что исследователи могут использовать наборы данных, содержащие в целом меньшее количество субъектов.
Некоторые участки содержат слишком мало информации для обучения, например, лбы, и были удалены из коллекций.
По материалам Biometrics Research Group. Автор Chris Burt