Синтетические данные – серьёзный инструмент для обучения

Синтетические данные, создаваемые системами искусственного интеллекта, для систем искусственного интеллекта являются растущим рынком, поскольку общие состязательные сети (GAN) используются для обучения распознаванию лиц и другим биометрическим алгоритмам.

The Washington Post рассказывает о компании под названием Yuty и о пути, который она прошла для предоставления синтетических наборов данных по лицам, и сообщает, что это один из примерно 50 стартапов в этой области.

В сообщении отмечается, что, по прогнозам Gartner, к 2024 году 60 процентов всех обучающих данных ИИ будут синтетическими.

Недавно Amazon сообщила, что она в значительной степени полагается на синтетические данные для обучения своей биометрии palm.

В аналогичном ключе инструмент машинного обучения DALL-E от OpenAI обновил политику, позволяющую своим пользователям делиться синтетическими изображениями лиц, после того, как разработчики инструмента встроили механизмы для предотвращения его использования при создании глубоких подделок, сообщает Vice.

Однако DALL-E на самом деле не предназначен для создания фотореалистичных лиц. Название инструмента – это словосочетание художника-сюрреалиста Сальвадора Дали и мультипликационного героя WALL-E. Вместо этого инструмент в основном используется для создания мемов.

Datatang на выставке на CPVR 2022

Datatang представила свою технологию генерации синтетических данных на Конференции по компьютерному зрению и распознаванию образов 2022 года (CVPR 2022) в качестве серебряного спонсора мероприятия и провела розыгрыш, чтобы помочь улучшить современное состояние в области обнаружения биометрической живости и предотвращения подделки.

Компания передала биометрические обучающие данные на сумму 20 000 долларов в виде 5 наборов данных для 3D-обнаружения живости, 2D-обнаружения подделки и обучения системы повторной идентификации.

«Мы надеемся, что эти обучающие наборы данных помогут исследовательским институтам и технологическим компаниям улучшить свои модели искусственного интеллекта», – объясняет менеджер по международному маркетингу Datatang Фрэнк Ванг.

«Являясь ведущей конференцией в области компьютерного зрения, CVPR ежегодно привлекает большое количество профессионалов из областей искусственного интеллекта, компьютерного зрения и машинного обучения по всему миру», – пишет Ван. «С момента начала эпидемии CVPR 2022 впервые возобновил участие в автономном режиме. Число поданных статей достигло почти 10 000, что на 15% больше по сравнению с прошлым годом, из которых 44,59% авторов – выходцы из материкового Китая».

«Статья исследователей из Alibaba и Университета Тунцзи ”ePRO-PnP: Обобщенная сквозная вероятностная перспектива-n точек для оценки положения монокулярного объекта” получила награду за лучшую студенческую работу».

В этом году на CPVR 2022, который проходил с 21 по 24 июня, было представлено 250 презентаций, а также 66 семинаров и 29 учебных пособий.

По материалам Biometrics Research Group. Автор Chris Burt

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *