Набор биометрических данных из полумиллиона изображений

Фирма-разработчик программного обеспечения утверждает, что собрала набор данных из 500 000 фотографий, который, по её словам, не только «юридически чист» и подходит для использования в биометрии, но и является самой большой такой коллекцией из когда-либо выпущенных.

Стандартные методы увеличения данных могут увеличить общее количество до 2 миллионов, согласно vAIsual, который до сих пор был сосредоточен на синтетических носителях.

Оригинальные фотографии реальных людей в высоком разрешении поставляются с биометрическими версиями, позволяющими использовать их для обучения искусственного интеллекта.

Подготовленные профессионалы делали фотографии в студии на фоне зеленого экрана. Специалисты по машинному обучению присутствовали на сеансах, помогая создавать изображения, которые лучше всего подходят для машинного обучения. Процессы получения согласия и захвата показаны в видеоролике на YouTube.

Это история о том, как человек кусает собаку, потому что индустрия машинного обучения чувствует себя изрядно выжженной из-за одной путаницы с наборами данных за другой, за которой следует продемонстрированная предвзятость.

Несмотря на набор данных vAIsual, тенденция, вероятно, всё ещё движется к синтетическим предметам. Тем не менее, vAIsual может в конечном итоге продемонстрировать, что обучающие базы данных реальных людей (у которых есть свои преимущества) могут быть собраны без вывода компании из бизнеса.

По материалам Biometrics Research Group. Автор Jim Nash

Добавить комментарий

Ваш адрес email не будет опубликован.