Фирма-разработчик программного обеспечения утверждает, что собрала набор данных из 500 000 фотографий, который, по её словам, не только «юридически чист» и подходит для использования в биометрии, но и является самой большой такой коллекцией из когда-либо выпущенных.
Стандартные методы увеличения данных могут увеличить общее количество до 2 миллионов, согласно vAIsual, который до сих пор был сосредоточен на синтетических носителях.
Оригинальные фотографии реальных людей в высоком разрешении поставляются с биометрическими версиями, позволяющими использовать их для обучения искусственного интеллекта.
Подготовленные профессионалы делали фотографии в студии на фоне зеленого экрана. Специалисты по машинному обучению присутствовали на сеансах, помогая создавать изображения, которые лучше всего подходят для машинного обучения. Процессы получения согласия и захвата показаны в видеоролике на YouTube.
Это история о том, как человек кусает собаку, потому что индустрия машинного обучения чувствует себя изрядно выжженной из-за одной путаницы с наборами данных за другой, за которой следует продемонстрированная предвзятость.
Несмотря на набор данных vAIsual, тенденция, вероятно, всё ещё движется к синтетическим предметам. Тем не менее, vAIsual может в конечном итоге продемонстрировать, что обучающие базы данных реальных людей (у которых есть свои преимущества) могут быть собраны без вывода компании из бизнеса.
По материалам Biometrics Research Group. Автор Jim Nash