Больше реальных денег за синтетические биометрические данные

Добавьте 50 миллионов долларов к венчурному финансированию, привлечённому компанией Datagen, которая специализируется на моделировании людей для использования в обучении алгоритмов ИИ.

По данным TechCrunch, вливание серии B приносит 72 миллиона долларов (включая начальный раунд), которые привлекла израильская фирма.

Datagen является одной из десятков компаний по всему миру, разрабатывающих синтетические данные, которые были объявлены чем-то вроде эликсира для исследователей искусственного интеллекта и биометрии, разработчиков, поставщиков и покупателей, пытающихся выкопать мины предвзятости и конфиденциальности из алгоритмов, обученных на реальных данных.

Scale Ventures Partners, новый инвестор компании, возглавил раунд и теперь имеет место в совете директоров. В нем приняли участие директор Nvidia по искусственному интеллекту Гэл Чечик (Gal Chechik), а также компьютерщики Тревор Даррелл (Trevor Darrell) и Майкл Блэк (Michael Black).

Также добавились практика роста Viola Ventures, Spider Capital и TLV Partners. Год назад Datagen привлекла $18,5 млн в рамках раунда А.

Согласно отчету Ctech, четырехлетняя компания (считающаяся частью сектора компьютерного зрения) зафиксировала доход менее 10 миллионов долларов. Его специализация — фотореалистичные визуальные симуляции и воссоздания, в том числе объектов. Особое внимание уделяется человеческому движению.

Как правило, разработчик искусственного интеллекта обучает алгоритм и работает с ним, чтобы получить желаемые результаты. Руководители Datagen заявили, что это не лучшая практика, особенно когда могут быть созданы новые синтетические данные.

Если обучающие данные состоят из биометрических и других идентификаторов реальных лиц в популяции, разработчиков ограничивает биометрический и демографический состав реальных данных.

Но если обучающие данные полностью созданы или основаны только на отдельных людях из желаемой человеческой популяции, компоненты этого набора данных могут быть перенастроены с помощью клавиатуры. Есть надежда, что это уменьшит, по крайней мере, непреднамеренную предвзятость.

Кроме того, все, кто использует синтетические данные, наслаждаются жизнью, не опасаясь появления неоптимально анонимных головных болей в будущем.

Конечно, не все видят одну и ту же радужную картину. В статье о синтетических данных и Datagen в прошлом году в MIT Technology Review цитировались инсайдеры индустрии ИИ, говорящие, что опасности существуют.

На самом деле, в статье упоминалась возможность того, что необработанные данные Datagen «содержат пропорционально меньшее количество этнических меньшинств».

И, обращаясь к молодой отрасли в целом, идея о том, что идеально сбалансированные наборы данных обязательно создают безупречно честные алгоритмы, была подвергнута резкой критике.

Явно есть люди, которых не пугают ледяные ванны.

Инвестиционное издательство Nanalyze написало, что Datagen сейчас сосредоточена на розничной торговле, робототехнике, автоматизации автомобилей, Интернете вещей и виртуальной реальности. И он опубликовал график, в котором перечислены многие стартапы, торгующиеся в этих водах.

По материалам Biometrics Research Group. Автор Jim Nash

Добавить комментарий

Ваш адрес email не будет опубликован.