Wombo.ai превращает фотографию в поющее дипфейк лицо

Wombo.Ai разработало приложение, которое позволяет превратить любую фотографию в поющее лицо. Wombo.Ai – это маленькая компания, в штате которой всего семь человек. Генеральный директор Бен-Цион Бенхин изменил свой приоритет с разработки веб-сайтов на создание лиц с помощью искусственного интеллекта. За две недели после запуска приложения, его скачали более двух миллионов раз.

В социальных сетях стали распространяться созданные при помощи Wombo.Ai дипфейк видео таких фигур, как Ким Чен Ын или Мона Лиза. Для создания видео с эмоциональным исполнением песен, используются несколько аудио записей, полтора десятка видео шаблонов и алгоритм искусственного интеллекта. Приложение стало настолько популярным, что пользователи загрузили его более чем 2,2 миллиона раз, и с его помощью создали более 15 миллионов видеороликов.

«Можно встать перед камерой, спеть песню и устроить забавное, интересное или развлекательное выступление, но с ИИ это сможет каждый. Вся моя цель с Wombo – облегчить любому пользователю создание веселого и интересного контента о себе».

Сказал Бен-Цион Бенхин – генеральный директор Wombo.ai в интервью Insider

Бенхин провел предыдущие пять лет в агентстве по дизайну веб-сайтов в Торонто, прежде чем решиться на разработку собственного приложения. Впервые ему пришла в голову идея Wombo в августе прошлого года, опираясь на свою близость и любовь к технологиям искусственного интеллекта. Бета-версию приложения была развёрнута в январе.

Как работает Wombo.ai?

За каждой песней стоит драйвовое видео, которое разработчики снимают в своей студии с помощью захвата движения. Исполнитель выполняет серию движений лица, глаз и губ вместе с песней. Это движение применяется к модели, которая затем сопоставляется с изображениями, которые отправляют пользователи. Используя некоторую «сложную математику», приложение обрабатывает загруженные фотографии и генерирует видео.

Приложение позволяет пользователю использовать любое изображение, при этом в большинстве популярных репостов используются персонажи и песни, защищенные авторским правом. Пока правообладатели не вызывали проблем для разработчиков, но Бенхин сказал: «Кто, черт возьми, знает, что произойдет?»

В приложении можно использовать 15 различных треков, от песни Рика Эстли «Never Gonna Give You Up» до классической интернет-музыки, такой как «Numa Numa». По словам Бенхина, они все ещё работают над «вопросом прав», но у них есть «договоренности с несколькими артистами». Забегая вперед, Бенхин надеется, что музыканты захотят донести свою музыку «потому что это даст им совершенно новый способ взаимодействия со своей аудиторией – вирусным и забавным способом».

Wombo.ai безопасно?

Согласно политике конфиденциальности, ваши «данные о чертах лица» сохраняются только в приложении для создания видео, а затем «сразу же удаляются». Данные передаются в Amazon Web Services для «возможностей фотоанимации» и для «платформы поведенческой аналитики» Amplitude.

Пользователи могут платить за премиум-версию приложения за $4,49 в месяц или $29,99 в год, что дает им более быстрое преобразование фотографии в видео и отсутствие рекламы. Приложение можно использовать бесплатно, но в этом случае будет демонстрироваться реклама. В будущем Wombo надеется сотрудничать с музыкантами или рекламодателями.

Wombo использует искусственный интеллект для создания близкого к реальности дипфейка, которая значительно улучшилась за эти годы и стала доступной для обычных людей, хотя и в ограниченном объёме. MyHeritage, выпустила свой инструмент Deep Nostalgia, который позволяет пользователям анимировать изображения умерших родственников. Другим примером использования deepfake алгоритма стал вирусный ролик с поддельным Том Круз.

«Эти дипфейки в ближайшее время никуда не денутся. Со временем общественность станет к этому подходить … Я думаю, что мы только начинаем исследовать возможности применения этой технологии».

Отмечает Бенхин

Дипфейк потенциально может причинить вред, поскольку неосведомленные наблюдатели могут спутать фрагменты достаточно реалистичных подделок с настоящими. По словам Бенхина, Wombo избегает этой проблемы двумя способами: приложение создает изображение, которое «выглядит реалистично, но не выглядит реальным», а ограниченный выбор песен делает так, что «худшее, что вы можете сделать, – это заставить кого-то петь».

На сгенерированных видео заметны артефакты, что не даёт их спутать с реальными записями.

Будущее Wombo зависит от того, сможет ли приложение использовать вирусный импульс, чтобы превратиться из уловки или причуды в то, что пользователи Интернета постоянно будут использовать. Есть социальные планы для приложения, которые позволят пользователям создавать собственные профили и делиться своими лицами с друзьями.

«Это будет место, где можно будет насладиться и открыть для себя новую музыку. И вообще, это будет приложение, в которое ты пойдешь, когда захочешь смеяться и улыбаться»

Считает Бенхин
По материалам Insider. Автор Steven Asarch

Добавить комментарий

Ваш адрес email не будет опубликован.