Рекламный ролик Сбера с героем комедии «Иван Васильевич меняет профессию» Жоржем Милославским определил тренд на использование технологии deepfake для создания видеоконтента. Мария Чмир, генеральный директор компании Deepcake.io, вернувшей обаятельного киноперсонажа на экраны, провела презентацию на международном форуме IPQuorum 2021: Tech for Content, в рамках которой представила собственные высокотехнологические решения, способные генерировать ещё более убедительные deepfake-модели, чем Жорж Милославский. В интервью Мария Чмир подробно рассказала о том, как с помощью новых технологий создаётся видео без съемочного процесса.
Как вы пришли к deepfake?
Я родом из креативной рекламы, занималась маркетингом, коммуникациями, а последним местом была одна из крупнейших компаний, производящих контент для стокового рынка. Контента производилось так много, что можно было учиться им управлять, правильно его дистрибутировать, сохранять. Так я и познакомилась с технологической частью, связанной с процессами автоматизации производства, хранения и управления контентом. Удалось и многое понять про сам контент: в первую очередь, для чего и кем он создаётся. На стыке этих двух компетенций возникла идея полной автоматизации процесса создания контента. Вот так я сначала занялась дипфейками, а в прошлом году основала свою компанию. Сейчас мы уходим в стопроцентный синтез deepfake без съёмочного процесса.
Сколько времени уходит на создание образа?
Смотря какого. К нам приходит много разных запросов, и мы понимаем, что наша аудитория часто хочет не создать внешность какого-то героя, а воссоздать личность, сущность персонажа, образ его мыслей, манеру речи, эмоциональную экспрессию. Вот со всем этим у ИИ пока ещё не очень хорошо. К тому же исторические персонажи трудно «оживить», потому что мы не знаем ни голоса, ни манеры поведения, ни эмоциональности, скажем, того же Петра I. Мы можем анимировать изображение, которое у нас есть. Процесс «оживления» фотографий идет очень быстро. У нас есть технология, которая на основе одного фото за минуту создаёт минуту видеоконтента. Технология высокореалистичной генерации лиц в уже созданном контенте требует времени — от десяти дней на то, чтобы нейронная сеть поняла, как выглядит конкретный человек, создала и воспроизвела его лицо.
Кто основной потребитель deepfake?
Все, кто заинтересован в создании большого объёма контента, — это наша целевая аудитория. Чаще всего это креативные рекламные агентства, бренды, которые хотят привлечь селебрити, или продюсерские центры, которые не могут из-за закрытых границ привезти какого-то зарубежного артиста или, если актёр состарился, нуждаются в его омоложении. И вторая история – это кинематограф. Возникла, например, такая ситуация: умер один из ведущих актёров сериала, а он полюбился зрителям, и его хотят оставить хотя бы в качестве героя второго плана. Последний кейс мы как раз сейчас реализуем. Надеюсь, в конце этого года фильм выйдет на экраны.
Какой именно?
Пока не скажу.
Заказчики приходят к вам со всеми правовыми документами?
Безусловно, это обязательное условие. Мы работаем только с теми клиентами, которые получили права на использование тех или иных образов. И здесь много разных аспектов, начиная с того, что такие права получаются у конкретного человека, и заканчивая тем, что у персонажа, которого хотят создать, тоже есть правообладатели. Как, например, было с кейсом Леонида Куравлёва в образе Жоржа Милославского. Так что не только актёр дал свое согласие, но и «Мосфильм», который является правообладателем образа Милославского.
Можно ли отличить deepfake от живого человека?
Генеративные технологии устроены так, что каждая следующая «подделка» лучше предыдущей. Технологии детекции всегда будут отставать на полшага. Мы уже живём в обществе симуляций, и, на мой взгляд, deepfake даже честнее, чем другие симуляции, с которыми мы порой сталкиваемся.
Надо ли опасаться, что deepfake вытеснит живых людей — актёров, политиков?
Наоборот, это возможность подсветить аутентичный контент, и скоро мы будем платить не за создание дипфейков, а за то, чтобы потреблять настоящее. У людей появится выбор: смотреть настоящих актёров или deepfake, слушать настоящий сценарий, написанный живым человеком, или потреблять синтезированный контент.
В чём ограничен deepfake?
Ограничений много. Например, по определенным ракурсам. Из-за того, что технологии детекции лица не срабатывают в ракурсах, где лицо не очень видно. Есть и ограничения по свету — в очень темной комнате, где люди пытаются распознать лицо человека, нейронные сети оказываются бессильны.
Как не стать жертвой мошенников, использующих deepfake?
Скрывать свою личность. Но если ваши видеоматериалы доступны широкой общественности, то они могут послужить основой для создания вашего клона. Так что, если вы присутствуете хоть в каком-то виде в цифровом пространстве, вы уже потенциально подвержены «клонированию» deepfake.
По материалам Популярная механика