Китайская Tencent Cloud объявила о запуске цифровой платформы для создания людей — Deepfakes-as-a-Service (DFaaS). Она обещает создавать цифровые копии людей высокой чёткости, используя всего три минуты живого видео и 100 произнесённых фраз.
Такая услуга стоит $145. Для создания дипфейка потребуется 24 часа.
При этом заказчик сможет кастомизировать задний фон персонажа, а также выбрать предпочтительный тон кожи и другие аспекты.
Сгенерированные дипфейки обладают плоской интонацией и единым речевым ритмом, характерным для традиционных акустических моделей, за счёт использования собственной технологии настройки тембра с малыми выборками. Она основана на акустических моделях глубокого обучения и вокодерах (устройствах синтеза речи на основе произвольного сигнала) нейронных сетей.
Tencent Cloud надеется построить автоматизированную фабрику людей «AI + Intelligent Factory» и полагаться на универсальную платформу для производства, продаж и обслуживания. Фабрика по созданию цифрового человека опирается на платформу Tencent Cloud TI — платформу машинного обучения, которая предлагает более десятка алгоритмов ИИ.
Tencent предлагает пять стилей для своих цифровых людей: 3D-реалистичный, 3D-полуреалистичный, 3D-мультфильм, 2D-реальный человек и 2D-мультфильм. Также для цифрового человека можно создавать индивидуальные вопросы и ответы, которые превратят его в подобие дипфейка для чат-бота.
Сама Tencent заинтересована в использовании такой технологии для размещения рекламных роликов в прямом эфире. Местные СМИ также сообщили, что она сможет создавать цифровых врачей, юристов и других специалистов.
По материалам Хабр