Сбербанка начал использовать Deepfake рекламу

Обычно для качественного синтеза речи с помощью технологии TTS нужно не меньше 20 часов речи в записи, но у команды было только четыре минуты

Deep Fake Challenge