Детские сказки «заговорили» благодаря синтезу речи

Синтез речи от группы компаний ЦРТ, входящей в экосистему Сбера, теперь используется для озвучивания сказок на сервисе MySkazka. Благодаря инновационной технологии уже «заговорили» 10 сказок — их можно воспроизводить как женским, так и мужским голосом.

Синтез речи — это перевод печатного текста в звучащую речь. В группе ЦРТ он осуществляется на стеке методов глубинного обучения, что обеспечивает высокое качество получаемого голоса.

Мы используем сложные нейросетевые модели для непрерывной генерации речевого аудиосигнала, глубокий синтаксический и лексический анализ текста, моделирование интонаций и дыхания — это позволяет добиться плавности и выразительности искусственной речи. Наш синтез встроен в сложные продукты и AI-решения в банках, телекоме, медицине и других отраслях. Совместная работа с MySkazka особенно значима для нас, поскольку связана с самой юной аудиторией. Мы рады поддержать этот проект и уверены, что он будет развиваться

Дмитрий Дырмовский, Генеральный директор группы компаний ЦРТ

MySkazka — первый в Рунете сервис персональных иллюстрированных и озвученных сказок. Все сказки сервиса написаны профессиональными детскими психологами и писателями, а для их иллюстрирования был проведён отбор среди более чем 100 специалистов. Проект стартовал в августе 2020 года — и сразу же возник вопрос озвучки.

Перед нами стояла трудная задача, поскольку сервис использует персональные переменные, которые пользователь заполняет в реальном времени. Поэтому простой вариант — пригласить профессионального диктора — нам не подошёл. Мы начали искать технологическое решение и выбрали синтез группы ЦРТ: для нас было важно не просто синтезировать речь из текстов сказок, но сделать её максимально похожей на настоящую — с интонацией, придыханием, знаками препинания, ведь наша целевая аудитория — дети. Озвучивание сказок позволит пользоваться сервисом детям, которые ещё не умеют читать или испытывают специфические трудности с чтением, а также тем, кто предпочитает формат аудиокниг. Озвучка работает всего неделю, но мы уже наблюдаем положительную динамику — retention rate сервиса (коэффициент удержания пользователей) вырос на 30%, а конверсия новых пользователей в регистрации увеличилась с 7 до 11%

Иван Глушков, Co-founder MySkazka.com

Добавить комментарий

Ваш адрес email не будет опубликован.