Рынок
Сначала обсудим более широкий рынок распознавания речи и голоса.
- В ноябре 2018 года Grand View Research заявила, что «Рынок распознавания речи и голоса» к 2025 году будет стоить 31,82 млрд долларов, а CAGR составит 17,2%.
- 9 января 2019 года Markets and Markets сообщили, что «Рынок распознавания речи и голоса» к 2024 году будет стоить 21,5 млрд долларов, увеличившись в среднем на 19,18%.
- 15 января компания IDTech Ex Research заявила, что рынок интеллектуальных речевых и голосовых технологий достигнет 15,5 млрд долларов к 2029 году.
Этот рынок охватывает все технологии, связанные с голосом и речью, будь то распознавание, синтез, преобразование и т.д. (от автоматизированных голосовых записей и интернета вещей до умных динамиков и говорящих роботов).
Теперь о рынках, которые находятся ближе к нам:
1) Рынок Text-to-Speech
- Markets and Markets, в 2017 году подытожили, что рынок TTS был оценен в 1,3 миллиарда долларов в 2016 году и достигнет 3,03 миллиарда долларов к 2022 году, CAGR составляет 15,21%.
- Другие отчеты этого года также указывают на 15,9 ~ 16% CAGR.
2) Рынок преобразование голоса (Voice-Over) и клонирования
- В 2017 году Voices.Com было установлено, что рынок голосовой связи в 2015 году стоил 4,4 миллиарда долларов.
- BusinessWire пишет, что к 2023 году рынок голосового клонирования должен достичь 1,74 млрд долларов против 456 млн долларов в 2018 году, а CAGR составит 30,7%.
- Только в 2018 году TikTok зафиксировал более 150 миллионов запросов и 34 миллиарда просмотров контента, связанного с изменением и преобразованием голоса.
3) Рынок Speech-to-Speech
Здесь не так много данных, потому что это новая и сложная технология, и, честно говоря, никто еще не обеспечил действительно успешный коммерческий сервис!
Игроки
- LOVO (США
- Lyrebird (Канада / США – YC, приобретена Descript, другой компанией YC)
- Respeecher (Украина / США – Techstars)
- VocalID (США)
- Modulate.ai (США)
- Typecast (Корея)
- …и более!
Некоторые из этих компаний существуют с 2014 года, в то время как другие образовались только в 2019 году. У каждой компании свой собственный технологический стек, целевая аудитория, брендинг и, самое главное, различия в качестве выпускаемой продукции.
Продукт LOVO, который расшифровывается как «Love Your Voice», представляет собой платформу для преобразования, создания и клонирования голоса, которая обеспечивает идеальный голос для любого контента. От отдельных пользователей YouTube и подкастеров до корпораций, стремящихся создавать привлекательные рекламные объявления и интерактивные продукты.
В отличие от простых инструментов TTS, которые просто переводят написанные слова, LOVO может взять стиль речи человека, эмоции и доставку и перенести их на новый голос. Это создает гораздо более убедительный конечный результат, что приводит к более аутентичному, привлекательному и приятному контенту.
По материалам из блога Tom Lee