Математическую модель распознавания речи, превосходящую аналоги по отдельным параметрам в несколько раз, создали учёные ТУСУРа. По их словам, разработка может стать основой комплексной системы цифровой идентификации личности, а также позволит легче управлять «умной» техникой с помощью голоса. Об этом сообщил Проектный офис «Приоритет 2030» ТУСУР.
Определение личности по голосу с помощью распознавания речи – активно развивающийся подход к цифровой безопасности, применяемый при управлении техникой и в системах безопасности банковских сервисов дистанционного обслуживания, сообщили специалисты.
Учёные Томского государственного университета систем управления и радиоэлектроники (ТУСУР) разработали новую математическую модель распознавания речи, превосходящую аналоги по точности и позволяющую корректно идентифицировать говорящего.
«Наш математический аппарат отличается от аналогов детальным соответствием устройству внутреннего уха человека при распознавании критических частот речи. Вероятностные механизмы, на которых построены существующие системы распознавания речи, у нас играют только вспомогательную роль»
Рассказал заместитель директора ЦК НТИ «Технологии доверенного взаимодействия» ТУСУР Антон Конев
По словам учёных, погрешность при распознавании основного тона речи у новой системы в четыре раза меньше, чем у лучших мировых аналогов. Это позволяет разработке намного лучше справляться с распознаванием обычной спонтанной речи или даже пения.
Как объяснили создатели, эта возможность поможет, например, общаться с «умными» системами не с помощью формальных команд, а почти так же, как с обычным живым собеседником.
«Наша разработка особенно эффективна при распознавании различных аббревиатур, редко встречающихся слов и фраз. Отдельное направление – выделение ключевых слов из речи, распознавание которых может стать заменой формальных команд при управлении «умной» техникой»
Подчеркнул Конев
Одним из результатов работы, как объяснили учёные ТУСУРа, должна стать система продлённой аутентификации, которая позволит в течение всего сеанса связи удостоверять личность собеседника. Это позволит полностью исключить некоторые типы мошенничества, уверены учёные.
Кроме инструментов повышения цифровой безопасности, связанных с речью, специалисты ТУСУРа также создают нейросетевые инструменты, ориентированные на работу с текстом. По словам учёных, их подход позволит проверять авторство различных текстовых материалов, от сообщений в социальных сетях до исходного кода программного обеспечения.
В дальнейшем научный коллектив намерен разработать комплексное программное решение, которое позволит контролировать присутствие конкретного абонента в чате, веб-конференции или переписке в электронной почте, а также отличать бота от реального человека.
Работа по данному направлению ведётся в рамках государственной программы Минобрнауки «Приоритет-2030».
По материалам РИА Новости