Как будут поддерживать создание и обнаружение DeepFake

В России утверждена дорожная карта по развитию «Новых коммуникационных интернет-технологий», к которой относятся поисково-рекомендательные и игровые сервисы, а также платформы видео-коммуникаций. В том числе документом запланирована разработка продуктов по автоматическому определению сгенерированных ботами новостей, интеллектуальной генерации и адаптации контента (DeepFake) и определения такого рода контента.

Дорожная карта «Новые коммуникационные интернет-технологии»

В распоряжении CNews оказалась дорожная карта «Новые коммуникационные интернет-технологии» (НКИТ), подготовленная «Ростелекомом» в рамках соглашения с правительством. Документ был утвержден Правительственной комиссией по цифровому развитию, использованию ИТ для улучшения жизни людей и условий ведения предпринимательской деятельности. В отличие от других дорожных карт по развитию «прорывных» цифровых технологий, в данном документе не содержится размеров необходимых затрат.

Поисково-рекомендательные технологии

В документе выделяется несколько приоритетных технологий и созданных на их базе продуктов, и сервисов. Во-первых, это продукты на основе поисково-рекомендательных технологий. К данным технологиям относятся:

  • сервисы, предлагающие персонализированный контент для развития личности потребителя на базе рекомендательных технологий, в том числе сервисы для индивидуального прогнозирования карьерного развития и для динамического мониторинга состояний (настроения человека);
  • рекомендательные сервисы, основанные на программном комплексе коллаборативной фильтрации (прогнозы поведения пользователей, исходя из накопленной информации об интересах и вкусах других пользователей);
  • программный комплекс управления процессами извлечения, преобразования и загрузки данных для подключения к рекомендательным сервисам конечных потребителей.

Также на основе поисково-рекомендательных технологий создаются:

  • сервисы интеллектуального поиска по различным видам медиа-контента, в том числе интеллектуального анализа видеопотока на всем потоке данных и систем выявления цепочек распространения инфоповодов и идентификации инфоповодов, распространяемых ботами;
  • нейронная сеть, позволяющая в автоматическом режиме проводить оценку профессиональных качеств и компетенций кандидатов на вакансии на основе открытых резюме, обеспечивающая выбор оптимального соотношения «соискатель-вакансия» с формированием (при необходимости) соискателю рекомендаций для достижения соответствия требования работодателя;
  • сервисы по формированию тематических сообществ (подбор собеседников по интересам, потребностям) в социальных сетях и иных коммуникационных сервисах (наука, образование, профессиональная деятельность, волонтерство, творчество, спорт).

Для создания соответствующих продуктов используются следующие модели и алгоритмы:

  • прогнозирования реакции потребителей на определенные триггеры;
  • оценки степени влияния информации из различных каналов на пользователя;
  • индивидуального прогнозирования карьерного развития на базе прогностических моделей;
  • прогнозирования поведения пользователей с предсказанием различных жизненных ситуаций;
  • динамического мониторинга состояний (настроений) человека на базе рекомендательных технологий;
  • формирования тематических сообществ (подбор собеседников по интересам, потребностям) в социальных сетях и иных коммуникационных сервисах (наука, образование, профессиональная деятельность, волонтерство, творчество, спорт и пр.).

Для развития соответствующего направления необходимы: разработка подходов, концепции и прототипов технологий интеллектуального поиска по медиа-контенту из различных сред данных, базирующемся на отечественном ПО; разработка технологий индексирования и разметки потокового видео/аудио; разработка динамических систем тренд-анализа на всем потоке данных.

Объем мирового рынка рекомендательных технологий увеличится с $1,17 млрд в 2020 г. до $4,17 млрд в 2024 г. За этот же период объем российского рынка увеличится с 6 млрд руб. до 21,7 млрд руб., объем продаж российских компаний на внешнем рынке — с $300 тыс. руб. до $1,5 млн руб., объем продаж российских компаний на внутреннем рынке — с 4,9 млрд руб. до 17,4 млрд руб. Точность выявления отечественными решениями инфоповодов, распространяемых ботами, к 2024 г. составит 70%, к 2030 г. — 90%.

Коммуникационные сервисы

Следующая приоритетная технология — коммуникационные сервисы (социальные сети и мессенджеры). На базе этой технологии создаются следующие продукты: программный комплекс автоматического формирования титров для аудиовизуального контента (включая платформу распознавания речи и перевода в текст); программный комплекс для доставки текстового или аудиовизуального контента конечным потребителям на основе их предыдущего опыта взаимодействия с контентом данной тематики; сервис по выявлению нарушений прав граждан в сети интернет на основе автоматического анализа коммуникационных сред (социальные сети, мессенджеры, многопользовательские игры); сервисы для проведения многопользовательских онлайн-видеоконференций.

Также на базе коммуникационных сервисов создается российская многопользовательская комплексная коммуникационная платформа с высоким уровнем безопасности, основанным на применении сертифицированных средств криптографической защиты информации. Платформа будет обладать простым интерфейсом, универсальной бизнес-моделью для работы с производителями и поставщиками контента и широким функционалом. В том числе платформа будет поддерживаться интегрированные видеосервисы со встроенными технологиями искусственного интеллекта для создания контента, производства и дистрибуции других видов медиа-контента, рекомендательные сервисы, платежные инструменты, голосовой помощник и онлайн-переводчик, сквозной доступ к различным сторонним сервисам с аккаунта платформы, гео-специфические и социальные сервисы.

На базе коммуникационных сервисов создается российская многопользовательская комплексная коммуникационная платформа

Кроме того, на базе технологий коммуникационных сервисов создаются: программный комплекс для сбора, хранения и обработки информации по целевым аудиториям доставки текстового и аудиовизуального контента; коммуникационная платформа с клиентским программным обеспечением и шифрованным каналом взаимодействия между пользовательскими устройствами с применением сертифицированных средств криптографической защиты информации (класс сертифицированных средств криптографической защиты информации выбирается на основе разрабатываемой модели нарушителя); коммуникационный хаб, объединяющий учетные записи пользователей в различных коммуникационных интернет-сервисах и предоставляющий сквозной доступ для общения с одной площадки с использованием разных соцсетей и мессенджеров.

Объем мирового рынка коммуникационных сервисов вырастет с $81 млрд в 2020 г. до $187 млрд в 2024 г., объем российского рынка — со 100 млрд руб. до 247,5 млрд руб. Зарубежная аудитория отечественных комплексных коммуникационных платформ за этот период вырастет с 24 млн до 35 человек, российская аудитория отечественных комплексных коммуникационных платформ увеличится с 74 млн до 108 млн (и до 130 млн в 2030 г.).

Видеосервисы

Следующей технологий являются коммуникационные видеосервисы. На их базе создаются такие продукты как: платформы видеохостинга с расширенным функционалом (универсальные бизнес-модели для работы с производителями и поставщиками контента, встроенные технологии искусственного интеллекта для создания контента и рекомендаций); программный комплекс для распознавания аудиовизуального контента по запросу (с использованием коротких ссылок или посредством встраивания в конечный канал распространения кусков гипертекстовой разметки); сервисы кодирования/декодирования видеосигнала различных форматов с различной степенью сжатия; онлайн-кинотеатры с профессиональным видеоконтентом, интегрированным с рекомендательными системами, а также сервисами генерации и адаптации контента.

Объем мирового рынка коммуникационных видеосервисов с $49,8 млрд в 2020 г. вырастет до $83,7 млрд в 2024 г., объем российского рынка — с 36,4 млрд руб. до 103,3 млрд руб. Объем продаж российских компаний на внешнем рынке за этот период увеличится с $8,4 млн до $27,4 млн, объем продаж российских компаний на внутреннем рынке — с 29,7 млрд руб. до 92,7 млрд руб. Российская аудитория отечественных видеосервисов вырастет с 63 млн до 96 млн (и до 120 млн в 2030 г.).

Для развития коммуникационных сервисов (в том числе видеосервисов) необходимы следующие модели и алгоритмы: автоматического формирования титров для аудиовизуального контента, включая платформу распознавания речи и перевода в текст; кодирования/декодирования видеосигнала различных форматов с различной степенью сжатия; автоматического формирования титров для аудиовизуального контента, включая платформу распознавания речи и перевода в текст; кодирования/декодирования видеосигнала различных форматов с различной степенью сжатия.

Запланировано создание прототипов коммуникационных сервисов и их элементов с применением сертифицированных средств криптографической защиты информации и прототипа коммуникационного хаба, объединяющего учетные записи пользователей в различных коммуникационных интернет-сервисах и предоставляющего сквозной доступ для общения с одной площадки с использованием разных соцсетей и мессенджеров.

CDN и игровые сервисы

В документе рассматриваются и сервисы CDN. Это сервисы распределенного хранения и доставки контента, обладающие географически распределенной сетевой инфраструктурой и позволяющие оптимизировать доставку и дистрибуцию медиа-контента конечным пользователям российских медиа-платформ. Объем мирового рынка CDN-сервисов увеличится с $13,9 млрд в 2020 г. до $22,15 млрд в 2024 г., объем российского рынка — с 2,9 млрд руб. до 11,3 млрд руб.

Также в документе рассматриваются и игровые сервисы. С их помощью создаются следующие продукты: облачная игровая платформа, предоставляющая мгновенный доступ к играм по различным каналам потребления (веб-браузеры, смартфоны, игровые консоли, VR-очки); программный комплекс для разработки игрового программного обеспечения; набор подпрограмм для программного комплекса разработки игрового программного обеспечения, предоставляющих возможность обмена сообщениями как между конечными пользователями, так и централизованно от имени сервиса; программный комплекс для распространения игрового программного обеспечения (компьютерных игр) в интернете; компьютерные игры (видеоигры, мобильные игры).

Для развития данного направления запланирована разработка: прототипов сервисов облачного гейминга и их элементов; прототипа программного комплекса для разработки игрового программного обеспечения; прототипов подпрограмм для программного комплекса разработки игрового программного обеспечения, обеспечивающих возможность обмена сообщениями как между конечными пользователями, так и централизованного от имени сервиса; прототипа программного комплекса для распространения игрового программного обеспечения в сети интернет.

Объем мирового рынка игровых сервисов увеличится с $150 млрд в 2020 г. до $202,2 млрд в 2024 г. Объем российского рынка за этот же период увеличится с 183,3 млрд руб. до 256 млрд руб., российская аудитория отечественных облачных игровых платформ увеличится с 180 тыс. до 2,31 млн (и до 10 млн в 2030 г.).

Объем продаж российских платформ облачного гейминга на внешнем рынке увеличится с $2,9 млн в 2020 г. до $36,9 млн в 2024 г. (и $160 млн в 2030 г.), объем продаж российских компаний на внутреннем рынке сервисов облачного гейминга — с 800 млн руб. до 10,2 млрд руб. (и до 44,3 млрд руб. в 2030 г.), объем продаж российских платформ для распространения игрового программного обеспечения в интернете на зарубежном рынке — с $30 млн до $43 млн, объем продаж российских платформ для распространения игрового программного обеспечения в интернете на внутреннем рынке — с 11,4 млрд руб. до 16,1 млрд руб.

Технологии генерации и адаптации контента (DeepFake)

Отдельно в документе рассматриваются технологии интеллектуальной генерации и адаптации контента DeepFake. На их базе создаются следующие продукты: сервисы динамической адаптации элементов контента в режиме реального времени (выбор внешности актеров и т.д.) на основе пользовательских настроек или адаптации видео под новый текст, генерации персонажа с повторением крупной и мелкой моторики и мимики; сервисы генерации комплексного развлекательного контента на базе вводных от автора (генерация видео-фильма на базе сценария) или генерации и автоматизации генерации комплексного контента на базе персонального профиля потребителя с минимальным участием автора.

Отдельно в документе рассматриваются технологии интеллектуальной генерации и адаптации контента

Для развития соответствующего направления запланирована разработка: прототипов решений по динамической адаптации элементов контента в режиме реального времени (выбор внешности актера и т.д.) на основе пользовательских настроек; прототипов решений по адаптации видео под новый текст; прототипов решений по генерации комплексного развлекательного контента на базе вводных от автора; прототипов решений по генерации и автоматизации генерации комплексного контента на базе персонального профиля потребителя с минимальным участием автора; прототипов решений по распознаванию сгенерированного и выдаваемого за реальный контент.

Объем мирового рынка соответствующих технологии увеличится с $533 млн в 2020 г. до $2,5 млрд в 2024 г., объем российского рынка — с 664 млн руб. до 3,3 млрд руб. Объем продаж российских компаний на внешнем рынке за этот период увеличится с $5,2 млн до $36,8 млн (и до $70 млн в 2030 г.), объем продаж российских компаний на внутреннем рынке — с 509 млн руб. до 2,6 млрд руб. (и до 5 млрд руб. в 2030 г.).

Технологии распознавания сгенерированного контента (DeepFake)

Заключительная группа технологий — это технологии распознавания сгенерированного контента (DeepFake). На их базе создаются следующие продукты: сервисы распознавания сгенерированного и выдаваемого за реальный контент; технологии распознавания сгенерированного и выдаваемого за реальный контент (распознавания DeepFake); технологии машинного и глубокого обучения.

Объем мирового рынка соответствующий технологий увеличится с $8,7 млн в 2020 г. до $90 млн 2024 г., объем российского рынка — с 10,9 млн руб. до 119 млн руб., объем продаж российских компаний на внешнем рынке — со $100 тыс. до $2,9 млн, объем продаж российских компаний на внутреннем рынке — с 8,6 млн руб. до 107 млн руб. Точность определения сгенерированного и выдаваемого за реальный контента отечественными решениями по распознаванию контента к 2024 г. составит 70%, к 2030 г. — 90%.

Поддержка проектов в области «Новых коммуникационных интернет-технологий»

Дорожная карта предполагает несколько направлений поддержки в области «Новых коммуникационных интернет-технологий»: грантовая поддержка проектов малых предприятий по разработке, применению и коммерциализации решений; грантовая поддержка проектов по разработке и внедрению отечественных продуктов, сервисов и платформенных решений; венчурное финансирование компаний с целью вывода на рынок цифровых технологий на экспериментальной стадии; льготное кредитование компаний в рамках поддержки проектов по преобразованию приоритетных отраслей экономики и социальной сферы на основе внедрения отечественных продуктов. Для поддержки проектов в этой области будет организован специальный венчурный фонд.

Кроме того, запланирована акселерация проектов. Предполагается проведение исследований, на основании которых будут определены тренды и прогнозы в сфере ИТ, определено влияние региональных условий на развитие технологических компаний, разработаны механизмы взаимодействия корпораций с технологическими компаниями и характеристики стратегий и траекторий развития, возможных к реализации технологическими компаниями. Не менее 416 компаний должны будут пройти очные и заочные акселерационные программы в целях развития высокотехнологической области «Новые коммуникационные интернет-технологии».

В области образования и подготовки кадров будут разработаны профильные учебные программы, например, специалист в области психологии и обработки больших данных и программист медиа-структур. Также будут разработаны отдельные курсы по кросс-отраслевым специальностям, например, по анализу данных для медиа-коммуникационной отрасли, по разработке для создания компьютерных игр или по использованию новых технологий при создании кинофильмов и другого вида контента.

Также будут дополнены действующие образовательные программы в различных сферах, например, гуманитарные и технические, а также киберспортивные дисциплины для развития «мягких» навыков (soft skills). Будут разработаны механизмы удержания и возврата высококвалифицированных российских специалистов, а в миграционное законодательство будут внесены изменения в части упрощения разрешительных процедур для высококвалифицированных иностранных специалистов.

На базе предложений экспертного сообщества, консолидированного вокруг Центра компетенций, будет сформирована аналитическая справка о необходимых мерах для улучшения условий развития сервисов, решений и продуктов в высокотехнологичной области «Новые коммуникационные интернет-технологии». Также запланирована подготовка аналитических материалов о развитии высокотехнологичной области «Новые коммуникационные интернет-технологии» в России и в мире.

По итогам реализации мероприятий дорожной карты объем затрат на исследования и разработки (прикладные и опытно-конструкторские работы) в рамках реализации дорожной карты развития высокотехнологичной области «Новые коммуникационные интернет» технологии за период до 2024 г. составит 1 млрд руб.

Количество проектов малых предприятий по разработке, применению и коммерциализации продуктов, сервисов или решений на основе «Новых коммуникационных интернет-технологий», поддержанных за счет грантового финансирования, к 2024 г. достигнет 90. В том числе будет поддержано 50 проектов в области поисково-рекомендательных продуктов, 30 проектов в области коммуникационных продуктов, 5 проектов в области гейминга и 5 проектов в области интеллектуальной генерации и адаптации информационно-развлекательного контента, а также распознавания сгенерированного контента.

Разрабатываются алгоритмы обнаружения презентационной атаки и устранения гендерной предвзятости.

По материалам cNews. Автор Игорь Королев

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *