Дикторы просят предотвратить кражу их голоса

Представители отрасли просят о регулировании технологий синтеза речи

Союз дикторов просит Госдуму установить специальное регулирование синтеза человеческого голоса с помощью технологий искусственного интеллекта (ИИ). Дикторы говорят о случаях кражи их голосов и опасаются снижения доходов на фоне распространения технологий. Предлагается, в частности, ввести лицензии на использование определенного голоса. Компании, синтезирующие речь, говорят, что заботятся о легитимности технологии. Но юристы подтверждают, что голос никак не защищен от копирования.

Фото: Юрий Мартьянов, Коммерсантъ

«Ъ» ознакомился с копией письма Союза дикторов России главе комитета Госдумы по информполитике Александру Хинштейну от 26 января. Дикторы предлагают в нём разработать регулирование синтеза голосов с помощью ИИ. В союзе подтвердили подлинность письма, господин Хинштейн заявил «Ъ», что пока его не получал.

Речь идёт о технологиях, которые копируют голос человека на основе звуковой записи и позволяют в дальнейшем использовать его в голосовых помощниках, онлайн-синтезаторах и пр.

В перспективе получить синтезированную речь станет дешевле, чем записать диктора, и многие голосовые артисты лишатся работы, считают авторы письма.

Дикторы в письме рассказывают о фактах «кражи» голоса с помощью ИИ: «Нет ни норм, ни практики, ни понимания, как писать претензию. Заказчики ссылаются на договор, в котором есть пункты про отчуждение прав, право на переработку и право передачи третьим лицам».

Члены союза предлагают закрепить запрет на отчуждение прав исполнителей при использовании голосового синтеза и перейти на лицензионные договоры «с чётко определённым сроком действия», как в сфере защиты прав на товарный знак. Также предлагается закрепить норму о том, что запись синтезированного голоса может использоваться только в конкретном проекте.

«Можно сколько угодно говорить о том, что роботы вытеснят какие-то специальности, заменят людей. Не соглашусь с этим»

Михаил Мишустин, премьер РФ, 2 сентября 2021 года (цитата по ТАСС)

ИИ-инструменты начинают активно внедряться для озвучивания аудиокниг: участники рынка рассчитывают, что это удешевит и ускорит процесс их производства. «Издательствам нужна хорошая озвучка по приемлемой цене, дикторам — сохранение профессии, которой многие отдали годы»,— говорит руководитель аудиопроектов Alpina Digital Николай Боронин. У владельца или разработчика ИИ должен быть договор на использование голоса, однако от прямого пиратства никто не застрахован, признаёт он.

В издательской группе «Эксмо-АСТ» считают, что опасения дикторов «не в полной мере оправданны». Сервис «Яндекса» SpeechKit, с которым сотрудничает группа, заключает договоры с диктором, на основе голоса которого синтезируется речь, говорят в пресс-службе группы. Кроме того, без личного участия специалиста, чей голос отобран по специальным параметрам, невозможно добиться качества автоматического озвучивания, добавляют в группе.

Глава VS Robotics (занимается решениями на базе речевых технологий) Дмитрий Теплицкий рассказал, что в теории синтезировать речь определённого человека можно и без многочасовой записи: «У нас есть опыт создания голосов знаменитых личностей на основе записей спектаклей, отрывков из фильмов, публичных выступлений. Здесь важно, чтобы записи были как можно более чистыми и сопровождались текстовой расшифровкой». Но для создания нового голоса для TTS (text-to-speech, преобразование текста в речь) компания всё же отбирает дикторов и записывает их живой голос продолжительностью от пяти часов. Гендиректор ЦРТ Дмитрий Дырмовский отмечает, что компании-лидеры в области речевых технологий уделяют внимание легитимности его применения «и в целом этике ИИ».

Голос невозможно защитить от «копирования»: если имитирование само по себе совершается без преступного умысла, то за такое использование даже ответственности не предусмотрено, говорит управляющий партнер Enterprise Legal Solutions Юрий Федюкин:

«Понять дикторов можно, но с точки зрения закона реализация их инициативы невозможна просто в силу того, что законом защищается не голос, а фонограмма, созданная с его применением»

Внесение изменений в российское законодательство, которые могли бы сделать это возможным, не имеет смысла, полагает Юрий Федюкин, поскольку обрабатывать фонограммы дикторов тогда просто будут в других странах.

По материалам «Коммерсантъ». Автор Валерия Лебедева и Юрий Литвиненко

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *