Эти Deepfake голоса могут помочь трансгеймерам

ФОТОГРАФИЯ: REKLAMLAR/GETTY IMAGES

Фред, транс человек, щёлкнул мышью, и его нежный тон внезапно стал глубже. Он включил изменение голоса алгоритмы это обеспечило то, что звучало как мгновенная трансплантация голосовых связок. «Это Сет», – сказал он, говоря о личности, которую он тестировал во время разговора в Zoom с репортёром. Затем он перешел на «Джо», чей голос был более гнусавым и приподнятым.

Подруга Фреда Джейн, транс-женщина, также тестировавшая прототип программного обеспечения, усмехнулась и продемонстрировала несколько искусственных голосов, которые ей нравились из-за их женственного звучания. «Это «Кортни»» – яркая и жизнерадостная. «Вот «Майя»» – тон выше, иногда много. «Это «Алисия», та, которая, как я считаю, наиболее вариативна», – заключила она более мягко. Сбои были достаточно незначительными, чтобы вызвать мимолётную мысль, что пара, возможно, с самого начала не присоединилась к звонку своими «настоящими» голосами.

Фред и Джейн – первые тестеры технологий из стартапа Modulate, которые могут добавить новых удовольствий, защиты онлайн-общению. WIRED не использует их настоящие имена для защиты конфиденциальности; трансгендеры часто становятся объектами преследований в Интернете. Программное обеспечение – последний пример хитрого потенциала искусственной интеллект технологии, которая может синтезировать реально кажущееся видео или аудио, иногда называемое deepfakes.

Соучредители Modulate Майк Паппас и Картер Хаффман изначально думали, что технология, которую они называют «скинами голоса», может сделать игры более увлекательными, позволяя игрокам воспринимать голоса персонажей. Когда пара представила студии и набрала первых тестеров, они также услышали интерес к использованию голосовых скинов в качестве защиты конфиденциальности. Более 100 человек спросили, может ли технология облегчить дисфорию, вызванную несоответствием их голоса и гендерной идентичности.

«Мы поняли, что многие люди не чувствуют, что они могут участвовать в онлайн-сообществах, потому что голос подвергает их большему риску», – говорит Паппас, генеральный директор Modulate. В настоящее время компания работает с игровыми компаниями, чтобы предоставить скины для голоса таким образом, чтобы они предлагали как развлечения, так и параметры конфиденциальности, а также обещают не допустить, чтобы они сами становились инструментом мошенничества или преследования.

Игры, такие как Fortnite а социальные приложения, такие как Discord, стали обычным явлением для общения в голосовых чатах с незнакомцами. Как и в первые дни обмена текстовыми сообщениями через Интернет, голосовой бум открыл как новые прелести, так и ужасы.

Антидиффамационная лига выявила в прошлом году что почти половина игроков сталкивались с домогательствами через голосовой чат во время игры, а не через текстовые сообщения. Сексистская полоса в игровой культуре заставляет женщин и ЛГБТК подвергаться особому насилию. Когда Riot Games запустила командный шутер Valorant в 2020 году, исполнительный продюсер Анна Донлон сказала, что была ошеломлена тем, что быстро возникла культура сексистских домогательств. «Я не использую голосовой чат, если иду одна», – сказала она.

Технология Modulate еще не широко доступна, но Паппас говорит, что ведёт переговоры с игровыми компаниями, заинтересованными в её развертывании. Один из возможных подходов – создать режимы в игре или сообществе, где каждому назначается скин голоса, соответствующий его персонажу, будь то грубый тролль или рыцарь в доспехах; в качестве альтернативы, голоса могут быть назначены случайным образом.

В июне два голоса Modulate, запущенные внутри предварительного просмотра приложения под названием Animaze, который превращает пользователя в цифровой аватар во время прямых трансляций или видеозвонков. Разработчик, Holotech Studios, позиционирует голоса как функцию конфиденциальности и способ «изменить свой голос, чтобы он лучше подходил персонажу с другим возрастом, полом или телосложением, нежели ваш собственный». Modulate также предлагает программное обеспечение игровых компаний, которое автоматически уведомляет модераторов о признаках злоупотреблений в голосовых чатах.

Голосовые скины Modulate работают на обучение с помощью машины алгоритмы, которые регулируют звуковые паттерны голоса человека, чтобы он звучал как кто-то другой. Чтобы научить свою технологию озвучивать множество разных тонов и тембров, компания собрала и проанализировала аудиозаписи сотен актеров, читающих сценарии, созданные для обеспечения широкого диапазона интонаций и эмоций. Индивидуальные скины голоса создаются с помощью алгоритмов настройки для имитации звука определённого голосового актера.

Паппас говорит, что этот процесс вызывает задержку всего около 15 миллисекунд, что делает её практически незаметной. Компания также добавляет к своим голосам цифровые водяные знаки, которые не могут быть обнаружены человеческим ухом, но очевидны для звукового программного обеспечения в качестве защиты от мошенничества.

Программное обеспечение, которое может изменить голос человека, не является новой концепцией, но существующие технологии часто навязчивы или раздражают, маскируя голос человека, а не заменяя его. В голосовых чатах это может привлечь нежелательное внимание. Суперзвезда Twitch стример Pokimane рассказала, что пробовала использовать технологию изменения голоса, чтобы избежать преследований, часто направленных на женщин-геймеров. Все прошло не очень хорошо. «Я звучала как робот LOL,– написала она в Твиттере.

Скины голоса Modulate звучали поразительно реалистично в демонстрациях от сотрудников компании и первых тестеров. Большинство сбоев напоминало искажения, характерные для обычных телефонных звонков, такие как случайная роботизированная заметка или сглаженный тон, хотя также казалось вероятным, что человек может научиться обнаруживать эту технологию.

Modulate отказался предоставить версию программного обеспечения для тестирования; Animaze, предварительная версия приложения с дополненной реальностью, работала с ошибками из-за доступного оборудования WIRED. Паппас утверждает, что очаровал инвесторов, присоединившись к звонкам Zoom с помощью голоса, и только позже раскрыл свой естественный голос. Он говорит, что тесты персонала в публичных голосовых чатах также остались незамеченными.

Фред и Джейн присоединились к первым тестировщикам Modulate, потому что они видели в алгоритмах изменения голоса способ получить новый контроль над тем, как их пол воспринимается в Интернете. Пара впервые подружилась через Discord и приобрела привычку ежедневно общаться в голосовом чате, играть в игры и делиться своим опытом смены пола.

Оба добились лишь частичного успеха в использовании вокальных техник, чтобы приблизить звучание к их гендерной идентичности, Фред – к мужскому началу, а Джейн – к женскому. «Мой голос изменился, но не так сильно, как, возможно, я хотел», – говорит Фред, который прошёел гормональное лечение. «Я старался избегать голосовых чатов». Джейн потратила сотни долларов на звуковое оборудование для изменения голоса с неутешительными результатами. «Это добавило образ бурундука, которое немного неприятно слушать», – говорит она.

Друзья сочли технологию Modulate более приятной и убедительной. «Качество было действительно впечатляющим по сравнению с другими вещами, которые я пробовал», – говорит Фред. Также полезно потратить время на то, чтобы выяснить, какие темы оформления голоса подходят для вас. Невербальные звуки, такие как кашель или смех, могут вызвать сбои в голосе ИИ.

Modulate просит тестировщиков не использовать эту технологию в общедоступном Интернете, но Фред и Джейн говорят, что друзья-трансгендеры были впечатлены. Теперь они обычно надевают голосовые шкуры всякий раз, когда разговаривают вместе. «Просто приятно звучать», – говорит она.

«Трансгендерные люди часто первыми используют новые технологии, которые могут настраивать или скрывать личность», – говорит Ти Чуанромани, изучающий взаимодействие человека и компьютера в Университете Нотр-Дам. Виртуальный мир Second Life является одним из примеров.

«Технологии открыли много возможностей для исследования новых аспектов себя и установления связи с другими», – говорит Чуанромани, и скины голоса звучат многообещающе. В то же время любая новая техническая адаптация не изменит основную причину, по которой многие трансгендерные люди опасаются публичных пространств, цифровых или иных. «Обеспокоенность по поводу безопасности и конфиденциальности всегда будет на заднем плане – меня раскроют?»

Говорит Чуанромани

Фред и Джейн говорят, что надеются, что технология Modulate в конечном итоге поможет им более комфортно выходить в публичные онлайн-пространства, такие как потоковая передача. Однако они не откажутся от более традиционных голосовых техник. «Важно иметь возможность работать над этим, потому что я не смогу принести это в супермаркет», – говорит Джейн, – «Как бы я ни хотел».

Эта технология открывает безграничные возможности для телефонных мошенников. Посмотрим, как будут развиваться событи.

По материалам killerrobots. Автор Том Симонит

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *