Часть партнёров одной из крупнейших консалтинговых и аудиторских компаний Ernst & Young перешла на общение с клиентами через дипфейки «самих себя». Таким образом в фирме решили разнообразить общение с клиентами, которое теперь проходит только в онлайн-формате. На это обратили внимание в Wired.
Дипфейк-версии сотрудников начали применять в презентациях для клиентов и рядовой переписке по электронной почте. Вместо обычного текста или графиков клиенты получают полноценные виртуальные копии, которые рассказывают о презентации или содержимом письма.
В EY начали тестировать технологию британской компании Synthesia, потому что традиционные для компании способы укрепления деловых отношений стали невозможными. Переход на дипфейки также помог с языковым барьером: один из партнёров компании не говорил на японском, но встроенная система перевода позволила его виртуальной копии общаться с клиентом из Японии на его языке.
Мы используем это как отличительный признак. Вместо того, чтобы послать письмо с текстом «мы всё ещё настроены на пятницу», вы можете увидеть меня и услышать мой голос. Это всё равно что показать щенка на камеру.Джаред Ридерсотрудник команды креативной и технической поддержки партнёров EY
Зачем компания перешла на дипфейки
Вместо термина «дипфейк» Ernst & Young назвала своих двойников ARI — личностями дополненной реальности (artificial reality identity), отметил Джаред Ридер — глава по внедрению технологии в компании. По его словам, ARI оказались эффективным способом оживить привычное общение с клиентами. Сгенерированные ролики честно позиционируют как синтетические — компания утверждает, что они не предназначены для обмана.
Первого виртуального двойника сотрудников EY Ридер и команда создали в марте по просьбе одного из клиентов. Когда ARI помог им выиграть сделку, об этом узнали другие партнёры фирмы, и тоже захотели применить у себя копии виртуальных сотрудников. Теперь Ридер работает над аватарами для восьми других команд — все они отказались от комментариев Wired.
Процесс «клонирования» оказался простым и не потребовал от сотрудников специальной подготовки — достаточно было 40 минут находиться перед камерой и зачитывать специальный текст. Видео и аудио передают в Synthesia, алгоритмы которой учатся на данных о мимике и голосе человека, чтобы затем их скопировать. В конце процесса достаточно написать текстом то, что должен сказать человек — система сама всё визуализирует.
В Wired протестировали технологию на себе: Ридер прислал им видеопрезентацию, которую провёл его собственный виртуальный клон. По словам журналистов, копия была похожа на настоящего Ридера, с которым они общались по Zoom, а система «сносно сымитировала его голос». Свою речь виртуальный партнёр EY начал со слов «Привет, я Джаред Ридер. Но на самом деле нет — я его аватар».
Как и у всех клиентов Synthesia, у EY потребовали получать разрешения всех людей, которых они хотят скопировать. В компании утверждают, что доступ к технологии «строго ограничен», чтобы избежать злоупотреблений.
Какие вопросы вызывает применение технологии
В Ernst & Young планируют продолжать эксперименты с технологией, но опрошенные Wired специалисты не разделяют энтузиазма компании. По мнению профессора и психолога Университета Карнеги-Меллон Аниты Вулли (Anita Woolley), подобные ролики хоть и привлекают внимание, но могут выглядеть странно.
Когда у вас есть технология, повторяющая внешность человека, существует тонкая грань между комфортом и жутью. Кроме того, видеозвонки могут усложнить решение проблем, так как изображение может отвлекать от сути разговора.Анита Вулли
Как отметил Ридер, когда он продвигал использование технологии внутри компании, то тоже сталкивался со скепсисом коллег. Некоторые даже утверждали, что виртуальные двойники обесценивают «человеческий» элемент в их работе.
Однако Ридер считает, что технология наоборот позволяет усилить этот аспект. Ведь теперь партнёры могут общаться сразу со множеством клиентов, не снимая десятки видео лично — технология может сделать это за считанные минуты.
Что может быть более человечного, чем сказать «Здравствуйте, с добрым утром» моим голосом, моими манерами и моим лицом?Джаред Ридер
Впервые о технологии дипфейков заговорили в 2017 году. Тогда её начали использовать для наложения лиц знаменитостей на порно с помощью нейросетей: система позволяла копировать мимику и накладывать виртуальную маску.
Технологию также начали применять в кино и соцсетях. 11 августа 2021 года Nvidia заявила, что часть сцен на её апрельской презентации были сгенерированы компьютером, а гендиректора Дженсена Хуанга синтезировали с помощью технологии машинного обучения.
По материалам tjournal. Автор Дамир Камалетдинов