LALAL.AI — это онлайн‑сервис по разделению дорожек любого аудиоформата на вокал и музыку. С таким AI можно дать волю фантазии: караоке, ремиксы, саундтреки из фильмов — вырезать вокал из них можно в один клик, а процесс занимает несколько минут.
КАК РАБОТАЕТ НЕЙРОСЕТЬ LALAL.AI?
Может показаться, что разделение дорожки — это процесс несложный, но это не так. Чтобы достичь качественного разделения, в ход идут многообразные модели, процессы и базы данных.
Любой трек состоит из нескольких дорожек: вокала, ударных, баса, других инструментов. После сведения их в единую композицию разделить их обратно уже не так просто. Чтобы отделить вокал, нейросеть LALAL.AI анализирует трек и пытается извлечь из него информацию об отдельных инструментах и партиях.
База данных LALAL.AI насчитывает целых 20 Тбайт студийных звукозаписей высокого качества, которые используются для тренировки искусственного интеллекта. Это позволяет сервису справляться с работой, делая минимум ошибок.
Миллионы параметров и передовая цифровая обработка сигналов обеспечивают качественную и быструю работу, а процесс при этом остается простым и удобным для пользователя.
КАК ПОЛЬЗОВАТЬСЯ?
Шаг 1. Выбираем фильтр
Благодаря гибкой системе фильтров можно регулировать интенсивность обработки, что позволяет «найти подход» к каждому треку. В системе есть три фильтра:
- Mild (умеренный) — минимальный уровень обработки, при которой в выходных треках может проявляться оригинальная дорожка.
- Normal (стандартный) — уровень обработки по умолчанию, с умеренной фильтрацией. Большинство ошибок исправляется, но в выходных дорожках могут присутствовать искусственные элементы и высокочастотное размытие.
- Aggressive (интенсивный) — максимальный уровень обработки. Алгоритмы фильтрации наиболее чувствительно реагируют на возможные ошибки. Это может привести к тому, что особенности некоторых треков будут восприниматься как ошибки и удаляться.
Поиграть с фильтрами можно под кнопкой Select file.
Шаг 2. Выбираем сетку
LALAL.AI предоставляет нам две нейросети на выбор: Cassiopeia и ее предшественницу Rocknet.
Согласно тестам, Cassiopeia отстает от Rocknet по формальным метрикам, но инструментальная часть, и особенно вокальная дорожка, звучат гораздо естественнее и мягче, чем у Rocknet.
В любом случае для каждого трека найдется своя сетка — результат зависит от формата дорожки и жанра.
Для смены сетки на предыдущую (Rocknet) нужно сдвинуть ползунок.
Шаг 3. Загружаем трек
Выбираем аудиофайл любого жанра и загружаем его на LALAL.AI. Сервис поддерживает практически все аудиоформаты, включая Opus, FLAC, WebM, WEBA, WAV, Ogg, M4A, OGA, MP3, AIFF, WMA, AU, MP2, Ogg, AAC, AC3, DTS.
Помимо аудиофайлов, LALAL.AI также поддерживает обработку видео: теперь не нужно ломать голову над тем, как не потерять качество при конвертации.
Шаг 4. Получаем готовые дорожки
Теперь остается подождать несколько минут, пока ИИ сделает всю работу за нас. После обработки готовые дорожки можно прослушать онлайн или скачать, а если нет времени ждать, то можно бежать по делам: ссылки на скачивание также отправляются на почту.
По умолчанию обрабатывается только часть файла, чтобы пользователь мог протестировать сервис перед покупкой. Если результат нас устраивает, то можно обработать целый трек, а не его часть.
СТОИМОСТЬ СЕРВИСА
LALAL.AI предлагает три тарифных пакета, в каждый из которых входит определенное количество треков и минут:
- Бесплатный: 3 файла / 10 минут
- Lite: 10 файлов / 90 минут
- Professional: 30 файлов / 500 минут
Удобная система оплаты есть и для пользователей, чей объем данных превышает возможности пакета Professional.
Чтобы обработать целый трек и при этом сэкономить, можно получить бесплатный пакет минут. Нужно только зарегистрироваться на сайте через email. После регистрации минуты с аккаунта можно использовать в любое время с любого девайса для обработки целых треков, а также докупить минуты.
Музыку и вокал искусственный интеллект научился клонировать давно. Теперь он научился и удалять голос из записи.
По материалам Хакер.