Last updated on

Oct 27, 2010

title.png (6502 bytes)

Main page

Upper page

Loudness Maximizers

Максимайзеры

Алексей Лукин

Статья напечатана в журнале "Звукорежиссер" №1,2 2004.

Максимайзер (цифровой пиковый лимитер) - это прибор динамической обработки, повышающий уровень звукового сигнала при мастеринге. Иногда максимайзерами называют другие типы приборов, например, психоакустическую обработку типа BBE Sonic Maximizer, - их мы здесь рассматривать не будем. Мы познакомимся с принципами работы приборов динамической обработки и сравним между собой некоторые популярные модели программных максимайзеров.

Громкость и уровни

Громкость звука зависит не только от уровня звука (или звукового давления), но и от его спектрально-временного состава. Если частотный баланс фонограммы уже определен и менять его нежелательно, то для повышения громкости фонограммы нужно повышать уровень сигнала. Зачем повышать громкость? На это есть две причины. Первая из них заключается в том, что громкая музыка чаще всего кажется "красивее", чем тихая, и больше привлекает внимание. Поэтому большинство продюсеров всеми силами стремятся повысить уровень фонограммы при мастеринге: ведь от этого может зависеть ее коммерческий успех. Вторая причина повышения громкости - желание наиболее полно использовать динамический диапазон носителя аудиозаписи, будь то компакт-диск или аналоговая лента. Также важно максимально использовать динамический диапазон воспроизводящего устройства, чтобы запись не тонула в шумах.

При записи звука носители обычно ограничивают величиной перегрузки пиковый уровень сигнала, а не его среднеквадратичную мощность (это несколько упрощенная, но близкая к реальности модель для большинства аналоговых и цифровых носителей звука). Отношение пикового уровня фонограммы к ее среднеквадратичному уровню (RMS) называется пик-фактором (crest-factor, кросс-фактор). Прямоугольная волна (меандр) имеет единичный пик-фактор 0 дБ. Пик-фактор синусоиды равен 3 дБ. Фонограммы с широкой динамикой или резкими пиками обладают высоким пик-фактором (20 дБ и более), а сильно компрессированные фонограммы - низким пик-фактором (10...15 дБ). Ясно, что при ограниченной пиковой мощности, фонограмма с меньшим пик-фактором может достичь более высокой громкости. С целью уменьшения пик-фактора фонограммы ее пропускают через устройства динамической обработки (рис. 1). Рассмотрим их принципы работы.

fig01.png (2820 bytes)

Рис. 1. Фонограмма до динамической обработки и после. Уменьшение пик-фактора. Клиппинга здесь нет, и звук вполне приемлем для радио.

Устройства динамической обработки

Основными устройствами для работы с уровнями фонограммы являются устройства динамической обработки. Принцип действия этих устройств заключается в анализе уровня входящего в них аудио-сигнала и изменении этого уровня по некоторому закону. Основными параметрами устройств динамической обработки являются передаточная характеристика и время атаки/восстановления.

Передаточная характеристика (не путать с амплитудно-частотной характеристикой) - это зависимость желаемого выходного уровня звука от входного уровня. В соответствии с передаточной характеристикой, устройство динамической обработки определяет тот коэффициент усиления, который нужно применить к входному сигналу в каждый момент времени. Пример передаточной характеристики показан на рис. 2. Такое устройство динамической обработки называется компрессором; оно пропускает без изменения звуки с амплитудой до -20 дБ и уменьшает амплитуду всех звуков выше -20 дБ. Таком образом, компрессор делает громкие звуки тише, сужая динамический диапазон фонограммы.

fig02.png (1619 bytes)

Рис. 2. Передаточная характеристика компрессора. Порог равен -20 дБ, степень компрессии 2:1.

Перелом в передаточной характеристике называется точкой пеергиба (knee). Входной уровень, соответствующий колену, называется порогом (threshold). Угол наклона передаточной характеристики выше порога определяет степень сжатия (ratio, степень компрессии). Степень сжатия 2:1 означает, что при увеличении входного уровня на 2 дБ выше порога выходной уровень вырастет лишь на 1 дБ. Если степень сжатия равна единице, то уровень звука при прохождении через прибор не изменится. Если она стремится к бесконечности, то устройство будет ограничивать амплитуду выходного звука значением порога. Такие устройства называются лимитерами, они ограничивают динамический диапазон. Если же степень сжатия меньше единицы, например 1:1.5, то это значит, что когда входной уровень превышает порог, устройство будет повышать выходной уровень по сравнению с входным. Такие устройства называются экспандерами, они расширяют динамический диапазон. Существуют и другие типы устройств динамической обработки: гейты, дакеры, левелеры и пр., со своими специфическими передаточными характеристиками и параметрами работы.

Иногда передаточная характеристика сглаживается, чтобы в ней не было острых углов (рис. 3). Этот режим называется soft knee или soft threshold (мягкий порог). Компрессор с мягким порогом начинает немного уменьшать уровень сигнала еще до достижения им величины порога.

fig03.png (2532 bytes)

Рис. 3. Мягкий порог.

Работу устройства динамической обработки можно описать следующей схемой. Устройство следит за входным уровнем и в соответствии с ним регулирует выходной уровень, т.е. применяет к входному сигналу некоторую амплитудную огибающую (коэффициент усиления), меняющуюся со временем. Для хорошего звучания результирующего сигнала нужно соблюсти несколько условий. Самое главное из них таково: амплитудная огибающая должна быть гладкой, без разрывов и, по возможности, без изломов. Действительно, если амплитудная огибающая имеет разрывы, то выходной звук тоже будет иметь разрывы в форме волны, слышимые как щелчки и треск. Изломы в амплитудной огибающей также будут приводить к искажениям выходного сигнала.

Для сглаживания амплитудной огибающей в устройствах динамической обработки имеются два параметра: время атаки (attack, время срабатывания) и время восстановления (release). Они определяют скорость реакции устройства на изменения входного уровня. Время атаки показывает, за какое время устройство реагирует на превышение порога (атаку), а время восстановления показывает, за какое время устройство реагирует на возвращение входного уровня обратно под порог.

    fig04a.png (753 bytes)   fig04b.png (893 bytes)

Рис. 4. Звук до и после обработки компрессором.

Пусть на вход компрессора подается сначала слабый сигнал, не превышающий порога, а затем - атака, превышающая порог (рис. 4). В соответствии с передаточной характеристикой, компрессор должен пропустить слабый сигнал без изменения, а уровень громкого сигнала (атаки) - ослабить. Время атаки указывает, за какое время компрессор изменит свой коэффициент усиления от единичного до результирующего, предписанного передаточной характеристикой. Если вслед за громким сигналом входной уровень снова опускается ниже порога, то компрессор переходит в стадию восстановления и снова увеличивает свой коэффициент усиления до единичного. Время, за которое коэффициент усиления вернется к единичному значению, и будет временем восстановления.

Определения времени атаки и восстановления могут различаться у разных производителей. В некоторых устройствах под временем восстановления понимается не полное время возвращения коэффициента усиления, а время его возвращения, скажем, до половины обратного пути. Часто коэффициент усиления возвращается к исходному значению по экспоненте, и в этом случае лишь второе определение имеет смысл. В некоторых устройствах время атаки задается скоростью изменения коэффициента усиления (дБ/сек) или, наоборот, временем изменения коэффициента усиления на 6 дБ.

Время атаки и время восстановления измеряются в миллисекундах и могут меняться в широких пределах для различных приборов динамической обработки и в зависимости от конкретных задач. Так, например, в компрессорах обычное время атаки - порядка 10...100 мс, а типичное время восстановления - порядка 100...1000 мс. Ясно, что чем больше время атаки и восстановления, тем медленнее будет меняться во времени амплитудная огибающая, тем более гладкой она будет. Однако при большом времени атаки компрессор будет пропускать короткие атаки, превышающие порог, т.к. не будет успевать на них реагировать. Это может быть нежелательным, например, для лимитеров.

Еще один параметр, встречающийся в процессорах динамической обработки, - это задержка перед восстановлением (release delay или hold). Этот параметр задает время, через которое начинается стадия восстановления после спада входного уровня ниже порога. Другими словами, этот параметр позволяет отложить восстановление на некоторое время. Это может быть полезно, когда превышения порога в сигнале идут периодически, друг за другом. В этом случае задержка восстановления поможет избежать постоянного переключения компрессора между режимами атаки и восстановления и уменьшить изломанность амплитудной огибающей.

Теперь о том, каким образом приборы динамической обработки определяют уровень входного сигнала. Обычно это делается одним из двух способов и похоже на функционирование индикаторов уровня: пиковых и среднеквадратичных. Первый способ - детектирование мгновенных пиковых значений во входном сигнале. Второй - усреднение мощности во времени, т.е. вычисление RMS. Пиковый способ часто применяется в лимитерах, где бывает необходимо ограничить пиковые значения сигнала каким-то порогом (например, перед выдачей сигнала в радиолинию или записью на CD). RMS-способ чаще применяется в компрессорах для выравнивания громкости аудио, т.к. громкость сильнее связана со среднеквадратичной, нежели с пиковой, мощностью.

Пиковая мощность превышает RMS, и это нужно учитывать при настройке прибора. Также ясно, что вычисление RMS-мощности требует некоторого временного интервала для интегрирования мощности, и поэтому время реакции устройства на изменения входного уровня не может быть намного меньше, чем это время интегрирования. Другими словами, RMS-компрессор может пропустить кратковременные пики сигнала, практически не успев снизить коэффициента передачи.

Еще одна часто встречающаяся возможность процессоров динамической обработки - это side-chain - дополнительный управляющий вход для звукового сигнала. Когда эта функция задействована, прибору на вход подаются два сигнала: через основной и управляющий входы. При этом "управляющий" сигнал используется только для определения по нему входного уровня и управления уровнем основного сигнала в соответствии с передаточной характеристикой.

С помощью side-chain можно достигнуть некоторых интересных эффектов. Если на side-chain подать тот же сигнал, что и на основной вход, то устройство будет вести себя как обычно, без side-chain. Если же на side-chain подать другой сигнал, то устройство будет обрабатывать основной сигнал, руководствуясь амплитудным профилем управляющего сигнала. Например, если на side-chain подать сигнал, пропущенный через эквалайзер с частотной характеристикой, обратной кривым Флетчера-Мэнсона (кривые равной громкости слуха), то амплитуда управляющего сигнала будет более правильно отражать реальную громкость основного сигнала. И устройство динамической обработки будет при обработке основного сигнала руководствоваться реальной громкостью исходного сигнала, а не его амплитудой. С помощью такого приема можно более правдоподобно выравнивать громкость вместо амплитуды.

Подчеркнем, что сигнал, подаваемый на side-chain, никак не влияет на тембр (частотный баланс) основного обрабатываемого сигнала. Он только управляет амплитудной огибающей.

При работе со стерео-записями процессоры динамической обработки обычно действуют в режиме linked channels, т.е. применяют одинаковые амплитудные огибающие к левому и правому каналам. В противном случае нарушается стереопанорама.

 

 

Экспандер отменяет действие компрессора.

В заключение общей части о динамической обработке отметим, что хотя с помощью компрессоров были созданы лучшие записи мировой звукорежиссуры, неосторожное обращение с компрессором способно безвозвратно испортить хорошую запись. Ошибочно считать, что действие компрессора можно отменить экспандером. Если динамика потеряна, то расширять уже нечего. Кроме того, и компрессоры, и экспандеры обладают некоторой инерционностью, что делает невозможным точное восстановление динамики.

Максимайзеры

Итак, наша задача - повысить уровень готового микса до предельно возможных величин, не внося в него существенных искажений. Самый простой способ достичь этого - всем известная нормализация уровня, когда ищется пик максимального уровня в фонограмме и вся фонограмма усиливается на величину этого пика, так чтобы пик принял значение 0 дБ. Дальнейшее увеличение уровня фонограммы приведет к клиппингу (clipping, ограничение амплитуды) - перегрузке, влекущей нежелательные искажения.

Очевидно, что для дальнейшего повышения уровня фонограммы можно применять динамическую обработку. Если пропустить фонограмму через компрессор или лимитер, то пиковые значения фонограммы уменьшатся и можно будет еще поднять общий уровень без возникновения перегрузки.

Что же использовать для повышения громкости: компрессор или лимитер? Известный инженер мастеринга Боб Кац рекомендует использовать компрессор, когда требуется изменение характера звука, заметное на слух уменьшение его динамики. Лимитеры же используют, когда нежелательно вносить какие-либо изменения в звук, за исключением громкости.

Максимайзер - это прибор динамической обработки, который состоит из лимитера и последующего усилителя сигнала. Часто в максимайзеры также встраивается система снижения разрядности, но здесь мы эту часть рассматривать не будем.

Основные управляющие элементы максимайзера - порог срабатывания (threshold) и настройки лимитера (attack, release). В некоторых максимайзерах есть также регулятор "ceiling", позволяющий после лимитирования усилить сигнал не до 0 дБ, а чуть слабее, чтобы оставить немного "свободного места" (headroom) на случай небольшой дальнейшей обработки. Например, если фонограмма будет после максимайзера закодирована в mp3, то при раскодировании форма волны немного изменится, и может произойти клиппинг. Даже если сигнал не предполагается далее обрабатывать или сжимать с потерями качества, то немного свободного места может потребоваться для шума диттеринга, добавляемого при последующем снижении разрядности.

Чем ниже устанавливается порог срабатывания, тем сильнее лимитер ограничивает динамический диапазон и тем сильнее можно будет поднять громкость после лимитера. Таким образом, более низкие значения порога приводят к более громкому звучанию на выходе прибора.

 

 

Если ограничить пики более, чем на 3 дБ, то звук испортится.

Усилитель вопросов не вызывает, поэтому остановимся на устройстве лимитера. Задача максимайзера - максимально повысить уровень сигнала, но не допустить клиппинга, т.е. не позволить мгновенной мощности выйти за пределы уровня 0 дБ. Из этого следует, что в качестве метода определения входного уровня для максимайзеров подходит только пиковый метод. Максимайзер должен отслеживать пики сигнала и строить амплитудную огибающую так, чтобы после ее применения к сигналу пики оказались ниже уровня порога. Когда входной уровень ниже порога, лимитер максимайзера пропускает сигнал без изменений. А когда входной уровень превышает порог, лимитер должен ослабить сигнал так, чтобы превышения порога не было.

Так как мы хотим, чтобы амплитудная огибающая была плавной, без разрывов и изломов, то мы приходим к заключению, что лимитер должен знать, какой амплитудный профиль будет у звуковой волны в ближайшие будущие моменты времени. Действительно, если бы такой возможности у лимитера не было, то при возникновении на входе резкой атаки, превышающей порог, лимитеру пришлось бы мгновенно понизить уровень усиления, чтобы предотвратить превышение порога. Мгновенно понижение уровня усиления - это и есть разрыв или излом в амплитудной огибающей, которого желательно избежать. Итак, для построения плавной амплитудной огибающей лимитеру необходимо знать значения сигнала с некоторым опережением. Так как надежно предсказать сигнал по прошедшим значениям возможности нет, то функция "заглядывания вперед" (look-ahead) реализуется с помощью небольшой задержки выходного сигнала относительно входного. Таким образом, при выдаче выходного сигнала, соответствующего моменту времени t, у лимитера на самом деле уже есть входной сигнал для моментов времени вплоть до t+T, где T - время задержки. Это похоже на канал новостей, который "ретранслирует" другое новостное агентство с задержкой в 10 минут. В каждый момент времени сотрудники канала уже знают, что будет через 10 минут, и могут соответственно модифицировать выдаваемые зрителям новости, достигая лучшего качества материала за счет задержки.

Следует помнить, что задержка, вносимая лимитером, может быть нежелательной в некоторых ситуациях. Например, если в разрыв линейки пульта вставить лимитер, то эта линейка будет задержана по времени относительно других, что может привести к искажению тембра при микшировании линеек. К счастью, максимайзеры обычно применяются к уже готовому миксу в процессе мастеринга, и в этом случае задержка роли не играет. Если же максимайзер, работающий в реальном времени, не вносит задержки в сигнал, то это значит, что он либо допускает превышения порога, либо его амплитудная огибающая изломанная. Третьего не дано.

О задержке следует помнить также, когда требуется синхронизация каналов в программах, обрабатывающих звук в реальном времени. Если же обработка осуществляется не в реальном времени, то программа, выполняющая обработку (host-приложение), чаще всего может скомпенсировать задержку, т.е. "выровнять" выходной сигнал максимайзера по времени. Обычно задержки, вносимые максимайзерами, невелики, до 10 мс, но бывают и исключения.

Руководствуясь будущими значениями пиковых уровней, лимитер может построить плавную амплитудную огибающую, начав ослаблять усиление заранее, до начала атаки во входном сигнале. Другими словами, лимитер должен построить амплитудную огибающую вокруг пиков в виде ямок, где глубина ямок будет определяться величиной превышения порога пиковым уровнем, а ширина - временем атаки и восстановления (рис. 5). Ясно, что чем шире ямки, тем большие участки сигнала будут подавлены, и тем меньше будет окончательная громкость фонограммы. Таким образом, громкость фонограммы зависит не только от установленного значения порога, но и от времени атаки/восстановления, а также от формы амплитудной огибающей во время атаки и восстановления.

fig05.png (2823 bytes)

Рис. 5. Исходный звук (показан порог лимитера) и амплитудные огибающие, построенные различными максимайзерами. Сверху - быстрые восстановления, в середине - медленные, снизу - алгоритм автоконтроля восстановлений.

Управление временем атаки и восстановления

Когда сигнал умножается на амплитудную огибающую, в спектре сигнала могут появляться дополнительные гармоники. Чем меньше время атаки и восстановления максимайзера, тем громче получается результирующий звук, но тем более изломанной получается амплитудная огибающая и тем больше возникает интермодуляционных искажений.

При малом времени атаки и восстановления интермодуляционные искажения становятся особенно заметны, когда в сигнале присутствуют басовые тона большой амплитуды с периодом, большим или равным времени атаки/восстановления. Это можно продемонстрировать на тестовых сигналах, являющихся суммами синусоид с различными частотами (стандартный тест интермодуляционных искажений, рис. 6).

fig06a.png (9618 bytes)

fig06b.png (9104 bytes)

Рис. 6. Интермодуляционные искажения, возникающие при пропускании двух гармоник через максимайзеры. На верхнем рисунке агрессивность максимайзеров выше.

При большом времени атаки и восстановления начинает проявляться эффект "проваливания громкости" (pumping). Провалы громкости возникают вокруг кратковременных пиков в сигнале (рис. 5). Вокруг каждого из таких пиков амплитудная огибающая имеет форму широкой ямы, проваливая по громкости весь сигнал. На слух это воспринимается как выпадение, дрожание громкости.

Таким образом, выбор времени атаки/восстановления - это компромисс между интермодуляционными искажениями и эффектом проваливания громкости. Для дальнейших рассмотрений введем понятие агрессивности максимайзера. Будем говорить, что один максимайзер агрессивнее другого, если при равных значениях порога первый максимайзер дает более громкий (по RMS) звук на выходе. Понятно, что агрессивность зависит от времени атаки/восстановления и от формы амплитудной огибающей во время атак/восстановлений.

У большинства максимайзеров пользователь устанавливает время атаки и восстановления вручную, после установки величины порога. Если слышны интермодуляционные искажения, то агрессивность уменьшается (время атаки/восстановления увеличивается). Если не слышны - то можно попытаться увеличить агрессивность в надежде достичь большей громкости и уменьшения эффекта проваливания громкости. Обычно глубокое лимитирование требует большего времени атаки/восстановления.

Существует способ автоматического адаптивного управления агрессивностью максимайзера на основании анализа входного сигнала. Действительно, если в фонограмме присутствуют резкие пики, то желательно установить более высокую агрессивность, чтобы не возникло эффекта проваливания громкости. Интермодуляционных искажений в данном случае не возникнет, т.к. если пики единичны, то в амплитудной огибающей не будет существенных периодичностей, приводящих к интермодуляционным искажениям. Кроме того, наше ухо обладает свойством пониженной чувствительности к кратковременным, до 6 мс, искажениям. Таким образом, максимайзер будет "быстро реагировать" на единичные пики, сразу возвращаясь к единичному коэффициенту усиления.

Если же на вход поступает периодический сигнал, с постоянными, периодически следующими превышениями порога, то желательно понизить агрессивность максимайзера (т.е. увеличить время атаки/восстановления), чтобы не возникло интермодуляционных искажений.

Если осуществлять такое регулирование адаптивно, постоянно подстраиваясь под входной сигнал, то это позволит заметно повысить среднюю агрессивность максимайзера (т.е. громкость выходного сигнала), без увеличения искажений.

Один из первых максимайзеров, реализующих такую стратегию, - Waves L2 в режиме ARC (Auto Release Control). Следует отметить, что дословное понимание термина "автоматическое управление временем восстановления" не совсем точно описывает принцип работы Waves L2. В этом максимайзере используется чуть более сложный метод построения амплитудной огибающей, основанный на комбинировании двух видов амплитудных огибающих: агрессивной и неагрессивной. При единичных пиках входного сигнала применяется агрессивная огибающая, а при периодических, групповых превышениях порога - определенная комбинация двух огибающих. Таким образом достигается более громкое и качественное звучание, чем при простом управлении временем восстановления. Похожий алгоритм реализован в максимайзере iZotope Ozone 3.

 

Чтобы проверить наличие функции автоконтроля агрессивности, проведем несложный тест. В левом канале тестового файла создадим следующий тестовый сигнал. В первую секунду пусть там будет один кратковременный импульсный пик. Во вторую секунду поместим туда синусоиду с частотой 100 Гц и оставим в конце немного тишины. В правый же канал поместим постоянный ток (DC) на протяжении всего файла. Амплитуду сигналов выберем так, чтобы и импульс, и синусоида превышали порог максимайзера, а постоянный ток - не превышал.
Пропустим наш тестовый сигнал через максимайзер, обратив внимание на то, чтобы он работал в режиме linked channels, т.е. применял одну и ту же амплитудную огибающую к обоим каналам. Тогда на выходе максимайзера в правом канале будет содержаться амплитудная огибающая, которую максимайзер построил по левому каналу (рис. 5). Посмотрев на форму волны амплитудной огибающей можно сделать много полезных выводов о функционировании максимайзера. Если время восстановления после пика существенно меньше времени восстановления после синусоиды, то максимайзер использует автоконтроль времени восстановления.

Перегрузка между отсчетами

Подавляющее большинство максимайзеров - цифровые приборы. Действительно, в аналоге практически невозможно сделать "заглядывание вперед", и поэтому аналоговые пиковые лимитеры обречены либо на мгновенное время атаки (что приводит к изломам амплитудной огибающей), либо на пропуск некоторой перегрузки (клиппирование). Цифровые максимайзеры способны "заглядывать вперед" и заранее реагировать на атаку, за миллисекунды до наступления пика.

 

 

Аналоговые лимитеры лучше цифровых.

Цель большинства цифровых максимайзеров - не допустить превышения порога цифровой волной, то есть ограничить значения всех отсчетов сигнала величиной порога. Однако такое цифровое ограничение не обеспечивает отсутствия превышения порога в аналоговой волне, восстановленной по цифровому сигналу. Действительно, аналоговая волна, плавно осциллируя между дискретными отсчетами, может превышать величину цифровых отсчетов на величину до 3 дБ и выше (рис. 7). Как это может сказаться на звуке? Во-первых, может произойти перегрузка ЦАП. Обычно ЦАП используют передискретизацию - цифровое повышение частоты дискретизации сигнала. В этом случае восстановленные цифровые значения волны между отсчетами исходной цифровой волны могут переполнить разрядную сетку ЦАП (что часто и происходит). Таким образом, клиппирование "аналоговой" волны привело к искажениям звука еще до того, как сигнал стал аналоговым. Но даже если ЦАП правильно восстановил волну выше уровня 0 дБ FS, то остальные компоненты аудиоцепи (например, операционные усилители) могут оказаться не столь устойчивыми к перегрузкам.

fig07.png (1360 bytes)

Рис. 7. Аналоговые и цифровые пиковые уровни могут не совпадать.

Оказывается, возможно осуществить лимитирование в цифровом формате так, чтобы в восстановленной аналоговой волне также не содержалось превышений порога. Для этого достаточно с помощью передискретизации алгоритмически восстановить аналоговую волну и провести детектирование пиков не по цифровым отсчетам, а по аналоговой волне. Дальнейшее лимитирование цифровой волны осуществляется как обычно, но с использованием новой, "аналоговой" информации о пиках сигнала.

Традиционное средство для борьбы с проблемой аналогового клиппирования - это занижение параметра ceiling (коэффициента усиления после лимитирования) на доли децибела. Как видно из наших рассуждений, такая мера совершенно недостаточна. Для реального аудио аналоговое превышение порога часто составляет 1...1.5 дБ, а не доли децибела.

 

Вот простой тест, позволяющий определить работоспособность функции устранения аналогового клиппирования у максимайзера. Сгенерируем в цифровом файле синусоиду с частотой равной четверти частоты дискретизации и начальной фазой 45° (рис. 7). Для такой синусоиды аналоговая волна превышает значения цифровых отсчетов на 3 дБ. Пропустим эту синусоиду через максимайзер. Установим порог как можно ниже. Если максимайзер не позволяет разогнать уровень цифровых отсчетов сколько-нибудь заметно выше, чем -3 дБ, то он правильно определяет пики аналоговой волны. Если же он привычно разогнал цифровые отсчеты до 0 дБ, то детектирование пиков в нем осуществляется по цифровой волне.

Сглаживание амплитудной огибающей

Разрывы и изломы амплитудной огибающей - обычное явление для подавляющего большинства максимайзеров. Они приводят к аналогичным разрывам и изломам в форме волны выходного звука. В терминах спектра это означает, что спектр возникающих интермодуляционных искажений становится широким, охватывающим все частоты. При этом слышимость искажений многократно возрастает. Действительно, при гладкой амплитудной огибающей интермодуляционные искажения обычно группируются вокруг пиков в спектре сигнала, где они с большой вероятностью будут психоакустически замаскированы этими пиками. При наличии же изломов и разрывов амплитудной огибающей спектр искажений расширяется и может выйти за порог маскировки. Искажения становятся слышны как треск. На рис. 6 приведены примеры работы максимайзеров со сглаживанием амплитудной огибающей и без сглаживания.

 

Для иллюстрации этих искажений проведем следующий простой эксперимент. Возьмем любую аудиозапись и отфильтруем в ней все частоты выше 3 кГц. После этого пропустим запись через максимайзер. Установим порог так, чтобы лимитер не бездействовал, и будем слушать результат. Если мы выбрали максимайзер с разрывами или изломами амплитудной огибающей, то в записи будет слышен заметный треск (рис. 8).
Зачем мы отфильтровали все выше 3 кГц? Чтобы треск стал заметнее. Если бы мы не отфильтровывали ВЧ, то треск был бы тот же самый, только он бы несколько маскировался высокими частотами исходного звука.

fig08.png (85082 bytes)

Рис. 8. Спектрограмма треска в записи, появляющегося после обработки максимайзером. Верхний отрывок был обработан максимайзером без сглаживания амплитудной огибающей. Нижний - со сглаживанием амплитудной огибающей (и даже с большей агрессивностью).

Советы по использованию максимайзеров

Максимайзер должен быть последним звеном в цепи мастеринга. После него осуществляется только снижение разрядности аудио (часто оно совмещено с максимизацией). Все остальные обработки и преобразования звука, в том числе преобразование частоты дискретизации, должны выполняться до максимизации уровня, поскольку они могут изменить пиковые значения звуковой волны и привести к клиппированию или неполному использованию динамического диапазона.

При настройке параметров максимайзера следует отталкиваться от уровня громкости фонограммы, который нужно получить. Установите порог максимайзера в соответствии с желаемым увеличением громкости и после этого переходите к настройке агрессивности. Если заметны интермодуляционные искажения (например, хрип на басовых нотах), уменьшите агрессивность (например, увеличивая время восстановления). Если искажения не заметны - попробуйте увеличить агрессивность, чтобы уменьшить эффект проваливания громкости (pumping).

Если порог максимайзера уже очень низко, а громкости все равно недостаточно, - обратитесь к другим приборам динамической обработки. Обработайте звук компрессором. Если даже после компрессора и максимайзера "разгон не тот" - попробуйте многополосный компрессор. Если и этого мало - проверьте, не превратилась ли уже фонограмма в розовый шум.

Лимитеры и максимайзеры легко могут «убить» микродинамику фонограммы. Если компрессия обычно является художественным приемом, то лимитирование - скорее, технологическим решением. А технологию лучше оставить для специалистов по мастерингу, которые чаще всего обладают более качественной аппаратурой и средствами контроля результата.

Сравнение качества максимайзеров

 

 

При равном времени атаки/восстановления все максимайзеры звучат одинаково.

А теперь - обзор популярных максимайзеров, реализованных в виде программных модулей (plug-ins) для PC. Поскольку не существует единственно адекватного критерия сравнения максимайзеров, предлагается несколько возможных тестов, нацеленных на выявление особенностей и конструктивных недостатков максимайзеров.

В нашем обзоре участвуют следующие плагины:

  • Waves L1+, L2

  • Voxengo Elephant HQ 1.3, Voxengo Elephant 2.0 (EL-2 mode), Voxengo Elephant 3.0 (EL UNI mode)

  • Sonalksis MaxLimit

  • TC Native Limiter

  • Digidesign Maxim

  • Flux Pure Limiter

  • iZotope Ozone 2 Maximizer (Brickwall mode)

  • iZotope Ozone 3 Maximizer (Intelligent mode)

  • Sonic Foundry Wave Hammer

  • DSP-FX Optimizer

  • Steinberg PeakMaster

  • DB Audioware Mastering Limiter

  • Kjaerhus Audio Classic Master Limiter

  • Wave Arts FinalPlug 4.6

  • Anwida Soft L1V 1.5

  • 4Front Mastering Bundle XLimiter

  • встроенный лимитер из Nuendo 2

  • встроенный лимитер из Logic 5.5.1

  • встроенный лимитер VST Dynamics из Cubase SX 2

  • встроенный Hard Limiter из Cool Edit Pro (Audition).

Сразу необходимо оговориться, что здесь рассмотрены не все существующие модели. Максимайзеры выбраны по двум параметрам: качество звука и популярность. Намеренно был исключен из тестирования популярный Timeworks Mastering Compressor, т.к. он не является максимайзером со строгим порогом срабатывания и пропускает клиппинг. Также не включен в сравнение Steinberg Loudness Maximizer, так как в большинстве режимов он намеренно вносит в сигнал искажения перегрузки.

Критерии сравнения

Как лучше всего сравнивать максимайзеры? Слушать их в работе! Попробуем предложить некоторые условия экспериментов для более высокой объективности сравнения при прослушивании. Но прежде всего обратимся к некоторым способам сравнения, рекомендованным в других статьях, и поясним их недостатки.

В статье "Максимайзеры" Алексея Зайцева ("Музыкальное Оборудование", июнь 2001) подход такой. Через максимайзеры пропускается тестовый звук из двух синусоид (тест интермодуляционных искажений). После этого по спектрограмме делается анализ гармонических и интермодуляционных искажений (под гармоническими искажениями, по всей видимости, понимается уровень гармоник только тестового тона с более высокой частотой). Все тестируемые максимайзеры приводятся к "равным условиям": времени восстановления и порогам. Как мы уже знаем, равное время восстановления при равных порогах не обеспечивает одинаковой агрессивности максимайзеров. Поэтому выводы о качестве максимайзеров на основании уровней КГИ и КНИ, измеренных в данном тесте, не совсем справедливы.

Другой распространенный вид теста - приведение входной и выходной волн к одинаковой амплитуде и их вычитание. Такой тест популярен, когда хотят показать, как максимайзеры портят звук. Действительно, большая часть полученной волны равна нулю, но в тех местах, где происходило срабатывание максимайзера, прорываются сильные щелчки, треск и обрывки исходной мелодии. Пожалуй, этот тест полезен только для того, чтобы определить моменты срабатывания максимайзера. О реальном звучании максимайзера он судить не позволяет, также как такой "разностный тест" не позволяет судить, например, о системе шумоподавления. Заметность искажений нельзя оценить в отрыве от основного звука.

Еще один популярный тест определяет "наилучшую" частоту дисктеризации, на которой максимайзер дает меньше всего искажений. Берется синусоида с частотой 1 кГц, пропускается через максимайзер на различных частотах дискретизации (44.1 кГц и 96 кГц). По графикам спектров искажений (рис. 9а) делается вывод, что максимайзер на 96 кГц звучит гораздо чище, без искажений. Такие иллюстрации есть, например, в книге Боба Каца "Mastering Audio". На самом же деле меньшее количество искажений при частоте дискретизации 96 кГц - чистое совпадение для данного конкретного тестового сигнала. Все дело в том, что 96000 делится на 1000, а 44100 не делится на 1000. Поэтому амплитудный профиль данной синусоиды с частотой 1 кГц при частоте дискретизации 44.1 кГц имеет сложную форму, вынуждая максимайзер следовать его изгибам и вносить дополнительные гармоники. Если же взять синусоиду с другой частотой, скажем - 1260 Гц, то для нее можно получить прямо противоположные результаты (рис. 9б).

fig09a.png (2960 bytes)

fig09b.png (2473 bytes)

Рис. 9 (а, б). Уровень искажений максимайзера на разных частотах дискретизации некорректно определять по одному тестовому тону.

На самом деле, уровень искажений максимайзеров действительно зависит от частоты дискретизации. Однако зависимость не всегда простая. Дело в том, что далеко не все приборы корректно адаптируют время атаки/восстановления к различным частотам дискретизации, и у них оказывается различная агрессивность. Но если откинуть вопросы агрессивности, то часто оказывается, что на более высоких частотах дискретизации уровень искажений приборов динамической обработки получается меньше (как на тестовых синусоидах, так и на реальных сигналах). Для синусоидальных сигналов это объясняется тем, что при высокой частоте дискретизации амплитудный профиль оцифрованной синусоиды ближе к константе, и максимайзеру не приходится следовать его изгибам и вносить искажения. Для реальных музыкальных сигналов это объясняется тем, что интермодуляционные искажения, возникающие при обработке, распределяются по более широкой полосе частот, и часть искажений оказывается не слышна. (При меньших частотах дискретизации искажения, которые были бы в ультразвуке, отражаются в слышимую часть спектра, т.н. aliasing). В некоторых высококачественных приборах динамической обработки (например, Weiss), применяется технология double sampling, т.е. передискретизация цифрового сигнала перед динамической обработкой. Преимущества такой технологии для максимайзеров небесспорны, хотя она применяется, например, в плагине Voxengo Elephant HQ (и, возможно, приводит там к неточному следованию порогу). Однако для компрессоров сообщается о предполагаемом улучшении качества звука.

Как же увеличить объективность тестирования? Мы предлагаем сравнивать звучание максимайзеров на реальном звуковом материале, выставляя одинаковые значения порога и добиваясь от тестируемых максимайзеров одинаковой агрессивности. Как добиться одинаковой агрессивности? Только измеряя RMS результирующего сигнала! Пусть первый максимайзер дал на выходе сигнал с RMS, скажем, -9.25 дБ, а второй максимайзер при тех же настройках - -9.89 дБ. Хоть разница и невелика, но это усредненная разница в громкости по всему звуковому фрагменту. Если учесть, что максимайзер работает только над малой частью фрагмента (там, где были превышения порогов), то на самом деле громкость реально ограниченных участков могла различаться очень заметно. Поэтому мы делаем вывод, что агрессивность сравниваемых максимайзеров при данных настройках разная и меняем параметры (время восстановления) одного из максимайзеров так, чтобы RMS выходных сигналов сравнялись. Теперь максимайзеры работают с одинаковой эффективностью, и можно проводить сравнение на слух.

Обычно в первую очередь обращают внимание на наличие и заметность интермодуляционных искажений, на дрожание и провалы громкости (pumping), на треск и другие возможные дополнительные призвуки. Таким образом, когда все максимайзеры работают в равных условиях, выдавая сигнал одинаковой громкости, лучший из них выбирают на слух.

Если же желательно привести какие-то объективные численные данные, то можно проводить тесты интермодуляционных искажений и оценивать спектр и величину искажений (разумеется, добившись предварительно равной агрессивности максимайзеров).

На рис. 6 приведено сравнение двух максимайзеров при двух различных значениях агрессивности. В пределах каждого рисунка агрессивность максимайзеров совпадает. По графикам интермодуляционных искажений видно, что пики искажений практически совпадают по величине, но ширина спектра искажений сильно различается. Поэтому заметность искажений будет гораздо выше для максимайзера с более широким спектром искажений.

В статье Алексея Зайцева делается предположение, что широкий спектр интермодуляционных искажений у плагина Timeworks Mastering Compressor символизирует работу специальных сатурационных алгоритмов, имитирующих ламповые искажения. К сожалению, это весьма далеко от действительности. Широкий спектр интермодуляционных искажений, показанных на графике, возникает из-за клиппирования, которое пропускается этим плагином. Несмотря на то, что по приведенному в статье графику это не очень хорошо заметно, в действительности, искажения в этом случае не являются гармониками тестового сигнала. Каждая из таких "гармоник" состоит из нескольких близко расположенных интермодуляционных тонов. Кроме того, спектр ламповых искажений ценится именно тем, что в нем небольшое количество гармоник. В случае же с максимайзерами мы чаще всего имеем спектр с бесконечным медленно затухающим рядом гармоник, не особо напоминающим ламповые искажения даже по спектру, а по звуку больше напоминающим треск (рис. 8).

Сводная таблица

В этой таблице мы приводим данные о наличии у протестированных максимайзеров тех или иных возможностей (или отсутствии тех или иных недостатков). Я постарался учесть как можно больше объективных критериев, важных для качественного звука. Можно ожидать, что максимайзеры со сходными характеристиками будут звучать похоже. И хотя для подробного анализа звучания необходимо внимательное прослушивание конкретных приборов, опытному пользователю данная таблица позволит составить хорошее представление о звучании той или иной модели. В таблице отсутствуют те функциональные возможности, которые очевидны из документации (например, наличие тех или иных органов управления), внимание сосредоточено именно на особенностях реализации алгоритмов. Порядок алгоритмов в таблице не является однозначным рейтингом качества (хотя его можно рассматривать как приблизительный рейтинг).

Критерии сравнения:

  1. No clipping - отсутствие клиппирования.

  2. Full range - полное использование динамического диапазона (возможность максимизации со строгим порогом в 0 дБ).

  3. Look-ahead - возможность заглядывания вперед.

  4. Continuous env. - отсутствие разрывов в амплитудной огибающей.

  5. Smooth env. - сглаживание амплитудной огибающей, узкий спектр искажений.

  6. ARC - возможность автоматического контроля времени восстановления (auto release control).

  7. Adjustable ARC - возможность варьировать агрессивность при включенном режиме ARC.

  8. Analog detection - возможность детектирования пиков аналогового сигнала между цифровыми отсчетами.

ПРИМЕЧАНИЕ: эта таблица - не рейтинг качества, а сводная таблица возможностей алгоритмов (которые я считаю важными для лимитеров). Поскольку я участвовал в разработке алгоритмов для iZotope, в Ozone реализованы все перечисленные возможности. Другие производители могут придавать значение другим, не описанным здесь аспектам алгоритмов.

  No clipping Full range Look ahead Continuous env. Smooth Env. ARC Adjustable ARC Analog detection
Steinberg PeakMaster + - ? - - - - -
Steinberg BuzMaxi 3 - ? + + - - - -
TC Native L + + - - - - - -
Anwida L1V + + + - - - - -
Digidesign Maxim + + + - - - - -
iZotope Ozone 2 + + + - - - - -
DSP-FX Optimizer + +/- + + - - - -
Kjaerhus Classic + +/- + + - - - -
Crysonic SpectraPhy 1.0 + - + + - -/+ - -
4Front XLimiter + + + + - - - -
DB Mastering Limiter + + + + - - - -
GVST GMax + + + + - - - -
Logic Limiter + + + + - - - -
Cubase SX Dynamics + + + + - - - -
Nuendo Limiter + + + + - - - -
CEP Hard Limiting + + + + - - - -
SF Graphic Dynamics + + + + - - - -
Voxengo Elephant HQ +/- -/+ + + - + - -
Kjaerhus GPP-1 + + + +/- - -/+ - -
Massey L2007 + - + + - + + -
TB Barricade 2.1 + + + + + - - -
Wave Arts FinalPlug + + + + + - - -
G. Yohng's W1 Limiter + + + + + - - -
Sonalksis MaxLimit + + + + + - - -
Slate FG-X 1.1.2 + + + + + - - -
Sonnox Oxford Limiter + + + + - +/- -/+ -/+
Waves L1+ + + + + + - - +
Cakewalk Boost 11 + +/- + + +/- +/- - -
Flux Pure Limiter + + + + - + + -
Waves L2 + + + + + + - -
PSP Xenon + + + + - + + -/+
FabFilter Pro-L + + + + -/+ + + -/+
Voxengo Elephant 2.0 + +/- + + + + + -
Voxengo Elephant 3.0 + +/- + + +/- + + -/+
iZotope Ozone 3 + + + + + + + +

Краткие выводы

Наилучшее качество демонстрируют максимайзеры, имеющие технологию автоматического контроля времени восстановления. Максимайзер Waves L2 фактически стал промышленным стандартом для высококачественной обработки. Он сочетает технологию ARC со сглаживанием амплитудной огибающей. Недостатки L2 в том, что из него почему-то была исключена функция детектирования "аналоговых" пиков, хотя эта возможность присутствовала в Waves L1+, и в режиме ARC у него нет возможности регулирования агрессивности. Агрессивность L2 достаточно высока (и звучит он действительно громко), и при заметных уровнях ограничения начинают проявляться интермодуляционные искажения. Избавиться от них можно только отказавшись от режима ARC и вручную установив высокое время восстановления.

fig10.jpg (35334 bytes)

Максимайзер Voxengo Elephant HQ комбинирует режим автоматического управления временем восстановления с возможностью регулировать агрессивность. О максимайзере есть хорошие отзывы - на форуме Voxengo есть мнения, что Elaphant в ряде случаев звучит лучше L2. Учитывая регулируемую агрессивность ARC, это вполне возможно. Но ему не хватает некоторых грамотных технических решений для достижения наилучшего звука. Так, например, обычно Elephant не полностью использует динамический диапазон, а в некоторых случаях наоборот пропускает небольшое клиппирование. Также там нет сглаживания амплитудной огибающей, что приводит к довольно широкому спектру искажений.

В новой версии плагина Elephant 2.0 введен новый режим EL-2 со сглаживанием амплитудной огибающей и настраиваемой агрессивностью в режиме ARC. Недостатком этого режима является то, что иногда в нем лимитер не полностью использует динамический даиапазон (лимитирует ниже уровня 0 дБ FS).

fig11.jpg (35076 bytes)

Максимайзер Intelligent Maximizer из iZotope Ozone 3 вышел совсем недавно. Он сочетает в себе режим ARC с регулируемой агрессивностью, сглаживание амплитудной огибающей и возможность детектирования "аналоговых" пиков. Этот максимайзер обладает наилучшим звучанием, и его можно рассматривать как расширение Waves L2 в сторону настраиваемой агрессивности и детектирования аналоговых пиков.

fig12.jpg (59181 bytes)

Заключение

Максимайзер - обязательный прибор любой студии мастеринга, оказывающий заметное влияние на окончательный звук фонограммы. Мы рассмотрели принципы действия максимайзеров и основные параметры, определяющие качество их работы. Простые тесты, приведенные в статье, позволят легко проверить качество других, не рассмотренных здесь максимайзеров.

Дополнительная литература

  1. Статья "Максимайзеры" Алексея Зайцева ("Музыкальное оборудование", июнь 2001.

  2. Статья "Устройства динамической обработки сигналов" Михаила Чернецкого ("Звукорежиссер", 3/1999).

 

Автор выражает благодарность

Анатолию Вейценфельду,

Андрею Старцеву,

Андрею Субботину,

Владимиру Кузьмину

и Илье Прохорову

за интересные дискуссии и ценные замечания по статье.

 

Your comments and questions: lukin@ixbt.com