Музыку из Интернета сегодня качает даже ленивый. Например вот хороший музыкальный портал Mp3Grad на нем вы можете скачать mp3 музыку. Повсеместное распространение технологий 'сжатия аудио с потерями' - lossy-coding (MPEG, WMA, OGG Vorbis, VQF и многих других) - привело к тому, что достать музыку, некогда с таким трудом добываемую на аудиокассетах или CD, стало легко и просто. Это можно сделать в Интернете, даже не вставая с кресла. Такое положение вещей открыло новые возможности не только для пользователей, но и для тех, кто любит делать деньги на нечестном бизнесе. В этой статье речь пойдет о том, как нелегальный компьютерный бизнес использует современное ПО и компьютерные технологии в области звука. Мы поговорим об аудио CD, 'нарезанных' из MP3-файлов, о том, как практически отличить оригинальный CD от фальшивого.
Что нужно, чтобы наладить производство аудио компакт-дисков? Завод по изготовлению болванок, машины для тиражирования CD и своя звукозаписывающая студия? Нет, сегодня это уже не так. Болванки можно купить в магазине за углом, писать диски потихоньку на домашнем компьютере на недорогом приводе CD-R, а музыку выкачивать из Интернета, например, в формате MP3 (MPEG-1 Layer III). Все просто и самое главное - дешево. Этим и пользуется нечистоплотный бизнес. 'Бизнесмены' ставят подобное производство (с небольшими модификациями) на поток и продают результаты этого производства в магазинах, выдавая свои компакт-диски за оригинальные. Что в этом плохого, кроме некрасивого отношения к своим покупателям? Дело в том, что звучание подобных компактдисков если не катастрофически, то очень заметно отличается от звучания оригинальных композиций, из которых были сделаны использованные для записи CD MP3-файлы (то же самое относится и к файлам в других форматах). Кодирование с потерями качества.
Это обусловлено самой природой кодирования. Компрессоры (подобные MP3), основанные на идее кодирования с потерями качества, преследуют две цели: закодировать аудио так, чтобы сжатые данные занимали как можно меньший объем памяти и звучали при этом как можно более близко к оригиналу. Способы, которыми достигаются эти две цели, могут быть различными, однако все они в результате приводят к тому, что закодированные данные при воспроизведении уже не являются оригинальным сигналом, а лишь похоже звучат. Такая деградация оригинального качества звука связана с тем, что в процессе кодирования данные сильно 'упрощаются': из них выбрасываются ненужные, слабослышимые или замаскированные детали, а также используются другие методы облегчения данных (подобная техника упрощения известна под понятием 'психоакустическая модель'). Процесс декодирования уже не способен восстановить утраченные во время компрессии данные (нюансы звучания, отфильтрованные частоты). Поэтому, покупая сегодня аудио CD, можно столкнуться с тем, что компакт окажется подделкой и будет являть собой СD, созданный из декодированных MP3-файлов. А это означает, что качество звучания такого диска будет заведомо хуже оригинала. От слов к делу.
Предположим, вы приобрели аудио CD. Не спешите выбрасывать чек - может быть, вам еще придется вернуть этот диск назад в магазин. Давайте разберемся, что вас может насторожить в покупке. Таких моментов несколько. Первый и наиболее очевидный - это вид самого компакт-диска. Фирменный диск всегда качественно упакован, имеет голографическую маркировку, штрих-код и т. д., что явно отличает его от китайской штамповки. Второй момент - это, конечно, звучание CD: если оно сопровождается странными помехами - это уже плохой признак, так как все упомянутые помехи являются типичными артефактами кодирования в MP3. Третий момент, на который тоже следует обращать внимание, - это неравная громкость звучания треков. Это может оказаться признаком того, что диск был записан с использованием не выровненных по уровню громкости MP3-файлов. Давайте попробуем разобраться, каким образом можно отличить оригинальный CD от диска, записанного с использованием MP3-файлов. Таких способов есть несколько. Однако ради справедливости отметим, что ни один из указанных ниже способов не гарантирует, к сожалению, стопроцентной уверенности в напрашивающихся выводах. Это связано с тем, что все способы, которые мы рассмотрим, опираются на известные особенности кодирования в MP3 (или подобного ему, основанного на использовании психоакустики). Поэтому грамотный и хитроумный специалист может при желании замести следы. Но все же шанс обнаружить подделку при внимательном и правильном изучении диска достаточно велик. Кроме того, все рассматриваемые способы требуют некоторого понимания процесса компрессии аудио в MP3.
Способ 1. Пустые начальные фреймы треков.
Предпосылкой к рождению этого способа является одна специфическая особенность кодирования аудио в MP3. Кодирование данных происходит не целиком, а частями: аудиоданные разбиваются на так называемые 'фреймы' длительностью 50 мс, и каждый фрейм анализируется и сжимается кодером отдельно. Тонкости этого процесса описывать не будем. Главным является то, что самый первый фрейм в созданном в результате кодирования файле MP3 оказывается пустым (или, точнее, почти пустым). А значит, при обратном декодировании MP3 в WAV-файл полученный аудиопоток будет содержать полную тишину (сигнал с нулевой амплитудой) протяженностью около 25-40 мс (в зависимости от кодера, использованного для компрессии). Таким образом, аудиотрек на неоригинальном аудио CD (в случае, если его передний край не подрезали специально перед созданием CD) характеризуется наличием короткого участка полной тишины. Чтобы проверить, не имеем ли мы дело как раз с таким треком, нужно загрузить WAV-файл в звуковой редактор (см. блок 'Вещи первой необходимости'), подобрать масштаб по амплитудной и временной шкале, и в случае 'успеха' мы увидим картину, похожую на представленную на рис. 1 (показан только левый канал трека). Масштаб временной шкалы следует подбирать так, чтобы на все видимое рабочее поле отображалось примерно 60- 100 мс от начала файла. Масштаб амплитудной шкалы следует выбирать покрупнее, так как нужно быть уверенным наверняка в том, что интересующий нас участок аудио действительно несет нулевую амплитуду, а не просто очень низкий по уровню ненулевой сигнал. Надо отметить, что полная тишина в начале трека еще не означает, что трек фальшивый. Не исключено, что при подготовке диска к записи оригинальный сигнал действительно был нарочно приглушен по краям. Поэтому, чтобы сделать верные выводы относительно всего CD, нужно внимательно изучить не один и не два трека, а желательно все.
Что еще идет под нож при кодировании.
При сжатии в MP3 пользователь указывает желаемый битрейт (или границы изменения битрейта) для сжатого выходного потока (битрейт - количество бит, используемых для хранения одной секунды аудио). Чем ниже битрейт, тем меньше бит позволяется кодеру отводить для хранения информации об одной секунде аудио и, таким образом, тем хуже качество получаемого сжатого потока аудио. Наиболее распространенное среднее значение битрейта колеблется в пределах от 128 до 192 Кбит/с. Чтобы 'справиться' с компрессией данных при достаточно низких битрейтах (таких как 96, 112 и 128 Кбит/с), некоторые кодеры MP3 перед применением психоакустики отфильтровывают из оригинальных данных все частотные составляющие, расположенные выше определенного предела (для 128 Кбит/с граничная частота обычно составляет 16 КГц). Это означает, что при декомпрессии аудио этих частот также не будет. А это в свою очередь означает, что если исследуемый диск 'нарезан' из низкобитрейтных MP3-файлов, то нехитрый спектральный анализ покажет полное или частичное отсутствие частот выше определенной границы.
Способ 2. Определение границы фильтрации частот.
Рассмотрим другой способ, основанный на специфических нюансах lossy-кодирования в MP3. Как было упомянуто выше, кодирование основано на 'упрощении сигнала', которое сильно способствует повышению коэффициента сжатия (иными словами, упрощенный сигнал сжимается намного сильнее, чем оригинальный). В MPEG-1 Layer III под упрощением сигнала подразумевается применение к сжимаемым данным психоакустической модели. В процессе такой обработки из сигнала отфильтровываются, например, неслышимые и замаскированные частоты, а также резкие кратковременные всплески, нераспознаваемые или малозаметные для человеческого слуха. Подобная фильтрация тем агрессивнее, чем ниже битрейт используется для компрессии. Для того чтобы проверить нашу гипотезу, загрузим один из треков в редактор и посмотрим на этот трек в режиме сонограммы (в редакторе Cool Edit Pro режим просмотра сонограммы включается в меню 'View -> Spectral View'). Пример того, как выглядит сонограмма WAV-файла, декодированного из MP3 128 Кбит/с, можно увидеть на рис. 2 (показан только левый канал). Как видите, частот выше 16 КГц просто нет. Более того, видна совершенно четкая граница фильтрации. Надо отметить, что этот метод проверки CD более точен. Однако и в этом случае нужно учитывать, что, во-первых, не все кодеры и не во всех режимах осуществляют такую жесткую фильтрацию - грамотно сжатый MP3 даже на низком битрейте более или менее правильно отражает спектральную картину оригинального сигнала во всей полосе частот. Поэтому даже если диск не оригинальный, подобной картины можно и не увидеть. Во-вторых, следует обратить внимание на то, что проблема имеет и обратную сторону. В ваших руках может оказаться оригинальный диск, который по результатам подобной проверки вы можете принять за фальшивый. Некоторые диски могут быть записаны со старых носителей (старые магнитные ленты, виниловые пластинки), где частотный диапазон ограничен либо качеством самого носителя, либо записывающей аппаратуры.
Способ 3. Анализ спектра сигнала.
Как мы уже сказали выше, помимо возможной фильтрации верхних частот, при кодировании в MP3 происходит сильное упрощение сигнала. Кодер анализирует аудиоинформацию и, опираясь на указанный пользователем битрейт, решает, какие тонкости звучания можно выбросить. Чем ниже битрейт, тем сильнее будут упрощены оригинальные аудиоданные. Такая обработка сигнала не проходит бесследно: сжатый сигнал начинает звучать менее естественно, а к звучанию добавляются 'артефакты кодирования' ('бульканье', позвякивание, заметные скачки уровня сигнала на различных частотах). Возвращаясь к практической части разговора, надо отметить, что описанные искажения и дефекты кодирования в той или иной степени можно распознать на сонограмме. Если анализируемый аудиоматериал действительно является декодированным из MP3, то такие артефакты будут различимы на сонограмме (в зависимости от битрейта исходного MP3 они будут различимы больше или меньше). Итак, для определения уровня искаженности сигнала берем фрагмент одного из треков с с наиболее насыщенным звучанием протяженностью 1-1,5, причем масштаб временной шкалы следует подобрать так, чтобы выбранный фрагмент занимал все рабочее поле. На рис. 3 в качестве примера приведена сонограмма фрагмента MP3-файла (128 Кбит/с). А теперь для сравнения посмотрите на сонограмму оригинального сигнала (рис. 4). Как видите, сонограмма оригинального сигнала выглядит гладко, однородно, без резких скачков и рваных краев. Первая же сонограмма выглядит, наоборот, очень прерывистой, зернистой, неоднородной. Это и есть результат попыток кодера максимально отработать всю полосу частот, сохранив тонкости звучания. Конечно, когда вы попытаетесь воспользоваться приведенным способом для определения подлинности купленного диска, в вашем распоряжении не будет оригинала. Однако представленная на рис. 3 сонограмма типична для низкобитрейтного MP3-файла и может послужить вам примером того, как выглядит неоригинальный сигнал. Видимая невооруженным глазом неоднородность, крупнозернистость и прерывистость спектра является наглядным примером наиболее характерных артефактов кодирования. Заметим, что наглядность снижается с увеличением битрейта MP3-файла. В качестве еще одного примера посмотрим на сонограмму того же сигнала, однако закодированного с битрейтом 160 Кбит/с (рис. 5). В этом случае неоднородность сигнала хотя и стала менее заметной, однако все равно различима. К сожалению, и этот способ не гарантирует абсолютной достоверности. Он лишь дает наиболее уверенные результаты, но тоже не претендует на объективность по нескольким причинам. Во-первых, не всегда исследуемый сигнал имеет фрагменты с таким наглядным насыщенным спектром. Во-вторых, при подготовке диска к записи профессионал может попытаться скрыть следы MP3-кодирования. Кроме уже описанного обрезания тишины в начале файла, он может попытаться скрыть артефакты кодирования путем пропускания декодированного сигнала через специальные программы, облагораживающие звучание и реконструирующие частотные составляющие. Однако все же этот способ анализа CD может оказаться решающим в определении происхождения купленного диска.
Способ 4. Поиск артефактов звучания путем вычитания каналов.
Последний способ, который может сыграть одну из решающих ролей в установлении истины, прост и красив. Способ основан на следующей идее. Обычно основная аудиоинформация расположена на стереопанораме приблизительно в центре. То есть по субъективным ощущениям слушателя источником звука является некий мнимый источник, находящийся посредине между двумя физическими. Артефакты кодирования же являются, как мы говорили, результатом невозможности точно отработать все тонкости звучания. Таким образом, вычитание сигнала одного канала из сигнала другого канала по сути выбросит все основное звучание, оставив только то, что находилось по бокам. Артефакты кодирования при этом станут намного заметнее, поскольку они окажутся выделенными на общем фоне. Теперь о том, как вычесть каналы. Загрузите один из WAV-файлов (треков) в редактор и произведите вычитание правого канала из левого (в Cool Edit Pro: выделите правый канал, скопируйте его в буфер, теперь выделите левый канал, воспользуйтесь меню 'Edit -> Mix Paste ', включите 'Invert' и 'Overlap', примените). Теперь, исключительно для удобства прослушивания, скопируйте полученный результат из левого канала в правый. В случае, если в вашем распоряжении оказался все-таки фальшивый трек, декодированный из MP3, результатом проделанной процедуры будет сигнал, содержащий все ужасы кодирования в MP3: все шумы, искажения и скрежет, 'захлебывание' ударных, высокочастотный шум. Все это с большой долей вероятности окажется в полученном результирующем сигнале.
Выводы.
Личная практика автора по применению приведенных способов анализа показывает, что ни один из четырех представленных на ваш суд способов не является панацеей. Однако если большая часть результатов применения приведенных выше мето дов склоняет вас думать о подлоге, то, скорее всего, так оно и есть.