Самые распространенные методы сжатия без потерь Huffman, LZW для сжатия аудиофайлов в большинстве случаев не приемлемы. Использование простых методов сжатия, например, сжатие тишины и ADPCM - Adaptive Differential Pulse Code Modulation приводит к потерям. Сжатие стандарта CCITT G.721 -- от 16 до 32 Kbits/sec невозможно из-за того, что в процессе квантования часть информации теряется. Такие системы сжатия как ACE / MACE (компании Apple ), Linear Predictive Coding ( LPC ) и Code Excited Linear Predictor тоже обладают своими минусами.
Методы сжатия, основанные на психоаккустике более приемлемые за счет следующего алгоритма кодека:
- маскирование
- деление сигнала на частотные подполосы
Использование одного квантового уровня для нескольких входных значений за счет квантования сигналов в подполосах
Самые известные представители - MPEG layers 2, MPEG layer 3 (MP3), AAC (Advanced audio coding).
Для более доступного объяснения восприятия звуков стоит немного рассказать о строении уха.
Внешнее ухо отвечает за локализацию источника звука в пространстве. Повышенная чувствительность в диапазоне 2kHz обуславливается резонированием внешнего ушного канала в этом диапазоне.
Среднее ухо выступает 'усилителем звука' за счет того, что в улитке находится жидкость, а снаружи воздух.
Внутреннее ухо отвечает за частотный анализ, благодаря своему строению.
Попадая в ухо и достигая конечной цели, звук претерпевает изменения.
Для иллюстрации всего вышеизложенного можно привести следующие факты:
- лучше всего воспринимается звук в диапазоне от 2 до 4 KHz,
- самые громкие звуки, способные восприниматься ухом 96 dB
- человеческое ухо способно различить изменения частоты начиная с 0,3% на частоте порядка 1kHz.
- при различии сигналов по амплитуде менее чем на 1 дб - сигналы трудноразличимы.
- ухо способно локализовать звук с точностью до 1 градуса.
- Звуки различной частоты распространяются в воздухе с разной скоростью.
- Человек не в состоянии заметить внезапное исчезновение высоких частот, если оно не превышает порядка 2ms
- с возрастом воспринимаемый частотный диапазон сужается.
Надо отметить, что частота во многом влияет на восприятие звука. При частоте до 1,5 кГц, к каждому нервному окончанию может подключится до 3-х нейронов , благодаря этому частотное разрешение улучшается в 3 раза. В определении местонахождения частот выше 1,5кГц, помагает разница амплитуд для правого и левого уха. Благодаря такой особенности возможно применение режимов Joint Stereo - запоминается либо информация для суммы правого и левого каналов и их разница, со значительно меньшей точностью (Mid/Side coding), либо вообще запоминается лишь амплитуда сигнала (Intensity coding).