Моя ХАТА

МР3: прошлое, настоящие, будущее

Этот самый популярный на сегодняшний день цифровой формат аудиосжатия, был разработан несколько лет назад небольшой немецкой фирмой Fraunhofer IIS. Европейская корпорация THOMSON активно поддержала новоявленный формат и приложила все усилия к его быстрейшему распространению. В частности при ее поддержке новичок стал одним из стандартов аудиосжатия семейства MPEG1, MPEG2 и получил название MPEG Layer3 или более привычное нам MP3.

Революция звука

Появление этого формата на свет уместнее всего назвать тихой революцией. Революцией – потому что до MP3 ни один формат звуковых файлов не мог обеспечить такое качество при таком относительно небольшом размере. Единственный на тот момент сетевой формат .RA (real audio) иначе чем издевательством над слухом не назовешь. MPEG Layer3 задумывался именно как «убийца» этого убогого монополиста, великана на глиняных ногах. MP3 – это формат, разработанный специально для сети Internet, для быстрой пересылки качественного звука куда угодно. Именно поэтому MP3 является потоковым форматом, что это значит будет рассмотрено в дальнейшем. Способность этого алгоритма сжатия уменьшать размер звуковых файлов практически без потери качества, выглядела по тем временам совершенно фантастически. Ведь даже при кодировании с максимальной шириной потока (bitrate) равной 320 kbs (килобит в секунду), а это качество звука практически неотличимое от оригинального, размер исходного WAV файла уменьшается в четыре раза!

Да, это была революция, но очень странная революция. Ведь этот уникальный алгоритм в начале своего существования висел буквально на волоске. Полное отсутствие рекламы, никаких проигрывателей музыки данного формата, кроме фирменного от Fraunhofer IIS, который отличался крайней убогостью дизайна, жутким управлением и непомерными системными требованиями. Прибавьте еще и колоссальные аппетиты самих разработчиков, которые хотели за свои кодеки (CODEC – COder/DECoder) довольно немалые суммы (схожая ситуация сейчас с некоторыми форматами семейства AAC) и отсутствие музыки как таковой, в отличие от солидных залежей музыки в формате RA. Эти факторы вполне могли загубить новорожденного сразу же после родов. И все любители хорошей музыки должны сказать огромное спасибо тем известным и безымянным разработчикам freeware MP3 CODEC, которые не дали создателю этого формата фирме Fraunhofer IIS из-за своей маркетинговой глупости и жадности погубить гениальное творение.

Так же следует отметить ту важную роль которую сыграл популярный проигрыватель WinAMP в распространении формата MP3. Этот плеер первым предоставил то удобство, которого так не хватало фирменным проигрывателям. Потом, как я уже говорил, этот формат заметила компания THOMSON, и с этого начался победный марш MP3 по всему миру.

МР3 изнутри: психофизиология звука

Данный формат использует крайне сложный алгоритм кодирования. В отличие от обычных архиваторов, которым нужно ухитрится сжать информацию таким образом, чтобы после извлечения из архива в ней не изменилось ни одного бита, mp3 преследует несколько иные цели. Помимо математических алгоритмов сжатия, в этом формате присутствует так же сложнейший алгоритм удаления ненужной звуковой информации, основанный на психолого-физиологических особенностях организма человека. Попытаюсь остановится на данном моменте несколько подробнее.

Как уже говорилось, MP3 является потоковым форматом. Это означает, что звуковая информация при кодировании разбивается на равные по продолжительности участки, которые называются фреймами. Все фреймы взаимно независимы. Каждый из этих фреймов кодируется отдельно со своими параметрами и имеет заголовок, в котором эти параметры описаны. При воспроизведении последовательность декодированных фреймов и порождает непрерывное звучание записанного звука.
Какие преимущества дает данный подход? Во-первых, возможность перемотки, так как возможен легкий переход к произвольному фрейму, и воспроизведение звука именно с этого места. Во-вторых, именно эта структурная особенность и делает MP3 по настоящему сетевым форматом. Загрузив первые несколько фреймов в оперативную память или дисковый кэш, проигрыватель начинает их воспроизводить, при этом одновременно подгружая новые фреймы, чем достигается непрерывность воспроизведения. И наконец, если вы не смогли целиком скачать MP3 файл из сети Internet, то ничего страшного, музыку все равно можно будет слушать, просто проигрыватель дойдет до того места, на котором оборвалась связь и остановится.

Так вот вернемся к нашим фреймам. При высоком качестве MP3, а это bitrate ~ 320 кbs, для кодирования фреймов применяются только математические алгоритмы сжатия. Качество при этом совершенно не страдает, но и размер уменьшается всего в четыре раза, то есть коэффициент сжатия такой, какой бы дал обычный архиватор; именно поэтому файлы формата МР3 практически не ужимаются обычными архиваторами. При уменьшении полосы пропускания (bitrate) до 256 kbs и ниже, в дело вступают те самые алгоритмы удаления «ненужных» звуков, которые основаны на особенностях восприятия звука человеческим ухом, так называемая «психоакустическая модель». Процессы удаления «ненужных» звуков называются квантованием. Чем меньше bitrate, тем жестче идет квантование.

По каким же критериям оценивается «нужность» и «ненужность» звуков? Подавляющее число кодеков выбрасывает звуки, которые считаются выходящими за порог слышимости человека. При этом за значение порога, так сказать de fakto, принимается величина равная 16kHz. Несмотря на то, что этот порог признан азбучной величиной и вписан во все учебники по физике, этот подход неверен. Люди весьма разнообразны по своим физиологическим особенностям. Кроме того, нужно учитывать, что у молодежи слуховой порог гораздо выше, чем у пожилых людей, и запросто может превышать эту среднестатистическую величину. Так же многое зависит от интенсивности сигнала. Следовательно, удаление частот выше 16kHz абсолютно неприемлемо для высоких битрейтов претендующих на CD качество, но вполне уместно для низких битрейтов, где качество приносится в жертву размеру.