Сегодня трудно найти человека, незнакомого с трехбуквенной аббревиатурой – MP3. Вот только, когда начинаешь спрашивать, что же это такое и как расшифровывается, то некоторые люди недоуменно разводят руками, а другие говорят так: ”Ты что? Это же музыка этот MP3!”. Кроме того, MP3 поддерживают многие мобильники. Об этом то мы знаем, а дальше, а больше? :)Понятно, что мало кому понятно, что это за формат. В этой статье я как раз и объясню, что же все — таки это такое, этот MP3.
MP3 – это наиболее популярный формат хранения и передачи информации в цифровой форме, использующий компрессию сигнала. Формат MP3, или MPEG Audio Layer-3, был разработан компаниями Fraunhofer IIS и Thomson. По сравнению с WAV-файлами, являющимися копиями треков Audio CD (PCM, 16 bit, Stereo, 44,1 kHz), MP3-композиции занимают намного меньше места на диске. На обыкновенном CD-R/RW-бланке можно сохранить свыше 11 часов музыки вполне пристойного качества.
Для MP3 написано множество отличных программ (кодировщиков, проигрывателей и т. д.), налажено производство аппаратных (стационарных, карманных и автомобильных) плееров, каждый современный телефон поддерживает MP3-мелодии (и даже имеет встроенный плеер для их удобного воспроизведения). По сравнению со многими другими форматами сжатия аудио MP3 обеспечивает лучшее качество звучания и сегодня по своей популярности занимает, пожалуй, второе место после Audio CD.
Описание формата MP3
Формат сжатия аудиоданных MP3 (сокращение от MPEG Layer3) — один из первых популярных способов сжатия звука. Разработан немецкой компанией Fraunhofer IIS и позднее, при поддержке фирмы THOMSON, внедрён как часть видеоформатов MPEG1 и MPEG2. Обеспечивает высокое качество звука при сравнительно небольших размерах файла.
Технические сведения о формате MP3
Высокая степень сжатия в MP3 достигается за счёт достаточно сложного алгоритма кодирования. Используются как математические методы компрессии, так и особенности человеческого слуха (психоакустическая модель): эффект маскировки слабого звука одной частоты более громким звуком такой же или соседней частоты, понижение чувствительности уха к тихому звуку сразу после громкого, невосприимчивость к звукам ниже определённого уровня громкости.
Поток звука при кодировании разбивается на равные по участки (фреймы). Каждый из фреймов кодируется отдельно со своими параметрами и содержит заголовок, в котором эти параметры указаны. Сжатие может быть выполнено с разным качеством и соответственно размером конечного файла.
Степень сжатия характеризуется битрейтом (bitrate) — количество передаваемой за единицу времени информации. Файлы MP3 обычно закодированы с битрейтом от 64 до 320 килобит в секунду (kbps или kb/s), а также с переменным битрейтом (VBR) — когда для каждого фрейма используется свой, оптимальный для данного участка, битрейт.
Исходный сигнал с помощью фильтров разделяется на несколько частотных диапазонов, для каждого диапазона определяется величина маскирующего эффекта от соседних диапазонов и предыдущего фрейма, несущественные сигналы игнорируется. Для оставшихся данных для каждого диапазона определяется, сколькими битами можно пожертвовать, чтобы потери были ниже величины маскирующего эффекта. На этом работа психоакустической модели завершается, а итоговый поток дополнительно сжимается по алгоритму Хаффмана (аналогично RAR архиватору).
При битрейте 320 kbps применяется только итоговое сжатие, без психоакустического моделирования. Следует иметь в виду, что различные кодеки могут кодировать аудиосигнал по-разному, различия особенно проявляются на высоких частотах и низких битрейтах. В формате MP3 кодируется стереосигнал, при этом возможны несколько вариантов преобразования:
- Dual Channel — каждый канал получает половину потока и кодируется отдельно — возможна запись двух абсолютно разных сигналов.
- Stereo — каждый канал кодируется отдельно, но программа-кодер может использовать свободное место одного канала для размещения информации другого. Режим stereo выставлен по умолчанию в большинстве кодеров.
- Joint Stereo (MS Stereo) — стереосигнал раскладывается на общий для обоих каналов и разностный. Имеет вариант — MS/IS Stereo с упрощённым разностным сигналом.
Сильные стороны формата MP3:
- Высокая степень сжатия при приемлемом качестве звука.
- Степень сжатия и качество может регулироваться пользователем.
- Фреймовая структура удобна для передаче по сети, позволяет переход к любому месту файла.
- Широкое распространение аппаратуры и программ.
Особенности применения MP3
Несмотря на то, что кодирование в MP3 осуществляется с утерей части исходной информации, при битрейтах 256 и 320 kbps практически невозможно отличить на слух сжатый сигнал от оригинала, особенно при прослушивании на распространённой аудио аппаратуре. При этом размер файла в самом худшем случае будет в 4 раза меньше, чем в формате CD audio.
Для использования в компактных плеерах и других устройствах с невысоким качеством акустики можно вполне использовать битрейт не ниже 192 kbps. Битрейты ниже 192 kbps рекомендуется использовать для сжатия сигнала с ограниченным частотным диапазоном или невысокими требованиями к достоверности (например, разговор или телепередача).
На чем же основана идея компрессии звука в MP3?
Наверняка, обращаясь к приятелю, отгороженному от внешнего мира «музофоном», вы замечали, как он начинает неестественно громко отвечать на ваши вопросы, поскольку собственный голос, слышимый им под рев рок-концерта, звучит для него непривычно тихо — особенность человеческого восприятия. И дело тут не столько в остроте слуха, сколько в способности нашего мозга «переваривать» звуковую информацию: не реагировать на импульсы, мощность которых ниже определенного уровня; после сильного грохота не слышать шепота и т. д.
Этим и пользуются при создании MP3-кодеров, в каждом из которых может быть реализована своя собственная, варьируемая в зависимости от целей и задач, так называемая психоакустическая модель, где можно пренебречь сравнительно слабыми сигналами.
Как же работают такие методы?
Исходный звуковой сигнал разбивается на отдельные блоки, именуемые фреймами, к каждому из которых применяется специальный алгоритм кодирования, причем параметры сжатия для разных фреймов могут значительно отличаться друг от друга. В процессе кодирования блока исходный сигнал разделяется на несколько составляющих частотных диапазонов. Для каждого из них просчитывается величина так называемого эффекта маскирования слабого сигнала более мощным от соседнего диапазона или от предыдущего фрейма. Затем в зависимости от результатов происходит удаление второстепенных звуков, которые не будут слышимы «среднестатистическим» человеком из-за наличия в данный момент более громкого сигнала. Кроме того, учитывается неспособность большинства людей различать высокочастотные сигналы (выше 16 kHz).
Аудиоинфоpмация, сжатая по данной схеме, может передаваться потоком, например через интернет, а может храниться в файлах формата MP3.
Битрейт и его значение
Одной из важнейших характеристик MP3-файла является битрейт — скорость потока обрабатываемых данных, или общее количество информации, передаваемой в единицу времени. Эта величина не зависит от того, содержит этот поток моно- или стереозвук.
Битрейт 128 Kbps с легкой руки Fraunhofer IIS был признан оптимальным для использования в интернете, а некоторые производители кодеров распространили мнение о том, что этой скорости вполне достаточно для кодирования музыки с качеством, близким к Audio CD. Однако это не так. На хорошей аппаратуре невосполнимые потери аудиоинформации становятся заметными.
Чем выше битрейт, тем больше места на диске потребуется для сохранения конечного MP3-файла, но и, как правило, тем выше будет качество закодированного сигнала. В целом же каждое значение битрейта имеет свою область применения.
Даже профессиональные эксперты с тонким музыкальным слухом порой не в состоянии отличить на хорошей аппаратуре звучание трека Audio CD и его образа, закодированного в MP3-файл с низким коэффициентом сжатия, например 4:1 (320 Kbps). Для рядового же меломана эта разница становится практически неощутимой при скорости потока 192-256 Kbps.
Ежели вы имеете дело только с компьютерными акустическими системами или недорогой бытовой радиоаппаратурой, то для кодирования и последующего прослушивания композиций вполне достаточно 160-192 Kbps. Для компрессии быстро устаревающей поп-музыки, а также для «выкладывания» музыкального архива в сети вполне подойдет и 128 Kbps. Значения битрейта ниже 128 Kbps не позволяют добиться должного качества звучания. Скорости 64-96 Kbps чаще всего используют для сжатия аудиоуроков иностранного языка, лекций, интервью и аудиотрансляций.
Долгое время кодеры поддерживали лишь постоянный битрейт (CBR — Constant BitRate), т. е. пользователь задавал определенную скорость потока данных, а программа обеспечивала при этом максимально возможное качество кодирования. Но очевидно, что плотность потока значимой информации от фрейма к фрейму различна. (Зачем, к примеру, кодировать паузы?) Вот разработчики кодеров и решили использовать для компрессии каждого фрейма свой битрейт, т. е. поставили задачу минимизировать скорость потока данных, сохранив тот же уровень качества. Так родилась идея переменного битрейта VBR (Variable BitRate).
Думаю, теперь вам стало чуть более понятно, какую музыку «предпочитает» ваш телефон. Желаю вам больше приятных мелодий! До встреи в следующих статьях на mobime!
Автор: Язон
Как жаль, что без картинок!
в смысле? тут полно картинок
Алгоритм «Хаффмана» аналогично RAR. я бы сказал - аналогично всех существующих архиватором и множесто других форматов аудио, видео и ипрото картинок :)
Жаль что в статье нет ни даты патентования, ни номера патента MP3. Ни даты изобретения самого MPEG.
Всё-таки не понятно, какова продолжительность фрейма в реальном времени? Одинакова ли она у разных фреймов? Имеет ли файл *.mp3 общий заголовок, или достаточно только заголовков фреймов?
А вот ещё вопрос. Пусть битрейт увеличился вдвое. При этом отсчёты считываются вдвое чаще? Или частота дискретизации остаётся той же, но каждый отсчёт цифруцется бОльшим количеством битов?
ИЛЬЯ ВИКТОРОВИЧ СКАЗАЛ ЧТО САЙТ КУЛЬНЫЙ)))
технология супер.лет десять назат ктобы представил что в один кв миллиметр можно впихнуть миллионы транзисторов
СУКА :)
ппц
узнала много нового для себя спасибо)))
Почему при кодировании в MP3 прогой LAME максимальный битрейт для моно - 320 kbps, а не 160?
Тогда можно было сделать для стерео максимальный битрейт 640 kbps, и было бы почти идеальное звучание для современной акустики
Я преобрёл диск с записью 360 песен и ещё с десяток фрагментов из фильмов и все в формате мп3 на CD диске -R Плеер JKYBOX201 записан на этом же диске. Но на WIN7 не устанавливается корректно т.е. названия песен с него на комп не копируются, хотя сами песни и фрагменты фильмов можно скопировать и проиграть на WIN7 плеере7 Вопрос в том как можно вместить на 700 МВ диск столько песен (360) ????
Подскажите если кто то знает ??Нужно всего то битрейт уменьшить. Если на диске 360 песен, то скорей всего битрейт там 96-128, уменьш до 64
Почему одинаковые mp3 файлы весят по-разному? Одно и то же произведение, битрейт одинаковый (320), длительность тоже, а размер у одного 7,5, у второго 10,5 МБ. Что там может быть лишнего «напихано», кроме картинки обложки, и как это лишнее найти и удалить?
Вопрос: почему после преобразования в MP3 одного видео с Youtube на конверторе AVC при закачке его в Sumsung D600 МР3-файл не читается и не воспроизводится, а после преобразования другого такого же файла H264 в результате аналогичной процедуры файл MP3 воспроизводится нормально? Что нужно изменить при преобразовании видеофайла в аудиофайл, чтобы он воспроизводился на мобильнике?
браво автору!! ну хоть что-то понятно стало..
Советую слушать в 320 kb/s или в 256 ниже урезать поверьте мне не стоит,ну а если Опера или Металл то лучше использовать формат FLAC