Сегодня трудно найти человека, незнакомого с трехбуквенной аббревиатурой – MP3. Вот только, когда начинаешь спрашивать, что же это такое и как расшифровывается, то некоторые люди недоуменно разводят руками, а другие говорят так: ”Ты что? Это же музыка этот MP3!”. Кроме того, MP3 поддерживают многие мобильники. Об этом то мы знаем, а дальше, а больше? Понятно, что мало кому понятно, что это за формат. В этой статье я как раз и объясню, что же все - таки это такое, этот MP3.
MP3 – это наиболее популярный формат хранения и передачи информации в цифровой форме, использующий компрессию сигнала. Формат MP3, или MPEG Audio Layer-3, был разработан компаниями Fraunhofer IIS и Thomson. По сравнению с WAV-файлами, являющимися копиями треков Audio CD (PCM, 16 bit, Stereo, 44,1 kHz), MP3-композиции занимают намного меньше места на диске. На обыкновенном CD-R/RW-бланке можно сохранить свыше 11 часов музыки вполне пристойного качества.
Для MP3 написано множество отличных программ (кодировщиков, проигрывателей и т. д.), налажено производство аппаратных (стационарных, карманных и автомобильных) плееров, каждый современный телефон поддерживает MP3-мелодии (и даже имеет встроенный плеер для их удобного воспроизведения). По сравнению со многими другими форматами сжатия аудио MP3 обеспечивает лучшее качество звучания и сегодня по своей популярности занимает, пожалуй, второе место после Audio CD.
Описание формата MP3
Формат сжатия аудиоданных MP3 (сокращение от MPEG Layer3) - один из первых популярных способов сжатия звука. Разработан немецкой компанией Fraunhofer IIS и позднее, при поддержке фирмы THOMSON, внедрён как часть видеоформатов MPEG1 и MPEG2. Обеспечивает высокое качество звука при сравнительно небольших размерах файла.
Технические сведения о формате MP3
Высокая степень сжатия в MP3 достигается за счёт достаточно сложного алгоритма кодирования. Используются как математические методы компрессии, так и особенности человеческого слуха (психоакустическая модель): эффект маскировки слабого звука одной частоты более громким звуком такой же или соседней частоты, понижение чувствительности уха к тихому звуку сразу после громкого, невосприимчивость к звукам ниже определённого уровня громкости.
Поток звука при кодировании разбивается на равные по участки (фреймы). Каждый из фреймов кодируется отдельно со своими параметрами и содержит заголовок, в котором эти параметры указаны. Сжатие может быть выполнено с разным качеством и соответственно размером конечного файла.
Степень сжатия характеризуется битрейтом (bitrate) - количество передаваемой за единицу времени информации. Файлы MP3 обычно закодированы с битрейтом от 64 до 320 килобит в секунду (kbps или kb/s), а также с переменным битрейтом (VBR) - когда для каждого фрейма используется свой, оптимальный для данного участка, битрейт.
Исходный сигнал с помощью фильтров разделяется на несколько частотных диапазонов, для каждого диапазона определяется величина маскирующего эффекта от соседних диапазонов и предыдущего фрейма, несущественные сигналы игнорируется. Для оставшихся данных для каждого диапазона определяется, сколькими битами можно пожертвовать, чтобы потери были ниже величины маскирующего эффекта. На этом работа психоакустической модели завершается, а итоговый поток дополнительно сжимается по алгоритму Хаффмана (аналогично RAR архиватору).
При битрейте 320 kbps применяется только итоговое сжатие, без психоакустического моделирования. Следует иметь в виду, что различные кодеки могут кодировать аудиосигнал по-разному, различия особенно проявляются на высоких частотах и низких битрейтах. В формате MP3 кодируется стереосигнал, при этом возможны несколько вариантов преобразования:
Dual Channel - каждый канал получает половину потока и кодируется отдельно - возможна запись двух абсолютно разных сигналов.
Stereo - каждый канал кодируется отдельно, но программа-кодер может использовать свободное место одного канала для размещения информации другого. Режим stereo выставлен по умолчанию в большинстве кодеров.
Joint Stereo (MS Stereo) - стереосигнал раскладывается на общий для обоих каналов и разностный. Имеет вариант - MS/IS Stereo с упрощённым разностным сигналом.
Сильные стороны формата MP3:
Высокая степень сжатия при приемлемом качестве звука.
Степень сжатия и качество может регулироваться пользователем.
Фреймовая структура удобна для передаче по сети, позволяет переход к любому месту файла.
Широкое распространение аппаратуры и программ.
Особенности применения MP3
Несмотря на то, что кодирование в MP3 осуществляется с утерей части исходной информации, при битрейтах 256 и 320 kbps практически невозможно отличить на слух сжатый сигнал от оригинала, особенно при прослушивании на распространённой аудио аппаратуре. При этом размер файла в самом худшем случае будет в 4 раза меньше, чем в формате CD audio.
Для использования в компактных плеерах и других устройствах с невысоким качеством акустики можно вполне использовать битрейт не ниже 192 kbps. Битрейты ниже 192 kbps рекомендуется использовать для сжатия сигнала с ограниченным частотным диапазоном или невысокими требованиями к достоверности (например, разговор или телепередача).
На чем же основана идея компрессии звука в MP3?
Наверняка, обращаясь к приятелю, отгороженному от внешнего мира "музофоном", вы замечали, как он начинает неестественно громко отвечать на ваши вопросы, поскольку собственный голос, слышимый им под рев рок-концерта, звучит для него непривычно тихо - особенность человеческого восприятия. И дело тут не столько в остроте слуха, сколько в способности нашего мозга "переваривать" звуковую информацию: не реагировать на импульсы, мощность которых ниже определенного уровня; после сильного грохота не слышать шепота и т. д.
Этим и пользуются при создании MP3-кодеров, в каждом из которых может быть реализована своя собственная, варьируемая в зависимости от целей и задач, так называемая психоакустическая модель, где можно пренебречь сравнительно слабыми сигналами.
Как же работают такие методы?
Исходный звуковой сигнал разбивается на отдельные блоки, именуемые фреймами, к каждому из которых применяется специальный алгоритм кодирования, причем параметры сжатия для разных фреймов могут значительно отличаться друг от друга. В процессе кодирования блока исходный сигнал разделяется на несколько составляющих частотных диапазонов. Для каждого из них просчитывается величина так называемого эффекта маскирования слабого сигнала более мощным от соседнего диапазона или от предыдущего фрейма. Затем в зависимости от результатов происходит удаление второстепенных звуков, которые не будут слышимы "среднестатистическим" человеком из-за наличия в данный момент более громкого сигнала. Кроме того, учитывается неспособность большинства людей различать высокочастотные сигналы (выше 16 kHz).
Аудиоинфоpмация, сжатая по данной схеме, может передаваться потоком, например через интернет, а может храниться в файлах формата MP3.
Битрейт и его значение
Одной из важнейших характеристик MP3-файла является битрейт - скорость потока обрабатываемых данных, или общее количество информации, передаваемой в единицу времени. Эта величина не зависит от того, содержит этот поток моно- или стереозвук.
Битрейт 128 Kbps с легкой руки Fraunhofer IIS был признан оптимальным для использования в интернете, а некоторые производители кодеров распространили мнение о том, что этой скорости вполне достаточно для кодирования музыки с качеством, близким к Audio CD. Однако это не так. На хорошей аппаратуре невосполнимые потери аудиоинформации становятся заметными.
Чем выше битрейт, тем больше места на диске потребуется для сохранения конечного MP3-файла, но и, как правило, тем выше будет качество закодированного сигнала. В целом же каждое значение битрейта имеет свою область применения.
Даже профессиональные эксперты с тонким музыкальным слухом порой не в состоянии отличить на хорошей аппаратуре звучание трека Audio CD и его образа, закодированного в MP3-файл с низким коэффициентом сжатия, например 4:1 (320 Kbps). Для рядового же меломана эта разница становится практически неощутимой при скорости потока 192-256 Kbps.
Ежели вы имеете дело только с компьютерными акустическими системами или недорогой бытовой радиоаппаратурой, то для кодирования и последующего прослушивания композиций вполне достаточно 160-192 Kbps. Для компрессии быстро устаревающей поп-музыки, а также для "выкладывания" музыкального архива в сети вполне подойдет и 128 Kbps. Значения битрейта ниже 128 Kbps не позволяют добиться должного качества звучания. Скорости 64-96 Kbps чаще всего используют для сжатия аудиоуроков иностранного языка, лекций, интервью и аудиотрансляций.
Долгое время кодеры поддерживали лишь постоянный битрейт (CBR - Constant BitRate), т. е. пользователь задавал определенную скорость потока данных, а программа обеспечивала при этом максимально возможное качество кодирования. Но очевидно, что плотность потока значимой информации от фрейма к фрейму различна. (Зачем, к примеру, кодировать паузы?) Вот разработчики кодеров и решили использовать для компрессии каждого фрейма свой битрейт, т. е. поставили задачу минимизировать скорость потока данных, сохранив тот же уровень качества. Так родилась идея переменного битрейта VBR (Variable BitRate).
Сегодня трудно найти человека, незнакомого с трехбуквенной аббревиатурой – MP3. Вот только, когда начинаешь спрашивать, что же это такое и как расшифровывается, то некоторые люди недоуменно разводят руками, а другие говорят так: ”Ты что? Это же музыка этот MP3!”. Кроме того, MP3 поддерживают многие мобильники. Об этом то мы знаем, а дальше, а больше? Понятно, что мало кому понятно, что это за формат. В этой статье я как раз и объясню, что же все - таки это такое, этот MP3.
MP3 – это наиболее популярный формат хранения и передачи информации в цифровой форме, использующий компрессию сигнала. Формат MP3, или MPEG Audio Layer-3, был разработан компаниями Fraunhofer IIS и Thomson. По сравнению с WAV-файлами, являющимися копиями треков Audio CD (PCM, 16 bit, Stereo, 44,1 kHz), MP3-композиции занимают намного меньше места на диске. На обыкновенном CD-R/RW-бланке можно сохранить свыше 11 часов музыки вполне пристойного качества.
Для MP3 написано множество отличных программ (кодировщиков, проигрывателей и т. д.), налажено производство аппаратных (стационарных, карманных и автомобильных) плееров, каждый современный телефон поддерживает MP3-мелодии (и даже имеет встроенный плеер для их удобного воспроизведения). По сравнению со многими другими форматами сжатия аудио MP3 обеспечивает лучшее качество звучания и сегодня по своей популярности занимает, пожалуй, второе место после Audio CD.
Описание формата MP3
Формат сжатия аудиоданных MP3 (сокращение от MPEG Layer3) - один из первых популярных способов сжатия звука. Разработан немецкой компанией Fraunhofer IIS и позднее, при поддержке фирмы THOMSON, внедрён как часть видеоформатов MPEG1 и MPEG2. Обеспечивает высокое качество звука при сравнительно небольших размерах файла.
Технические сведения о формате MP3
Высокая степень сжатия в MP3 достигается за счёт достаточно сложного алгоритма кодирования. Используются как математические методы компрессии, так и особенности человеческого слуха (психоакустическая модель): эффект маскировки слабого звука одной частоты более громким звуком такой же или соседней частоты, понижение чувствительности уха к тихому звуку сразу после громкого, невосприимчивость к звукам ниже определённого уровня громкости.
Поток звука при кодировании разбивается на равные по участки (фреймы). Каждый из фреймов кодируется отдельно со своими параметрами и содержит заголовок, в котором эти параметры указаны. Сжатие может быть выполнено с разным качеством и соответственно размером конечного файла.
Степень сжатия характеризуется битрейтом (bitrate) - количество передаваемой за единицу времени информации. Файлы MP3 обычно закодированы с битрейтом от 64 до 320 килобит в секунду (kbps или kb/s), а также с переменным битрейтом (VBR) - когда для каждого фрейма используется свой, оптимальный для данного участка, битрейт.
Исходный сигнал с помощью фильтров разделяется на несколько частотных диапазонов, для каждого диапазона определяется величина маскирующего эффекта от соседних диапазонов и предыдущего фрейма, несущественные сигналы игнорируется. Для оставшихся данных для каждого диапазона определяется, сколькими битами можно пожертвовать, чтобы потери были ниже величины маскирующего эффекта. На этом работа психоакустической модели завершается, а итоговый поток дополнительно сжимается по алгоритму Хаффмана (аналогично RAR архиватору).
При битрейте 320 kbps применяется только итоговое сжатие, без психоакустического моделирования. Следует иметь в виду, что различные кодеки могут кодировать аудиосигнал по-разному, различия особенно проявляются на высоких частотах и низких битрейтах. В формате MP3 кодируется стереосигнал, при этом возможны несколько вариантов преобразования:
Сильные стороны формата MP3:
Особенности применения MP3
Несмотря на то, что кодирование в MP3 осуществляется с утерей части исходной информации, при битрейтах 256 и 320 kbps практически невозможно отличить на слух сжатый сигнал от оригинала, особенно при прослушивании на распространённой аудио аппаратуре. При этом размер файла в самом худшем случае будет в 4 раза меньше, чем в формате CD audio.
Для использования в компактных плеерах и других устройствах с невысоким качеством акустики можно вполне использовать битрейт не ниже 192 kbps. Битрейты ниже 192 kbps рекомендуется использовать для сжатия сигнала с ограниченным частотным диапазоном или невысокими требованиями к достоверности (например, разговор или телепередача).
На чем же основана идея компрессии звука в MP3?
Наверняка, обращаясь к приятелю, отгороженному от внешнего мира "музофоном", вы замечали, как он начинает неестественно громко отвечать на ваши вопросы, поскольку собственный голос, слышимый им под рев рок-концерта, звучит для него непривычно тихо - особенность человеческого восприятия. И дело тут не столько в остроте слуха, сколько в способности нашего мозга "переваривать" звуковую информацию: не реагировать на импульсы, мощность которых ниже определенного уровня; после сильного грохота не слышать шепота и т. д.
Этим и пользуются при создании MP3-кодеров, в каждом из которых может быть реализована своя собственная, варьируемая в зависимости от целей и задач, так называемая психоакустическая модель, где можно пренебречь сравнительно слабыми сигналами.
Как же работают такие методы?
Исходный звуковой сигнал разбивается на отдельные блоки, именуемые фреймами, к каждому из которых применяется специальный алгоритм кодирования, причем параметры сжатия для разных фреймов могут значительно отличаться друг от друга. В процессе кодирования блока исходный сигнал разделяется на несколько составляющих частотных диапазонов. Для каждого из них просчитывается величина так называемого эффекта маскирования слабого сигнала более мощным от соседнего диапазона или от предыдущего фрейма. Затем в зависимости от результатов происходит удаление второстепенных звуков, которые не будут слышимы "среднестатистическим" человеком из-за наличия в данный момент более громкого сигнала. Кроме того, учитывается неспособность большинства людей различать высокочастотные сигналы (выше 16 kHz).
Аудиоинфоpмация, сжатая по данной схеме, может передаваться потоком, например через интернет, а может храниться в файлах формата MP3.
Битрейт и его значение
Одной из важнейших характеристик MP3-файла является битрейт - скорость потока обрабатываемых данных, или общее количество информации, передаваемой в единицу времени. Эта величина не зависит от того, содержит этот поток моно- или стереозвук.
Битрейт 128 Kbps с легкой руки Fraunhofer IIS был признан оптимальным для использования в интернете, а некоторые производители кодеров распространили мнение о том, что этой скорости вполне достаточно для кодирования музыки с качеством, близким к Audio CD. Однако это не так. На хорошей аппаратуре невосполнимые потери аудиоинформации становятся заметными.
Чем выше битрейт, тем больше места на диске потребуется для сохранения конечного MP3-файла, но и, как правило, тем выше будет качество закодированного сигнала. В целом же каждое значение битрейта имеет свою область применения.
Даже профессиональные эксперты с тонким музыкальным слухом порой не в состоянии отличить на хорошей аппаратуре звучание трека Audio CD и его образа, закодированного в MP3-файл с низким коэффициентом сжатия, например 4:1 (320 Kbps). Для рядового же меломана эта разница становится практически неощутимой при скорости потока 192-256 Kbps.
Ежели вы имеете дело только с компьютерными акустическими системами или недорогой бытовой радиоаппаратурой, то для кодирования и последующего прослушивания композиций вполне достаточно 160-192 Kbps. Для компрессии быстро устаревающей поп-музыки, а также для "выкладывания" музыкального архива в сети вполне подойдет и 128 Kbps. Значения битрейта ниже 128 Kbps не позволяют добиться должного качества звучания. Скорости 64-96 Kbps чаще всего используют для сжатия аудиоуроков иностранного языка, лекций, интервью и аудиотрансляций.
Долгое время кодеры поддерживали лишь постоянный битрейт (CBR - Constant BitRate), т. е. пользователь задавал определенную скорость потока данных, а программа обеспечивала при этом максимально возможное качество кодирования. Но очевидно, что плотность потока значимой информации от фрейма к фрейму различна. (Зачем, к примеру, кодировать паузы?) Вот разработчики кодеров и решили использовать для компрессии каждого фрейма свой битрейт, т. е. поставили задачу минимизировать скорость потока данных, сохранив тот же уровень качества. Так родилась идея переменного битрейта VBR (Variable BitRate).