FAQ / mp3 и lame

Сжатие аудиоданных с потерями (lossy)
Сжатие данных с потерями — метод сжатия (компрессии) данных, при использовании которого распакованные данные отличаются от исходных, но степень отличия не является существенной с точки зрения их дальнейшего использования. Этот тип компрессии часто применяется для сжатия аудио- и видеоданных, статических изображений, в Интернете, особенно в потоковой передаче данных, и цифровой телефонии.

MP3

MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3; но не MPEG-3) — это кодек третьего уровня, разработанный командой MPEG, лицензируемый формат файла для хранения аудиоинформации.
MP3 является одним из самых распространённых и популярных форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически во всех популярных операционных системах, на большинстве портативных аудиоплееров, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.
В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения звука очень близкого к оригинальному (по мнению большинства слушателей), хотя аудиофилы говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/11 от оригинального файла с CD-Audio. Само по себе несжатое аудио формата CD-Audio имеет битрейт 1411,2 кбит/с. MP3-файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия. При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация, не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG.
В прошлом было распространено мнение, что запись с битрейтом 128 кбит/c подходит для музыкальных произведений, предназначенных для прослушивания большинством людей, обеспечивая качество звучания Audio-CD. В действительности всё намного сложнее. Во-первых, качество полученного MP3 зависит не только от битрейта, но и от кодирующей программы (кодека) (стандарт не устанавливает алгоритм кодирования, только описывает способ представления). Во-вторых, помимо превалирующего режима CBR (Constant Bitrate — постоянный битрейт) (в котором, проще говоря, каждая секунда аудио кодируется одинаковым числом бит) существуют режимы ABR (Average Bitrate — усреднённый битрейт) и VBR (Variable Bitrate — переменный битрейт). В-третьих, граница 128 кбит/c является условной, так как она была «изобретена» в эпоху становления формата, когда качество воспроизведения звуковых плат и компьютерных колонок как правило было ниже, чем в настоящее время.
На данный момент наиболее часто встречаются MP3 файлы с битрейтом 192 кбит/c, что может косвенно говорить о том, что большинство считает этот битрейт достаточным. Реально воспринимаемое «качество» зависит от исходного аудиофайла, слушателя и его аудиосистемы. Некоторые меломаны предпочитают сжимать музыку с «максимальным качеством» — 320 кбит/c, либо даже переходить на кодеки без потерь, например FLAC. Также среди меломанов бытует мнение, что некоторые семплы (фрагменты аудиозаписи) не поддаются качественному сжатию с потерями: на всех возможных битрейтах не составляет особого труда отличить сжатое аудио от оригинала.
Технические недостатки. Количество каналов звука ограничено двумя, в отличие от более современных AAC и Ogg Vorbis. В mp3 файле даже самого высокого качества (44100гц — 320 kbps) срезаются некоторые частоты выше 16 кГц — что учитывает особенности слуха человека: к старости верхняя граница слышимого диапазона значительно падает, однако, для специалистов и людей, привыкших слушать музыку на высококачественной аппаратуре, такие искажения становятся заметны на слух — снижается ясность звучания, прозрачность, пропадают детали и полутона, стереопанорама становится плоской.

Кодер формата mp3 - LAME
Официальный сайт
Скачать LAME 3.99.5 с нашего сайта: [attachment=98]

Хоть сегодня MP3 и не самый качественный lossy аудио кодек, всё же он бесспорно является лидером за счет своей огромной популярности и совместимости с практически всеми аппаратными и софтовыми плеерами.



Рекомендации и примеры
Рекомендованным режимом является режим VBR - он дает лучшую скорость кодирования и стабильное качество звучания для сигналов разной степени сложности.

Ниже приведены примеры параметров для конвертера foobar2000:

Приемлемое качество для большинства слушателей:
--silent -V 2 --noreplaygain - %d

Максимальное VBR качество:
--silent -V 0 --noreplaygain - %d

Высокое качество, 320 кбит/с (постоянный битрейт):
--silent -b 320 --noreplaygain - %d

Более высокое качество, 320 кбит/с (чуть более низкая скорость кодирования):
--silent -q 2 -b 320 --noreplaygain - %d

Максимально возможное качество, 320 кбит/с, CBR (в большинстве случаев не дает прироста в качестве, очень медленное кодирование):
--silent -b 320 -q 0 --noreplaygain - %d

Пояснения:
-q - параметр регулирует соотношение скорость/качество. Значение по-умолчанию - 3.
--silent - параметр задан в связи с тем что foobar2000 автоматически скрывает консольное окно кодировщика.
--noreplaygain - отключение анализа ReplayGain кодером LAME, что немного повысит скорость кодирования. Foobar2000 самостоятельно выполняет ReplayGain сканирование (если оно включено в настройках конвертера).

Скриншот с примером:



Так же читайте статью Принципы настройки конвертера foobar2000
  • Яндекс.Метрика