Расширение файла PCM. Что такое расширение файла PCM? Почему тогда не каждый диск содержит звук в PCM

Цифровой звук. Как же много мифов крутится вокруг этой фразы. Сколько споров возникало между любителями удобства и качества цифры и приверженцами «живого воздушного» винилового звука помноженного на «тёплое ламповое» звучание. Кроме того, есть немало споров и между любителями «цифры»: достаточно ли 16х44.1 или нужно 24х192? Что лучше: мультибит или дельта-сигма? CDDA или SACD? PCM или DSD? В этой статье я попробую простым языком изложить азы цифрового звука, а так же более подробно остановлюсь на сравнении двух типов кодирования аналогового сигнала в цифровой: DSD и PCM .

Для начала ответим на вопрос, что есть цифровой звук? Чем он отличаются от аналогового? Если говорить кратко, математическим языком, аналоговый звуковой сигнал - непрерывная функция , цифровой звуковой сигнал - дискретная функция . Что это значит?

Аналоговый сигнал

Если нарисовать в воображении график синусоиды (именно так в чаще всего изображают звуковую волну): то, как бы мы его не увеличивали, стараясь рассмотреть все детали, - всегда будем видеть плавную гладкую линию: это аналоговый звуковой сигнал (рис. 1).

Рис. 1. Аналоговый сигнал

Аналоговый звук (запись) имеет множество параметров, с помощью которых можно оценить его качество. Рассмотрим три самых важных: частотный диапазон, динамический диапазон, искажения.

Частотный диапазон - набор частот, содержащихся в звуке. Принято считать, что частотный диапазон человеческого слуха 20… 20.000 Гц (иногда указывается 16 - 22.000 Гц). Сам по себе частотный диапазон музыки никакого интереса в плане оценки качества не представляет (к примеру, частотный диапазон все того же взлетающего самолета будет очень широк, а вокальной партии тенора - намного уже). Качественным параметром, скажем, наушников является потенциальный частотный диапазон, а оценивается он с помощью амплитудно-частотной характеристики (АЧХ). Идеальная АЧХ - прямая линия на всем диапазоне частот слуха – означает, что источник звука не усиливает и не ослабляет какие-то отдельные частоты, а значит извлекаемый звук совпадает с оригиналом.


Рис. 2. АЧХ MP3 файла 256 kbps

Динамический диапазон (ДД) - разность между самым тихим и самым громким звуком. Измеряется громкость в децибелах (дБ). Принято считать, что максимальная громкость, не наносящая травм человеку - это 130 дБ - звук взлетающего самолета, а минимальная слышимая громкость - 5… 10 дБ - на уровне шелеста листьев в маловетреную погоду. Естественно, что шелест листьев на фоне взлетающего самолета разобрать будет невозможно, да и слушать музыку с уровнем 130 дБ крайне неприятно. Поэтому принято считать, что комфортный ДД для прослушивания музыки - 80… 100 дБ.

Искажения – не что иное, как отклонение сигнала от оригинала.

Принципы представления звука в цифровом виде

Что же происходит при оцифровке аналогового звука? Не будем углубляться в технические аспекты, разберем все, как говорится, на бумаге: для этого нарисуем нашу воображаемую «идеальную» синусоиду и будем измерять величину сигнала через равные промежутки времени (этот процесс называется дискретизацией или квантованием): мы получим некий последовательный набор значений - это и будет наш цифровой сигнал, полученный методом импульсно-кодовой модуляции (PCM) (рис. 3).


Рис. 3. Преобразование аналогового сигнала в PCM

Два основных параметра качества PCM сигнала - это частота и разрядность. Частота - это количество измерений за одну секунду, чем их больше - тем с большей точностью передаётся сигнал. Частота измеряется в герцах: 44100 Hz, 192000 Hz и др. Разрядность - количество возможных значений величины сигнала (точность передачи величины). Чем больше вариантов - тем больше точность сигнала. Разрядность измеряется в битах: 16 bit (65.536 возможных значений, ДД 96 дБ), 24 bit (16.777.216 значений, ДД 144 дБ) и др.

Но это не единственный вариант представления звуковой волны в цифровом виде. Есть способ избавиться от такого параметра, как разрядность, оставить только два уровня амплитуды: -100% и +100% (0 или 1). Чтобы добиться этого, не потеряв в качестве, - нужно многократно увеличить частоту считывания величины сигнала (рис. 4).


Рис. 4. Преобразование аналогового сигнала в DSD

Такой вид представления цифрового звука называется импульсно-плотностной модуляцией, чаще всего для него используется аббревиатура DSD. Фактически, единственный качественный параметр такого сигнала - частота. Но так как частоты используются очень высокие (от 2.822.400 Hz), такие цифры сложно запомнить, принято делить частоту DSD сигнала на 44.100 Hz. Полученное число и является показателем качества: DSD64 (ДД 120 дБ), DSD128, DSD256 и т.д.

Восстановление аналогового сигнала из «цифры»

Но оцифровка аналогового сигнала – это полдела. Для прослушивания цифровой музыки нужно выполнить обратное преобразование. Для начала рассмотрим, каким образом превратить в звук цифровой DSD поток. Как мы уже знаем, этот поток представляет из себя высокочастотный (2,8 МГц и более) двухуровневый сигнал, средняя величина этого сигнала меняется со звуковой частотой. То есть, если подходить к решению задачи максимально просто, - нужно отфильтровать все высокочастотные составляющие DSD потока, оставив только полезный звуковой сигнал (частоты до 20...22 кГц). Делается это с помощью аналогового фильтра низкой частоты (ФНЧ). Простейший ФНЧ – это RC цепочка . Сигнал полученный, после прохождения этой цепочки, показан на рис. 5.


Рис. 5. Восстановление аналогового сигнала из DSD

Как видим, полученный график лишь отдаленно напоминает исходную синусоиду. Но не забываем, что мы «применили» простейший фильтр, улучшая схему фильтра можно добиться практически полного отсутствия высокочастотного шума и получить аналоговый звук с хорошими качественными показателями.

Для восстановления аналогового сигнала из цифрового PCM недостаточно только лишь аналогового ФНЧ, нужно предварительно расшифровать цифровые данные, для этого используются цифро-аналоговые преобразователи (ЦАПы). Бывают они разных типов, но описывать их все в задачи данной статьи не входит. Остановимся на 2-х самых распространённых типах в звуковой технике. Во-первых, это так называемый ЦАП лестничного типа (его ещё называют мультибитным). Как вы, наверное, догадались, такой ЦАП преобразует PCM поток цифровых данных в поток величин звукового сигнала, которые на графике выглядят как лестница (рис. 6). Как и в случае DSD, обязательно использование аналогового фильтра для сглаживания «ступенек».


Рис. 6. Восстановление аналогового сигнала из PCM

Зачастую, в таких преобразователях используется промежуточная передискретизация цифрового PCM сигнала в более высокие значения частоты (например, 192 кГц): это уменьшает «ступеньки», что позволяет упростить схему аналогового фильтра.

Второй тип ЦАП – дельта-сигма – использует передискретизацию в ещё большие значения частоты с одновременным уменьшением разрядности до одного бита. Ничего не напоминает? Это же знакомый нам DSD сигнал! Как далее обработать такой сигнал и превратить его в аналоговый, мы уже рассматривали выше.

Применение PCM и DSD, достоинства/недостатки

Где же мы можем встретить каждый из способов кодирования? PCM формат очень распространён: CDDA диски, DVD Audio, файлы MP3, FLAC, ALAC, AAC, звук в фильмах, и далее, и далее, проще сказать, когда не-PCM. Super Audio CD диски, DSD диски, файлы DSF, DFF - это DSD формат. Что же всё-таки лучше? При воспроизведении какого формата мы получим более качественный звук?

В статьях, посвященных DSD формату, описано множество преимуществ перед PCM, но все ли описываемые преимущества верны или это мифы, придуманные для обывателей, не разбирающихся в технической составляющей, чтобы отвоевывать рынок, плотно занятый PCM форматом? Давайте кратенько пройдемся по списку.

Выводы

Итак, что выбрать DSD или PCM? Однозначного ответа нет и быть не может: PCM 24 бит 92 кГц и DSD128, например, очень схожи по качественным характеристикам, причем эти характеристики лучше, чем у аппаратуры, на которой эти форматы будут проигрываться, а значит дальнейшее увеличение качества цифровых форматов для воспроизведения на данном этапе нецелесообразно. При оценке качества звука разных форматов высокой чёткости на первый план выходят субъективные ощущения, ведь не качеством единым питается человеческий мозг: дизайн аппаратуры, ее стоимость, и, главное, самочувствие и настроение слушателя дают гораздо больший эффект на ощущения от прослушивания музыки. А значит выбирайте то, что нравится лично вам, и не навязывайте другим свое мнение. Всем приятного прослушивания!

СТАНДАРТЫ ЗВУКА


Технология DVD позволяет записывать многоканальный звук, как в сжатом виде (Dolby Digital, DTS, MPEG), так и несжатый, в виде линейного и пакетного PCM. Чем больше сжатие звука, тем хуже его качество. Многоканальность звука обозначается как 2.0, 5.1 и т.п. - первая цифра - количество отдельных звуковых каналов, вторая - обозначает наличие низкочастотной (сабвуферной) дорожки. Пятиканальная реализация звука предполагает 2 фронтальных динамика, 2 тыловых, центральный динамик и сабвуфер. При 6 и 7 канальном звуке добавляется центральный тыловой или второй центральный фронтальный или два боковых динамика. Многие неопытные пользователи предпочитают звук Dolby Digital, но они не знают всех его недостатков.

Основные форматы записи звука на DVD-дисках следующие:

Advanced Resolution (linear PCM и packed PCM) = применяется только для записи МУЗЫКИ и только на дисках DVD-AUDIO. Этот формат предоставляет наивысшее качество звука. Максимальные значения разрешения = 24bit/192khz, правда, аппаратура, поддерживающая столь высокое разрешение, встречается редко. Более распространённый формат - 24bit/96khz. Advanced Resolution бывает в следующих форматах: 2.0; 4.0; 5.1
PCM (LPCM) (Pulse Code Modulation uncompressed) = звук с линейной импульсно-кодовой модуляцией, как и на обычном компакт-диске. На DVD программах обычно записывается в стандарте, чуть лучшем, чем на компакт-диске = 16bit/48khz, однако часто встречается 20-битная запись. В очень редких случаях можно встретить 24bit/96khz - буквально на единичных изданиях. Этот стандарт применяется для записи музыкальных программ, т.е. видеоклипов и концертов, и для этих программ он является наилучшим. Нам приходится сталкиваться с непониманием покупателей, которые хотят слушать музыкальные программы в Dolby Digital, но достаточно послушать на хорошей аппаратуре PCM и Dolby, и все преимущества PCM становятся очевидными даже самому тугому на ухо человеку. PCM бывает только в 2.0, или STEREO, но если Вы хотите услышать окружающее звучание, любой ресивер без труда декодирует этот формат в Dolby Surround Pro-Logic, правда, вся живая суть музыки умрёт. Музыку должно и нужно слушать в несжатом стереоформате - вот мнение меломанов. PCM Stereo - правильный выбор для этого.
DTS (Digital Theater System) - система записи окружающего звучания, разработанная специально для систем кинопроката, позднее внедрена в системы домашнего видео. Качество звука, предлагаемого данным методом отличает большая динамика и чистота. Сжатие звука невелико - приблизительно 1:3, разрядность - 20bit, поэтому по качеству DTS может конкурировать с PCM и часто используется при издании концертных записей на DVD. Некоторые кинофильмы также издаются с DTS дорожкой, правда, в основном на языке оригинала. В системе DTS предусмотрено следующее количество каналов 2.0, 4.0, 5.0, 5.1, 6.1 и даже 7.1. Последние два стандарта называются DTS ES и DTS EX и требуют специальных декодеров и дополнительных каналов усиления, хотя эти два стандарта совместимы и с обычными ресиверами с реализацие звука в 5.1.
Dolby Digital - наиболее распространённый и наименее хорошо (или скорее, наиболее отвратительно) звучащий формат звука в DVD-технологии. И это неудивительно, поскольку сжатие в максимальных значениях доходит до 1:11. Правда, величина этого сжатия переменая, зависит от насыщенности звукового потока, и при грамотной кодировке недостатки сжатия могут быть несколько нивелированы. Тем не менее для кинофильмов эти недостатки практически незаметны, а вот в музыкальных программах часто весьма и весьма очевидны,к сожалению. Способ и качество кодировки Dolby Digital можно сравнить с записью в MP-3 формате. И производители музыкальных программ часто идут на поводу у рынка, записывая музыку в популярном народном формате Dolby Digital, и не предлагая никакой альтернативной дорожки в PCM или DTS. Стандарт Dolby Digital предлагает следующие виды многоканального звука: 1.0; 2.0; 2.1; 4.0; 4.1; 5.0; 5.1; 6.1. THX сертификация Dolby Digital предполагает внесение особых изменений во временных задержках сигнала и в его АЧХ. Естественно, используется при записи кинозвука, но не музыки. Пожалуй, единственный музыкальный THX сертифицированый релиз - это концерт Rolling Stones "Live At The Max", да и тот, по сути, является кинофильмом, поскольку был снят для демонстрации в широкоплёночных кинотеатрах IMAX.
Dolby Surround - устаревшая система окружающего звучания, позволяет получить из обычного аналогового (не цифрового) стереосигнала четыре составляющие - правый, левый, центральный и тыловой каналы, а так же возможно подключение сабвуфера. Дополнительные каналы выделяются матричным декодированием противофазного сигнала из двух стереоканалов. Обозначается этот формат как 2.1, 3.1, 4.0 или 4.1
MPEG Multichannel - устаревшая (скорее мертворождённая) система окружающего звучания, предлагавшаяся европейскими производителями дисков. От Dolby Digital практически ничем не отличается, разработана с целью не платить авторских отчислений Dolby Labs. В настоящее время практически не встречается, кроме редких французских изданий.

СТАНДАРТЫ ВИДЕО

Стандарт DVD подразумевает запись изображения с соотношением сторон, принятым в телевещании, т.е. 3:4, или, по другому, 1,33. Однако подавляющее большинство кинофильмов снимается с другим соотношением сторон, а именно 1,77; 1,85; 2,35 и т.п. То есть фильмы снимаются как правило в широкоэкранном виде. Каким образом можно уместить широкий кадр в обычный формат 1,33, предусмотренный стандартом?
То, что происходит с изображением в этом случае, представляет наибольшую трудность в понимании для новичков. Ниже на простых схемах мы вам обьясним, как изменяется изображение и что нужно знать об этом пользователю.

ИЛЛЮСТРАЦИИ ГОТОВЯТСЯ:)))
АНАМОРФНОЕ изображение считается наиболее КАЧЕСТВЕННЫМ, поскольку сохраняет высокое разрешение и позволяет, в зависимости от настройки плейера, смотреть кинофильм как в леттербоксированном виде, так и в анаморфированном. Если у Вас обычный, не широкоэкранный телевизор, то указав в настройках плейера тип телевизора как 3:4 (normal), вы увидите широкий фильм как на картинке 2, а выбрав тип телевизора как 16
:9 (wide), вы увидите изображение как на картинке 3. Если же у Вас широкоэкранный телевизор, то Вы наглядно сможете увидеть все недостатки letterbox, как на нижеприведённой иллюстрации:

ИЛЛЮСТРАЦИИ ГОТОВЯТСЯ:)))
СТЕПЕНЬ АНАМОРФИРОВАННОСТИ киноизображения зависит от исходного кинокадра и бывает от 1,77 до 3,1; Наиболее соответствующим широкоэкранному ТВ-формату является анаморфирование в соотношении 1,85. В более высоких соотношениях сверху и снизу экрана появляются узкие чёрные полоски, но качество изображения всё равно остаётся неизменно высоким. Коллекционеры DVD во всём мире предпочитают анаморфные издания. Наивысшее качество DVD-картинки получается на плейерах с возможностью прогрессивной развёртки, соответствующей стандартам HDTV, т.е. телевидения высокой чёткости.

Как люди, непосредственно связанные с AV сферой, мы постоянно говорим об аудио-кодировании и аудиокодеках, а что же это такое? Аудиокодек – это, по сути, устройство или алгоритм, способный кодировать и декодировать цифровой аудиосигнал.

На практике аудиоволны, которые передаются по воздуху, являются продолжительными аналоговыми сигналами. Сигналы преобразуются в цифровой формат устройством, которое называется аналого-цифровой преобразователь (АЦП), а устройство обратного преобразования – цифро-аналоговый преобразователь (ЦАП). Кодек находится между этими двумя функциями и именно он позволяет откорректировать некоторые важные параметры для успешного захвата, записи и трансляции звукового сигнала: алгоритм кодека, частота дискретизации, разрядность и скорость передачи данных.


Три наиболее популярных аудиокодека: Pulse-Code Modulation (PCM), MP3 и Advanced Audio Coding (AAC ). Выбор кодека определяет степень сжатия и качество записи. PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками. Источник сигнала для PCM сэмплируется через равные интервалы, и каждый сэмпл представляет собой амплитуду аналогового сигнала в цифровом значении. PCM – это наиболее простой вариант для оцифровки аналогового сигнала.

При наличии правильных параметров этот оцифрованный сигнал может быть полностью реконструирован обратно в аналоговый без каких-либо потерь. Но этот кодек, обеспечивающий практически полную идентичность оригинальному аудио, к сожалению, не очень экономичен, что выражается в очень больших объемах файлов, а такие файлы не подходят для потокового вещания. Мы рекомендуем использовать PCM для записи цифровых образов для ваших источников или когда вы занимаетесь постобработкой аудио.

К счастью, у нас всегда есть возможность выбрать другой кодек, который может сжимать цифровые данные (по сравнению с PCM) на основании некоторых полезных наблюдений о поведении звуковых волн. Но в этом случае приходится идти на компромисс: все альтернативные алгоритмы сопряжены с «потерями», так как невозможно полностью восстановить исходный сигнал, но, тем не менее, результат всё равно хорош настолько, что большинство пользователей не смогут уловить разницу.

MP3 – это формат аудио-кодирования с использованием как раз такого алгоритма сжатия цифровых данных, который позволяет сохранять аудиосигнал в меньшие по объему файлы. Кодек MP3 чаще всего используется пользователями для записи и хранения музыкальных файлов. Мы рекомендуем применять MP3 для трансляций аудио-контента, так как ему требуется меньшая пропускная способность сети.

AAC – это более новый алгоритм кодирования аудиосигнала, ставший «преемником» MP3. AAC стал стандартом для форматов MPEG-2 и MPEG-4. По сути это тоже кодек сжатия цифровых данных, но с меньшей, чем у MP3, потерей качества при кодировании с одинаковыми битрейтами. Мы рекомендуем использовать этот кодек для онлайн трансляций.

Частота дискретизации (кГц, kHz)

Частота дискретизации (или частота сэмплирования) - частота, с которой происходит оцифровка, хранение, обработка или конвертация сигнала из аналога в цифру. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (сэмплов), взятых через равные промежутки времени.

Измеряется в герцах (Гц, Hz) или килогерцах (кГц, kHz,) 1 кГц равен 1000 Гц. Например, 44 100 сэмплов в секунду можно обозначить как 44 100 Гц или 44,1 кГц. Выбранная частота дискретизации будет определять максимальную частоту воспроизведения, и, как следует из теоремы Котельникова, для того, чтобы полностью восстановить исходный сигнал, частота дискретизации должна в два раза превышать наибольшую частоту в спектре сигнала.

Как известно, человеческое ухо способно улавливать частоты между 20 Гц и 20 кГц. Учитывая эти параметры и значения, показанные в таблице ниже, можно понять, почему именно частота 44,1 кГц была выбрана в качестве частоты дискретизации для CD и до сих пор считается очень хорошей частотой для записи.


Есть ряд причин для выбора более высокой частоты дискретизации, хотя может показаться, что воспроизводить звук вне диапазона человеческого слуха – пустая трата сил и времени. При этом среднестатистическому слушателю будет вполне достаточно 44,1 – 48 кГц для качественного решения большинства задач.

Разрядность

Наряду с частотой дискретизации есть такое понятие как разрядность или глубина звука. Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла. Проще говоря, разрядность определяет «точность» измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. С минимальной возможной разрядностью есть только два варианта измерения точности звука: 0 для полной тишины и 1 для звучания в полном объеме. Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 = 65 536) различных значений.

Разрядность закреплена в кодеке PCM, но для кодеков, которые предполагают сжатие (например, MP3 и AAC) этот параметр рассчитывается при кодировании и может меняться от сэмпла к сэмплу.

Битрейт

Битрейт - это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Для линейного PCM битрейт рассчитывается очень просто.

битрейт = частота дискретизации × разрядность × каналы

Для таких систем как Epiphan Pearl, которые кодируют линейный PCM 16-бит (разрядность 16), этот расчет может быть использован для определения, сколько дополнительных полос пропускания может потребоваться для PCM аудио. Например, для стерео (два канала) оцифровка сигнала производится с частотой 44,1 кГц на 16-бит, а битрейт при этом рассчитывается таким образом:

44,1 кГц × 16 бит × 2 = 1 411,2 кбит/с

Между тем алгоритмы сжатия аудиосигнала, такие как AAC и MP3, имеют меньшее количество бит для передачи сигнала (в этом и заключается их цель), поэтому они используют небольшие битрейты. Обычно значения находятся в диапазоне от 96 кбит/с до 320 кбит/с. Для этих кодеков чем выше битрейт вы выбираете, тем больше аудио бит вы получаете на сэмпл, и тем выше будет качество звучания.

Частота дискретизации, разрядность и битрейты в реальной жизни.

Аудио CD-диски, одни из первых наиболее популярных изобретений для простых пользователей для хранения цифрового аудио, использовали частоту 44,1 кГц (20 Гц – 20 кГц, диапазон человеческого уха) и разрядность 16-бит. Данные значения были выбраны, чтобы при хорошем качестве звука иметь возможность сохранять как можно больше аудио на диске.

Когда к аудио добавилось видео и появились DVD, а позднее Blu-Ray диски, был создан новый стандарт. Записи для DVD и Blu-Rays обычно используют линейный формат PCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.1 Surround) и разрядность 24. Эти значения были выбраны в качестве идеального варианта, чтобы сохранять аудио с синхронизацией с видео и при этом получать максимально возможное качество с использованием дополнительного доступного дискового пространства.

CD, DVD и Blu-Ray диски преследовали одну цель – дать потребителю высококачественный механизм воспроизведения. Задачей всех разработок было предоставить высокое качество аудио и видео, не заботясь о величине файла (лишь бы он умещался на диск). Такое качество мог обеспечить линейный PCM.

Напротив, у мобильных средств информации и потокового медиа совсем другая цель – использовать максимально низкий битрейт, при этом достаточный для поддержания приемлемого для слушателя качества. Для этой задачи лучше всего подходят алгоритмы сжатия. Теми же принципами вы можете руководствоваться для своих записей.


При записи аудио с видео…

В случае если запись будет использоваться для последующей обработки , выбирайте кодек PCM с частотой 48 кГц и максимальной разрядностью (16 или 24), чтобы обеспечить наилучшее качество аудио. Мы рекомендуем данные параметры для Epiphan Pearl .

При потоковой передаче аудио с видео…

При потоковой передаче или записи для последующей трансляции можно получить хорошее звучание аудио при меньшей полосе пропускания, используя кодеки AAC или MP3 с частотой 44,1 кГц и битрейт 128 кбит/с или выше. Такие параметры гарантируют, что звук будет достаточно хорош и не скажется на качестве трансляции.

Посмотрело: 5468

2


Таблица форматов многоканального и ВР-звука (дня начинающих)

rutracker.org

Начав разбираться с многоканальным звуком меня поразило количество разнообразных форматов. Форматов звука (кодеков), типов дисков и медиаконтейнеров, в которых МК-звук и спрятан. Но максимум неразберихи внес тот факт, что во многих раздачах материал, рипнутый с одного формата, перекодирован и выложен в другом. А в описании - только общие слова, иногда ещё с перепутанной терминологией. Поди догадайся!
Если с разновидностями Dolby и DTS я разобрался за пару дней, то на всё остальное ушло недели 2, не меньше. Читал разные FAQ, статьи, качал раздачи и сверял, что заявлено в описании и что на самом деле в образах *.ISO и *.nrg. Опробовал разные медиаплееры, настройки (надо отдельную статью писать) и DVD-плееры.
С этим сталкивается каждый, решивший окунуть голову в мир окружающего звука. Чтобы помочь быстрее освоиться среди кучи форматов я и решил написать этот топик, по возможности объединив наиболее распространённые форматы в таблицу, по типу диск-медиаконтейнер-кодек.
Картина примерно следующая: есть несколько форматов звука, закодированных с помощью соответствующих кодеров и хранящихся в файлах определённого формата и расширения.

*.wav - PCM-звук (изначально) (1 канал и больше, обычно 2 или 6) (CD, DVD-audio, DVD-Video и много др.)
*.flac - сжатый lossless PCM-звук (1 канал и больше)
*.mlp - сжатый lossless PCM-звук (1 канал и больше, обычно 6 ) (DVD-audio, Dolby TrueHD)
*.dts - сжатый DTS-кодером (2 - 7 каналов, обычно 5.1) (может быть *.wav)
*.dtshd - lossless DTS-HD Master Audio File
*.ac3 - сжатый Dolby Digital-кодером (2 - 6 каналов, обычно 5.1)
*.dff (???) DSDIFF - PDM-звук (DSD-формат) (SACD)
*.dsf - PDM-звук (DSD-формат) (DSD-disc)
*.(???) - DST, сжатый lossless DSD-звук (SACD)

др.

Но на дисках вместо этих файлов применяются другие, называемые медиаконтейнерами.

В 1 медиаконтейнере могут находиться разные форматы звука, зачастую одновременно.
звук 1-го формата можно поместить в разные типы медиаконтейнеров.

*.aob (DVD-audio)
*.vob (DVD-Video, DVD-audio)
*.wav (PCM-звук или DTS)
*.2CH, *.MCH (SACD)
*.m2ts (Blu-ray BDAV Video File)
*.avi, *.mkv

др.

Формат файла*.wav изначально предназначен для PCM-звука (например с компакт-диска). После появления DTS CD дисков для озвучки кинофильмов, в *.wav начали писать DTS-звук. И *.wav стал контейнером для 2-х форматов звука: несжатого PCM и сжатого DTS.
А уже файлы медиаконтейнеров записаны на соответствующих дисках.
DVD-audio
Звук хранится в папке AUDIO_TS в файлах *.aob в формате PCM или MLP (сжатый PCM) .

Также на диске может присутствовать папка VIDEO_TS с файлами *.vob, запись в которых соответствует DVD-Video.
DVD-Video (audio-DVD)

Звук хранится в папке VIDEO_TS в файлах *.vob вместе с видео. Он может быть одновременно в нескольких форматах: PCM, Dolby Digital, DTS, MPEG-audio (родственник mp3) и др. (например PCM 2.0, DD 5.1, DTS-ES 6.1). Выбор желаемой "аудиодорожки" - через меню плеера.
DVD-audio плееры сначала читают содержимое аудио-части (AUDIO_TS), при желании можно переключиться в просмотр видео-части (если она есть, VIDEO_TS). Обычные бюджетные DVD-плееры не понимают DVD-audio, зато понимают кучу всего другого.
На некоторых звуковых DVD дисках хранятся непосредственно файлы *.wav или некоторые другие.

Прочие варианты дисков, в основном, представляют комбинации этих типов DVD и CD-DA. Они подробно рассмотрены в http://rutracker.org/forum/viewtopic.php?t=382402
DTS-CD (DTS Music Disc или 5.1 Music Disc)
Внутрь обычной аудиодорожки (*.cda) CD-DA диска записан закодированный 5.1 (от 2.0 до 6.1) звук. Такой диск читают обычные CD-плееры, но воспроизводят вместо музыки шум. Для прослушивания нужен DTS-декодер. Для кинотеатров DTS-звук тоже на CD-дисках (но не аудио CD-DA), закодирован и записан в другом формате.

Приставка к CD-плееру (например AV-ресивер с поддержкой DTS)
CD\DVD-плеер со встроенным декодером
программа-медиаплеер с поддержкой DTS
плагин для программы-аудиоплеера

Кроме дорожек *.cda и файлов *.wav для DTS существует расширение *.dts . Для некоторых плееров нужно переименовывать *.wav в *.dts, иначе не включат декодер. Современным DVD-плеерам безразлично CD диск или файлы *.wav\*.dts на прочих носителях.
Таблица PCM.

Сверху - высокого разрешения (ВР, HiRes) и CD, претендующих на достоверное звучание.
Ниже - многоканальный (МК, Multichannel).

http://md.dozor-auto.ru/ex/mch/HR_1600.JPG
XRCD
http://rutracker.org/forum/viewtopic.php?t=848721
HDCD High Definition Compatible Digital
http://rutracker.org/forum/viewtopic.php?t=1119317
SHM CD, Gold CD, SHM SACD
Отличие от обычных - диск сделан из более качественного материала.
Превосходным примером CD-Extra может служить диск JMlab Focal Teach 2008
http://rutracker.org/forum/viewtopic.php?t=1208227
Чтобы аудиоманы (т.е. мы) не скучали и не расслаблялись, а покупали новые диски и проигрыватели, гиганты аудиоиндустрии придумали писать звук в другом, не совместимым с привычным PCM формате. Формат PDM (DSD) стал основой SACD.
Звук проще (дешевле) оцифровать в DSD, нежели в PCM, но пока существуют трудности в его обработке. ЦАПы с передискретизацией также более технологичны, поэтому имеют минимальную себестоимость.
Для редактирования и прослушивания на привычной аппаратуре существуют программы-корверторы (в т.ч. плагины)
Таблица DSD.

http://md.dozor-auto.ru/ex/mch/DSD_1200.JPG
Некоторое отношение к DSD, как пишут в Сети, имеют форматы DXD и DSD-CD (оба PCM).
Из DXD конвертируют DSD, а из него конвертируют DSD-CD (стандартный CD-DA, но с "понтовой" приставкой)
Для lossless сжатия DSD есть формат DST (MPEG-4 audio)

DSD64 и DST64 обозначают формат 1bit 2,8224MHz (передискретизация 44,1кГц в 64 раза)
DSD128 и DST128 обозначают формат 1bit 5,6MHz (в 128 раз)

На SACD и DVD дисках встречается защита от копирования, создающая трудности при воспроизведении лицензионных дисков.
МК и ВР звук встречаеся и на других носителях, например HD-DVD и Blu-ray (BD-disc).
Предполагается, что диск будут непосредственно смотреть или слушать, а не копировать на жёсткий диск. Скорость считывания не бесконечна, ограничена конкретныви значениями для каждого типа диска, что накладывает ограничения на количество каналов и их качество (в смысле формат звука). Например, для DVD-audio до 6 независимых каналов 24бит\96кГц используя сжатие MLP.

http://md.dozor-auto.ru/ex/mch/ddd_1600.JPG
Нельзя также не упомянуть, что ВР записи могут предлагать на USB-носителях, например "USB Audio Card" (не "звуковуха") и "MasterFlash" (записи *.wav или *.flac).
Большой популярностью в студийной среде пользовался формат PCM 16бит\48кГц (цифровые магнитофоны).
Остались неосвещёнными такие вещи, как
скрытый текст

XRCD2 CD, XRCD24 CD
K2 HD CD
XtractHD CD
DD-ACD (Dolby Digital Audio CD)

Preowned (CD, XRCD, DVD, SACD)
SuperDisc Video

MD (MiniDisc), Hi-MD
DASH
SlotMusic (mp3) и прочее

[свернуть]
Ещё пару слов можно сказать про воспроизведение.
скрытый текст
Если весь процесс воспроизведения происходит на одном устройстве, проблем возникает меньше.
Если на разных, и компоненты приходится стыковать "по цифре" (S\PDIF или HDMI\DVI), нужно обратить внимание на...
S\PDIF сгодится, если передаются данные до ~ 1,5 Мбит\с (от конкретного девайса зависит)

Стерео 16бит\44,1кГц в PCM (2 х 16 х 44,1х10^3 = 1,411Мбит\с)
ядро Dolby Digital (~448\640 кбит\с)
ядро DTS (~768\1509(???) кбит\с)

Некоторые звуковухи могут обеспечить и 2 канала

24бит\96кГц (по оптике)
24бит\192кГц (по коаксиалу), а это уже почти 10 Мбит\с

В среде передачи данных принято измерять скорость в мегабит\с, 1,4Мбит\с означает скорость 1,4х10^6 бит\с.
Объёмы накопителей (дисков, лент) принято измерять в "эМбайтах", 1,4Мбайт означает объём 1,4х2^20 байт.

10^3=1000 и 2^10=1024, в глазах "юзера" разница небольшая, но она имеет значение. И этим пользуются производители жёстких дисков и флешек. Например хард объёмом 2 Тб (имея объём 1,96 терабайта) определяется в ОС всего как 1,78 "Тэ байта". Жёстких стандартов нет, поэтому и скорости передачи иногда указывают в эМбайтах\с или эМбитах\с. И получается, что у некоторых 1,41Мбит\с = 1,35 Мбит\с. А сколько на самом деле?
Ещё один неприятный момент может возникнуть при проигрывании DTS-CD (16\44) через S\PDIF с компа на ресивер (внешний декодер), если звуковуха не поддерживает 44,1 кГц.
Например звуковухи

Встроенная AD1988 внутри 48 кГц, выдаёт S\PDIF только 48 кГц, а
Креатив Аудиджи (sb0570) может выдавать S\PDIF 44,1 кГц, но внутри она, как и предыдущие 48 кГц.
и таких звуковух море!

Нужна звуковуха с аппаратной поддержкой 44,1 кГц, например ESI Juli@ или любая другая на том же контроллере VIA Envy24, даже самой урезанной его версии.
При проигрывании DTS-CD как CD-DA\WAV цифровой поток должен без изменений пройти из файла на цифровой выход и далее поступить в декодер (в ресивере). Если хоть где-то поток изменят - он будет разрушен и негоден для декодирования. Это и происходит, когда внутри звуковухи он "ресемплится" до "удобной" железу частоты. Тот же эффект даёт программная регулировка громкости, микширование и всё остальное непостижимое простым умам, что Винда любит делать.

Например Foobar2000 с драйвером WASAPI (и монопольным доступом к аудио, в обход микшера, на Вин7) - работает

А со стандартным DirectSound - уже не аллё, ни Фубар, ни другие.
Я проверял в конфигурации Вин7х64 Foobar2000 (+WASAPI) -> Juli@ -> S\PDIF коаксиал -> 20 метров экранированного кабеля -> ресивер Ямаха.
Получается, прогнать цифровой аудиотракт DTS "ом - простой и доступный способ узнать, не "ковыряется ли" какая нибудь программа в звуке!!!
Что интересно, пишут S\PDIF коаксиал расчитан на 10 метров, а у меня спокойно шло на 45 м до 48кГц и 20 м на 96кГц. Причём использовал 1 жилу и экран 110-омного балансного кабеля, все соединения "по ГОСТ "у - на скрутках. А какого расстояния можно добиться, использовав, как полагается, 75-омный коаксиал с низким затуханием???
К счастью аудиодорожки в фильмах и DD и DTS обычно 48кГц и проблем не возникает. В меню плеера при поигрывании видео обычно есть пункт прямого вывода звука по цифре.

Если нужно передать больше каналов в высоком разрешении - не обойтись без HDMI.

HDMI первых версий позволяет передать 8-канальный 24бит\192кГц звук в PCM. Если звук в другом формате, его придётся сначала раскодировать на источнике (компе или плеере).
HDMI и DVI последних версий позволяют передавать звук в том формате, в котором он записан на диске, в т.ч. зашифрованный. Раскодировку тогда придётся делать устройству назначения (AV-ресивер, усилитель).

Есть ещё несколько многоканальных интерфейсов (ADAT, TDIF, R-BUS, SDIF, MADI, а также видео SDI), но от бытовой аппаратуры они пока далековаты... зато близки USB и FireWire (iLink).
Сразу вспоминаем про внешние "звуковухи" и блочные ЦАП.
[свернуть]
Простой способ проверки ПЛЕЕР->ДРАЙВЕРЫ->ЗВУКОВУХА описан выше под спойлером.
Изложенный материал не лишён субъективности, не претендует на полноту и точность, ибо собирался из разных, зачастую противоречивых, источников.

Что такое аудио формат DSD


DSD (Direct Stream Digital ) - однобитный аудиоформат, разработанный компаниями Sony и Philips , в котором используется кодирование плотностно-импульсной модуляции , разновидность сигма-дельта-модуляции и применяется для хранения звукозаписей на оптическом носителе SACD (Super Audio CD) .

Изначально SACD предполагался как архивный формат звукозаписывающей компании Sony Music для перевода музыкального архива в цифровой формат.

Аналоговый звуковой сигнал конвертируется в цифровой с помощью дельта-сигма модуляции при частоте дискретизации 2 822,4 кГц (в 64 раза больше, чем у CD Audio при частоте 44,1 кГц ), но с разрешением 1/16 от разрешения в 16 бит . Для снижения уровня шумов в пределах частного диапазона полезного сигнала используется технология «Формирование шума» (перемещение частотного спектра шума дискретизации в верхнюю или нижнюю октавы за пределы слышимого диапазона) реализуется посредствам использования супердискретизации сигнала 64х для уменьшения шума и искажений, вызванных погрешностью квантования аудиосигнала до одного бита.

Избыточное семплирование имеет большое значение при устранении шумов квантования, вносимых квантователем. Поскольку сигнал передискретизирован, соседние отсчеты коррелируют друг с другом. В итоге так называемого «сетевого эффекта» мощность шума в частотном диапазоне, занимаемом полезным сигналом, уменьшается пропорционально повышению частоты дискретизации. Таким образом, отношение сигнал/ шум увеличивается, когда частота дискретизации становится больше. Передискретизация позволяет избежать необходимости предварительного фильтрования и сохраняет гармоники в их первоначальном состоянии. Фазовая характеристика становится более схожей с высокочастотной характеристикой аналоговых систем.

Положительное изменение амплитуды будет представлено всеми «1». Отрицательное - всеми «0». Нулевая точка будет представлена сменой двоичного числа. Поскольку значение амплитуды аналогового сигнала в каждый момент представлено в виде плотности импульсов, этот метод иногда называют плотностно-импульсной модуляцией Pulse Density Modulation (PDM) .

Преимущества формата DSD

  • превосходные частотные и фазовые характеристики
  • помехоустойчивость
  • более простая обработка и коммутация
  • снижение влияния ошибок
  • возможность усовершенствования без ущерба для совместимости носителей
  • oднобитный формат DSD не нуждается в кадровой структуре и не требует многоразрядных шин, что дает несколько важных технических преимуществ:
  • соединение осуществляется одной парой проводников (как в аналоговой технике)
  • нет необходимости создания буфера для хранения многоразрядного слова. Поскольку система одноразрядная, нет также необходимости усложнять её синхронизацией
  • эффекты задержек отсчетов (джиттер) незначительны, поскольку задержка нескольких отсчетов при передискретизации оказывает на аудиосигнал минимальное влияние, так как даже при самой высокой частоте сигнала составляет малую часть периода; в многоразрядных системах задержка на один отсчет будет равняться уже половине периода высокочастотных компонентов сигнала.
  • блоки обработки и микросхемы имеют меньше соединений и могут использовать последовательный интерфейс.
  • DSD способен обеспечить динамический диапазон 120 дБ от 20 Гц до 20 кГц . Значительное повышение уровня шума происходит за границей слышимого диапазона свыше 20 кГц

Применение технологии DSD

Используется в носителях SACD

DSD-диск - оптический диск (DVD-R, DVD+R, DVD-RW или DVD+RW) , содержащий файлы DSD с расширением *.DSF , который может проигрываться на компьютере или другом оборудовании, поддерживающем воспроизведение этих файлов. Содержит аудиофайлы высокого разрешения с частотой дискретизации 2822,4 кГц . Качество аудиозаписи на DSD-диске такое же, как на SACD , с тем отличием, что на первом не может быть записан многоканальный сигнал. Фирмой Sony разработана спецификация под названием DSD Disc Format , которой пользуются некоторые звукозаписывающие фирмы для выпуска DSD-дисков . Этот формат является открытым, и при наличии специального ПО такой диск может быть подготовлен в бытовых условиях и содержать файлы DSD , полученные, например, через Интернет. Фирма Mytek Digital выпускает отличные ЦАП способные напрямую обрабатывать DSD поток, очень популярен их продукт .

С 2010 года в Интернете стали распространяться аудиофайлы DSD , имеющие расширение DSDIFF или DSF . С помощью специального ПО и ЦАПа они могут воспроизводиться на компьютере, либо могут быть преобразованы в ИКМ-файлы для последующего прослушивания.

Сравнение DSD с PCM

Звук SACD сохраняется в формате, называемом Direct Stream Digital (DSD) , который отличается от обычного PCM (Импульсно-кодовая модуляция - ИКМ ) используемого в компакт-дисках или в обычных компьютерных аудио системах.

Рекордер Direct Stream Digital (DSD) использует модуляцию сигма-дельта. Разрешение DSD составляет 1 бит с частотой сэмплирования 2,8224 МГц . Выходной сигнал рекордера DSD чередуется между уровнями положений "включено" и "выключено" и представляет собой двоичный сигнал - bitstream . Долгосрочный средний коэффициент этого сигнала пропорционален исходному сигналу. В DSD используются методы формирования шума для того, чтобы вывести шумы за пределы слышимого диапазона. В принципе, сохранение потока bitstream в DSD позволяет проигрывателю SACD использовать базовую (однобитную) схему ЦАП, которая включает в себя аналоговый фильтр низкого порядка. Формат SACD способен передавать динамический диапазон 120 дБ от 20 Гц до 20 кГц и расширенный частотный диапазон до 100 кГц , хотя большинство имеющихся в настоящее время плееров заявляют верхний предел 80-90 кГц, а 20 кГц является верхним пределом восприятия человеческого слуха.

Процесс создания сигнала DSD концептуально походит на использование 1-битного аналогово- цифрового (A/D) преобразователя дельта-сигма и исключения decimator (прореживателя), который преобразует 1-битный поток bitstream в многобитный PCM . Вместо того, чтобы записывать напрямую 1-битный сигнал, теоретически требуется только низкочастотный фильтр для восстановления исходного аналогового сигнала. На самом деле это сложнее, и аналогия является неполной при таком 1-битном преобразовании сигма-дельта, и в наши дни имеет довольно редкое применение, одна из причин заключается в том, что 1-битный сигнал не может быть должным образом дитерингован: большинство современных преобразователей сигма-дельта являются многобитными.

Из-за характера преобразователей сигма-дельта, прямое сравнение между DSD и PCM не представляется возможным. Однако возможно некоторое приближение, если преобразовать DSD в некоторых аспектах сопоставимый с форматом PCM , который имеет разрядность 20 бит и частотную дискретизацию 96 кГц . Дискретизация PCM - 24 бит обеспечивает (теоретически) дополнительный динамический диапазон 24 дБ .

Ввиду того, что было чрезвычайно трудно осуществить DSP операции (например работу с эквализацией, балансом, панорамированием и другими изменениями в цифровом виде) в 1- битной среде, а также распространенности студийного оборудования, такого как Pro Tools, которое исключительно работает на основе PCM , подавляющее большинство дисков SACD – в особенности рок и современная музыка, которая опирается на многоканальную технику – фактически микшировались в PCM (или микшировалась в аналоге, а записывались на PCM рекордеры), а затем преобразовывалась в DSD для мастеринга в SACD .

Для решения некоторых подобных проблем, был разработан новый студийный формат, как правило, его называют «DSD -wide », который сохраняет высокую частоту дискретизации стандартного DSD , но использует 8-бит , а не однобитовый digital word length, при этом в значительной мере опирается на принцип «формирования шума ». Он становится почти таким же, как PCM (его иногда пренебрежительно называют "PCM - narrow "), но имеет дополнительные преимущества и более практичен при DSP операциях в студии. Главное отличие в том, что "DSD-Wide " по-прежнему сохраняет частоту дискретизации 2,8224 МГц (64Fs) в то время как самая высокая частота РСМ - 352,8 кГц (8FS) . Затем сигнал "DSD-Wide " преобразуется с понижением в обычный DSD для мастеринга SACD . В результате этой технологии и других улучшений, в настоящее время существует несколько цифровых аудио рабочих станций (DAWs), которые работают или могут работать в области DSD , в частности Pyramix и некоторые системы SADiE .

Другой формат для редактирования DSD это DXD (Digital eXtreme Definition) , формат PCM с 24- битным разрешением дискретизации 352,8 кГц (или как вариант 384 кГц ).

Обратите внимание, что PCM высокого разрешения (DVD-Audio, HD DVD и Blu-ray Disc ) и DSD (SACD) все еще могут технически отличаться на высоких частотах. Фильтры восстановления обычно используются в системах декодирования PCM , таким же образом как и раньше, поэтому обычно используются ограничивающие фильтры пропускной способности в системах кодирования PCM . Любые ошибки или нежелательные объекты привносимые такими фильтрами, как правило, влияют на конечный результат. Явное преимущество DSD , заключается в том, что подобная фильтрация не используется. Динамический диапазон DSD быстро спадает при частотах свыше 20 кГц благодаря использованию системы подавления шумов, а также во всех плеерах SACD используется дополнительный фильтр низких частот 50 кГц для обеспечения безопасности, в ситуациях, когда усилители или колонки не будут выдавать искаженный выходной сигнал, если в сигнале присутствует шум свыше 50 кГц .

Схематичное объяснение DSD


Схема PCM (Pulse Code Modulation) Импульсно-кодовая модуляция - ИКМ


Схема DSD (Direct Stream Digital)



Модуляция Дельта-Сигма

Спектральный DSD vs. PCM

DSD как формат кодирования


DSD как формат кодирования


DSD как формат кодирования


Результат кодирования PCM 1FS


Результат кодирования PCM 2FS


Результат кодирования DSD

Записи DSD

  • Существует много записей, которые были преобразованы из оригинальных записей PCM
  • Лейблы Audiophile имеют большие библиотеки записей DSD, которые используется для SACD
  • Записи DSD все более доступны для скачивания через Интеренет

Показатели скорости загрузки

  • Размеры файлов для 3 минутной песни и время загрузки (при условии скорости подключения к Интернет 5 мб/сек)
Redbook (16/44.1kHz) 32 мб 1 мин.
24/88.2kHz 95 мб. 2.6 мин.
24/96kHz 103 мб. 2.8 мин.
24/176.4kHz 190 мб. 5 мин.
DXD (24/352.8kHz) 380 мб. 10 мин.
DSD 127 мб. 3.4 мин.

Оборудование для проигрывания DSD

  • Cуществует много ЦАПов, в которых используются стандартные готовые чипы, которые либо не понимают DSD , либо конвертируют поток DSD через PCM для преобразования в аналоговый звук
  • Есть производители, которые создают ЦАПы, способные конвертировать DSD в аналог напрямую без обходных путей
  • Уже имеется много программ способных проигрывать как DSD так и PCM файцлы на Mac и PC

Открытый стандарт DSD-over-PCM (DoP)

  • Обеспечивает отправку данных DSD по стандартным интерфейсам PCM (например AES/ EBU, SPDIF, USB и т.д.)
  • Без преобразования в PCM !
  • Поддерживается наибольшим количеством производителей ЦАП и программного обеспечения для воспроизведения

Ссылки на внешние ЦАП

Благодаря DoP (DSD через PCM ) любой стандартный интерфейс PCM может использоваться для DSD , а именно:

AES / EBU

  • Плюсы : длинный кабель, синхронизация
  • Минусы : ограниченная частота дискретизации, требуется второй канал для мастер клока

S / PDIF

  • Плюсы : синхронизация
  • Минусы : короткие кабеля, ограниченная частота дискретизации, требуется второй канал для мастер клока

HDMI

  • Плюсы : синхронизация, DSD
  • Минусы : ограниченная частота дискретизации, ограниченная длина кабеля, дороговизна, нет настройки мастер клока

USB

  • Плюсы : стандартный на всех компьютерах, поддержка стандартных операционных систем, открытость (может поддерживать DSD или любые будущие форматы), нет ограничения по частоте дискретизации, не требуется второй канал для мастер клока
  • Минусы : ограниченная длина кабеля, асинхронность

Firewire

  • очень похож на USB , но все менее и менее популярен среди производителей компьютеров