Не секрет, что цифровые форматы аудио и видео записи пришли в наш, реальный мир из виртуального мира компьютеров. Но, имея компьютер и соединение с интернет, можно за пару минут закачать проигрыватель или кодек на любой вкус и формат. С бытовой электроникой, будь то автомагнитола или компонент домашнего кинотеатра, дело обстоит намного сложнее. Поменять прошивку, что бы добавить тот или иной формат или сделать апгрейд существующего, дело довольно хлопотное и зачастую чревато потерей гарантии. А такая покупка делается, как минимум года на три, поэтому к выбору аудиотехники следует отнестись очень серьезно. Тем более, сегодня производители предлагают сразу огромное количество разнообразнейших форматов, и выбрать подходящие подчас бывает довольно трудно. Мы постараемся помочь нашим читателям решить эту задачу, познакомив их с новыми тенденциями на рынке цифровых форматов обработки аудио сигнала.
Такой знакомый, незнакомый CD.
Самый распространенный формат аудиозаписи на сегодня – это Audio CD с импульсно-кодовой модуляцией. Авторитет этого формата пока остается непоколебим, не смотря на том, что в 90-х годах прошлого столетия производители, решили еще повысить качество записи и предложили формат Super Audio CD – детище совместного творчества Sony и Philips.
Audio CD, на сегодняшний день, имеют довольно средние характеристики: тактовую частоту 44 кГц и разрешение 16 бит. Округленная частота сигнала Audio CD составляет около 20 кГц. При этом от разрядности кодирования зависит разрешающая способность передачи аналогового звукового сигнала. Отношение сигнал/шум увеличивается для Audio CD от 96 дБ на 16 битах, до 120 дБ при 20 бит или даже до 144 дБ при 24 битах.
Сегодня даже обычного слушателя сложно удивить динамическим диапазоном звучания в 120 дБ. По этим показателям, обычный CD проигрыватель уже подбирается к профессиональным студийным аналоговым магнитофонам, которые работают на полдюймовой ленте со скоростью 76,2 см/c.
В проигрывателях компакт-дисков используется технологии воспроизведения на основе высокой частоты дискретизации аудиосигнала, при которой даже на самых низких уровнях передачи слушателями не воспринимаются помехи, так называемые «шумы квантования». Второе преимущество компакт-диска, запись на CD — это идеальный материал для перехода на любой из других видов носителей или форматов.
Соображения ли престижа, чисто технические или экономические вопросы привели к тому, что в 1997 году, что Philips и Sony предложили совместную разработку, так называемую Bitstream-технологию, или более понятно Direct Stream Digital, что переводится как «прямой цифровой поток». На основе технологии DSD был предложен формат записи дисков высочайшего качества. И диски, выпущенные с применением формата DSD, не долго думая так и назвали: Super Audio CD (SACD).
Новый формат позволил добиться практически неотличимого на слух, по качеству звучания, любого музыкального материала от своего «живого» оригинала. В этом он заметно превзошел звучание обычного Audio CD. Говоря простым языком, при воспроизведении звукового сигнала в Bitstream-технологии, один бит следует за другим. А частота следования битов (частота дискретизации) принимается значительно более высокой, чем для CD. Это обеспечивает ощутимое на слух повышение точности передачи динамики — разницы между высоким и низким звучанием музыки. При 64-кратной, по сравнению с Audio CD, величиной частотной сигнал изменяется не 44100 раз в 1сек, а 2822400 раз. Это значит, что за 1сек передается более 2,8 млн. бит. Ресурс обычного Audio CD позволяет использовать только четверть этой величины.
Стоит еще заметить, что диски формата SACD являются гибридными двухслойными носителями, на которых, кроме самого SACD, записана та же информация и в варианте стандартного Audio CD. Что делает записи доступными с обычных CD-проигрывателей, повышая потребительскую ценность формата.
DVD — вместе мы сила!
Основным конкурентом Audio CD эксперты считают формат DVD-Audio. Напомним, что DVD правильно переводиться как Digital Versatile Disk, что означает — «Цифровой Универсальный Диск», а не «Цифровой Видео Диск», как считают многие. Всем, что связано с ДиВиДи занимается огромный консорциум производителей, насчитывающий более 250 компаний, объединенных в DVD Forum. На съезде которого, в марте 1999 года, и было объявлено о выходе рабочего релиза формата DVD-Audio. Новый формат позволяет поддерживать до шести дорожек информации, производители не стали экономить, и заложились на тактовую частоту сэмплироания до 192 кГц с разрешением до 24 бит.
Сразу напрашивается вопрос, зачем это нужно, так как «среднестатистическое» ухо не способно воспринимать записи сделанные с частотой более 64 кГц? Но как оказалось, резон в этом есть. Такое решение позволило снизить погрешности оцифровки, которые проявляют себя в виде шумов, как раз в слышимом диапазоне.
В целом DVD-Audio диск идентичен DVD-Video, сохраняя свое главное достоинство — на него помещается почти в семь-восемь раз больше информации, чем на CD. А при использовании технологии изготовления двух- и трехслойных DVD дисков, емкость можно повысить до 17 Гб информации, т.е. в 24 раза больше, чем на Audio-CD!
В качестве стандартного решения для DVD-Audio принята технология DVD-9 – односторонний двухслойный диск, емкостью до 8,5 Гб.
Еще один интересный момент, DVD-Audio можно записывать с различными частотными характеристиками: 48, 96, 192 кГц при 16, 24 и 24 битах соответственно. Кроме всего прочего DVD-Audio диск поддерживает как стерео, так и многоканальный вариант записи, поддерживает DTS и Dolby Digital, может хранить сведения об исполнителе, тексты песен, комментарии, фото и даже видео.
Здравомыслящий читатель вправе спросить, на основе чего был сотворен данный аудиомонстр? Стандарт DVD поддерживает максимальную скорость передачу информации с диска на проигрыватель до 6,144 Мб/с. Это позволило получить комбинации из 8 каналов на частоте 48 кГц при 16 битах, 6 каналов – 48 кГц/20 бит, 4 канала – 96 кГц/16 бит, 3 канала – 96 кГц/20 бит, 2 канала – 96 кГц/16 бит. «Перескочить» сразу на 96 кГц при 24 бит в формате DVD возможности не было предусмотрено.
В DVD-Audio применили новый протокол MLP (Meridian Lossless Packing), который сжимает хранимую информацию с компрессией 2:1, с одной стороны, и позволяет передавать информацию с максимально высоким битрейдом, с другой стороны. Что позволяет получить при воспроизведении до шести каналов звука с рабочей частой 96 кГц при 24 битах.
Существенной особенность формата является уникальная система защиты от копирования. Копирование таких дисков практически исключено из-за наличия цифровых «ключей», которые внедрены как в саму информацию, но и нанесены на поверхности диска. Наличие ключей проверяется сразу при загрузке диска. Вторая ловушка для пиратов — это специальная микросхема, которая стоит в цепочке воспроизведения аудиозаписи. Поэтому воспроизведения дисков такого формата возможно только на специализированных проигрывателях.
Пути перспективного развития данного формата в унификации и сливании с DVD-Video. И следующим шагом будет появление DVD-AV, что-то среднего между аудио- и видеодисками.
Главный пиратский калибр
Лозунг «старый звук на новом носителе» в можно смело отнести именно к МР3 или, что более правильно — MPEG Audio Layer 3. Гамма форматов MPEG лишний раз продемонстрировала, что такое эрзац в мире аудио- и видеозаписи.
И сразу оговоримся, что хотя формат MP3 является лицензированным и не подлежит свободному распространению (за лицензию использовать его в аппаратуре производители обязаны заплатить пару-тройку долларов владельцу патента) именно МР3 можно назвать «пиратским» форматом, так он практически не содержит в себе какой-либо защиты от копирования информации.
Вопрос качества воспроизведения аудиозаписей, не относящихся к классу Hi-Fi сам по себе довольно субъективен. Тут главная оценка — объем информации на единицу емкости. Тем не менее, кое-какие выводы сделать можно. Основные рабочие параметры формата МР3 лежат в пределах частот от 20 кГц (при плотности потока 256 кбит/с) и до 16 кГц (для 128 кбит/с). Степень сжатия аудиозаписи характеризуется шириной звукового потока — битрейтом (bitrate) и выражается в количестве килобит (тысяч бит), использующиеся для кодирования секунды звукового потока. Пользователь при кодировании может задавать битрейт от 320 кбит/с, до 64 кбит/с и ниже. Это позволяет серьезно повысить качество и сократить размеры файла.
Поток в 128 Кбит/с считается оптимальным, так как редко кто хорошо воспринимает звуки с частотой более 20 кГц, и для воспроизведения таких записей вполне достаточно аппаратуры среднего качества. Так что можно с уверенностью сказать — формат МР3 имеет приемлемые показатели качества воспроизведения, но не предназначен для настоящих меломанов.
Изначально МР3 поддерживает один или два канала, то есть подразумевает выбор между моно и стерео. Как в старые, добрые времена. На высококлассной аппаратуре конечно можно добиться качества воспроизведения МР3-записи с битрейтом 256 кБ или даже 320 кБ, практически не отличимого по качеству от Audio CD, можно разложить сигнал на дополнительные каналы… Только вот стоит ли это делать?
В формате МР3 используется модель «психоакустического сжатия». Уменьшение объема записи достигается за счет «отсекания» лишних битов информации по определенному правилу-алгоритму. Если в лоб сжать запись в 10 раз, убрав каждые 9 единиц информации из 10, то полученный в результате звук будет мало похоже на музыку. В основу формата сжатия МР3 положены особенности человеческого слуха.
Т.е. идентичность исходной и конечной звуковой волны не самоцель — главное, чтобы слуховое восприятие в обоих случаях было практически одинаковым. Используемая модель базируется на утверждении, что звук, в котором соседствуют волны различной частоты и громкости, воспринимается не полностью. Многие звуки экранируют, накладываются друг друга, громкие заглушают тихие. И значит, что этими частотами (звуками) можно расстаться без сильной потери качества. Полученный после отбрасывания излишней звуковой информации поток данных сжимается по алгоритму Хаффмана (аналогичный алгоритм применяется в популярном архиваторе RAR).
Формат MP3 является достаточно гибким и позволяет варьировать степень сжатия. Тем самым пользователь имеет выбор: пожертвовать качеством для достижения минимального объема или получить больший файл с более высоким качеством.
Еще в июле 2001 года компанией CodingTech., вместе с TomsonMulimedia и институтом Fraunhofer был анонсирован формат MP3Pro, в качесве прямого продолжением, или точнее, развитием старого MP3. MP3Pro совместим с MP3 «вперед» полностью и «назад» частично. То есть файлы, закодированные с помощью MP3Pro, можно воспроизводить в обычных проигрывателях, однако качество звучания при этом заметно хуже, чем при воспроизведении в специальном MP3Pro-проигрывателе. Это связано с тем, что файл в формате MP3Pro несет в себе два потока аудио: один — стандартный в формате MP3, а другой – специальный, дополнительный поток. Обычные проигрыватели MP3 распознают в новом формате только один, первый из перечисленных, поток, это и обуславливает лишь частичную совместимость «назад».
В MP3Pro использована новая технология SBR (Spectral Band Replication). Эта технология предназначена для передачи верхнего частотного диапазона. Идея технологии и ее предпосылки следующие: дело в том, что как и алгоритмы компрессии данных без потерь ограничены в своей эффективности, так и технологии, основанные на использовании «психоакустической» модели, имеют один общий недостаток: все они работают качественно до битрейта 128 кбит. На более низких битрейтах начинают проявляться сильные искажения звучания: бульканье, позвякивания, заметные скачки уровня сигнала на различных частотах и проч. Единственный найденный способ борьбы с этим явлением заключается в урезании частотного диапазона сигнала перед компрессией. Однако эта процедура также отрицательно сказывается на восприятии звучания. Все это показывает, что для получения более-менее качественного звучания на низких битрейтах использования «психоакустической» модели недостаточно.
Новая технология SBR от Coding Tech. дополняет использование «психоакустической» модели. В файле передается (кодируется) чуть более узкий диапазон частот, чем обычно (с «урезанными верхами»), а верхние частоты воссоздаются уже самим декодером на основе имеющейся небольшой дополнительной информации о более высоких частотных составляющих. Таким образом, технология SBR применяется фактически не столько на стадии сжатия, сколько на стадии декодирования. Технология SBR в MP3Pro задействована следующим образом. Основные данные кодируются в несколько более зауженном, чем обычно, диапазоне частот в MP3 и записываются в первый основной поток MP3Pro. Второй, параллельный поток данных, невидимый для обычного MP3-проигрывателя, несет ту минимальную необходимую информацию, которая используется при воспроизведении для восстановления верхних частот.
MPEG-2 — узник сжатия ААС
Формат аудиосжатия MPEG-2 AAC (MPEG-2 Advanced Audio Coding – «Продвинутое аудио кодирование») был разработан в стенах института Fraunhofer, при активном участии компаний AT&T, Sony, NEC и Dolby в начале 1998 года. Этот формат изначально позиционировался разработчиками как преемник MP3, так как обладал по сравнению с последним рядом несомненных достоинств. Как и в MP3 в основе алгоритма AAC лежит «психоакустическая» модель кодирования, то есть при сжатии какая-то часть звукового спектра удаляется. При этом алгоритм AAC содержит большое количество усовершенствований, направленных именно на улучшение качества выходного аудиосигнала. В MPEG-2 AAC используются другие алгоритмы преобразований, улучшенные обработчики шумов и новый банк фильтров. Из специальных возможностей можно назвать, так называемые «водяные знаки» — информацию об авторских правах, которую AAC позволяет хранить в теле аудиокомпозиции, причем удалить эту информацию не разрушив целостность аудиоданных невозможно.
При этом MPEG-2 AAC обладает высочайшим качеством звучания и очень хорошей степенью компрессии аудиокомпозиций. И вполне возможно этот формат заменил бы устаревающий MP3 если бы не одно но…
Сразу же после окончания работ над MPEG-2 AAC некоторые из компаний соучредителей забрали причитающиеся им исходные коды стандарта и на их базе создали собственные форматы, коммерческие и не совместимые друг с другом. Вот таким образом и появилась та мешанина несовместимых форматов, которые называют «семейство форматов аудиосжатия AAC». На данный момент существуют четыре разновидности формата AAC: Homeboy AAC, AT&T a2b AAC, Liquifier PRO AAC, Astrid/Quartex AAC. Все эти модификации несовместимы между собой, имеют собственные кодеры и неодинаковы по качеству. Так, последние две модификации по ряду параметров превосходят первую пару.
И это при всем том, что MPEG-2 AACимел такие достоинства: объем файла на четверть меньше чем MP3 при том же качестве и увеличенное максимальное количество каналов, с 2 у MP3 до 48.
Неуловимый ковбой OGG
При всех, очевидных недостатках качества хранения музыкальной информации в формате МР3, количество интересной музыки со временем не уменьшается, хранить аудиодиски в порядке становится всё сложнее — они занимают слишком много места, что особенно становится заметно в автомобиле. Обычный для многих выход — коллекционирование звука в МР3 — пока что спасал. Пока… в середине 2000 года не вышел релиз формата Ogg Vorbis, и относительно недавно было объявлено о появлении окончательной версии формата. Информация о нем пока слишком скудная, и до сих пор формат является наиболее темной лошадкой, среди способов аудио компрессии. Хотя некоторые издания уже нарекли Ogg «убийцей МР3», в ответ на громкое уверение его создателей, в том, что он призван заменить собой все платные патентованные аудиоформаты и создать полностью открытую систему мультимедиа. Этим Ogg Vorbis отличается от формата MP3, разработанного в институте Фраунгофера и распространяющегося по коммерческой лицензии.
Как утверждают разработчики, файлы в формате Ogg Vorbis получаются меньшего размера, чем при сжатии в формате MP3. Это достигается за счет более совершенной технологии кодирования с переменным битрейтом. Суть ее заключается в том, что различные фрагменты звукового потока кодируются с различным битрейтом, в зависимости от их сложности и насыщенности. Это позволяет серьезно повысить качество и сократить размеры файла.
Все это вылилось в основное преимущество алгоритма Ogg Vorbis, в сравнении с другими форматами сжатия, заключается в существенно лучшем качестве звучания при почти вдвое меньшем объеме записи и одинаковой частоте оцифровки.
При более детальном препарировании формат Ogg Vorbis представляет из себя не патентуемый и не нуждающийся в лицензировании аудиоформат с открытым кодом, обеспечивающий скорость от 16 до 512 бит и частоту сэмплироания от 8 до 48 кГц. По своей сути он близок к формату MP3, однако есть и отличия. Формат не ограничен двумя аудиоканалами (стерео) и способен поддержать до 225 отдельных каналов. В заголовке файла может размещаться информация о песне, исполнителе, в описание можно вставить даже изображения. Формат изначально поддерживает тэги с кириллицей в кодировке UTF-8.
«Психоакустическая» модель, используемая в Ogg Vorbis по принципам действия тоже близка к МР3 и подобным ему, но и только — математическая обработка и практическая реализация этой модели в корне отличается, что существенно влияет на качество звучания.
При всем «единстве противоположностей» MP3 и Ogg Vorbis достаточно сложно сравнивать. Субъективно, последний на слух воспроизводится гораздо лучше. Кроме этого есть ряд других принципиальных отличий – например, пороговая максимальная частота оцифровки у Ogg, не 44 Кгц как в MP3, а 48.
Для наглядности качество кодирования с использованием переменного битрейта, можно очень хорошо оценить по десятибалльной шкале. При этом, для сравнения,: 0 сопоставим с качеством МР3 на 64 кбит/с., 5 – примерно соответствует 160 кбит/сек., и 10 дает приблизительно около 400 кбит/сек.. Для среднестатистического слушателя вполне достаточно качества 5-6 балов, что радует — остаются и резервы для совершенствования.
Похоже, что у формата действительно большое и светлое будущее. Он уже появился в промышленных образцах китайский производителей аудиотехники. DVD проигрыватели с поддержкой Ogg уже присутствуют в каталогах HAIER, MICO, SHINKA с 2004 года. Радиостанция BBC, ещё в 2002 году, начала интернет-вещание, передавая потоковое аудио с расширением .ogg. Не смотря на это, более именитые производители аудиотехники, пока взирают на новый формат со спокойствием олимпийцев.
Грянет ли эра NERO?
В заключении можно коснуться еще двух цифровых аудио-форматах компьютерного мира, которые хищно поглядывают на рынок медиаиндустрии.
С ростом популярности пишущих CD-ROM, все большую известность приобретают программы записи от компании NERO. И видимо, на волне успеха своего программного продукта разработчики выступи с заявлением, что в ближайшее время следует ожидать появление нового формата компрессии данных NERO Digital, который будет применим и для создания аудиозаписей.
Тем более, в соответствии с условиями договора, заключенного между компаниями Ahead Software и ESS Technology, последняя уже, реализует поддержку Ahead NERO Digital в своих наборах микросхем семейства Vibratto, предназначенных для применения в потребительских DVD-проигрывателях. Благодаря этому у владельцев таких плейеров появится возможность проигрывать на них видеозаписи, закодированные при помощи упомянутого формата (ранее и кодирование, и воспроизведение подобных записей возможно было только на ПК). Как заявляют в Ahead, ее формат обеспечивает максимальную совместимость со спецификациями стандарта MPEG, поддерживая как последний его вариант. NERO Digital обеспечивает возможность формирования DVD со стандартными функциями — разбиение на эпизоды, субтитры, многоязычные звуковые дорожки. В качестве аудиостандарта в NERO Digital используется MPEG-4 AAC.
Первый промышленный образец проигрывателя с поддержкой NERODigitalвыпустила фирма XORO.
Слово за дядюшкой Билли
Ну и конечно, как же можно было обойтись без вездесущей Microsoft? В планах компании продвигать на рынке совой формат WMA.
Немножко истории формата WMA.
Компания Voxware, известная своими разработками в области мультимедиа, непоседливостью и большим интересом ко всему новому и передовому в мае 1998 года примкнула к проекту TwinVQ, разработанному творческой группой Human Interface Laboratory, являющейся подразделением компании NTT, с целью развития и усовершенствования формата vqf, который но тот момент был еще очень сырым и не оптимизированным. Содружество это увенчалось успехом — стандарт VQF был доработан и приобрел тот вид, в котором мы его видим и сейчас.
Ну, а компания Voxware, убедившись, что и без нее дела идут неплохо, решительно пустилась в самостоятельное плавание. Используя собственные новаторские идеи, а так же некоторые фрагменты технологии TwinVQ, приобретя на эту разработку определенные права, Voxware создала собственный формат, с хорошим потенциалом, в этом формате было впервые достигнуто качество МР3 128 кбит на битрейде всего 64 кбит.
И, самое главное, поддержка этого формата была включена компанией Microsoft среди прочих аудиоформатов, в бесплатный Media Player. И в один прекрасный день руководство фирмы Microsoft вдруг осознало, что множество компаний в мире производит программные кодеки для сжатия звуковой информации. При этом компания Microsoft, которая бьется за звание крупнейшего мирового монополиста еще ничего не сделала в этой области, продолжая использовать в качестве основного звукового формата своих операционных систем несжатую аудиоинформацию в виде .wav файлов.
К чести Microsoft, стоит отметить, что эта компания не сразу кинулась в погоню за конкурентами заполучив новинку, а предварительно хорошо поработала над этим в общем-то сыроватым кодеком доведя его до ума и лишь потом выпустила в широкие массы. Этот кодек хоть и вышел позднее других, зато обладал гораздо более высокими характеристиками и главное — был бесплатен! Похоже, Microsoft изобрела наиболее эффективный способ уничтожения конкурентов — делать собственные продукты бесплатными, но с поддержкой только Windows.
Новорожденный формат назван WMA — Windows Media Audio. Этот формат позиционируется своими создателями как преемник целой плеяде устаревающих аудиоформатов, начиная с Real Audio и заканчивая MP3.
Но, похоже, что WMA может сменить не только устаревающие форматы, но и относительно новые. Вот несколько фактов.
Файлы WMA с 64 кбит лучше звучат, чем MP3 файлы с 128 кбит, или по крайне мере, обладают тем же качеством. Формат работает на частоте в диапазоне от 22 кГц до 48 кГц (по умолчанию 44 кГц). Что еще является существенным достоинством — формат WMA один из немногих, кто поддерживает нормальную перемотку, то есть переход на любое место композиции происходит мгновенно.
От MS трудно ожидать прорыва в технологии качественной аудиозаписи, но побороться за бюджетную нишу записывающих и воспроизводящих устройств, да преподнести любопытные сюрпризы, в рамках всеобщей глобализации, Билл Гейтс вполне может себе позволить.
Так, например, обновив в очередной свой Windows XP и запустив на какую то запись, следы появления которой на моем жестком диски были давно утеряны, проигрыватель выдал мне информацию с какого диска эта мелодия, где-то нашел кое-что об авторе и исполнителе, и не навязчиво предложил купить лицензионный диск…
Среди производителей дисков постоянно идут споры, которые периодически выливаются в настоящие войны форматов за кусок рынка и уши слушателей. И это будет происходить до тех пор, пока не будут выработаны единые технические нормы и стандарты звукового диска.
Но выработка этих самых норм и стандартов сама по себе является поводом для очередной войны. Первого выстрела, который нарушит равновесие мира аудионосителей, пока не прозвучало, но в воздухе уже ощутимо «запахло порохом». В заключении хочется напомнить, что никакие, рожденные в муках, решения производителей, никакие нормы, не смогут спрогнозировать — будет ли данный продукт пользоваться спросом. Так как это зависит от очень многих посторонних факторов: благосостояния общества, жадности владельцев авторских прав, политики Всемирной Торговой Организации и даже… от пассивности местных компетентных органов к производителям пиратской продукции.