Реферат: Мультимедиа технологии. Графические форматы. Курсовая работа Мультимедиа. Форматы звуковых файлов

В этой статье мы рассмотрим инструменты для конвертации видео и аудио, разберемся в форматах мультимедиа и выберем лучшие инструменты для преобразования файлов.

Хотим мы того или нет, но не может быть так, чтобы в мире цифровых развлечений целиком доминировал некий единственный формат. Тот же MP3 сегодня успешно заменяется OGG и AAC, AVI - MPG, FLV и проч. На самом деле, существенной проблемы в таком разнообразии нет.

Разделение форматов мультимедиа - это необходимость. У каждого формата - своя специфическая особенность, причина, по которой может или должен быть использован он, а не какой-либо другой. Зачастую все упирается в экономию - в нашем случае, экономию пространства жесткого диска. В каждом случае есть формат, наиболее выигрышный в данной ситуации и менее оптимальный. Сегодня мы сделаем следующее: во-первых, вспомним, какие мультимедиа форматы наиболее востребованы при конвертации видео/аудио и, во-вторых, рассмотрим необходимый набор . Подчеркиваем: мы рассматриваем только мультимедиа форматы - а именно звук и аудио.

Часть I. Форматы и кодеки для конвертации

Поскольку нельзя объять необъятное, мы затронем только самые распространенные и востребованные мультимедиа форматы, кодеки, дадим их краткое описание и пояснение, в каких случаях их лучше всего использовать. При описании мы также представим список программ, которые каким-либо образом связаны с данным форматом. Ссылки приводить не будем, все программы вы сможете найти на сайт .

Видеостандарты

MPEG -1

MPEG -1 - стандарт, принятый группой экспертов MPEG (Moving Picture Experts Group - группа экспертов в области видео). На данный момент видео в MPEG -1 используется в на Video CD (качество VCD наиболее близко к качеству VHS видеокассет).

Изначально использование MPEG -1 видео ограничено скоростью потока1.5 Мегабита/c и разрешением 352?240. Однако данный стандарт позволяет использовать любое разрешение вплоть до 4095?4095.

MPEG -2

Стандарт MPEG -2 используется для при вещании, включая спутниковое вещание и кабельное телевидение. Имеет жесткие ограничения по разрешению (не более 720 ? 576), частоте кадров (25 к/с и 29.97 к/с), битрейту и др.

MPEG -3

Стандарт кодирования аудио и видео для телевидения высокой четкости (HDTW - High-definition television) со скоростью передачи данных от 20 до 40 Mбит/с. Работа над MPEG -3 была прекращена после модификации MPEG -2 (когда стандарт MPEG -2 не хуже MPEG -3 стал справляться с обработкой видео).

Не следует путать MPEG -3 с музыкальным форматом MP3 (MPEG -1 Part 3 Layer 3/MPEG-1 Audio Layer 3).

MPEG -4

MPEG -4 используется для сжатия цифрового аудио и видео. Предназначен для вещания в Интернете (потоковое видео, видеотелефония), кодирования и записи фильмов на компакт-диски, (видеотелефон) и широковещания.

Видеокодеки

DivX (Digital video express)

Самый известный видеокодек для платформ Microsoft Windows и Mac OS X, которым сегодня сжимаются большинство фильмов. Сжатие позволяет разместить полуторачасовой видеоматериал на 1 - 2 CD. Распространяется он в двух версиях: DivX и DivX Pro. DivX бесплатный (AdWare), его можно использовать без ограничений, второй - платный. Приставка “Pro” стоит $19.99 вместе с дополнительными возможностями пакета и преимуществами перед бесплатной версией. Это:

Лучшая компрессия (около 25%) видео,
- поддержка технологии GMC (Global Motion Compensation), которая улучшает качество видео и немного улучшает степень сжатия,
- DivX Pro обеспечивает полную поддержку двунаправленного кодирования (B-frames),
- включает в себя дополнительный инструментарий для кодирования видео.

Программы для работы с DivX

DivX Player - официальный проигрыватель от создателей видеоформата DivX.

DivX Subtitle Displayer - программа для отображения субтитров при воспроизведении DivX видео.

DivFix - утилита для восстановления поврежденного DivX видео.

DivX AntiFreeze – некоторые видеоклипы имеют поврежденные кадры. AntiFreeze препятствует “замораживанию” видео.

Dr. DivX - программа для перегона видео с различных источников (из файла, с видеокамеры, ТВ и т.д.) в видеофайлы в формате DivX. Утилита умеет работать с MPEG1, MPEG2, MPEG4, AVI и WMV .

Библиотека преобразования видео стандарта MPEG -4, распространяется по GNU General Public License. В отличие от кодека DivX, который выпущен только для платформ Microsoft Windows и Mac OS X, Xvid - продукт кроссплатформенный (используется на всех платформах и операционных системах, для которых можно скомпилировать исходный код кодека).

Как можно заметить, название кодека - “перевертыш” от DivX. На практике, Xvid - это и есть альтернатива DivX. Кодек отличается быстрой скоростью работы и приемлемым качеством изображения. Настраивается как через сторонние программы, так и через собственное окно настроек.

Программы для работы с Xvid

На сегодня существует большое количество разновидностей (компиляций) Xvid, которые с одинаковым успехом позволяют просматривать, конвертировать видео на телефоны, диски и др. носители.

Koepi XviD - одна из таких компиляций.

Nic’s XviD - еще один популярная сборка, включающая Xvid.

Windows Media Video

Система кодирования, разработанная компанией Microsoft. Входит в мультимедийный пакет Windows Media. Существует в нескольких версиях: Microsoft MPEG -4 Video Codec, Windows Media Video 9 и др. Несмотря на то, что с DivX видео WMW конкурировать не может, он активно используется в разработке медиа- и игровых приложений под платформу Windows.

Программы для работы с WMV

Windows Media Encoder - кодек и оболочка для кодировщика.

Windows Media Video 9 VCM - аналогично с предыдущим, но не включает в состав графическую оболочку.

Ligos Indeo

Вначале кодек Ligos Indeo разрабатывался Intel, но затем был взят на доработку компанией Ligos. Сейчас кодек позволяет просматривать видео под разными битрейтами, соответственно, с адаптивным качеством. Ligos Indeo поддерживает процессорную инструкцию MMX (правда, у DivX поддерживаемых инструкций куда больше).

Программы для работы с Ligos Indeo

Intel Codec Installer - поставляет так называемый кодек I263, который делает возможным проигрывание электронных открыток и видео в формате Ligos Indeo.

Intel JPEG Library Video Codec (ijlvid) - специальный драйвер, основанный на библиотеке Intel JPEG , поддерживающий декомпрессию в RGB24 и компрессию форматов RGB24 и YUY2.

Intel Music Coder - благодаря этому пакету можно прослушивать видео формата AVI со звуком, кодированным в IMC .

Apple QuickTime

Этот бесплатный пакет кодеков достаточно известен не только пользователям продукции Apple. Доступен для загрузки с сайта Apple (www.apple.com) вместе с программой для воспроизведения видео в quicktime- формате, которая так и называется - QuickTime.

Программы для работы с Apple QuickTime

QuickTime - программа для воспроизведения файлов формата MOV /QT. К сожалению, портированная в Windows версия обладает множеством недостатков (неудобство интерфейса, неоправданная ресурсоемкость и т. п.).

QuickTime Alternative - альтернатива QuickTime. Пакет содержит кодеки и программы для воспроизведения видео в формате quicktime .

DScaler MPEG

Программы для работы с DScaler MPEG

GPL MPEG -1/2 DirectShow Decoder Filter , Stinky’s MPEG -2 Codec - позволяет проигрывать файлы формата MPEG -1 и MPEG -2 в Windows Media Player и др. плейерах.

Dscaler - программа для захвата и обработки видео MPEG формата.

TrueMotion VP6

TrueMotion VP6 - конкурент MPEG4 кодеков DivX и Xvid. На невысоких битрейтах даёт заметно лучшую картинку, чем последние. В последнее время многие видеоролики закодированы именно в VP6 и имеют формат FLV . Взамен TrueMotion VP6 предлагается усовершенствованная версия - VP7.

Программы для работы с VP6

Браузеры с поддержкой Flash, видеоплейеры.

Free FLV Converter и Any Video Converter - соответственно платный и бесплатный конвертеры из FLV в другие видеоформаты.

Совет. Если хотите, чтобы все вышеперечисленные пакеты были установлены на вашем компьютере вы и не желаете скачивать каждый кодек по-отдельности, загрузите и установите универсальный и бесплатный пакет K-Lite Pack (www.codecguide.com). Распространяется он в 5 версиях:

  • Basic - содержит в себе необходимый минимум: кодеки DivX и Xvid.
  • Standard - более расширен по сравнению с предыдущим пакетом. Позволяет проигрывать распространенные и не самые известные форматы.
  • Full - пакет, в наибольшей степени предназначенный для кодирования/декодирования видео. Включает все необходимые для этих операций инструменты.
  • Corporate - корпоративное решение. Очень похоже на пакет Full.
  • Mega - Full-версия плюс набор кодеков Real Alternative.

Видеоформаты

MPG

Основной формат MPEG . Файл с данным расширением содержит MPEG1 видео + MP2 (MPEG -1 layer 2) или реже MP1 аудио.

VOB

Формат MPEG файлов на DVD -Video дисках. Представляет собой тот же MPG , но с субтитрами и звуковой дорожкой не-MPEG формата (это может быть AC-3 аудио.

AVI

AVI (Audio Video Interleaved - Аудио + Видео + Слоёные) - формат, разработанный компанией Microsoft.Чаще всего применяется для хранения MPEG4 видео. В настоящий момент Microsoft рекомендует использовать вместо AVI формат ASF .

ASF

ASF (Active Streaming Format) - еще одна разработка Microsoft. Существует два варианта ASF - v1.0 и v2.0. С некоторого времени ASF файлы имеют расширения WMA или WMV .

MOV /QT

Формат разработан компанией Apple. QuickTime - рекомендованный формат для MPEG4. MOV файлы идут с расширением MPG или MP4. Видео и аудио в этих файлах - не что иное, как MPG и AAC .

RealMedia

Формат потокового вещания. Характеризуется, с одной стороны низким качеством изображения на высоких битрейтах и, с другой - хорошей степенью сжатия. Это позволяет воспроизводить музыку и видео в сети Интернет в “демонстрационном” качестве. Файлы формата RealMedia имеют расширение *.RM, *.RAM или *.RMVB.

Аудиоформаты (в сокращении)

ASF

ASF (Advanced Streaming Format, не путать с одноименным видеоформатом) - стандарт аудио для OC Mac. Большой размер файла и качество, приближенное к AudioCD.

FLAC (Free Lossless Audio Codec)

FLAC (Free Lossless Audio Codec) - сжатие звука до 50 процентов без потери качества звучания.

WAV

Стандартный формат для Windows. Звук хранится без потери качества и, соответственно, файл занимает много пространства на диске.

FLAC (англ. Free Lossless Audio Codec - свободный аудиокодек без потерь) - популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC , не удаляет никакой информации из аудиопотока и подходит как для прослушивания музыки на высококачественной звуковоспроизводящей аппаратуре, так и для аудиоколлекции. Поддерживается многими аудиоприложениями.

AIFF

Формат файлов для платформы Mac OS. Характеризуется высоким качеством звучания, поскольку не подвержен сжатию (т. н. формат loseless).

Monkey’s Audio - популярный формат кодирования цифрового звука без потерь. Распространяется бесплатно вместе с открытым исходным кодом и набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. Файлы Monkey’s Audio имеют расширения APE для хранения аудио и APL для хранения метаданных.

WMA (Windows Media Audio) - формат, разработанный компанией Microsoft для хранения и трансляции аудио-информации. Изначально формат WMA задумывался как альтернатива MP3, но на день Microsoft противопоставляет ему другому формату - AAC . Файлы, сжатые этим кодеком, примерно в четверть более объемные, чем OGG , хотя формат WMA характеризуется неплохой способностью сжатия, что позволяет ему на низких битрейтах «обходить» по качеству звучания MP3.

MP3 формат сжатия с потерями. Вкратце, алгоритм компрессии звука такой: звуковая информация, которую человек воспринять не может, из записи удаляется.

Объективно MP3 нельзя назвать “лучшим”, “оптимальным” форматом. Главное его достоинство - формат распространен настолько, что проблем с программной/аппаратной несовместимостью быть не может. Степень сжатия можно варьировать, в том числе в пределах одного файла. Интервал возможных значений битрейта составляет 8 - 320 кбит/c. Большая часть музыки, распространяемая в Интернете нелегальным способом, имеет битрейт от 128 до 256 (в редких случаях 320) kbps. Для ознакомительного слушания такого качества вполне хватает, но для хранения в аудиоколлекции мы порекомендуем использовать OGG или AAC . По соотношению размер/качество выигрывает AAC .

AAC

AAC (Advanced Audio Coding) - наиболее вероятная альтернатива MP3 (как еще говорят - “результат эволюции MP3-файлов ”). Формат продвигается компанией Apple - в частности, в известном онлайновом музыкальном магазине iTunes. Иногда AAC встречается и на других сервисах по продаже музыки.

При сжатии AAC теряет меньше, чем MP3, звуковой информации. В результате, при одинаковом размере AAC по качеству опережает MP3. Более того, в данном формате есть возможность сжимать аудио без потери качества (профиль ALAC ). Другие особенности по сравнению с MP3:

Частоты с 8 Гц до 96 кГц (MP3: 8 Гц - 48 кГц)
- До 48 звуковых каналов
- Большая эффективность кодирования при постоянном звуковом потоке
- Большая эффективность кодирования при изменяющемся звуковом потоке

Формат файлов:

M4A - незащищённый файл AAC ,
M4B - файл AAC , поддерживающий закладки (используется для аудиокниг и подкастов),
M4P - защищённый файл AAC . Используется в онлайн-магазинах для защиты файла от копирования.

OGG

Ogg Vorbis - относительно новый формат аудиокомпрессии (официально появившийся летом 2002 года). Поскольку лицензия, по которой он распространяется, полностью открыта, OGG “прижился” в качестве основного формата в среде Linux. OGG позволяет в достойном прослушивания качестве сжимать треки (8kHz-48.0kHz, 16+ бит, битрейт от 16 до 128 kbps на канал). Это ставит формат в один ряд с AAC , WMA и, разумеется, MP3. Психоакустическая модель, используемая в Vorbis, близка к MPEG Audio Layer III , но практическая реализация этой модели несколько иная. Поэтому при прослушивании OGG файлов можно заметить ощутимую разницу (как на на высоких, так и на низких битрейтах) по сравнению с другими форматами.

Любой пользователь компьютерных систем, мобильных устройств или интернета практически каждый день сталкивается с файлами мультимедиа. Что такое медиафайл? Далее предлагается рассмотреть этот вопрос подробнее. Впрочем, ничего особо сложного в понимании всей концепции мультимедиа нет.

Что такое медиафайл в общем понимании?

Начнем, пожалуй, с самого элементарного. Как правило, к мультимедиа относят все то, что связано с файлами video, audio и графики или их сочетанием, причем даже с содержанием текстов. По большому счету, даже презентации, созданные в Power Point, которые содержат один или несколько из вышеперечисленных объектов, тоже можно отнести к некой разновидности мультимедиа, хотя считается, что это именно презентация, а не мультимедиа только по той простой причине, что такие файлы программными или «железными» проигрывателями не воспроизводятся.

Именно эти три большие группы и представляют основные направления всей категории мультимедиа. Однако для всех трех классов можно привести еще и дополнительную классификацию, разделяя их по форматам или содержанию. Так, например, в категории видео в плане содержания могут присутствовать фильмы, мультфильмы, клипы, видеооткрытки, рекламные материалы и т.д.

А если в каждом классе копнуть еще и в разновидности форматов, времени не хватит, чтобы описать их все, поскольку сегодня в компьютерном мире их можно насчитать даже не десятки - сотни. Но говоря о том, что такое медиафайл, отдельно стоит рассмотреть каждую категорию.

Аудио

Аудио или звуковые файлы являются одной из самых больших категорий, которая объединяет огромное количество всевозможных форматов.

На заре их появления и создания изначально использовался формат PCM WAVE, который был разработан корпорацией Microsoft. Но файлы этого типа были очень большими по размеру и хранить их на жестких дисках малого объема или съемных носителях в виде тех же дискет было достаточно проблематично.

Все изменилось, когда был разработан специальный кодек Fraunhofer MP3 Encoder, позволявший производить сжатие аудиоинформации с уменьшением размера исходного WAV-файла. Правда, с небольшой потерей качества на уровне понижения звуковых характеристик (частоты дискретизации, глубины звука и т.д.). Однако сегодня формат MP3 усовершенствован настолько, что не только разница в звучании незаметна, но иногда файлы этого стандарта, к примеру, с битрейтом на уровне 320 кбит/с звучат намного лучше, нежели любой другой формат.

Говоря о том, что такое медиафайл категории аудио, можно отметить, что в последнее время достаточно распространенными и популярными форматами являются такие как:

  • AIFF;
  • FLAC;
  • CDDA;
  • DVD Audio и многие другие.

Некоторые их этих форматов являются самостоятельными и могут воспроизводиться любыми проигрывателями. Другие представляют собой аудиодорожки, которые встраиваются в видео. Если же взять еще и узкоспециализированные форматы музыкальных программ (например, формат FLP для секвенсора FL Studio), количество форматов возрастает просто неимоверно.

Видео

Еще одним большим классом считается видео. При этом ролики могут содержать audio, video, графику, текст (например, субтитры) и т.д. В этой категории форматов тоже можно насчитать очень много.

Самыми распространенными считаются следующие:

  • DivX;
  • Xvid;
  • MPEG;
  • RealVideo;
  • 3GP и т.д.

Всего, что сегодня есть в этой категории, просто не перечислишь. Однако тут есть один нюанс. Бывает так, что проигрыватель не воспроизводит медиафайлы этого типа. Почему? Да только потому, что каждого стандарта необходимо использовать специальные программы, называемые кодеками и декодерами (об этом будет сказано отдельно).

Графика

Наконец, еще один большой класс мультимедиа - графика. Здесь, пожалуй, всевозможных форматов можно насчитать больше всего. Кроме того, можно разделить стационарные изображения и анимацию, которая, хотя и относится к графике по формату, но по содержанию ближе к видео, или растровые и векторные изображения. Самый простой пример - файл GIF. Их, кстати, в равной степени можно отнести и так называемым смешанным файлам.

Что же касается самих графических файлов, тут дело не ограничивается только стандартными форматами картинок. Если взять в расчет инженерные, проектировочные или чертежные программные пакеты вроде AutoCAD, их «родные» форматы тоже смело можно относить к разновидности графических объектов.

Смешанные медиафайлы

Что такое медиафайл смешанного типа? Проще всего пояснить это на примере документов PDF, которые могут содержать и графику, и текст.

Несмотря на то, что для их просмотра или редактирования предусмотрены специальные программы вроде Adobe Reader, а не стандартные средства, применяемые для графических изображений, они тоже в некотором смысле представляют собой одну из разновидностей мультимедиа.

Создание медиафайлов

Что же касается создания или редактирования мультимедиа, для каждой категории предусмотрены специальные средства в виде узконаправленных редакторов или программ, объединяющих несколько возможностей.

Звуковые файлы создать (записать) или отредактировать можно не только в специализированных приложениях вроде Adobe Audition, Sound Forge или ACID, но и с применением программ для видео, в которых, помимо обработки видео, имеются инструменты и для редактирования аудио. Одной из самых мощных считается программа Sony Vegas Pro. Но на самом деле сегодня таких приложений разного уровня можно найти достаточно много. Естественно, все они отличаются своими возможностями и профессионализмом получаемого результата.

Ну а если посмотреть на утилиты для создания и обработки графики, здесь столько всего, что неискушенный пользователь просто потеряется в этом огромном списке при выборе необходимой утилиты.

Кодеки и декодеры

Отдельно стоит остановиться на кодеках и декодерах, которые необходимы не только для корректного воспроизведения мультимедиа некоторых типов, но и для преобразования форматов. При этом тот же кодек видео может использоваться в каком-нибудь конвертере для преобразования видео в аудио и наоборот.

Самыми популярными и наиболее распространенными пакетами с полным набором необходимых инструментов считаются K-Lite, которые, в зависимости от модификации, могут содержать разное количество кодеков и декодеров. Самым полным считается пакет K-Lie Mega Codec Pack, в котором присутствуют абсолютно все известные на сегодня декодеры и кодеки. После установки любой кодек видео или декодер аудио встраивается в операционную систему, программы для воспроизведения или обработки мультимедиа автоматически, поэтому проблем с их использованием быть не должно. Только на стадии инсталляции необходимо отметить все то, что нужно установить.

Updated: March 30, 2011

Applies To: Windows Home Server 2011

Digital media refers to audio, video, and photo content that has been encoded (digitally compressed). Encoding content involves converting audio and video input into a digital media file such as a Windows Media file. After digital media is encoded, it can be easily manipulated, distributed, and rendered (played) by computers, and is easily transmitted over computer networks.

Examples of digital media types include: Windows Media Audio (WMA), Windows Media Video (WMV), MP3, JPEG, and AVI. For information about the digital media types supported by Windows Media Player, see the article “Information about the Multimedia file types that Windows Media Player supports .

Why would I want to stream my digital media?

Like many people, you probably have a lot of music, video, and pictures in Windows Home Server 2011 shared folders. There may be times when you want to do following:

    Watch videos . Your home server can be used to store and stream large collections of videos and recorded TV shows to your home computers or other playback devices on your home network. You can stream videos to an Xbox 360 or to a home computer by using Windows Media Player.

    Play music . When you turn on Media Sharing for the Music shared folder, you can access your music from devices that support Windows Media Connect. You do not need to enable or configure any user accounts to stream from the Music shared folder after sharing is turned on.

    Present photo slide shows . You can store your digital photos in the Photos shared folder on your home server and then access them from any home computer or from an Xbox 360 that is connected to a TV in your home. You can watch photo slide shows, turning your TV into a large picture frame.

Sharing copy-protected media

Windows Home Server 2011 does not support the sharing of copy-protected media. This includes music purchased through an online music store.

Copy-protected media can be played back only on the computer or device that you used to purchase it. Copy protection prevents you from playing media on more than one computer or device, even if you copy the media to your home server and play it from there. However, you can store the copy-protected media on Windows Home Server 2011 and continue to play back the media on the computer or device used to purchase it.

БЕЛОРУССКАЯ ГОСУДАРСТВЕННАЯ ПОЛИТЕХНИЧЕСКАЯ АКАДЕМИЯ

ПРИБОРОСТРОИТЕЛЬНЫЙ ФАКУЛЬТЕТ

Кафедра «ИНЖЕНЕРНАЯ МАТЕМАТИКА»

Подготовил студент: Бескаровайный А. Л.
Группа 113039

Руководитель работы: Анисимов В. Я.

Минск 2000
СОДЕРЖАНИЕ:

МУЛЬТИМЕДИА. ФОРМАТЫ ЗВУКОВЫХ ФАЙЛОВ.

Multimedia – это подхваченный всеми термин, обозначающий интерактивный инструмент для работы с графикой, анимацией, звуком и видео. Мультимедиа привносит блеск в презентации, живопись и игры, и, кроме того, доставляет удовольствие при обучении. Она превращает компьютер из настольной системы с клавиатурой и монитором в некий «космический аппарат», укомплектованный динамиками, микрофоном, наушниками, джойстиками и компакт-дисками.

Что же такое мультимедиа?

Мультимедиа позволяет работать на компьютере со всеми видами информации, а не только с текстом или обычными рисунками. Мультимедиа – это цифровая информация, имеющая более широкие возможности, чем другие ее виды.
    Поскольку звуковая и графическая информация записывается в цифровой форме, она может копироваться без потери качества.
    Цифровая информация может сжиматься до минимума для хранения.
    Можно записать огромное количество информации на CD-ROM, а сам CD-ROM занимает очень мало места.
    Интерактивные компьютерные программы, использующие цифровые медиасистемы, являются отличными средствами обучения.
Если вы покупаете компьютер со встроенными средствами мультимедиа или устанавливаете на свой компьютер, то вам необходимо разобраться в многообразии средств мультимедиа, а также познакомиться с существующими способами записи и воспроизведения. Существуют два основных вида систем мультимедиа:
    Системы воспроизведения. Эти системы, как правило включают многоскоростной дисковод CD-ROM, звуковую карту, динамики и видеосистему с относительно высоким разрешением. Не помешает также наличие карты декомпрессии, работающей с цифровой информацией.
    Авторские системы. (системы, используемые для создания файлов систем мультимедиа). Авторские системы, как правило, включают такие компоненты, как микрофоны и видеокамеры для записи звука и съемки видеоизображений. Они также высокоскоростные, емкие жесткие диски, способные хранить и обслуживать большие объемы информации, требующиеся для цифрового видео.
В 80-х годах персональный компьютер состоял из микропроцессора (CPU), клавиатуры, монитора, дисковода и принтера. Все, что вы могли сделать на компьютере, – это работать с текстом. Люди тратили очень много времени, оформляя письма, производя финансовые расчеты и просматривая базы данных.
Но теперь, когда появились такие графические пользовательские интерфейсы, как Windows95/98(SE)/МЕ/NT/2k. , и значительно более мощные персональные компьютеры, начали появляться приложения, предоставляющие возможность использовать анимационные эффекты, звук и видео. В конце 1980г. люди начали сочинять музыку на компьютере, комбинируя анимацию и звук, создавая захватывающие мультимедиа-презентации со звуком и движущимися картинками. Оборудование, однако, было дорогим, а результаты часто не оправдывали ожиданий. Windows3.1 и DOS не имели достаточно ресурсов для поддержки систем мультимедиа, поэтому картинки на экране двигались очень медленно.

Мультимедиа и Windows 95/98(SE)/МЕ/NT/2k/XP.

Благодаря Windows все преобразовалось. Она поддерживает средства значительно улучшающие работу с мультимедиа.
    Windows95/98(SE)/МЕ/NT/2k. является 32-разрядной, многозадачной, многопоточной операционной системой. Это означает, что Windows поддерживает выполнение нескольких задач одновременно, проигрывание мультимедиа-презентаций и работу пользователей в диалоговом режиме.
    При установке Windows автоматически определяет конфигурацию мультимедиа устройств.
    Приложения Windows поддерживают мультимедиа. Вы можете создавать составные документы, т.е. документы, включающие звук, видео, графику, диаграммы, картинки и другие элементы различных приложений.
    Windows поддерживает форматы компакт-дисков Sony/Philips CD+ и Kodak PhotoCD, а также позволяет легко запускать программы и проигрывать диски с устройства CD-ROM.
    Видеостандарт Windows широко поддерживается в компьютерной индустрии. Разработчики мультимедиа-продуктов могут спокойно распространять свою продукцию, зная, что она будет работать под Windows.
    Мультимедиа-продукты, разработанные для Windows, как правило, являются продуктами высокого качества, так как Windows поддерживает большие видеоокна и 32-разрядная архитектура Windows улучшает прохождение данных.
    Windows поддерживает интерфейс Sony VISCA. Это означает, что в приложениях вы можете использовать так называемые VCR-кнопки (VCR – английская аббревиатура от Video Cassette Recorder – видеомагнитофон, т.е. кнопки, функционально аналогичные кнопкам перемотки, воспроизведения и другим на аудио- и видеовоспроизводящих устройствах) при проигрывании лазерных дисков.
    Качество игр в Windows значительно улучшено за счет нового программного графического интерфейса.
    Windows поддерживает множество различных стандартных промышленных звуковых и видеоустройств компрессии информации при ее записи в файл, а также декомпрессии при воспроизведении (так называемых кодек-устройств). Кодек сокращает объем мультимедиа-файлов и позволяет распространять их в различных форматах.
Наиболее важным средством мультимедиа в последние несколько лет стало видео. Видео вмещает невероятное количество информации, которая может быть сжата перед перенесением ее с одного устройства на другое, например, из видеокамеры на жесткий диск через шину компьютера. Применение технологии сжатия аудио- и видеоинформации позволяет расширить рынок средств мультимедиа.

Системы мультимедиа

Дополнительными периферийными устройствами к компьютеру в середине 80-х годов были дисководы, сканеры, принтеры и коммуникационные средства типа модем. В 90-х годах появляется звуковые карты, видео-карты, дисководы CD-ROM и высокоскоростные коммуникационные средства, благодаря которым теперь вы можете связаться с информационной службой, передающей вам мультимедиа по проводам.
Ниже перечислены минимальные требования для запуска мультимедиа под Windows.
    Процессор Intel 80486 (Для цифровых видеоприложений рекомендуется Pentium).
    Шина PCI для передачи данных для контроллера диска и видеокарты.
    Жесткий диск большого объем (от 300 Мбайт). Для высококачественных цифровых видеосистем требуется гигабайты памяти.
    CD-ROM со скоростью не ниже 4-х с регулировкой звука на передней панели.
    Звуковая карта, обеспечивающая частоты квантования 11,025; 22,05 и 44,1-кГц для стерео звучания. Также требуется многоголосные и многотембровые устройства, способные воспринимать на входе несколько источников, а на выходе представить стереозвучание.
    Видеоаппаратуру, поддерживающую высокие разрешения монитора. Microsoft рекомендует для лучшего качества представления видео использовать VESA или PCI видеокарты. В последнее время стали популярны AGP адаптеры.
    IBM-совместимый аналоговый порт джойстика.
    MIDI-порт, поддерживающий установленные стандарты для ввода, вывода и передачи данных. Некоторые звуковые карты содержат MIDI-синтезаторы, но в общем случае вы подсоединяетесь к внешнему MIDI-синтезатору, по внешнему виду напоминающему клавиатуру.
MIDI (Musical Instrument Digital Interface – интерфейс цифровых музыкальных инструментов) является стандартом для записи нот и сопутствующей информации, связанной с проигрыванием музыки на электронном музыкальном устройстве. Реальный звук при этом не записывается.

Вышеперечисленные компоненты необходимы для воспроизведения и записи средствами мультимедиа. Однако, если вы хотите сами создавать мультимедиа-клипы, то вам могут потребоваться дополнительная аппаратура.

Типы и стандарты мультимедиа

Мультимедиа-информация храниться в виде файлов специального формата, содержащих звук, видеоизображения, или в файлах формата MIDI.

Аудиомедиа (звуковая медиа) хранится, в основном, в двух форматах, WAV и MIDI. Большинство WAV-файлов требует много дискового пространства, но они могут воспроизводиться с помощью любой звуковой карты. MIDI-файлы занимают значительно меньше места на диске, но могут проигрываться только на MIDI-совместимых устройствах. В настоящее время почти все карты способны воспроизводить MIDI-файлы.

Визуальное медиа – это анимационные файлы и видеофайлы.
Анимация. В Windows, если у вас есть соответствующее приложение, вы можете создавать изображения, перемещающиеся по экрану. Не существует стандартного формата анимационного файла, однако многие разработчики одновременно развивают производство как анимационных средств, так и воспроизводящей аппаратуры. Анимация может сопровождаться звуковыми файлами разных форматов.
Видео. Video for Windows – это видеостандарт для Windows. Вы можете записать фильм с видеокамеры или лазерного диска на жесткий диск компьютера и сохранить его как файл в формате AVI либо MPG. Сжатие требуется лишь для высококачественного видео и его эффективного хранения.

О звуковой мультимедиа

Приложения для записи и воспроизведения звука были одними из первых известных приложений мультимедиа для персонального компьютера. Добавив звуковую карту, вы сможете записывать сообщение, переданное голосом, сохранять его как файл на диске, переносить его на другой компьютер, где оно также может быть воспроизведено. Вы также можете записывать музыку и звук для компьютерных презентаций.
Существует два способа звукозаписи:
      Цифровая запись, когда реальные звуковые волны записываются и конвертируются в цифровые данные.
      MIDI-запись, вообще говоря, является не реальным звуком, а записью нажатий на клавиши или другой операций, выполняемых на синтезаторах или MIDI-совместимых электромузыкальных устройствах. MIDI-файл является электронным эквивалентом игры на фортепиано.

Цифровая запись

Звуковая плата преобразует звук на выходе в цифровую информацию путем измерения звука тысячи раз в секунду. Цифровой звук хранится в файлах с расширением WAV. При записи звука аналого-цифровой преобразователь конвертирует звук в цифровые данные. При воспроизведении звука цифроаналоговый преобразователь конвертирует цифровые данные в аналог звуковой волны.
Звук представляет собой вибрации, которые формируют волну с соответствующими амплитудой и периодом, как это показано на рис.1. Амплитуда выражает высоту волны, или громкость звука. Период – это расстояние между двумя звуковыми волнами. Наконец, частота показывает количество периодов в секунду и измеряется в герцах. Например, сто периодов в секунду – это 100 Гц. Человек может воспринимать звук с частотой от 20 до 20000 Гц, и вся выпускаемая звуковоспроизводящая и звукозаписывающая аппаратура рассчитана на этот диапазон частот.

Рис. 1. Измерение звуковой волны

Для того чтобы записать звук и хранить его на цифровом устройстве типа вашего компьютера, производится квантование звука, т.е. разбиение звуковой волны на определенные интервалы по времени. Звуковая волна, показанная на рис.2, была разбита на 16 интервалов. Если предположить, что продолжительность звуковой волны равна одной секунде, то ее частота квантования – 16 Гц.

Рис. 2. Квантование волны при частоте квантования 16 Гц
Как правило, такая низкая частота квантования не используется. Даже цифровой звук с частотой квантования 100 или 1000 Гц не будет распознаваться при воспроизведении. Это происходит потому, что цифровое представление волны в данном случае не сглажено. Фильтрующая аппаратура сглаживает волну, однако наилучшим способом получения качественной цифровой записи является повышение частоты квантования. Следует учесть, что при этом увеличивается объем хранящихся данных, что потребует больше памяти на диске.
Стандартам мультимедиа соответствуют три типа частоты квантования: 11,025; 22,05; 44,1 кГц. Частота квантования зависит от записываемого звука: 11,025 кГц подходит для записи голоса, но для получения высококачественной записи требуется частота квантования 44,1 или 48 кГц. Однако повышение частоты квантования приводит к увеличению размера файла и требуемого пространства на диске для его хранения. Формула для расчета дискового пространства будет приведена ниже, но прежде необходимо разобраться с одной переменной – числом разрядов (бит), используемым для хранения информации о квантовании.
Каждый интервал содержит информацию о малом временном сегменте звука. Количество разрядов для записи каждого интервала определяет точность аппроксимации звуковой волны, однако увеличивает размер файла, в котором хранится цифровой звук. 4-разрядное разбиение на интервалы обеспечивает деление амплитуды звуковой волны по вертикали на 16 уровней, а 8-разрядное разбиение – на 256 уровней. Для высококачественной записи требуется 16-разрядное разбиение на интервалы по амплитуде, которое определяет 65536 уровней амплитуды.
Предшествующее обсуждение касалось сглаженной звуковой волны, но реальная волна не сглажена – она состоит из многих различных частот, которые вместе создают тембр звука. Тембр – это уникальный звук, присущий инструменту. Например, колебания струны и резонатор определяют звучание скрипки (уникальное звучание скрипки Страдивари является результатом добавления ценных веществ в ее полировку). Скрипка производит целый комплекс звуковых волн, как это показано на рис. 3.
Теперь вы видите важность повышения частоты квантования и разрядности звуковой платы при записи звука. Вам необходимо знать не только амплитуду каждого выбранного интервала, но и все, что происходит с волной за единицу времени. Повышение частоты квантования и разрядности звуковой платы обеспечивает качественную запись звука, однако, следует помнить, что это приводит к значительному увеличению дискового пространства, необходимого для хранения записываемого звука. К счастью, если вы записываете голос, то нет необходимости использовать большую частоту квантования и разрядность звуковой платы.

Рис. 3. реальные звуковые волны имеют весьма сложную форму и для получения их высококачественного цифрового представления требуется высокая частота квантования

Ниже приводится формула расчета требуемого дискового пространства для хранения цифрового звука:

На секунду

В табл. 1. приведено требуемое пространство на диске для хранения записи звука продолжительностью одна минута для каждой частоты квантования при разрядности 8 бит. Первая строка в таблице соответствует низкокачественной записи голоса, а последняя строка – стандартам, установленным для цифровых аудиокомпакт-дисков.

Таблица 1. Требования по хранению звуковых файлов

Заметим, что высокая частота квантования и разрядность не требуются, если звук был записан и проигрывается на оборудовании более низкого качества. Например, карманный микрофон записывает звук гораздо более низкого качества, чем запись при частоте квантования 44 кГц. Если у вас высококачественная запись, то для ее воспроизведения соответственно требуется аппаратура высокого качетва.

Звук и типы звуковых файлов

Звук – это физическое природное явление, распространяющееся посредством колебаний воздуха и, следовательно, можно сказать, что мы имеем дело только с волновыми характеристиками. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком.
Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.
Любой звуковой файл можно представить, чтобы Вам было наиболее понятно, как базу данных. Она имеет свою структуру, о параметрах которой указывается обычно вначале файла. Потом идет структурированный список значений по определенным полям. Иногда вместо значений стоят формулы, позволяющие уменьшать размер файла. Данные файлы могут читать только специализированные программы, в которые заложен блок чтения.

РСМ
РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3D Audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.
DPCM
Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.
ADPCM
Адаптивный DPCM. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициэнт масштабируемости.
WAV
Самое простое хранилище дискретных даннных. Я бы сказал прямое. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали – это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.
RIFF
Resource Interchange File Format. Уникальная система хранения любых структурированных данных.
IFF
Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga – одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.
MOD
Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента. Проще говоря, прошитый в синтезатор сэмпл.
AIF или AIFF
Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.
AIFC или AIFF-С
Тот же AIFF, только с заданными параметрами сжатия (компрессии).
AU
Опять же та же гонка за экономией места. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало "весят", за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры m-Law 8 кГц – моно. Но есть и 16-битные стерео-файлы с частотами 22050 и 44100 Гц. Это звуковой формат предназначен для работы со звуком в рабочих системах SUN, Linux и FreeBCD.
MID
Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.
МР3
Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.
VQF
Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF – процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.
VOC
Восьмибитный моно-формат от семейства SoundBlaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).
НСОМ
То же самое, что и VOC (восемь бит, моно), но только для Apple Macintosh.
UL
Стандартный формат U-Law. 8 кГц, 8 бит, моно.
RA
Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.
SND
Бывает двух видов. Один – это тот же AU для SUN и NeXT. Другой – это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.

Существуют и другие типы звуковых файлов, но это, скорее всего, файлы различных программ для создания и обработки музыки. В основном, такие файлы читаются только той программой, в которой они были созданы.

Компрессия аудиоданных

Мультимедиа-информация состоит из огромного количества цифровых данных, которые необходимо хранить в сжатом виде. Windows включает в себя средства управления компрессией аудио- и видеоизображений, которые работают с одним или более модулями декомпрессии и называются кодеками (от Компрессия и ДЕКомпрессия). Большое количество программных кодеков поставляются с Windows. Когда вы записываете или воспроизводите звук или видеофайл, Windows автоматически использует кодек.
Многие звуковые и видеокарты имеют встроенные аппаратные кодеки. Windows сначала использует аппаратный кодек, поскольку он быстрее и не очень нагружает процессор. Если аппаратный кодек отсутствует, то Windows применяет программные кодеки. Если она не смогла найти кодек, на экране появится сообщение об ошибке, поскольку сжатый файл невозможно распаковать.

Программа управления компрессией аудиоданных (Audio Compression Manager, ACM) в Windows использует следующие кодеки для компрессии/декомпрессии аудиоданных.

      TrueSpeech Сodec. Кодек, ориентированный на голос, разработанный компанией DSP Group. Используйте этот кодек только при сжатии и передачи по сетям или телефонным линиям файлов, содержащих запись голоса. TrueSpeech производит компрессию данных не в реальном времени, в свою очередь, декомпрессия производится в реальном масштабе времени.
      Microsoft GSM Audio Codec. Кодек, производящий компрессию данных монохромных звуковых записей низкого качества в реальном масштабе времени. Используйте этот кодек при записи голосовых сообщений, вставленных в сообщения электронной почты (e-mail). Для записи голосовых сообщений вы можете использовать приложение Фонограф.
      Microsoft CCITT G.711 A-Law and U-Law Codec. Этот кодек обеспечивает совместимость телефонных стандартов в Европе и северной Америке. Он обеспечивает коэффициент сжатия данных 2:1.
      Microsoft ADPCM Codec. Этот кодек обеспечивает компрессию как в реальном, так и не в реальном масштабе времени, последняя используется пользователями авторских систем мультимедиа. Аудиофайлы лучше генерируются кодеком не в реальном времени масштабе времени.
      IMA ADPCM Codec. Этот кодек был рекомендован Interactive Multimedia Association для использования на различных платформах мультимедиа. Он осуществляет компрессию в реальном масштабе времени и подобен кодеку Microsoft ADPCM.
      Microsoft PCM converter. Этот конвертер позволяет проигрывать 16-разрядный звук на 8-разрядной звуковой карте. Вы также можете использовать этот кодек в случае, когда необходимо поддерживать частоту квантования 1 МГц для карты, поддерживающую другую частоту квантования.

Программное обеспечение по преобразованию цифровой записи

Существует множество программ- кодеков, разработанных специально для преобразований файлов с цифровой записью. Цель каждой такой программы одна – сжатие звукового файла с наименьшей потерей качества и наибольшей степенью сжатия. У каждой из них свои плюсы и минусы: у одних качество сжатия высоко, однако скорость этого сжатия желает лучшего, другие моментально кодируют но с потерей качества, кто же захочет слушать файл с любимой музыкальной композицией, которая кряхтит, свистит и шуршит как старая дедова пластинка.
Наиболее популярные программы-кодеки приведены ниже.

Voice

Программное обеспечение состоит из четырёх модулей, которые могут работать как на одном компьютере, так и на разных.
Первый модуль, работающий в среде Windows, отвечает за работу с внешней аппаратурой, производит непосредственно запись с телефонной (радио) линии и воспроизведение в телефонную (радио) линию звуковых файлов.

Рис. 4. Диалоговое окно программы Voice

Второй программный модуль, отвечающий за сжатие звуковых файлов, использует в свой работе стандартные алгоритмы сжатия Wav-файлов. Используемые алгоритмы сжатия позволяют упаковывать поступающие сообщения до уровня 4Кбайт - 600байт за секунду. Алгоритмы сжатия можно оперативно изменять в зависимости от требуемой степени сжатия и качества звучания.
Третий программный модуль отвечает за ведение базы данных (добавление разговоров в базу данных и автоматическое удаление из неё по мере их старения). В базе данных информация хранится в течение заданного отрезка времени, после чего она либо архивируется, либо автоматически удаляется.
Последний, четвёртый программный модуль предназначен для работы с базой данных: поиск разговоров, их прослушивание, перезапись и ручное удаление.
Все модули работают в 32х разрядных средах Windows. Всё программное обеспечение одновременно может работать как друг с другом, так и с другими Windows-приложениями.

Mpeg Encoder

Одна из лучших программ-кодеков уходящего столетия.

Рис.5. Диалоговое окно программы mpeg Encoder

Один недостаток mpeg Encoder – уходит много времени на сжатие файла с цифровой записью. На обработку звукового файла продолжительностью около 3-5 минут уходит порядка 25-40 минут. Но ожидания стоят того – качество не отличается от оригинала.
Программа состоит только из одного диалогового окна, что упрощает работу. Не требуется каких-либо дополнительных знаний в области преобразований цифровой информации и т.п., вы указываете путь к исходящему файлу в поле SOURCE и в поле TARGET конечную папку, в которой будет находиться сжатый файл в формате mp3 (по умолчанию). Задаете частоту квантования, параметры качества – стерео или моно и… вперед! Смело жмем кнопку Encode.

LameBatch

LameBatch - это незатейливая оболочка, написанная с целью упрощения работы с командными строками mp3-кодеров, называющегося LAME от Mark Taylor и компании. Оболочки основана на простом ядре.

Рис. 6. Диалоговое окно с параметрами программы LameBatc h

Содержит всего две вкладки «Files» и «Settings», в последней вы указываете все нужные вам параметры сжатия.

Основные фишки:

    Только одно окошко (без всплывающих окон непосредственно кодера).
    Индивидуальные настройки кодирования каждого файла.
    Возможность их изменения для других файлов во время кодирования одного.
    Всяческая информация о ходе процесса.
    Проверка файлов на допустимость формата.
    Различные варианты сортировки очереди.
    Незатейливое прописывание тэгов.
    Возможность отложить работу на неопределенный срок.
    Различная настройка папки для результатов.
    Проверка перезаписи и доступного места.
    Поддержка Drag and drop.
    Встраивается в контекстное меню Explorer.
    Выключение машины по окончании процедуры.
Последняя версия на сегодня это LameBatch 0.99c и выпущена 25 октября. При тестировании использовались LAME 3.35. LameBatch распространяется как халява, поэтому - никаких гарантий.

Список программ и их достоинства, и недостатки можно перечислять очень долго. Программ-кодеков в последнее время разработано много, стоит подключиться к сети Internet, набрать в строке поискового портала «programs&encode&multimedia» как сразу получишь список программ для обработки звуковых и не только файлов.

Заключение

Порассуждаем немного о сжатии звуковых файлов. Для чего это нужно, особо говорить не стоит, упомяну лишь то, что широко распространенные способы сжатия цифровых музыкальных данных в 11–14 раз позволили неимоверно толкнуть вперед программную и «железную» музыкальную индустрию, не говоря уже о том, что с качественной музыкой теперь в Internet проблем, в общем-то, нет. Найти можно практически любую композицию. (На самом деле, конечно же, далеко не любую. Попробуйте поискать что-нибудь нетривиальное - Билли Маккензи, например, или Берни Марсдена, вряд ли у вас что-нибудь получится. Найти можно преимущественно популярную музыку или классику жанра, да и то далеко не всю.
С момента начала своего бурного развития (около двух лет назад) открытая технология сжатия музыкальной (звуковой) информации качественных изменений технологии сжатия не претерпела. Другими словами, многочисленным поклонникам музыки приходится мириться с достаточно емкими файлами, т. к. никаких сдвигов на этом фронте не намечается. Сегодняшние пределы для сжатия без значительной потери качества составляют около 11–12 раз от оригинального размера музыкального файла. Как известно, на компакт-диске со стандартной частотой оцифровки 44 100 Гц (стерео, два байта на одно амплитудное значение) может уместиться до 74 минут звука - примерно по 10 Мбайт на минуту.
При средней длительности музыкальной композиции 4 минуты имеем чистого (несжатого) звука 40 Мбайт. Много. Очень много для Internet. Имея модем со скоростью 33,6 Кбайт/с и полный канал для скачивания (т. е. в идеале - 3,5 Кбайт/с) 40 Мбайт мы получим только через 4–5 часов (обычно эта цифра в 1,5–2 раза больше).
Применяя сжатие музыкального файла без потери его основных характеристик (стерео, частота дискретизации при оцифровке 44 100 Гц, 2 байта на выборку амплитуды), можно добиться уменьшения размера в 11–12 раз. Так что вместо 40 Мбайт получится всего 3,8–3,9 Мбайт. Это уже вполне приемлемо. Можно сжимать еще больше, но тогда ощутимо проигрываем в качестве: отличия от оригинала становятся слышимыми даже не меломану. Называемые здесь пределы - 11 или 12 раз - это уже подобранные и проверенные критерии качество/размер за всю недолгую историю использования программ-сжимателей звуковых файлов.

Литература

    Том Шелдон. «Windows 95 проще простого»
Диалектика. Киев. 1996г.
    А. Чижов. «Napster - панацея для MP3-меломана»
Фантазия. 1999-2000г.
    Internet. Сайты:
      http://www.psf.by.ru
      http://www.submarine.ru
      http://www.nsk.su/~sibell
      http://www.sound_world.ru
      http://www.sulaco.org
Поиск материала осуществлялся поисковыми системами:
        yandex.ru
        rambler.ru
        altavista.com
        yahoo.com

Полученный в результате оцифровки звука или видео массив данных («цифровое представление» оригинального объекта) может использоваться компьютером для дальнейшей обработки, передачи по цифровым каналам, сохранению на цифровой носитель. Перед передачей или сохранением цифровое представление, как правило, подвергается фильтрации и кодированию для уменьшения объема .

Сжатием мультимедиа информации занимаются особые программы – кодеки , являющиеся важнейшим программным элементом компьютера как мультмедийного центра.

Именно благодаря кодекам возможно прослушивание и просмотр аудио и видео соответственно, при приемлемых размерах файлов. Итак, кодек – программа, сжимающая цифровой поток (кодирование) и также с помощью которой он воспроизводится (декодирование). По первым слогам этих функций образовано название Кодек (Codec). Кодеки бывают аудио и видео и являются важной частью формата медиа файла. Главная задача и суть кодека - это уменьшить размер файла. При этом существуют разные алгоритмы выполнения этой задачи, справляющиеся с ней с различной эффективностью.

Не стоит путать понятия кодек и формат файла . Формат - это определённая структура представления оцифрованного звука или изображения. А кодек - это программный алгоритм, сжимающий в определённый формат. То есть цель кодека - сжать, а сделать это можно по разному, поэтому для одного формата могут использоваться разные кодеки (с разной степенью качества). Естественно, не обходится здесь без потерь в качестве. Однако алгоритмы настолько хорошо справляются с задачей, что потери часто бывают не заметны. Примером простого алгоритма сжатия аудиоданных может служить, например, вырезание диапазона частот не слышимого для человеческого уха, или, к примеру, если раздаются 2 звука, первый громкий, второй тихий, при этом получается, что ухо не слышит второго звука, логично, что можно обойтись без второго звука. В изображении, если имеется преимущество одного цвета в кадре, то достаточно лишь описать одну точку с этим цветом, и указать места где он повторяется. Это конечно простые примеры, на деле всё гораздо сложней. Сейчас существуют кодеки, сжимающие без потерь.

Еще раз отметим, что кодеки выполняют и обратную операцию - раскодирования, в этом случае их называют декодерами.

Кодеки преобразуют данные в особый файл, который называют контейнером.

Контейнер - это специальная оболочка, в которой хранится зашифрованная с помощью кодеков информация. По сути, медиаконтейнеры - это и есть форматы видеофайлов, которые содержат данные о своей внутренней структуре. Первый медиаконтейнер был создан в 1985 году. В контейнере может храниться информация разного качества, в частности, изображения, аудио, видео и субтитры. Разные виды контейнеров определяют объем и качество информации, которая может быть в нем сохранена, но при этом не влияют на способы кодирования данных.

Наиболее популярными видео кодеками являются DivX, XviD, H.261, H.263, H.264 и следующие:

MPEG-2 – группа стандартов цифрового кодирования видео и аудио сигналов. MPEG-2 в основном используется для кодирования видео и аудио при вещании, включая спутниковое вещание и кабельное телевидение. С некоторыми модификациями этот формат также используется как стандарт для сжатия DVD.

MPEG-4 – новый международный стандарт сжатия цифрового видео и аудио, появившийся в 1998 году. Используется для вещания (потоковое видео), записи дисков с фильмами, видеотелефонии и широковещания. Включает в себя многие функции MPEG-2 и других стандартов, добавляя такие функции, как поддержка языка виртуальной разметки VRML для показа 3D-объектов, объектно-ориентированные файлы, поддержка управления правами и разные типы интерактивного медиа.

Ogg Theora – видеокодек, разработанный Фондом Xiph.Org как часть их проекта «Ogg» (целью этого проекта является интеграция видеокодека On2 VP3, аудиокодека Ogg Vorbis и мультимедиа-контейнера Ogg в одно мультимедийное решение, наподобие MPEG-4). Полностью открытый, свободный в лицензионном отношении мультимедиа-формат.

Любая операционная система изначально содержит некий набор кодеков, но, как правило, их недостаточно для воспроизведения определенных форматов видеофайлов.

Видеоформаты напрямую на качество не влияют, лишь обеспечивая поддержку кодеков и «технологичность» фильма:

AVI - очень древний стандарт, которому уже более десяти лет. Не соответствует современным требованиям качества и не поддерживает некоторые кодеки (в частности звуковой кодек Vorbis), а также переменный битрейт в кодировании. Существует и проблема с синхронизацией потоков.

MKV – «молодой» тип контейнеров, характеристикой которому станет предыдущий абзац без слов «не». Если перед вами файл с фильмом *.mkv, то, как правило, сам фильм будет высокого качества.

ASF - формат, разработанный в недрах всеми любимой фирмы Microsoft и ими же запатентованный. По непонятным причинам очень бережно ими оберегается, даже законом запрещено использование этого стандарта для видеокодирования и редактирования ASF-фильмов третьими сторонами, то есть пользователями, чтобы его попробовать в кодировке, придётся найти софт, который этот закон не уважил. Сам по себе стандарт очень старый, поэтому вряд ли обеспечивает совместимость с современными кодеками.



VOB - контейнер DVD фильмов. На DVD-диске с фильмом выкладываются несколько VOB-файлов ~ по 1Гб каждый вместе с разными системными файлами (IFO, BUP...). Скинув VOB-файлы на жёсткий диск компьютера, можно их просмотреть с помощью какого-либо видео-плеера. Внутрь VOB-файла зашиваются собственно видео, одна или несколько звуковых дорожек и субтитры.

На практике возникает огромное количество случаев, когда необходимо преобразовать видео из одного формата в другой. Основная проблема заключается в том, что различные устройства накладывают особые требования к качеству загружаемого видео, в частности к его формату. В этой ситуации на помощь приходят специальные программы - конвертеры , которые позволяют переделать видео в нужный формат. Например, удобный видео конвертер на русском языке - ВидеоМАСТЕР.

Аудиоформаты

Среди звуковых носителей информации выделяют аналоговые и цифровые носители. Для целей мультимедиа-технологий наибольшее значение имеют последние, причем преимущественно это аудио-файлы, значительное количество которых было разработано в последние годы. В классификации форматов аудио-файлов выделяют форматы без потерь и форматы с потерями .

Аудиоформаты без потерь предназначены для точного (с точности до частоты дискретизации) представления звука. В свою очередь они делятся на несжатые и сжатые форматы.

Примеры несжатых форматов :

· RAW – сырые замеры без какого-либо заголовка или синхронизации.

· WAV (Waveform audio format) –разработан Microsoft совместно с IBM, распространенная форма представления звуковых данных небольшой продолжительности.

· CDDA – стандарт для аудио-CD. Первая редакция стандарта издана в июне 1980 года компаниями Philips и Sony, затем была доработана организацией Digital Audio Disc Committee.

Примеры сжатых форматов :

· WMA (Windows Media Audio 9 Lossless) – лицензируемый формат аудио-файлов, разработанный компанией Microsoft для хранения и трансляции. В рамках формата есть возможность кодирования звука как с потерей, так и без потери качества.

· FLAC (Free Audio Lossles Audio Codec) – популярный формат для сжатия аудиоданных. Поддерживается многими аудио-приложениями, а также устройствами воспроизведения звука.

Аудиоформаты с потерями ориентированы в первую очередь на по возможности компактное хранение звуковых данных: при этом идеально точное воспроизведение записанного звука не гарантируется. Примеры таких форматов:

· MP3 –лицензируемый формат файла для хранения аудиоинформации, разработанный рабочей группой института Фраунхофера MPEG в 1994 году. На данный момент MP3 является самым известным и популярным из распространенных форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для передачи музыкальных произведений. Формат может проигрываться в любой современной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.

· Vorbis –свободный формат сжатия звука с потерями, появившийся летом 2002 года. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к MP3. По всевозможным оценкам этот формат является вторым по популярности после MP3 форматом компрессии звука с потерями. Широко используется в компьютерных играх и в файлообменных сетях для передачи музыкальных произведений.

· AAC (Advanced Audio Coding) –формат аудио-файла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Изначально создавался как преемник MP3 с улучшенным качеством кодирования, но в настоящий момент распространен существенно меньше, чем MP3.

· WMA –см. выше.

Следует отметить, что кроме описания звуковых колебаний в цифровом виде, применяется также создание специальных команд для автоматического воспроизведения на различных электронных музыкальных инструментах, ярчайшим примером такой технологии является MIDI .

Интерфейс MIDI позволяет единообразно кодировать в цифровой форме такие данные как нажатие клавиш, настройку громкости и других акустических параметров, выбор тембра, темпа, тональности и др., с точной привязкой во времени. В системе кодировок присутствует множество свободных команд, которые производители, программисты и пользователи могут использовать по своему усмотрению. Поэтому интерфейс MIDI позволяет, помимо исполнения музыки, синхронизировать управление другим оборудованием, например, осветительным, пиротехническим и т.п.

Последовательность MIDI-команд может быть записана на любой цифровой носитель в виде файла, передана по любым каналам связи. Воспроизводящее устройство или программа называется синтезатором (секвенсором ) MIDI и фактически является автоматическим музыкальным инструментом.

В качестве контейнера для обмена и передачи видео- и звуковых данных в сфере профессионального производства и вещания применяется формат MXF (от англ. The Material eXchange Format ), однако, не исключается возможность записи в контейнеры AVI, MOV и прочие.



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: