Просмотр содержимого документа
«Кодирование звуковой информации»
Кодирование звуковой информации
- Звук – это колебания среды (воздуха, воды), которые воспринимает человеческое ухо. С помощью микрофона звук преобразуется в так называемый аналоговый электрический сигнал.
Аналоговый сигнал – это произвольное изменение некоторой величины в заданном диапазоне.
В любой момент времени сигнал на выходе микрофона (ток или напряжение) может принимать любое значение в некотором интервале.
Оцифровка звука
Число T называется интервалом дискретизации , а обратная ему величина 1/ T – частотой дискретизации . Частота дискретизации обозначается буквой f и измеряется в герцах (Гц) и килогерцах (кГц). Один герц – это 1 раз в секунду, а 1 кГц – 1000 раз в секунду. Чем больше частота дискретизации, тем точнее мы записываем сигнал, тем меньше информации теряем. Однако при этом возрастает количество отсчетов, то есть информационный объем закодированного звука.
Оцифровка – это преобразование аналогового сигнала в цифровой код.
Для кодирования звука в компьютерах чаще всего используются следующие частоты дискретизации:
- 8 кГц (плохое качество, но достаточно для распознавания речи);
- 11 кГц, 22 кГц, 44,1 кГц (звуковые компакт-диски);
- 48 кГц (фильмы в формате DVD) ;
- также 96 кГц и 192 кГц (высококачественный звук в формате DVD‐audio).
Выбранная частота влияет на качество цифрового звука.
Представим себе, что на один отсчет выделяется 3 бита. При этом код каждого отсчета – это целое число от 0 до 7. Весь диапазон возможных значений сигнала, от 0 до максимально допустимого, делится на 8 полос, каждой из которых присваивается номер (код). Все отсчеты, попавшие в одну полосу, имеют одинаковый код
Преобразование измеренного значения сигнала в число называется дискретизацией по уровню. Эту операцию выполняет аналого-ифровой преобразователь (АЦП) звуковой карты.
Разрядность кодирования - это число бит, используемое для хранения одного отсчета.
Недорогие звуковые карты имеют разрядность 16-18 бит, большинство современных - 24 бита, что позволяет использовать 2 24 = 16 777 216 различных уровней.
Объем информации, полученный после оцифровки звука, зависит от разрядности и частоты дискретизации. Например, если используется 16-разрядное кодирование с частотой 44 кГц , за 1 с выполняется 44000 измерений сигнала, и каждое из измеренных значений занимает 16 бит (2 байта). Поэтому за 1 секунду накапливается 44000 х 2 = 88000 байт информации, а за 1 минуту
88000 х 60 = 5 280 000 байт = 5 Мбайт . Если записывается стерео звук (левый и правый каналы), это число нужно удвоить .
С помощью оцифровки можно закодировать любой звук, который принимает микрофон. В частности, это единственный способ кодирования человеческого голоса и различных природных звуков (шум прибоя и т.п.).
Среди форматов звуковых файлов наиболее известны:
- WAV (англ. Waveform Audio File Format, файлы с расширением .wav ) - стандартный
- формат звуковых файлов в операционной системе Windows; сжатие данных возможно, но используется редко;
- M P3 (файлы с расширением . mp3 ) - самый популярный формат звуковых файлов,
- использующий сжатие c потерями: для значительного уменьшения объема файла снижается качество кодирования для тех частот, которые практически неразличимы для человеческого слуха;
- WMA (англ. Windows Media Audio, файлы с расширением .wma ) - формат звуковых
- файлов, разработанный фирмой Microsoft; чаще всего используется сжатие для уменьшения объема файла;
- Ogg Vorbis (файлы с расширением . ogg ) - свободный (не требующий коммерческих
- лицензий) формат сжатия звука с потерями. Все эти форматы являются потоковыми, то есть можно начинать прослушивание до того момента, как весь файл будет получен (например, из Интернета).
Метод инструментального кодирования
- Этот метод основан на стандарте MIDI (англ. Musical Instrument Digital Interface — цифровой интерфейс музыкальных инструментов). В отличие от оцифрованного звука, в таком формате хранятся последовательность нот, коды инструментов (можно использовать 128 мелодических и 47 ударных инструментов), громкость, тембр, время затухания каждой ноты и т.д. Фактически это программа, предназначенная для проигрывания звуковой картой, в памяти которой хранятся образцы звуков реальных инструментов (волновые таблицы, англ. wave tables).
?
- Что такое аналоговый сигнал?
- Какие вы знаете аналоговые приборы?
- Что такое оцифровка? Если ли потеря информации при оцифровке? Почему?
- Что такое интервал дискретизации и частота дискретизации?
- Как связаны частота дискретизации с потерей информации и объемом файла?
- Какие частоты дискретизации сейчас используются?
- От чего зависит выбор частоты дискретизации?
- Почему частоты дискретизации более 48 кГц применяются очень редко?
- Что такое дискретизация по уровню?
- Что такое разрядность кодирования звука? На что она влияет?
- В чем достоинства и недостатки оцифровки?
- Какие форматы файлов для хранения оцифрованного звука вы знаете?
- Что такое потоковый звук?
- Что такое инструментальное кодирование?
- В чем достоинства и недостатки инструментального кодирования звука?
- Почему MIDI-файлы могут звучать по-разному на разной аппаратуре?