Современные информационные технологии работы со звуком

Автор работы: Пользователь скрыл имя, 12 Сентября 2011 в 19:06, курсовая работа

Описание

Цель исследования – изучение современных компьютерных технологии обработки звука.


Задачи исследования:

1. изучить исторический аспект работы со звуком;

2. рассмотреть функциональные возможности звуковых карт;

3. рассмотреть способы представления звуковой информации в ЭВМ;

4. рассмотреть форматы звуковых файлов;

5. изучить принцип работы программных средств для работы со звуком.

Работа состоит из  1 файл

Введение.doc

— 413.50 Кб (Скачать документ)

     Дискретизация

     Важнейшим этапом аналого-цифрового преобразования является дискретизация аналогового сигнала. Вместо термина "дискретизация" в технической литературе иногда употребляют термин "выборка". По определению, дискретизация - это процесс взятия отсчетов непрерывного во времени сигнала в равноотстоящих (эквидистантных) друг от друга во времени точках. Иными словами, в процессе дискретизации измеряется и запоминается уровень аналогового сигнала. Через данный интервал времени, который называется интервалом дискретизации, процедура повторяется. Для качественного преобразования аналогового сигнала в цифровой необходимо производить достаточно большое количество отсчетов даже в течение одного периода изменения аналогового сигнала, другими словами, значение частоты дискретизации не может быть произвольным. И действительно, значение частоты дискретизации фактически определяет ширину полосы частот сигнала, который может быть записан с помощью используемой цифровой системы. Ширина этой полосы не может быть больше половины значения частоты дискретизации, как определяет теорема отсчетов (Котельникова-Шеннона-Найквиста). Эта теорема имеет важнейшее значение в технике записи и передачи сигнала в цифровой форме. Теорема гласит: сигнал, спектр частот которого занимает область от fmin до fmax, может быть полностью представлен своими дискретными отсчетами с интервалом Тд, если Тд не превышает 1/(2fmax). Другими словами, частота дискретизации fд=1/Тд в процессе преобразования должна быть, как минимум, вдвое больше наивысшей частоты звукового сигнала fmax. Если учесть, что человек способен слышать звуковые колебания, частота которых находится в диапазоне от 17 - 20 Гц до 20 КГц, и с позиций теоремы отсчетов взглянуть на требования к частотным характеристикам высококачественной аудиотехники (например, проигрывателей аудио компакт-дисков), становится ясно, что максимальная частота дискретизации исходного звукового сигнала должна составлять не менее 40 КГц. Реально для подобных систем частота дискретизации составляет не менее 44,1 КГц. Стандартное значение частоты дискретизации большинства звуковых карт составляет 44,1 и 48,0 КГц. Итак, результатом дискретизации является дискретный во времени сигнал, представляющий собой последовательность отсчетов - мгновенных значений уровня аналогового сигнала. Чем выше частота дискретизации, тем более точно будет восстановлен звуковой сигнал.

     Квантование

     После дискретизации происходит второй этап аналого-цифрового преобразования - квантования отсчетов. В процессе квантования производится измерение мгновенных значений уровня сигнала, полученных в каждом отсчете, причем осуществляется оно с точностью, которая напрямую зависит от количества разрядов, используемых для записи значения уровня. Если, задав длину N кодового слова, записать значение уровня сигнала с помощью двоичных чисел, то количество возможных значений будет равно 2N. Естественно, что столько же может быть и уровней квантования. Например, если значение амплитуды отсчетов представляется 16-разрядным кодовым словом, то максимальное количество градаций уровня сигнала (уровней квантования) будет равно 65536 (216). При 8-разрядном представлении будем иметь 256 (28) градаций уровня. Необходимая разрядность представления значений отсчетов определяется динамическим диапазоном аналогового сигнала - разрядностью между уровнями самого сильного сигнала, который устройство в состоянии пропустить, и самого слабого, еще различимого на фоне шумов. С другой стороны, разрядность АЦП однозначно определяет динамический диапазон цифрового сигнала. Так, при 8-разрядном представлении значений отсчетов динамический диапазон составит 48, а при 16-разрядном - 96 дБ. Для воспроизведения звукового сигнала, записанного в цифровой форме, необходимо преобразовать его в аналоговую форму, т.е. осуществить цифроаналоговое преобразование сигнала. На первом этапе из потока цифровых данных с помощью цифро-аналогового преобразователя выделяют отсчеты сигнала, следующие с частотой дискретизации. На втором этапе из дискретных отсчетов формируется путем сглаживания (интерполяции) непрерывный аналоговый сигнал. Эта операция равносильна фильтрации сигнала идеальным фильтром низкой частоты, который подавляет периодические составляющие спектра дискретизированного сигнала. Сразу после первого этапа цифро-аналогового преобразования сигнал представляет собой серию узких импульсов, имеющих многочисленные высокочастотные спектральные компоненты. На аналоговый фильтр в этом случае возлагается задача полностью пропустить сигнал нужного частотного диапазона (например, 0 - 24 КГц) и как можно сильнее подавить ненужные высококачественные компоненты. Аналоговому фильтру выполнить такие противоречивые требования не под силу. При использовании аналоговых усилителей с ограниченной полосой пропускания и нелинейной передаточной характеристикой, высококачественные составляющие, содержащиеся в выходном сигнале ЦАП, при недостаточной их фильтрации вызывают заметные на слух интермодуляционные искажения. Поэтому цифровой сигнал сначала интерполируют - вставляют дополнительные отсчеты, вычисленные по специальным алгоритмам, что приводит к увеличению частоты дискретизации без искажения исходного спектра сигнала. Это приводит к тому, что высококачественные спектральные компоненты на выходе ЦАП далеко отстоят от низкочастотных компонентов звукового сигнала, и, чтобы отфильтровать их, достаточно использовать простой аналоговый фильтр. В современных ЦАП интерполяция может выполняться не линейными и линейными методами в сочетании с аналоговой фильтрацией. Полученный в результате цифро-аналогового преобразования звуковой сигнал, как правило, попадает в микшер и через линейный выход направляется в акустическую систему, в которой колебания напряжения электрического сигнала преобразуются в колебания звукового давления. Принципы преобразования аналогового сигнала в цифровой одинаковы для любого типа информации (текст, графика, звук или видео). Основными характеристиками полученной цифровой информации являются частота дискретизации и разрядность (или глубина оцифровки, битовая глубина, количество уровней квантования).  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

    4. Форматы звуковых файлов 

    Перейдем  конкретно к расширениям звуковых файлов. Насчитывается немало форматов. Перечислим основные из них:

      · Wav – Формат аудио-файла, представляющий произвольный звук как он есть - в виде цифрового представления исходного звукового колебания или звуковой волны (wave), отчего в ряде случаев технология создания таких файлов, именуется wave-технологией. Позволяет работать со звуками любого вида, любой формы и длительности.

Рис.2. Графическое  представление  WAV-файла
    Где:
    А – амплитуда звуковой волны,

      Т – время ее распространения.

      Графическое представление WAV-файла очень удобно и часто используется в звуковых редакторах и программах-секвенсорах  для работы с ними и последующего преобразования (об этом речь пойдет в следующей главе). Данный формат был разработан компанией Microsoft и немудрено, что все стандартные звуки Windows имеют расширение WAV. Характерно еще и то, что эти файлы являются, как бы "промежуточными результатом", работы программ-"грабберов" и пихоакустических процессоров, для оцифровки треков СD и дальнейшего их сжатия. Но из-за того, что несжатые "полнометражные" музыкальные композиции в формате WAV имеют огромные размеры (30-50 МБ), они практически не используются. Их вытеснила музыка в MP3.

·  MP3 - сокращение от MPEG Layer3. Это один из цифровых форматов хранения аудио, разработанный Fraunhofer IIS и THOMPSON (1992г.), позднее утвержденный как часть стандартов сжатого видео и аудио MPEG1 и MPEG2. Данная схема является самой сложной из семейства MPEG Layer 1/2/3. Она требует больших затрат машинного времени для кодирования по сравнению с остальными и обеспечивает более высокое качество кодирования. Используется главным образом для передачи аудио в реальном времени по сетевым каналам и для кодирования CD Audio.

      Компрессия  достигается при активном использовании  известных особенностей человеческого слуха в плане восприятия аудиоинформации, что позволяет экономить на наименее значимых с точки зрения человеческого слуха деталях звучания. На проведенных тестах специально нанятые опытные прослушиватели не смогли различить звучание оригинального трека на CD и закодированного с коэффициентом сжатия 6:1.  

·  MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 80-х годов для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объём (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука. 

·  RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.

 ·   VQF - новый аудио формат, который вышел вслед за MP3.

      VQF файлы - приблизительно на 30-35 % меньше чем MP3 файлы.

      Пример: Длительность вашей песни составляет 5 минут, на КОМПАКТ-ДИСКЕ. WAV файл, который Вы сграбили бы, будет ~ 50МБ. MP3 файл, и 128kbps и 44kHz, был бы приблизительно 4. 5МБ, с некоторой потерей звукового качества. VQF файл, в 44kHz, и 96kbps (80kbps VQF - относительно тот же самый как 128kbps MP3), - приблизительно 3. 5МБ!

         Качество звука

      О качестве звука после сжатия можно сказать одно - хорошее. Нельзя сказать, что звук остается абсолютно без изменений, человек даже с неразвитым слухом заметит отличия. Если же говорить о VQF с точки зрения обыкновенного пользователя, то качество вполне приличное для использования в Internet. Ну а поскольку мы уже коснулись, качества звука то VQF - намного лучше чем MP3. Они почти столь же хороши как оригинал WAV файлы. 80kbps VQF столь же хорош как 128kbps MP3 файл. 96kbps VQF имеет качество, почти столь же хорошее как таковым 256kbps MP3. Одним словом можно с точно сказать что использование VQF - позволяет сэкономить до 25% дискового пространства без ощутимой потери качества.

         Использование процессора (CPU)

      Это - одна область, где VQF более тяжеловесен, чем MP3. Он требует больше ресурсов. Когда MP3 были развиты существовали только Pentium - ы. В настоящее время, с Pentium II, и другими мультимедийными средствами увеличились производительные возможностями системы. Этот не маловажный который позволяет кодировать больше звуковых данных в 30 % меньшие файлы!

      Недостатки:

      1. Этот формат достаточно новый  и пока достаточно редкий, что  нельзя сказать об MP3!. Но это - только вопрос времени. Как только люди начнут понимать, насколько он актуален на данный момент, их популярность возрастёт.

      2. Раскодирование - относительно медленно. Зависит от двух факторов:

      a) Лучшее сжатие означает, что будет  использованно большее количество  времени на "размышления" - кодирующего устройства. Оно работает по более сложным алгоритмам, таким образом, уходит большее количество времени.

      b) Кодирующее устройство достаточно  ново и очевидно, что Yamaha потратила не достаточно времени для разработки кодирующего устройств, обеспечивающего приемлимую производительность и качество. Но специалисты считают, что этот недостаток со временем будет исправлен.

      В завершении можно сказать, что новый  формат сжатия VQF будет популярным среди пользователей (если завтра не выйдет нового, сжимающего в сто раз). VQF развивается, усовершенствуется и пройдет еще несколько месяцев, и он будет сжимать файлы еще плотнее и качественнее.

      Конечно же, это не все музыкальные форматы, используемые на РС. Помимо вышеперечисленных, уже положительно проявивших себя форматов MIDI, WAV, MP3 и только вышедшего VQF, сушествует еще множество типов музыкальных файлов. Как, например, VOC - аналог формата WAV (разработанный компанией Creative Labs), XM, IT – форматы для программ-трекеров, AU – для программы Sound Gadged Pro и т.д. Но так как они используются не так часто, мы их затрагивать не будем. 
 
 
 
 
 
 
 
 
 
 
 
 
 

4. Программные средства для работы со звуком

     Программы для работы со звуком можно условно  разделить на две большие группы: программы-секвенсоры и программы, ориентированные на цифровые технологии записи звука, так называемые звуковые редакторы.

     MIDI-секвенсоры предназначены для создания музыки. С помощью секвенсоров выполняется кодировка музыкальных пьес. Они используются для аранжировки, позволяя “прописывать” отдельные партии, назначать тембры инструментов, выстраивать уровни и балансы каналов (треков), вводить музыкальные штрихи (акценты громкости, временное смещение, отклонения от настройки, модуляция и проч.). В отличие от обычного сочинения музыки эффективное использование секвенсора требует от композитора-аранжировщика специальных инженерных знаний. Программы звуковых редакторов позволяют записывать звук в режиме реального времени на жесткий диск компьютера и преобразовывать его, используя возможности цифровой обработки и объединения различных каналов.

Cakewalk Pro Audio (производитель Cakewalk Music Software)

Профессиональный многодорожечный секвенсор компании Twelve Tone Systems пользуется заслуженной популярностью у профессионалов. Поддерживает до 64 аудиодорожек и 256 — MIDI, 64 канала звуковых эффектов. Cakewalk был одним из первых программных продуктов, в котором появилась поддержка дополнительных подключаемых модулей (plug-in) разнообразных аудиоэффектов, созданных для интерфейса DirectX. Характерная особенность DirectX-эффектов заключается в том, что все они работают в реальном времени — достаточно щелкнуть по кнопке Preview, и можно настраивать все параметры выбранного эффекта прямо в процессе воспроизведения звукового фрагмента.

Cubase VST (производитель Steinberg)

Это универсальный  и сложный профессиональный секвенсор  фирмы Steinberg. Он имеет большее количество способов просмотра и манипулирования музыкой, чем какая-либо другая программа. В отличие от других, эта программа использует много непривычных терминов, поэтому для работы с ней требуется подготовка. Программа поддерживает как подключаемые модули с интерфейсом DirectX, так и с интерфейсом VST. VST специально разработан фирмой Steinberg как альтернативная платформа для поддержки эффектов реального времени.

Logic Audio Platinum (производитель EMAGIC)

HiEnd профессиональный  секвенсор фирмы Emagic имеет 128 аудиодорожек и неограниченное количество MIDI. Обеспечивает поддержку DirectX, обработку в реальном времени, качество 16/24 бит, может работать с несколькими звуковыми картами. Он также позволяет записывать звук и выполнять цифровую его обработку. Удобный оконный интерфейс отображает пьесу в виде, соответствующем решаемой задаче. Команды меню можно представить на разных языках.

Информация о работе Современные информационные технологии работы со звуком