Российский Государственный Университет
Им. И. Канта
Физический факультет
Кафедра Радиофизики и Электроники
Цифровая обработка речевых сигналов.
Курсовая работа
Студента 4 курса Р.Ф.
_____________
Научный руководитель
_____________
Калининград
2006 год.
Содержание:
-Введение
-Основные задачи психоакустики
Механизм работы слуховой системы
-Общие сведения о записи
-Микрофоны. Классификация и основные параметры.
1 Динамический микрофон (ДМ)
2 Конденсаторный микрофон (КМ)
3 Электретный микрофон (ЭМ)
4 Провода для микрофона
5 По характеристикам микрофонов
6 Устройство и принцип действия микрофонов
-Общие сведения о цифровой записи.
АЦП
ЦАП И АЦП
ЧАСТОТА ЗАПИСИ
БИТНОСТЬ
Основные преимущества цифровой записи:
-Цифровой звук – обо всем по-порядку
1 Оцифровка звука и его хранение на цифровом носителе.
2 Преобразование звука из цифрового вида в аналоговый.
3 Способы хранения цифрового звука.
4 Аппаратура.
5 Перспективы и проблематика ( -Вывод)
-Список литературы
-Введение
В работе с таким названием тяжело более или менее конкретно о чем то писать, в цифровую обработку речевых сообщении входит очень много выплывающих понятий.
Поэтому я решил рассказывать по определенной схеме, чтобы было понятно почему так.
-Для начала я решил рассказать о самом главном – устройстве человеческого слуха.
-В цепи предназначенной для записи речи первым пунктом является устройство воспринимающее речевой сигнал – МИКРОФОН (именно поэтому я уделил столько внимания этому прибору).
-Далее рассказываю про АЦП и всем к нему относящемуся.
В принципе все просто…
Основные задачи психоакустики
Основные задачи психоакустики - понять, как слуховая система расшифровывает звуковой образ, установить основные соответствия между физическими стимулами и слуховыми ощущениями, и выявить, какие именно параметры звукового сигнала являются наиболее значимыми для передачи семантической (смысловой) и эстетической (эмоциональной) информации.
Это принципиально важно как для дальнейшего развития аудиотехники, так и для музыкального искусства в целом (исполнительского творчества, совершенствования музыкальных инструментов, развития компьютерного музыкального синтеза и т.д.) и особенно для звукорежиссеров, поскольку понимание процессов формирования субъективного "слухового пространства" является необходимой базой их творчества.
Механизм работы слуховой системы
Звуковой сигнал любой природы может быть описан определенным набором физических характеристик: частота, интенсивность, длительность, временная структура, спектр и др. (Рис. 1).
Им соответствуют определенные субъективные ощущения, возникающие при восприятии звуков слуховой системой: громкость, высота, тембр, биения, консонансы-диссонансы, маскировка, локализация-стереоэффект и т.п.
Слуховые ощущения связаны с физическими характеристиками неоднозначно и нелинейно, например, громкость зависит от интенсивности звука, от его частоты, от спектра и т.п.
Еще в прошлом веке был установлен закон Фехнера, подтвердивший, что эта связь нелинейна: "Ощущения пропорциональны отношению логарифмов стимула". Например, ощущения изменения громкости в первую очередь связаны с изменением логарифма интенсивности, высоты - с изменением логарифма частоты и т.д.
Всю звуковую информацию, которую человек получает из внешнего мира (она составляет примерно 25% от общей), он распознает с помощью слуховой системы и работы высших отделов мозга, переводит в мир своих ощущений, и принимает решения, как надо на нее реагировать.
Прежде чем приступить к изучению проблемы, как слуховая система воспринимает высоту тона, коротко остановимся на механизме работы слуховой системы. В этом направлении сейчас получено много новых и очень интересных результатов.
Слуховая система является своеобразным приемником информации и состоит из периферической части и высших отделов слуховой системы. Наиболее изучены процессы преобразования звуковых сигналов в периферической части слухового анализатора.
Периферическая часть
- это акустическая антенна, принимающая, локализующая, фокусирующая и усиливающая звуковой сигнал; - микрофон; - частотный и временной анализатор; - аналого-цифровой преобразователь, преобразующий аналоговый сигнал в двоичные нервные импульсы - электрические разряды.
Общий вид периферической слуховой системы показан на рисунке 2
. Обычно периферическую слуховую систему делят на три части: внешнее, среднее, и внутреннее ухо.
Внешнее ухо состоит из ушной раковины и слухового канала, заканчивающегося тонкой мембраной, называемой барабанной перепонкой. Внешние уши и голова - это компоненты внешней акустической антенны, которая соединяет (согласовывает) барабанную перепонку с внешним звуковым полем. Основные функции внешних ушей - бинауральное (пространственное) восприятие, локализация звукового источника и усиление звуковой энергии, особенно в области средних и высоких частот. Слуховой канал представляет собой изогнутую цилиндрическую трубку длиной 22,5 мм, которая имеет первую резонансную частоту порядка 2,6 кГц, поэтому в этой области частот он существенно усиливает звуковой сигнал, и именно здесь находится область максимальной чувствительности слуха. Барабанная перепонка - тонкая пленка толщиной 74 мкм, имеет вид конуса, обращенного острием в сторону среднего уха. На низких частотах она движется как поршень, на более высоких - на ней образуется сложная система узловых линий, что также имеет значение для усиления звука.
Среднее ухо - заполненная воздухом полость, соединенная с носоглоткой евстахиевой трубой для выравнивания атмосферного давления. При изменении атмосферного давления воздух может входить или выходить из среднего уха, поэтому барабанная перепонка не реагирует на медленные изменения статического давления - спуск-подъем и т.п. В среднем ухе находятся три маленькие слуховые косточки: молоточек, наковальня и стремечко. Молоточек прикреплен к барабанной перепонке одним концом, вторым он соприкасается с наковальней, которая при помощи маленькой связки соединена со стремечком. Основание стремечка соединено с овальным окном во внутреннее ухо.
Среднее ухо выполняет следующие функции: согласование импеданса воздушной среды с жидкой средой улитки внутреннего уха; защита от громких звуков (акустический рефлекс); усиление (рычаговый механизм), за счет которого звуковое давление передаваемое во внутреннее ухо, усиливается почти на 38 дБ по сравнению с тем, которое попадает на барабанную перепонку.
Внутреннее ухо находится в лабиринте каналов в височной кости, и включает в себя орган равновесия (вестибулярный аппарат) и улитку.
Улитка (cochlea) играет основную роль в слуховом восприятии. Она представляет собой трубку переменного сечения, свернутую три раза подобно хвосту змеи. В развернутом состоянии она имеет длину 3,5 см. Внутри улитка имеет чрезвычайно сложную структуру. По всей длине она разделена двумя мембранами на три полости: лестница преддверия, срединная полость и барабанная лестница (Рис. 3)
. Сверху срединная полость закрыта мембраной Рейсснера, снизу - базилярной мембраной. Все полости заполнены жидкостью. Верхняя и нижняя полости соединены через отверстие у вершины улитки (геликотрему). В верхней полости находится овальное окно, через которое стремечко передает колебания во внутреннее ухо, в нижней полости находится круглое окно, выходящее обратно в среднее ухо. Базилярная мембрана состоит из нескольких тысяч поперечных волокон: длина 32 мм, ширина у стремечка - 0,05 мм (этот конец узкий, легкий и жесткий), у геликотремы - ширина 0,5 мм (этот конец толще и мягче). На внутренней стороне базилярной мембраны находится орган Корти, а в нем - специализированные слуховые рецепторы - волосковые клетки. В поперечном направлении орган Корти состоит из одного ряда внутренних волосковых клеток и трех рядов наружных волосковых клеток. Между ними образуется тоннель. Волокна слухового нерва пересекают тоннель и контактируют с волосковыми клетками.
Слуховой нерв представляет собой перекрученный ствол, сердцевина которого состоит из волокон, отходящих от верхушки улитки, а наружные слои - от нижних ее участков. Войдя в ствол мозга, нейроны взаимодействуют с клетками различных уровней, поднимаясь к коре и перекрещиваясь по пути так, что слуховая информация от левого уха поступает в основном в правое полушарие, где происходит главным образом обработка эмоциональной информации, а от правого уха в левое полушарие, где в основном обрабатывается смысловая информация. В коре основные зоны слуха находятся в височной области, между обоими полушариями имеется постоянное взаимодействие.
Общий механизм передачи звука упрощенно может быть представлен следующим образом: звуковые волны проходят звуковой канал и возбуждают колебания барабанной перепонки. Эти колебания через систему косточек среднего уха передаются овальному окну, которое толкает жидкость в верхнем отделе улитки (лестнице преддверия), в ней возникает импульс давления, который заставляет жидкость переливаться из верхней половины в нижнюю через барабанную лестницу и геликотрему и оказывает давление на перепонку круглого окна, вызывая при этом его смещение в сторону, противоположную движению стремечка. Движение жидкости вызывает колебания базилярной мембраны (бегущая волна) (Рис. 4)
. Преобразование механических колебаний мембраны в дискретные электрические импульсы нервных волокон происходят в органе Корти. Когда базилярная мембрана вибрирует, реснички на волосковых клетках изгибаются, и это генерирует электрический потенциал, что вызывает поток электрических нервных импульсов, несущих всю необходимую информацию о поступившем звуковом сигнале в мозг для дальнейшей переработки и реагирования.
Высшие отделы слуховой системы (включая слуховые зоны коры), можно рассматривать как логический процессор, который выделяет (декодирует) полезные звуковые сигналы на фоне шумов, группирует их по определенным признакам, сравнивает с имеющимися в памяти образами, определяет их информационную ценность и принимает решение об ответных действиях.
Общие сведения о записи
Под процессом записи понимают преобразование сигналов в пространственное изменение состояния или формы некоторого физического тела (носителя записи) с целью сохранения в нем информации для последующего ее извлечения (получения). Информацию, сохраняемую в носителе записи, называют записью. Носитель записи, содержащий информацию, полученную в процессе записи, называют фонограммой.
За столетие, прошедшее с момента возникновения первых идей записи звука, были предложены десятки способов записи. Одними из них являются: механический (грамзапись), фотографический, магнитный, лазерный и т.д.
Магнитную запись на движущийся ферромагнитный носитель производят с помощью особого электромагнита - магнитной головки - в обмотку которого подают ток сигнала. Магнитное поле электромагнита намагничивает носитель записи, в качестве которого используют пластмассовую ленту, покрытую порошком окислов ферромагнитных металлов или металлическим ферромагнитным слоем. Фонограмма получается в виде намагниченных участков разной длины. Она не нуждается ни в каких процессах обработки и может быть воспроизведена немедленно с помощью устройства, аналогичного записывающему.
Комбинацией механического и оптического способов записи является запись лазерным лучом на компакт-диски. Запись ведут модулированным лучом лазера на вращающийся диск. Под его воздействием в материале первичного носителя образуются углубления - лунки - разной длины. Далее как и при механической записи, получают матрицу. Прессованием получают копии первичной записи. Для воспроизведения также используют луч лазера.
Магнитооптическая запись (или запись на MiniDisk) - это гибрид магнитной и лазерной записи. В ней для записи используется и лазерный луч, и магнитная головка. Главная технология формата MD заложена в самом носителе, специальный магнитный слой которого обладает одним очень полезным, хотя и немного странным свойством. Если этот слой намагничен отрицательным полюсом магнита, то отражающийся от его поверхности лазерный луч немного отклонится в одну сторону. Если этот слой намагничен положительным полюсом, то он отклоняет луч в другую сторону. И хотя отклонения составляют всего лишь около одного градуса, этого достаточно, чтобы их уловил считывающий сенсор и зарегистрировал в виде нулей и единиц цифрового сигнала.
Микрофоны. Классификация и основные параметры.
Микрофон - это устройство для преобразования акустических колебаний воздушной среды в электрические сигналы.
В настоящее время существуют различные типы микрофонов, которые находят широкое применение в системах радиовещания, телевидения, телефонии, озвучения, звукоусиления, записи и усиления звука. Микрофон является первым и одним из наиболее важных звеньев любого электроакустического тракта. Поэтому его свойства оказывают огромное влияние на качество работы этого тракта.
Микрофоны в зависимости от назначения подразделяют на профессиональные и бытовые (любительские). Первые из них используют при профессиональной звукозаписи в радиовещании, телевидении, системах звукоусиления, для акустических измерений и т.д. Бытовые микрофоны используют при домашней звукозаписи.
По способу преобразования колебаний микрофоны подразделяют на электродинамические (ленточные и катушечные), электростатические (конденсаторные и электретные), электромагнитные, угольные и др.; по диапазону воспринимаемых частот - на узкополосные (речевые) и широкополосные (музыкальные); по направленности - на ненаправленные (круговые), двусторонненаправленные (восьмеричные или косинусоидальные), односторонненаправленные (кардиоидные, суперкардиоидные, гиперкардиоидные), остронаправленные; по помехозащищенности - на шумозащищенные и обычного исполнения.
1 Динамический микрофон (ДМ) Звуковая волна давит на мембрану (так здесь называется та часть которая в громкоговорителе называется диффузором), мембрана двигает катушку, в катушке под влиянием магнитного поля образуется переменное напряжение – звуковой электрический сигнал. Главное приемущество ДМ – его простота, а благодаря легкости мембраны и миниатюрности катушки его можно сделать достаточно чувствительным и широкодиапазонным. Недостатком таких микрофонов является их чувствительность к электромагнитным наводкам, что связано с одной стороны с их электромагнитной конструкцией, с другой стороны с малый уровнем выходного сигнала. Для устранения наводок было придумано немало ухищрений, как например использование особых экранирующих конструкций, противофоновой противофазной катушки вычитающей помеху из сигнала, встроенного усилителя. Но самым эффективным и простым способом борьбы с наводками является симметричное включение микрофона. Вспомним конструкцию ДМ. У катушки два конца. В простейшем случае (при несимметричном соединении) один конец соединяется с землей (оплеткой экрана кабеля) а второй с сигнальной линией. Если кабель короткий и рядом нет мощных источников помех (например трансформаторов питания), а головка хорошо экранирована, то проблем обычно не возникает. Если же кабель длинный, то и на него наводятся помехи. Что б от них избавиться применяют симметричное (баллансное) соединение. При этом от микрофона отходят не два а три проводника - от двух концов катушки и от экрана. Однако для того что б при таком включении можно было получить полезный сигнал относительно земли (общего провода) два противофазных сигнала на концах катушки надо сделать синфазными и просуммировать. Для этого в преампах используют либо трансформатор, либо дифференциальный усилитель, отчего подобное включение еще называют дифференциальным. Так как помеха наводится на оба провода одинаково (синфазно), а полезный сигнал является на концах катушки противофазным, то при суммировании с инверсией одного из сигналов, амплитуда полезного сигнала удваивается, а помеха наоборот вычитается. Для еще лучшего согласования с длинной линией на выходе хороших микрофонов также встраивается специальный трансформатор. 2 Конденсаторный микрофон (КМ) Представьте себе электрический конденсатор состоящий из неподвижной пластины и тонкой и легкой металлизированной мембраны натянутой очень близко от пластины. Если на такой конденсатор подать через резистор напряжение, то при воздействии на мембрану звуковой волны будет меняться расстояние между ней и пластиной, а вместе с этим емкость конденсатора, а значит и напряжение на нем. Получится высокочувствительный микрофон, по понятным причинам называемый конденсаторным. Благодаря очень малому весу мембраны КМ обладает самыми хорошими характеристиками, являясь своего рода королем микрофонов. Существуют КД с так называемой большой мембраной (около дюйма диаметром), используемые для записи голоса и некотороых инструментов и с так называемой малой мембраной (порядка 0.5-0.7 дюйма) имеющие форму и размеры близкие к сигаре и предназначенные для записи инструментов. Выходное сопротивление головки КМ очень высокое, а сигнал очень мал, в связи с чем для согласования с линией и входом преампа вначале в КМ встраивали вакуумные лампы. Недостатками ламповых микрофонов по сравнению с динамическими были высокий уровень шумов и слабая перегрузочная способность (большие искажения при большом уровне сигнала). Неудобство вызывали также необходимость подводить к микрофону высокое напряжение для питания анода лампы и напряжение накала, ограниченный срок службы ламп. Поэтому в 70-е годы ХХ-го века, когда стали доступны полевые транзисторы, свойства которых близки свойствам ламп, производители постепенно отказались от ламповых микрофонов. Резко улучшились шумовые параметры микрофонов, упростилось питание, пропала проблемма долговечности ламп. Но вместе со всем этим пропало и одно полезное свойство ламповых КМ – сатурация приводящая к специфическим искажениям при которых тембр обогащается приятными на слух гармониками. Вместе с тем прогресс не стоял на месте. Шумовые свойства ламп улучшились, было придумано питание головки не постоянным током, а высокочастными колебаниями получаемыми от встроенного генератора. Вот почему в 90-е годы разработчики, на новом витке развития КМ, решили вернуться к идее ламповых микрофонов. Это доказало тот факт, что ламповые микрофоны могут быть столь же качесвтенными как и транзисторные и при этом сохранять то свойственное им специфическое ламповое звучание которое так ценится звукорежиссерами. 3 Электретный микрофон (ЭМ) Электретный микрофон является разновидностью КМ. Когда КМ стали транзисторными, для их еще большего удешевления и упрощения цепей питания, придумали мембраны с электретным слоем который заряжается на заводе и тем самым отпадает необходимость в сравнительно высоком напряжении питания головки. Со временем электрет постепенно разряжается и параметры микрофона ухудшаются. 4 Провода для микрофона
Микрофон. Я подразумеваю хороший микрофон и микрофонный усилитель. И про то, и про другое можно найти массу информации в печатных изданиях, да и в Сети тоже. Дам совет только в одном.
Дело в том, что в студийной практике применяется один очень умный принцип для соединительных кабелей. Про витую пару сигнальных линий все уже знают, но вот как припаивать провода на концах проводов - лишь посвященные, да и то не все.
На рисунке ниже показано, как правильно изготовить шнур, который не внесет никакого вклада в качество записи, если он состоит из качественных проводов. В качестве экрана - медная оплетка (желательно, чтобы везде применялась медь!). Сигнальные жилы внутри экрана - витая пара медных многожильных проводов. Подобный кабель лучше купить в каком-нибудь магазине, где продают профессиональные микрофоны, гитары, и т.п. (дешевле обойдется провод, чем помехи). Стоит отметить, что только с микрофоном необходимо столь щепетильно отнестись к кабелю, иначе будете менять микрофонные усилители и сами микрофоны до греческих календ.
сам ПРИНЦИП:
Экран соединен с металлической основой капсюля (если она металлическая) или просто висит внутри корпуса микрофона, а на входе (только лишь на входе!!!) экран соединяется с землей. Тогда помехи и наводки, попав в экран, стекают в одну точку (как бы компенсируются), а не циркулируют по экрану. Экран не должен быть "антенной для помех"!
Запись с микрофона нуждается лишь в частотной коррекции (если АЧХ у микрофона имеет ощутимую неравномерность и спад раньше 18-19 кГц). Кое-кто чистит и шум, но "правильный" тракт до оцифровки менее шумен, чем капли дождя, падающие на подоконник и безжалостно фиксируемые на Ваш микрофон.
5 По характеристикам микрофонов
По электроакустическим параметрам микрофоны разделяют на четыре группы сложности: нулевая (высшая), первая, вторая и третья. Микрофоны нулевой, первой и второй групп сложности предназначены для звукопередачи, звукозаписи и звукоусиления музыки и речи, микрофоны третьей группы сложности - только для речи. Кроме того, по некоторым параметрам микрофоны подразделяются на устройства высшей и первой категории качества.
Основные параметры микрофонов: номинальный диапазон частот, модуль полного электрического сопротивления, чувствительность, типовая частотная характеристика чувствительности, характеристика направленности ...
Номинальный диапазон частот - тот диапазон частот, в котором микрофон воспринимает акустические колебания и в котором нормируются его параметры. для профессиональных студийных целей обычно стремятся использовать микрофоны нулевой группы сложности высшей категории качества, для которых нормируется диапазон частот 20 ... 20000 Гц. Микрофоны первой группы сложности должны иметь номинальный диапазон частот не менее 31,5 ... 18000 Гц, второй группы 50 ... 15000 Гц, третьей группы 63 ... 12500 Гц.
Модуль полного электрического сопротивления (называемого также выходным или внутренним) нормируется на частоте 1 кГц. Сопротивление может быть комплексным или активным. Если оно комплексное и, следовательно, зависимое от частоты, то приводят или модуль на частоте 1 кГц, или среднее значение по диапазону частот. Для микрофонов нулевой и первой групп сложности нормируется значение модуля полного электрического сопротивления 50 Ом и менее, 100 и 200 Ом, а для микрофонов второй и третьей групп сложности также еще и 2 кОм.
Чувствительность микрофона
- это отношение напряжения U на выходе микрофона к воздействующему на него звуковому давлению р, выраженное в милливольтах на паскаль (мВ/Па): E=U/p.
Уровень чувствительности
- чувствительность, выраженная в децибелах относительно величины Енач
= 1 В/Па и определяемая по формуле:
Nм
= 20 lgE - 60, дБ,
где Е - чувствительность микрофона, мВ/Па.
Неравномерность частотной характеристики определяется как разность между максимальным и минимальным уровнями чувствительности микрофона в номинальном диапазоне частот и выражается в децибелах:
DN = NMAX
- NMIN
.
Характеристика направленности
Если микрофон воспринимает одинаково звук со всех направлений (всенаправленный микрофон) это вызывает много проблемм. Во-первых рядом могут находиться другие источники звука (голоса, инструменты), но и зрители которые кашляют, чихают и даже разговариявают между собой, а также в микрофон могут проникать вторичные источники звука, т.е. вредные отражения от стен помещения. Поэтому такие микрофоны используют редко, например для записи хора в очень хорошо звучащем помещении. Самым распространенным типом микрофона с точки зрения направленности является кардиоидный микрофон. Он воспринимает сильнее звуки идущие спереди и слабее те что приходят из других направлений, особенно с его тыльной стороны. Однако за это приходится платить одним недостатком – зависимостью тембра звука от расстояния между источником и микрофоном и от угла поворота микрофона по отношению к источнику. Поэтому исполнитель должен сохранять перед микрофоном строго опреленное положение. С другой стороны при неподвижном источнике звука (ударные инструменты, ф-но, хор, гитарный комб) меняя расстояние и угол поворота кардиоидного микрофона можно «регулировать» тембр звука. Еще более направленным является суперкардиоидный микрофон, используемый в особо критических ситуациях, приемущественно на концертах. Естественно что недостатки кардиоидных микрофонах еще сильнее проявляются в суперкардиоидных. И последний тип микрофонов – двунаправленные (направленность в иде цифры 8). С их помощью можно записывать одновременно два источника звука находящихся напротив, например журналиста и приглашенного для интервью, или дуэт. Конденсаторные микрофоны часто имеют возможность переключения или регулировки характеристики направленности, что делает их универсальнее, но и значительно дороже. Нередко фирмы выпускают две одинаковые модели микрофонов, с одним лишь отличием – в «удешевленной» присутствует лишь кардиоидная характеристика направленности. Так что это неплохой путь экономии, учитывая что подавляющее большинство записей делается при помощи именно кардиоидных микрофонов. R(q) - зависимость чувствительности микрофона в свободном поле на определенной частоте f от угла q между рабочей осью микрофона и направлением на источник звука.
Диаграмма направленности - это графическое изображение характеристики направленности, которое чаще всего приводят в полярных координатах.
В качестве примера на рис. 5
приведены три наиболее часто встречающиеся диаграммы направленности микрофонов: а - круговая, б - кардиоидная, в - косинусоидальная.
Рис.5
. Типовые диаграммы направленности микрофонов.
6 Устройство и принцип действия микрофонов
Любой микрофон состоит из двух систем: акустико-механической и механоэлектрической.
Свойства акустико-механической системы сильно зависят от того, воздействует ли звуковое давление на одну сторону диафрагмы (микрофон давления) или на обе стороны, а во втором случае от того, симметрично ли это воздействие (микрофон градиента давления) или на одну из сторон диафрагмы действуют колебания, непосредственно возбуждающие ее, а на вторую - прошедшие через какое-либо механическое или акустическое сопротивление или систему задержки времени (асимметричный микрофон градиента давления).
Рис. 6
Устройство микрофонов: а - угольного; б - электромагнитного; в - электродинамического; г - ленточного; д - конденсаторного; е - пьезоэлектрического Большое влияние на характеристики микрофона оказывает его механоэлектрическая часть.
Первым получил распространение угольный микрофон, который и до сих пор используют в телефонии. Действие его основывается на изменении сопротивления между зернами угольного порошка при изменении давления на их совокупность.
Угольный микрофон (рис. 6, а)
работает следующим образом. При воздействии звукового давления на его диафрагму 1 она начинает колебаться. В такт этим колебаниям изменяется и сила сжатия зерен угольного порошка 2, в связи с чем изменяется сопротивление между электродами 3 и 4, а при постоянном электрическом напряжении изменяется и ток через микрофон. Если, скажем, включить микрофон к первичной обмотке трансформатора Т, то на зажимах его вторичной обмотки будет возникать переменное напряжение, форма кривой которого будет отображать форму кривой звукового давления, воздействующего на диафрагму микрофона.
Основное преимущество угольного микрофона - высокая чувствительность, позволяющая использовать его без усилителей. Недостатки - нестабильность работы и шум из-за того, что полезный электрический сигнал вырабатывается при разрыве и восстановлении контактов между отдельными зернами порошка, большая неравномерность частотной характеристики и значительные нелинейные искажения.
После угольного микрофона появился электромагнитный микрофон, который работает следующим образом (рис. 6, б)
. Перед полюсами (полюсными наконечниками) 2 магнита 3 располагают ферромагнитную диафрагму 1 или скрепленный с ней якорь. При колебаниях диафрагмы под воздействием на нее звукового давления меняется магнитное сопротивление системы, а значит, и магнитный поток через витки обмотки, намотанной на магнитопровод этой системы. Благодаря этому на зажимах обмотки возникает переменное напряжение звуковой частоты, являющееся выходным сигналом микрофона.
Электромагнитный микрофон стабилен в работе. Однако ему свойственны узкий частотный диапазон, большая неравномерность частотной характеристики и значительные нелинейные искажения.
В противоположность электромагнитному микрофону чрезвычайно широкое распространение для целей озвучения, звукоусиления получил электродинамический микрофон в своих двух модификациях - катушечной и ленточной.
Принцип действия электродинамического катушечного микрофона состоит в следующем (рис.6, в)
. В кольцевом зазоре 1 магнитной системы, имеющей постоянный магнит 2, находится подвижная катушка 3, скрепленная с диафрагмой 4. При воздействии на последнюю звукового давления она вместе с подвижной катушкой начинает колебаться. В силу этого в витках катушки, перерезывающих магнитные силовые линии, возникает напряжение, являющееся выходным сигналом микрофона.
Электродинамический микрофон стабилен, имеет довольно широкий частотный диапазон, сравнительно небольшую неравномерность частотной характеристики.
Устройство ленточного электродинамического микрофона несколько отличается от устройства катушечной модификации (рис. 6, г)
. Здесь магнитная система микрофона состоит из постоянного магнита 1 и полюсных наконечников 2, между которыми натянута легкая, обычно алюминиевая, тонкая (порядка 2 мкм) ленточка 3. При воздействии на обе ее стороны звукового давления возникает сила, под действием которой ленточка начинает колебаться, пересекая при этом магнитные силовые линии, вследствие чего на ее концах развивается напряжение.
Т.к. сопротивление ленточки очень мало, то для уменьшения падения напряжения на соединительных проводниках напряжение, развиваемое на концах ленточки подается на первичную обмотку повышающего трансформатора, размещенного непосредственно вблизи ленточки. Напряжение на зажимах вторичной обмотки трансформатора является выходным напряжением микрофона.
Частотный диапазон этого микрофона довольно широк, а неравномерность частотной характеристики невелика.
Для электроакустических трактов высокого качества наибольшее распространение в настоящее время получил конденсаторный микрофон. Принципиально он работает следующим образом (рис.6, д)
. Жестко натянутая мембрана 1 под воздействием звукового давления может колебаться относительно неподвижного электрода 2, являясь вместе с ним обкладками электрического конденсатора. Этот конденсатор включается в электрическую цепь последовательно с источником постоянного тока Е и активным нагрузочным сопротивлением R. При колебаниях мембраны емкость конденсатора меняется с частотой воздействующего на мембрану звукового давления, в связи с чем в электрической цепи появляется переменный ток той же частоты и на нагрузочном сопротивлении возникает падение напряжения, являющееся выходным сигналом микрофона.
Нагрузочное сопротивление должно быть большим, чтобы падение напряжения на нем не уменьшалось сильно на низких частотах, где емкостное сопротивление конденсатора очень велико и эксплуатация такого микрофона была бы невозможна из-за сравнительно небольшого сопротивления микрофонных линий и нагрузки. По этой причине почти у всех современных конденсаторных микрофонов предусмотрены конструктивно связанные с самим микрофоном усилители, имеющие малый коэффициент усиления (порядка 1), высокое входное и низкое выходное сопротивления.
Конденсаторные микрофоны имеют самые высокие качественные показатели: широкий частотный диапазон, малую неравномерность частотной характеристики, низкие нелинейные и переходные искажения, высокую чувствительность и низкий уровень шумов.
Электретные микрофоны, по существу, те же конденсаторные, но постоянное напряжение для них обеспечивается не обычным источником, а электрическим зарядом мембраны или неподвижного электрода, материалы которых отличаются тем, что способны сохранять этот заряд длительное время.
Некоторое распространение получили микрофоны пьезоэлектрические (рис.6, е)
. Их действие основано на том, что звуковое давление воздействует непосредственно или через диафрагму 1 и скрепленный с ней стержень 2 на пьезоэлектрический элемент 3. При деформации последнего на его обкладках вследствие пьезоэлектрического эффекта возникает напряжение, являющееся выходным сигналом микрофона.
Действие транзисторных микрофонов (весьма мало распространенных) основывается на том, что под действием звукового давления на диафрагму и скрепленное с ней острие, являющееся одновременно эмиттером полупроводникового триода, изменяется сопротивление эмиттерного перехода через него. Хотя транзисторные микрофоны с диафрагмой достаточно чувствительны, но они недостаточно стабильны и их частотные характеристики даже в сравнительно узком диапазоне частот неравномерны.
Стереофонический микрофон представляет собой систему из двух микрофонов, конструктивно размещенных в общем корпусе на одной оси друг над другом.
Рис. 7
. Характеристики направленности стереофонических микрофонов
Для записи по сис
. При записи по системе MS один из микрофонов (микрофон середины) имеет круговую характеристику направленности, а другой (микрофон стороны) - косинусоидальную характеристику направленности (рис. 7, б)
.
Радиомикрофон представляет собой систему, состоящую из микрофона, переносного малогабаритного передатчика и стационарного приемника. Микрофон чаще всего используют динамический катушечный или электретный. Передатчик либо совмещают в одном корпусе с микрофоном, либо выполняют карманного типа. Он излучает энергию радиочастот в УКВ диапазоне на одной из фиксированных частот. Вследствие влияния дополнительных преобразований в системе "передатчик - эфир - приемник" качественные параметры радиомикрофона уступают параметрам обычного микрофона.
Для приема речи в условиях окружающего шума применяют ларингофоны. Эти приборы воспринимают механические колебания гортани, возникающие при речеобразовании. Для этого ларингофоны (обычно пара) прижимаются к шее в области гортани. По принципу преобразования ранее применялись угольные ларингофоны, а в настоящее время - электромагнитные. Отличие их от соответствующих микрофонов в том, что в них нет диафрагм, на которые воздействует звуковое давление, а подвижный элемент вследствие инерции перемещается относительно корпуса колеблющегося в такт с колебанием гортани, к которой он прилегает.
Общие сведения о цифровой записи.
Когда компьютеры были большими (а по возрасту маленькими) они были как аналоговыми так и цифровыми (хотя в самом раннем детстве они не были даже электронными), причем аналоговые считались более перспективными (а некоторые ученые считают так и сейчас) и для них много чего изобрели, в частности такое прекрасное устройство как ОПЕРАЦИОННЫЙ УСИЛИТЕЛЬ (который потому так и называется, что в юности совершал математические операции) и без которого наши студийные приборы сейчас просто немыслимы. Но со временем цифровой компьютер победил (возможно временно) и всех стало интересовать почему это там все измеряется в «нулях» и «единицах», т.е. почему там используется двоичная система, когда все числа составляются из всего двух цифр - нуля и единицы. Оказывается такие системы стабильнее (меньше подвержены наводкам) и математические операции на них совершаются точно и просто. Составим число из 4-х цифр и назовем его термином «слово». При этом число (слово) будет называться 4-х разрядным и оно сможет изображать всего 16 разных чисел – от 0000 – это ноль, и далее до 1111 – это число 15. Конечно этого мало, но когда 15-ти значений не хватает, можно выйти из положения и разбить большое число на несколько слов и передать их по очереди. Ведь мы так и поступаем когда разговариваем друг с другой – передаем сложные значения комбинацией слов, почему бы и компьютерам так не делать? Да потому что это медленно! Хорошо, давайте увеличим длину слова до 8 разрядов, т.е. сделаем его 8-битным! Такое 8-битное слово еще называется байтом. В один байт можно закодировать 256 комбинаций. Уже лучше! Компьютеры были 8-битными довольно долго и даже наши любимые IBM-РС родились такими. Но людям всегда хочется больше и быстрее! Вначале 16 бит, потом 32 и совсем недавно они наконец стали 64-битными. Возможно через лет 10 дойдет очередь и до 128-битных. АЦП
АЦП (аналогово-цифровой преобразователь) это электронный вольтметр который периодически (с частотой F) измеряет входное напряжение и передает эти измерения в виде двоичных чисел в память компьютера. Т.е. он совершает конвертирование аналогового сигнала в цифровой и потому еще называется конвертером. Далее компьютер может совершать над этими изображающими звук числами чисто компьютерные операции. Если мы захотим сконвертировать в цифровую форму входной звуковой сигнал при помощи 4-х разрядного АЦП, то мы сможем это сделать с точностью в 1/15-ю от входного напряжения т.е. с искажениями в примерно 7%! Ужасно! И ведь это при том что амплитуда входного сигнала будет максимально возможной для данного АЦП. А что будет если сигнал будет слабее, скажем в два раза (-6дБ) ? В его конвертировании старший разряд уже не будет учавствовать и нам останется всего 8 комбинаций (3 бита) и погрешность возрастет до 14 % !!! И чем меньше будет сигнал, тем, само собой разумеется, больше будет погрешность. Теперь рассмотрим обратный случай – сигнал по амплитуде будет больше чем тот на который расчитан АЦП. Естественно что для отображения такого сигнала потребуется еще один, 5-й бит, но его ведь нет! И искажения сразу прыгнут до целых 50 % ! Вспоминаете треск цифровой перегрузки? Предположим теперь что у нас 16-разрядный АЦП. При его помощи можно получить уже целых 65356 различных значений (комбинаций) и при потере одного разряда искажения будут несущественными, но... это для максимальных значений сигнала! А ведь музыка имеет свой динамический диапазон и не все время играет громко, даже если это дискотечная музыка! А если у нас скажем инструмент второго плана играет с уровнем -24 дБ? Это уже минус 4 разряда. Но есть же инструменты которые звучат еще тише, наконец есть реверберация, от которой так много зависит, и которая звучит намного тише! К сожаленью в начале 80-х годов 20-го века были приняты стандарты цифрового диска - 16 бит при F=44100 Гц и цифрового магнитофона – 16 бит при F=48000 Гц. Как мы уже выяснили – этого мало, но... стандарт есть стандарт и его надо соблюдать! Тем более что тогда даже 16-битные АЦП были на грани технологических возможностей! В результате последующих акустических тестов при сравнении лучших магнитных лент с лучшими АЦП оказалось что разница между ними пропадает приблизительно при числе разрядов от 19-ти и выше. Вслед за этим появились 20-разрядные АЦП которые обеспечивают требуемое качество записи. Но во-первых почему не больше, разве магнитная лента предел мечтаний? Во-вторых при записи, редактировании и сведении обычно теряются несколько бит, а значит нужен студийный технологический запас. Вот почему сегодня АЦП стали 24-битными. ЦАП И АЦП
ЦАП (цифро-аналоговый преобразователь) это устройство обратное АЦП. Оно конвертирует звуковую информацию из цифровой в аналоговую. ЦАП сделать несколько проще, поэтому он дешевле чем АЦП. Работающие в паре ЦАП и АЦП должны иметь одинаковые параметры – т.е. одинаковое колличество разрядов и одинаковую частоту. Звук в компьютерном представлении мы слышать не можем, а потому без ЦАП-ов контроль звука невозможен. ЧАСТОТА ЗАПИСИ
Современные конвертеры могут работать на частотах 44100, 48000, 88200, 96000, а некоторые и 192000 Гц. Эта частота должна быть больше в два раза чем верхняя частота звукового диапазона. Если мы (с некоторым запасом) принимем верхнюю границу диапазона 22000 Гц, то частота работы конвертеров должна быть не меньше 44000 Гц. Отсюда и взялись стандартные 44100 и 48000 Гц. К сожаленью эти два формата друг в друга без потерь не конвертируются, поэтому если конечным продуктом ваших трудов будет CD, то записывать надо сразу в 44100, а если DVD – то 48000 Гц. Конечно, для лучшего качества можно работать на удвоеных частотах – 88200 и 96000 Гц, но при этом вам потребуется в два раза больше места на жестком диске и компьютер значительно мощнее. БИТНОСТЬ
Выше было уже сказано как случилось что конвертеры стали 24-битными и вполне можно рекомендовать этот формат как основной, но математики придумали еще один хитрый формат - 32 float, что-то вроде виртуальных 32-х бит. Этот формат позволяет избежать внутренних перегрузок математического аппарата. В некоторых случаях, например при записи через плагины, имеет смысл переключиться на этот формат, не забывая однако что при этом увеличится и пространство занимаемое на жестком диске.
Несмотря на все разнообразие моделей звуковых карт, их возможностей, качества звука и размеров все они имеют примерно одну структуру и основные блоки. Понимание устройства и принципов работы карты сильно облегчает разрешение возникающих при установке и работе проблем, а также позволяет более оптимально конфигурировать ее.
Эта единственная микросхема на самом деле состоит из трех функционально независимых узлов, составляющих три основных устройства большинства звуковых карт: • Узел цифрового тракта, ответственный за преобразование звука из аналоговой формы в цифровую и обратно, и обмен цифровым потоком с центральным процессором или памятью компьютера; • Узел музыкального синтезатора, построенного по частотно-модуляционному (FM) принципу и выполненному в стандарте OPL3; • Узел аналогового микшера, выполняющего смешивание сигналов с двух предыдущих узлов, а также с линейного и микрофонного входов карты. Эти три устройства функционально полностью независимы и программируются отдельно друг от друга.
Цифровой тракт такой карты можно считать ее основным узлом, поскольку именно он выполняет преобразование и передачу звука из внешней среды в компьютер и обратно. Для этого тракт имеет АЦП и ЦАП - аналогово-цифровой и цифро-аналоговый преобразователи, между которыми размещена логика управления цифровым потоком. Поступающий на АЦП звук в аналоговой форме - в виде непрерывно меняющегося электрического сигнала - подвергается в нем дискретизации и квантованию. Дискретизация разбивает непрерывный сигнал на последовательность его мгновенных значений - отсчетов, следующих с более высокой частотой (не менее, чем удвоенный верхний предел частотного диапазона), а квантование кодирует уровень каждого отсчета целым числом в диапазоне 0..255 (8-разрядная оцифровка) или 0..65535 (16-разрядная оцифровка). В результате образуется поток чисел, величина которых описывает закон изменения исходного сигнала. Этот поток проходит через схему управления и может считываться оттуда непосредственно процессором через регистры карты, однако чаще всего применяется автоматическая передача напрямую в память (прямой доступ к памяти - DMA), при котором от процессора требуется только настроить начальный адрес и параметры передачи, а все остальное сделают системный контроллер DMA и система управления цифрового тракта карты.
Аналогичным образом работает и обратный процесс: последовательность цифровых отсчетов, забираемая системой управления цифрового тракта карты из памяти, подается на ЦАП, который преобразует числовые значения в уровни напряжения, а затем объединяет дискретную последовательность этих уровней в непрерывный звуковой сигнал, который и снимается с выхода карты.
Все современные карты поддерживают запись и воспроизведение звука на частотах дискретизации до 44.1 кГц с 16-разрядным квантованием; в подавляющем большинстве реализовано также 8-разрядное квантование для работы со звуком низкого качества (параметры телефонной линии). Ряд карт поддерживает частоты дискретизации 48 кГц и выше, а те, что предназначены для профессиональной работы - 18- и 20-разрядное квантование.
Принцип, на котором базируется способ передачи звуковых сигналов в цифровой форме, состоит в том, что полное воспроизведение любого сигнала на стороне приема возможно и в том случае, когда передается не весь сигнал, а лишь периодически выделяемые из него отсчеты. В отличие от аналогового цифровой сигнал, искаженный помехами, можно восстановить (регенерировать) полностью. Для этого достаточно принять решение о наличии ("1") или отсутствии ("0") сигнала. Длительность цифрового сигнала при передаче выбирается строго определенной, и при приеме возможно полное устранение временных искажений.
Основные преимущества цифровой записи:
возможность получения сколь угодно большого динамического диапазона и сколь угодно малых искажений;
отсутствие детонации звука;
возможность многократного копирования фонограмм без ухудшения качества;
отсутствие модуляционных шумов;
отсутствие искажений АЧХ при любых уровнях сигнала в пределах динамического и частотного диапазонов.
Цифровая система звукозаписи требует представления входного аналогового сигнала в цифровом виде, а выходного цифрового сигнала - в аналоговом. Для преобразований используют аналого-цифровые (АЦП) и цифро-аналоговые (ЦАП) преобразователи. Обобщенная структурная схема системы цифровой звукопередачи показана на рис. 8
.
Рис. 8
. Обобщенная структурная схема цифровой системы звукопередачи.
Аналоговый сигнал источника подается на фильтр, ограничивающий его частотную полосу. Затем из аналогового сигнала с помощью схемы выборки-хранения выделяются отсчеты, т.е. производится квантование сигнала во времени. Далее сигнал поступает на АЦП, который преобразует амплитуду каждого отсчета в закодированные числа. Они и представляют собой цифровые сигналы, дискретные во времени и по величине. Для защиты от возможных ошибок, а также для согласования с параметрами канала передачи цифровой сигнал, как правило, перекодируется путем введения контрольных символов. На приемной стороне с помощью ЦАП вырабатывается сигнал, амплитуда которого в каждый момент времени соответствует амплитуде отсчета на стороне передачи. Наконец сигнал подается на фильтр НЧ, который позволяет восстановить непрерывный во времени (аналоговый) сигнал.
Для того чтобы осуществить дискретизацию аналогового сигнала, его частотная полоса должна быть ограничена фильтром НЧ. Необходимо также, чтобы фронты характеристики пропускания фильтра были по возможности более крутыми. Лишь при этом условии сигнал может удовлетворить требованиям теоремы отсчетов, которая гласит: сигнал, спектр частот которого занимает область от -В0
до +В0
(низкочастотный сигнал), может быть полностью представлен своими дискретными отсчетами с интервалом ТА
, если ТА
>=1/В0
. Другими словами, частота дискретизации fA
=1/ТА
должна быть как минимум вдвое больше максимальной частоты аналогового сигнала fmax
, т.е. fA
>=2fmax
. Если это условие не выполняется, то спектры дискретизации взаимно перекрываются и адекватно восстановить исходный аналоговый сигнал невозможно.
Дискретизацией
непрерывного во времени сигнала xA
(t) называется процесс взятия отсчетов во временных точках t=nT. Результатом дискретизации является дискретный во времени выходной сигнал xD
(t)=xA
(nT), представляющий собой последовательность отсчетов x(n). Демодуляция дискретизованного сигнала позволяет полностью восстановить информацию, содержащуюся в исходном сигнале.
Взятие отсчетов реализуется с помощью схемы выборки-хранения, в которой за период выборки ТА
происходит заряд конденсатора напряжением входного сигнала. При этом потенциал заряда соответствует мгновенному значению напряжения сигнала. Напряжения на конденсаторе сохраняется неизменным в течение некоторого отрезка времени, называемого временем хранения.
Рис. 9. Характеристики квантования: а) линейная; б) нелинейная.
Квантование сигнала можно описать графически с помощью характеристики квантования, где по горизонтальной оси отложены значения непрерывного сигнала, а по вертикальной - значения квантового сигнала (рис. 9.). Шаг квантования определяется числом разрядов АЦП. Квантование с постоянным шагом называется равномерным или линейным. Иногда применяется нелинейное квантование. Оно позволяет обеспечить достаточно большой динамический диапазон при снижении разрядности АЦП. При этом характеристика квантования имеет вид кривой, близкой к логарифмической. Число уровней квантования n и число двоичных разрядов АЦП определяют динамический диапазон преобразования. Динамический диапазон (в дБ) от числа разрядов АЦП или ЦАП определяется выражением D=6n+1,8, где n - число двоичных разрядов.
Цифровой звук – обо всем по-порядку
Некоторые факты и понятия, без которых тяжело обойтись: В соответствии с теорией математика Фурье, звуковую волну можно представить в виде спектра входящих в нее частот (рис. 10)
. Частотные составляющие спектра - это синусоидальные колебания (так называемые чистые тона), каждое из которых имеет свою собственную амплитуду и частоту. Таким образом, любое, даже самое сложное по форме колебание (например, человеческий голос), можно представить суммой простейших синусоидальных колебании определенных частот и амплитуд. И наоборот, сгенерировав различные колебания и наложив их друг на друга (смикшировав, смешав), можно
рис 10.
получить различные звуки. Справка: человеческий слуховой аппарат/мозг способен различать частотные составляющие звука в пределах от 20 Гц до ~20 КГц (верхняя граница может колебаться в зависимости от возраста и других факторов). Кроме того, нижняя граница сильно колеблется в зависимости от интенсивности звучания.
1 Оцифровка звука и его хранение на цифровом носителе.
«Обычный» аналоговый звук представляется в аналоговой аппаратуре непрерывным электрическим сигналом. Компьютер оперирует с данными в цифровом виде. Это означает, что и звук в компьютере представляется в цифровом виде. Как же происходит преобразование аналогового сигнала в цифровой?
Цифровой звук – это способ представления электрического сигнала посредством дискретных численных значений его амплитуды. Допустим, мы
рис.
11
имеем аналоговую звуковую дорожку хорошего качества (говоря «хорошее качество» будем предполагать нешумную запись, содержащую спектральные составляющие из всего слышимого диапазона частот – приблизительно от 20 Гц до 20 КГц) и хотим «ввести» ее в компьютер (то есть оцифровать) без потери качества. Как этого добиться и как происходит оцифровка? Звуковая волна – это некая сложная функция, зависимость амплитуды звуковой волны от времени. Казалось бы, что раз это функция, то можно записать ее в компьютер «как есть», то есть описать математический вид функции и сохранить в памяти компьютера. Однако практически это невозможно, поскольку звуковые колебания нельзя представить аналитической формулой (как y=x2
, например). Остается один путь – описать функцию путем хранения ее дискретных значений в определенных точках. Иными словами, в каждой точке времени можно измерить значение амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои недостатки, так как значения амплитуды сигнала мы не можем записывать с бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем приближать эту функцию по двум координатным осям – амплитудной и временной (приближать в точках – значит, говоря простым языком, брать значения функции в точках и записывать их с конечной точностью). Таким образом, оцифровка сигнала включает в себя два процесса - процесс дискретизации (осуществление выборки) и процесс квантования. Процесс дискретизации - это процесс получения значений величин преобразуемого сигнала в определенные промежутки времени (рис. 11)
. Квантование - процесс замены реальных значений сигнала приближенными с определенной точностью (рис.
12)
. Таким образом, оцифровка – это фиксация амплитуды сигнала через определенные промежутки времени и регистрация
рис.
12
полученных значений амплитуды в виде округленных цифровых значений (так как значения амплитуды являются величиной непрерывной, нет возможности конечным числом записать точное значение амплитуды сигнала, именно поэтому прибегают к округлению). Записанные значения амплитуды сигнала называются отсчетами. Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота дискретизации) и чем меньше мы будем округлять полученные значения (чем больше уровней квантования), тем более точное представление сигнала в цифровой форме мы получим. Оцифрованный сигнал в виде набора последовательных значений амплитуды можно сохранить.
Теперь о практических проблемах. Во-первых, надо иметь в виду, что память компьютера не бесконечна, так что каждый раз при оцифровке необходимо находить какой-то компромисс между качеством (напрямую зависящим от использованных при оцифровке параметров) и занимаемым оцифрованным сигналом объемом.
Во-вторых, согласно теореме Котельникова частота дискретизации устанавливает верхнюю границу частот оцифрованного сигнала, а именно, максимальная частота спектральных составляющих равна половине частоты дискретизации сигнала. Попросту говоря, чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц, необходима дискретизация с частотой не менее 44.1 КГц.
Существуют и другие проблемы и нюансы, связанные с оцифровкой звука. Не сильно углубляясь в подробности отметим, что в «цифровом звуке» из-за дискретности информации об амплитуде оригинального сигнала появляются различные шумы и искажения (под фразой «в цифровом звуке есть такие-то частоты и шумы» подразумевается, что когда этот звук будет преобразован обратно из цифрового вида в аналоговый, то в его звучании будут присутствовать упомянутые частоты и шумы). Так, например, джиттер (jitter) – шум, появляющийся в результате того, что осуществление выборки сигнала при дискретизации происходит не через абсолютно равные промежутки времени, а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а то немного раньше, то немного позднее. А так как входной сигнал постоянно меняется, то такая ошибка приводит к «захвату» не совсем верного уровня сигнала. В результате во время проигрывания оцифрованного сигнала может ощущаться некоторое дрожание и искажения. Появление джиттера является результатом не абсолютной стабильности аналогово-цифровых преобразователей. Для борьбы с этим явлением применяют высокостабильные тактовые генераторы. Еще одной неприятностью является шум дробления. Как мы говорили, при квантовании амплитуды сигнала происходит ее округление до ближайшего уровня. Такая погрешность вызывает ощущение «грязного» звучания.
Небольшая справка: стандартные параметры записи аудио компакт-дисков следующие: частота дискретизации - 44.1 КГц, уровень квантования – 16 бит. Такие параметры соответствуют 65536 (216
) уровням квантования амплитуды при взятии ее значений 44100 раз в секунду.
На практике, процесс оцифровки (дискретизация и квантование сигнала) остается невидимым для пользователя - всю черновую работу делают разнообразные программы, которые дают соответствующие команды драйверу (управляющая подпрограмма операционной системы) звуковой карты. Любая программа (будь то встроенный в Windows Recorder или мощный звуковой редактор), способная осуществлять запись аналогового сигнала в компьютер, так или иначе оцифровывает сигнал с определенными параметрами, которые могут оказаться важными в последующей работе с записанным звуком, и именно по этой причине важно понять как происходит процесс оцифровки и какие факторы влияют на ее результаты.
2 Преобразование звука из цифрового вида в аналоговый.
Как после оцифровки прослушивать звук? То есть, как преобразовывать его обратно из цифрового вида в аналоговый?
рис.
13
Для преобразования дискретизованного сигнала в аналоговый вид, пригодный для обработки аналоговыми устройствами (усилителями и фильтрами) и последующего воспроизведения через акустические системы, служит цифроаналоговый преобразователь (ЦАП). Процесс преобразования представляет собой обратный процесс дискретизации: имея информацию о величине отсчетов (амплитуды сигнала) и беря определенное количество отсчетов в единицу времени, путем интерполирования происходит восстановление исходного сигнала (рис. 13)
.
Еще совсем недавно воспроизведение звука в домашних компьютерах было проблемой, так как компьютеры не оснащались специальными ЦАП. Сначала в качестве простейшего звукового устройства в компьютере использовался встроенный динамик (PC speaker). Вообще говоря, этот динамик до сих пор имеется почти во всех PC, но никто уже не помнит как его «раскачать», чтобы он заиграл. Если вкратце, то этот динамик присоединен к порту на материнской плате, у которого есть два положения – 1 и 0. Так вот, если этот порт быстро-быстро включать и выключать, то из динамика можно извлечь более-менее правдоподобные звуки. Воспроизведение различных частот достигается за счет того, что диффузор динамика обладает конечной реакцией и не способен мгновенно перескакивать с места на место, таким образом он «плавно раскачивается» вследствие скачкообразного изменения напряжения на нем. И если колебать его с разной скоростью, то можно получить колебания воздуха на разных частотах. Естественной альтернативой динамику стал так называемый Covox – это простейший ЦАП, выполненный на нескольких подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают перевод цифрового представления сигнала в аналоговый – то есть в реальные значения амплитуды. Covox прост в изготовлении и поэтому он пользовался успехом у любителей вплоть до того времени, когда звуковая карта стала доступной всем.
В современном компьютере звук воспроизводится и записывается с помощью звуковой карты, подключаемой либо встроенной в материнскую плату компьютера. Задача звуковой карты в компьютере – ввод и вывод аудио. Практически это означает, что звуковая карта является тем преобразователем, который переводит аналоговый звук в цифровой и обратно. Если описывать упрощенно, то работа звуковой карты может быть пояснена следующим образом. Предположим, что на вход звуковой карты подан аналоговый сигнал и карта включена (программно) в режим записи. Сначала входной аналоговый сигнал попадает в аналоговый микшер, который занимается смешением сигналов и регулировкой громкости и баланса. Микшер необходим, в частности, для предоставления возможности пользователю управлять уровнями записи. Затем отрегулированный и сбалансированный сигнал попадает в аналогово-цифровой преобразователь, где сигнал дискретизуется и квантуется, в результате чего в компьютер по шине данных направляется бит-поток, который и представляет собой оцифрованный аудио сигнал. Вывод аудио информации почти аналогичен вводу, только происходит в обратную сторону. Поток данных, направленный в звуковую карту, преодолевает цифро-аналоговый преобразователь, который образует из чисел, описывающих амплитуду сигнала, электрический сигнал; полученный аналоговый сигнал может быть пропущен через любые аналоговые тракты для дальнейших преобразований, в том числе и для воспроизведения. Надо отметить, что если звуковая карта оборудована интерфейсом для обмена цифровыми данными, то при работе с цифровым аудио никакие аналоговые блоки карты не задействуются.
3 Способы хранения цифрового звука.
Для хранения цифрового звука существует много различных способов. Как мы говорили, оцифрованный звук являет собой набор значений амплитуды сигнала, взятых через определенные промежутки времени. Таким образом, во-первых, блок оцифрованной аудио информации можно записать в файл «как есть», то есть последовательностью чисел (значений амплитуды). В этом случае существуют два способа хранения информации.
рис. 14
Первый (рис. 14)
- PCM (Pulse Code Modulation - импульсно-кодовая модуляция) - способ цифрового кодирования сигнала при помощи записи абсолютных значений амплитуд (бывают знаковое или беззнаковое представления). Именно в таком виде записаны данные на всех аудио CD. Второй способ (рис. 15)
- ADPCM (Adaptive Delta PCM - адаптивная относительная импульсно-кодовая модуляция) – запись значений сигнала не в абсолютных, а в относительных изменениях амплитуд (приращениях).
рис.
15
Во-вторых, можно сжать или упростить данные так, чтобы они занимали меньший объем памяти, нежели будучи записанными «как есть». Тут тоже имеются два пути.
Кодирование данных без потерь (lossless coding) - это способ кодирования аудио, который позволяет осуществлять стопроцентное восстановление данных из сжатого потока. К такому способу уплотнения данных прибегают в тех случаях, когда сохранение оригинального качества данных критично. Например, после сведения звука в студии звукозаписи, данные необходимо сохранить в архиве в оригинальном качестве для возможного последующего использования. Существующие сегодня алгоритмы кодирования без потерь (например, Monkeys Audio) позволяют сократить занимаемый данными объем на 20-50%, но при этом обеспечить стопроцентное восстановление оригинальных данных из полученных после сжатия. Подобные кодеры – это своего рода архиваторы данных (как ZIP, RAR и другие), только предназначенные для сжатия именно аудио.
Имеется и второй путь кодирования – кодирование данных с потерями (lossy coding).
4 Аппаратура.
Блок цифровой обработки сигналов (кодек). В этом блоке осуществляются аналого-цифровые и цифро-аналоговые преобразования (АЦП и ЦАП). От этого блока зависят такие характеристики карты, как максимальная частота дискретизации при записи и воспроизведении сигнала, максимальный уровень квантования и максимальное количество обрабатываемых каналов (моно или стерео). В немалой степени от качества и сложности составляющих этого блока зависят и шумовые характеристики.
Рассмотрим важнейшие параметры, характеризующие звуковые и звукомузыкальные платы. Наиболее важными характеристиками являются: максимальная частота дискретизации (sampling rate) в режиме записи и в режиме воспроизведения, максимальный уровень квантования или разрядность (max. quantization level) в режиме записи и воспроизведения. Кроме того, так как звукомузыкальные платы имеют еще и синтезатор, то к их характеристикам относят и параметры установленного синтезатора. Естественно, чем с большим уровнем квантования карта способна кодировать сигналы, тем большее качество сигнала при этом достигается. Все современные модели звуковых карт способны кодировать сигнал с уровнем 16 бит. Одной из важных характеристик является возможность одновременного воспроизведения и записи звуковых потоков. Особенность карты одновременно воспроизводить и записывать называют полнодуплексной (full duplex). Есть еще одна характеристика, которая зачастую играет решающую роль при покупке звуковой карты - отношение сигнал/шум (Signal/Noise Ratio, S/N). Этот показатель влияет на чистоту записи и воспроизведения сигнала. Отношение сигнал/шум – это отношение мощности сигнала к мощности шума на выходе устройства, этот показатель принято измерять в дБ. Хорошим можно считать отношение 80-85 дБ; идеальным – 95-100 дБ. Однако нужно учитывать, что на качество воспроизведения и записи сильно влияют наводки (помехи) со стороны других компонент компьютера (блока питания и проч.). В результате этого отношение сигнал/шум может изменяться в худшую сторону. На практике методов борьбы с этим существует достаточно много. Некоторые предлагают заземлить компьютер. Другие, дабы как можно более тщательно уберечь звуковую карту от наводок, «выносят» ее за пределы корпуса компьютера. Однако полностью уберечься от наводок очень тяжело, так как даже элементы самой карты создают наводки друг на друга. С этим тоже пытаются бороться и для этого экранируют каждый элемент на плате. Но сколько бы усилий не прилагалось к решению этой проблемы, полностью исключить влияние внешних помех невозможно.
Еще одна не менее важная характеристика – коэффициент нелинейных искажений или Total Harmonic Distortion, THD. Этот показатель также критическим образом влияет на чистоту звучания. Коэффициент нелинейных искажений измеряется в процентах: 1% - «грязное» звучание; 0.1% - нормальное звучание; 0.01% - чистое звучание класса Hi-Fi; 0.002% - звучание класса Hi-Fi – Hi End.. Нелинейные искажения – результат неточности в восстановлении сигнала из цифрового вида в аналоговый. Упрощенно, процесс измерения этого коэффициента проводится следующим образом. На вход звуковой карты подается чистый синусоидальный сигнал. На выходе устройства снимается сигнал, спектр которого представляет собой сумму синусоидальных сигналов (сумма исходной синусоиды и ее гармоник). Затем по специальной формуле рассчитывается количественное соотношение исходного сигнала и его гармоник, полученных на выходе устройства. Это количественное соотношение и есть коэффициент нелинейных искажений (THD).
5 Перспективы и проблематика ( -Вывод)
Например, область распознавания речи еще очень не развита. Давно уже делались и делаются попытки создать программное обеспечение, способное качественно распознавать речь человека, однако все они пока не приводят к желаемому результату. А ведь долгожданный прорыв в этой области мог бы неимоверно упростить ввод информации в компьютер. Только представьте себе, что вместо набора текста его можно было бы просто надиктовывать, попивая кофе где-нибудь неподалеку от компьютера. Имеется множество программ якобы способных предоставить такую возможность, однако все они не универсальны и сбиваются при незначительном отклонении голоса читающего от заданного тона. Такая работа приносит не столько удобств, сколько огорчений. Еще куда более сложной задачей (вполне возможно, что и неразрешимой вовсе) является распознавание общих звуков, например, звучания скрипки в звуках оркестра или выделение партии рояля. Можно надеяться, что когда-нибудь такое станет возможным, ведь человеческий мозг легко справляется с такими задачами, однако сегодня говорить о хотя бы малейших сдвигах в этой области рано.
В области синтеза звука также есть пространство для изучения. Способов синтеза звука сегодня существует несколько, однако ни один из них не дает возможности синтезировать звук, который нельзя было бы отличить от настоящего. Если, скажем, звуки рояля или тромбона еще более-менее поддаются реализации, до правдоподобного звучания саксофона или электрогитары добиться еще так и не смогли – существует масса нюансов звучания, которые почти невозможно воссоздать искусственно.
Таким образом, можно смело сказать, что в области обработки, создания и синтеза звука и музыки еще очень далеко до того решающего слова, которое поставит точку на развитии этой отрасли человеческой деятельности.
-Список источников материала:
http://soundmastering.net
http://sound.amh.ru
http://625-net.ru/