Автор работы: Пользователь скрыл имя, 06 Мая 2011 в 22:08, курсовая работа
Несмотря на широчайшее внедрение автоматизированных и компьютеризованных систем обработки информации, человеческая речь остается одним из важнейших путей информационного взаимодействия. Более того, при децентрализации экономической и политической систем и соответствующем увеличении доли оперативной информации, непосредственно связывающей самостоятельных в принятии решений людей, значимость речевого обмена возрастает. Одновременно усиливается потребность в обеспечении конфиденциальности речевого обмена.
Интенсивность звука (I, Вт/м2) – количество энергии, переносимой через площадку 1 м2, расположенную перпендикулярно направлению распространения звуковой волны за 1 с.
Звуковое давление (Р, Па) – давление звукового поля в данной точке среды, являющееся избыточным по отношению к атмосферному давлению:
— едва слышимый звук;
— максимально громкий звук;
— среднее значение звука для естественной речи.
Для характеристики интенсивности речи обычно пользуются понятием спектрального уровня речи, который определяется выражением
,
где I1 – интенсивность, отнесенная к полосе частот шириной 1 Гц; I0 = 10-12 Вт/м2 — интенсивность, соответствующая абсолютному нулевому уровню.
Так
как I1/ I0 = (P1/P0)2,
то
где P1 – звуковое давление, отнесенное к полосе шириной 1 Гц, Па; P0 – звуковое давление, соответствующее абсолютному нулевому уровню (2·10-5 Па).
Спектр речи – зависимость среднего в течение длительного времени наблюдения спектрального уровня речи от частоты: Bp(f). Спектр русской речи, усредненный для мужских и женских голосов, представлен на рис. 1.7. Как следует из рис. 1.7, основная энергия в спектре речи сосредоточена в области низких частот. Если рассматривать раздельно спектры мужских и женских голосов, то в спектре мужских максимум незначительно сместится в область низких частот, в спектре женских – в область высоких частот.
Каждому звуку речи соответствует свое распределение энергии по частотному диапазону, называемое формантным рисунком.
Области частотного диапазона, где происходит увеличение амплитуд спектральных составляющих, называются формантными областями. А частоты, на которых происходит максимальное увеличение амплитуды - формантными частотами.
Спектральный
состав звуков речи различен. Например,
для гласных и звонких
Форманта характеризуется амплитудой Аi, частотой Fi и шириной полосы ΔFi или добротностью Qi. Ширина i-й форманты ΔFi определяется на уровне 0,707 Аi и связана для гласных звуков с добротностью соотношением .
Различные звуки имеют различное число формант: гласные – до четырех формант, глухие согласные до 5-6 формант.
Первые
две форманты называются основными,
остальные - вспомогательными. Основные
форманты определяют произносимый звук
речи, а вспомогательные
Частоты формант, их число и взаимное расположение для одних и тех же звуков, произносимых разными дикторами, могут сильно различаться. Однако для каждого звука речи характерно определенное положение формантных областей, и при наличии достаточного опыта по спектрограммам можно читать произнесенный текст.
На
рис. 3 и 4 приведены плотности
Данные о положении формант на частотной оси для английского и русского языков приведены в табл. 1. Из таблицы следует, что частотные диапазоны положений формант приблизительно одинаковы даже для разных языков.
Формантные частоты имеют тесную статическую взаимосвязь, характеризуемую коэффициентом взаимной корреляции, равным: 0,78 для F1 и F2; 0,82 для F2 и F3; 0,95 для F3 и F4.
Таблица 1.
|
Амплитудное распределение русской речи показано на рис. 5. Эта характеристика представляет собой интегральное распределение относительного числа интервалов времени наблюдения N, в которых превышается тот или иной уровень речи В, характеризующий интенсивность речи во всем частотном диапазоне. Видно, что средний уровень речи В (условно обозначенный нулем) превышается в 19 % интервалов времени наблюдения.
За максимальный уровень принимают уровень речи, который превышается лишь в 1 % интервалов времени наблюдения, – это уровень, равный 12 дБ. За минимальный уровень принимают уровень речи, который превышается лишь в 99 % интервалов времени наблюдения, – это уровень, равный 35 дБ.
Динамический диапазон D речевого сигнала определяется как разность между максимальным и минимальным уровнями и равен 47 дБ.
Пик-фактор Pj – это разность между максимальным и средним уровнями речи, равная 12 дБ.
При восприятии переданной речевой информации в качестве приемника выступает слуховой аппарат человека. Люди с «острым слухом» способны различать частоты в диапазоне от 20 до 20000 Гц. При этом слуховой аппарат человека позволяет решать следующие задачи слухового восприятия: распознавать речь (фонемы, слоги, слова), определять направление источника звука, адаптироваться к шумам и тишине (регулировка чувствительности), идентифицировать говорящего по речевым сигналам и т.д.
Таким образом, основными характеристиками слуха являются:
Чувствительность к чистым тонам, область слухового восприятия
Чувствительность к чистым тонам (гармоническим колебаниям) является одной из основных характеристик слуха. Воспринимаемое ухом значение спектрального уровня чистого тона принято называть порогом слышимости, а наибольшее значение спектрального уровня чистого тона данной частоты, которое человек воспринимает без болевого ощущения, - болевым порогом (порогом осязания). Область, ограниченная кривыми порога слышимости β0 и болевого порога γ, называется областью слухового восприятия, или областью слышимых звуков.
Порог слышимости имеет значительный диапазон и изменяется для различных слушателей в широких пределах. Например, на частоте 1000 Гц человеческое ухо способно различать звуки, отличающиеся друг от друга по давлению в 106 раз (около 120 дБ).
Громкость звуков
Громкость звуков определяется как субъективное ощущение уровня речи (В). Для численной оценки громкости принято сравнивать уровень речи В с чистым тоном частотой 1000 Гц. Значение звукового давления эталонного сигнала, равногромкого данному звуку, называется уровнем громкости этого звука.
Маскировка звуков
В процессе передачи речи на человеческое ухо наряду с «нужными» звуками (передаваемой информацией) воздействуют помехи (шумы). Это приводит к частичному или даже полному заглушению передаваемого звука, называемому маскировкой.
Можно сказать, что маскировка эквивалентна повышению порога слышимости. Количественно ее можно определить как разность:
,
где β — порог слышимости при воздействии помех; β0 — порог слышимости в тишине.
Разборчивость речи
В последние годы широкое развитие получили цифровые сети интегрального обслуживания, в которых все виды информации, в том числе речь, передаются в цифровом виде. При реализации цифровых преобразований речевых сигналов возникают специфические искажения, влияющие на качество речи. Одним из критериев качества речи является ее разборчивость.
Разборчивость — это объективная количественная величина, характеризующая способность тракта телефонной связи передать содержащуюся в речи смысловую информацию в данных конкретных условиях акустической среды. Эта величина является объективной в том смысле, что зависит от физических параметров тракта телефонной связи, а также от среды, в которой ведется телефонный разговор, и не зависит от субъективных свойств конкретных, измеряющих разборчивость операторов.
Под мерой разборчивости понимается выраженное в процентах или долях единицы отношение числа правильно принятых элементов речи (звуков, слогов, слов, предложений) к достаточно большому общему числу переданных. В соответствии с этим различают разборчиво звуков (D), слогов (S), слов (W) и фраз (I).
Методы защиты информации в канале связи можно разделить на две группы: методы, основанные на ограничении физического доступа к линии и аппаратуре связи и методы, основанные на преобразовании сигналов в линии к форме, исключающей (затрудняющей) для злоумышленника восприятие или искажение содержания передачи.
Методы второй группы направлены на обратимое изменение формы представления передаваемой информации. Преобразование должно придавать информации вид, исключающий ее восприятие при использовании аппаратуры, стандартной для данного канала связи. При использовании же специальной аппаратуры восстановление исходного вида информации должно требовать затрат времени и средств, которые по оценке владельца защищаемой информации делают бессмысленным для злоумышленника вмешательство в информационный процесс.
При
защите речевого обмена решающее значение
имеет форма представления
Основные
используемые в настоящее время
методы преобразования речевого сигнала
их взаимосвязь показана на рис. 6.
Рис. 6. Основные методы преобразования речевого сигнала и их взаимосвязь.
Применение вариантов преобразований Б, В и, в большинстве случаев, А требует наличия соответствующей аппаратуры у каждого из взаимодействующих абонентов сети.
При применении защитного шума (вариант А) следует учитывать ряд обстоятельств:
1.
Стойкий защитный эффект
Информация о работе Спектральные методы закрытия речевого сообщения в каналах связи