Спектральные методы закрытия речевого сообщения в каналах связи

Автор работы: Пользователь скрыл имя, 06 Мая 2011 в 22:08, курсовая работа

Описание

Несмотря на широчайшее внедрение автоматизированных и компьютеризованных систем обработки информации, человеческая речь остается одним из важнейших путей информационного взаимодействия. Более того, при децентрализации экономической и политической систем и соответствующем увеличении доли оперативной информации, непосредственно связывающей самостоятельных в принятии решений людей, значимость речевого обмена возрастает. Одновременно усиливается потребность в обеспечении конфиденциальности речевого обмена.

Скачать (38.19 Кб) Сколько стоит заказать работу?

Работа состоит из 1 файл

СТР.doc

— 158.50 Кб (Скачать документ)

Интенсивность звука (I, Вт/м²) – количество энергии, переносимой через площадку 1 м², расположенную перпендикулярно направлению распространения звуковой волны за 1 с.

Звуковое давление (Р, Па) – давление звукового поля в данной точке среды, являющееся избыточным по отношению к атмосферному давлению:

— едва слышимый звук;

— максимально громкий звук;

— среднее значение звука для естественной речи.

Для характеристики интенсивности речи обычно пользуются понятием спектрального уровня речи, который определяется выражением

где I₁ – интенсивность, отнесенная к полосе частот шириной 1 Гц; I₀= 10^-12 Вт/м² — интенсивность, соответствующая абсолютному нулевому уровню.

Так как I₁/ I₀ = (P₁/P₀)², то

где P₁ – звуковое давление, отнесенное к полосе шириной 1 Гц, Па; P₀ – звуковое давление, соответствующее абсолютному нулевому уровню (2·10^-5Па).

Спектр речи – зависимость среднего в течение длительного времени наблюдения спектрального уровня речи от частоты: B_p(f). Спектр русской речи, усредненный для мужских и женских голосов, представлен на рис. 1.7. Как следует из рис. 1.7, основная энергия в спектре речи сосредоточена в области низких частот. Если рассматривать раздельно спектры мужских и женских голосов, то в спектре мужских максимум незначительно сместится в область низких частот, в спектре женских – в область высоких частот.

Каждому звуку речи соответствует свое распределение энергии по частотному диапазону, называемое формантным рисунком.

Области частотного диапазона, где происходит увеличение амплитуд спектральных составляющих, называются формантными областями. А частоты, на которых происходит максимальное увеличение амплитуды - формантными частотами.

Спектральный состав звуков речи различен. Например, для гласных и звонких согласных (вокализованных звуков речи) энергетический спектр (формантный рисунок) имеет вид, представленный на рис. 1, для невокализованных звуков – на рис. 2.

Форманта характеризуется амплитудой А_i, частотой F_i и шириной полосы ΔF_i или добротностью Q_i. Ширина i-й форманты ΔF_i определяется на уровне 0,707 А_i и связана для гласных звуков с добротностью соотношением .

Различные звуки имеют различное число формант: гласные – до четырех формант, глухие согласные до 5-6 формант.

Первые две форманты называются основными, остальные - вспомогательными. Основные форманты определяют произносимый звук речи, а вспомогательные характеризуют индивидуальную для каждого человека окраску, тембр речи. Если фильтром нижних частот отрезать вспомогательные форманты спектра речевого сигнала, то исчезнет индивидуальная для каждого человека окраска произносимых звуков, но само речевое сообщение будет понятно.

Частоты формант, их число и взаимное расположение для одних и тех же звуков, произносимых разными дикторами, могут сильно различаться. Однако для каждого звука речи характерно определенное положение формантных областей, и при наличии достаточного опыта по спектрограммам можно читать произнесенный текст.

На рис. 3 и 4 приведены плотности распределения вероятностей формантных частот для вокализованных и невокализованных звуков речи, полученные для 10 мужских голосов.

Данные о положении формант на частотной оси для английского и русского языков приведены в табл. 1. Из таблицы следует, что частотные диапазоны положений формант приблизительно одинаковы даже для разных языков.

Формантные частоты имеют тесную статическую взаимосвязь, характеризуемую коэффициентом взаимной корреляции, равным: 0,78 для F₁ и F₂; 0,82 для F₂ и F₃; 0,95 для F₃ и F₄.

Таблица 1.

Номер форманты	Частотный диапазон, Гц
	Английский язык	Русский язык
F₁	1050	200…900
F₂	750…2400	700…2500
F₃	>2000	1900…3100
F₄	–	2900…4500

Амплитудное распределение речи

Амплитудное распределение русской речи показано на рис. 5. Эта характеристика представляет собой интегральное распределение относительного числа интервалов времени наблюдения N, в которых превышается тот или иной уровень речи В, характеризующий интенсивность речи во всем частотном диапазоне. Видно, что средний уровень речи В (условно обозначенный нулем) превышается в 19 % интервалов времени наблюдения.

За максимальный уровень принимают уровень речи, который превышается лишь в 1 % интервалов времени наблюдения, – это уровень, равный 12 дБ. За минимальный уровень принимают уровень речи, который превышается лишь в 99 % интервалов времени наблюдения, – это уровень, равный 35 дБ.

Динамический диапазон D речевого сигнала определяется как разность между максимальным и минимальным уровнями и равен 47 дБ.

Пик-фактор P_j – это разность между максимальным и средним уровнями речи, равная 12 дБ.

Характеристики слуха

При восприятии переданной речевой информации в качестве приемника выступает слуховой аппарат человека. Люди с «острым слухом» способны различать частоты в диапазоне от 20 до 20000 Гц. При этом слуховой аппарат человека позволяет решать следующие задачи слухового восприятия: распознавать речь (фонемы, слоги, слова), определять направление источника звука, адаптироваться к шумам и тишине (регулировка чувствительности), идентифицировать говорящего по речевым сигналам и т.д.

Таким образом, основными характеристиками слуха являются:

Чувствительность к чистым тонам;
Область слухового восприятия;
Громкость звуков;
Маскировка звуков;
Временные характеристики слуха.

Чувствительность к чистым тонам, область слухового восприятия

Чувствительность к чистым тонам (гармоническим колебаниям) является одной из основных характеристик слуха. Воспринимаемое ухом значение спектрального уровня чистого тона принято называть порогом слышимости, а наибольшее значение спектрального уровня чистого тона данной частоты, которое человек воспринимает без болевого ощущения, - болевым порогом (порогом осязания). Область, ограниченная кривыми порога слышимости β₀ и болевого порога γ, называется областью слухового восприятия, или областью слышимых звуков.

Порог слышимости имеет значительный диапазон и изменяется для различных слушателей в широких пределах. Например, на частоте 1000 Гц человеческое ухо способно различать звуки, отличающиеся друг от друга по давлению в 10⁶ раз (около 120 дБ).

Громкость звуков

Громкость звуков определяется как субъективное ощущение уровня речи (В). Для численной оценки громкости принято сравнивать уровень речи В с чистым тоном частотой 1000 Гц. Значение звукового давления эталонного сигнала, равногромкого данному звуку, называется уровнем громкости этого звука.

Маскировка звуков

В процессе передачи речи на человеческое ухо наряду с «нужными» звуками (передаваемой информацией) воздействуют помехи (шумы). Это приводит к частичному или даже полному заглушению передаваемого звука, называемому маскировкой.

Можно сказать, что маскировка эквивалентна повышению порога слышимости. Количественно ее можно определить как разность:

где β — порог слышимости при воздействии помех; β₀ — порог слышимости в тишине.

Разборчивость речи

В последние годы широкое развитие получили цифровые сети интегрального обслуживания, в которых все виды информации, в том числе речь, передаются в цифровом виде. При реализации цифровых преобразований речевых сигналов возникают специфические искажения, влияющие на качество речи. Одним из критериев качества речи является ее разборчивость.

Разборчивость — это объективная количественная величина, характеризующая способность тракта телефонной связи передать содержащуюся в речи смысловую информацию в данных конкретных условиях акустической среды. Эта величина является объективной в том смысле, что зависит от физических параметров тракта телефонной связи, а также от среды, в которой ведется телефонный разговор, и не зависит от субъективных свойств конкретных, измеряющих разборчивость операторов.

Под мерой разборчивости понимается выраженное в процентах или долях единицы отношение числа правильно принятых элементов речи (звуков, слогов, слов, предложений) к достаточно большому общему числу переданных. В соответствии с этим различают разборчиво звуков (D), слогов (S), слов (W) и фраз (I).

Методы защиты информации в канале связи

Методы защиты информации в канале связи можно разделить на две группы: методы, основанные на ограничении физического доступа к линии и аппаратуре связи и методы, основанные на преобразовании сигналов в линии к форме, исключающей (затрудняющей) для злоумышленника восприятие или искажение содержания передачи.

Методы второй группы направлены на обратимое изменение формы представления передаваемой информации. Преобразование должно придавать информации вид, исключающий ее восприятие при использовании аппаратуры, стандартной для данного канала связи. При использовании же специальной аппаратуры восстановление исходного вида информации должно требовать затрат времени и средств, которые по оценке владельца защищаемой информации делают бессмысленным для злоумышленника вмешательство в информационный процесс.

При защите речевого обмена решающее значение имеет форма представления аналогового речевого сигнала в канале связи.

Основные используемые в настоящее время методы преобразования речевого сигнала их взаимосвязь показана на рис. 6.

Рис. 6. Основные методы преобразования речевого сигнала и их взаимосвязь.

Применение вариантов преобразований Б, В и, в большинстве случаев, А требует наличия соответствующей аппаратуры у каждого из взаимодействующих абонентов сети.

Общее описание методов защиты речевых сигналов

При применении защитного шума (вариант А) следует учитывать ряд обстоятельств:

1. Стойкий защитный эффект оказывает лишь наложение шума, действительно являющегося случайным процессом и по диапазону частот полностью перекрывающего речевой сигнал. В то же время, многие известные и широко применяемые способы получения «шумового» сигнала на самом деле формируют псевдошумовой сигнал, по ряду своих частотных и временных параметров весьма близкий к действительно шумовому, но на самом деле в значительной степени детерминированный или имеющий существенные внутренние корреляционные связи. Такой сигнал во многих случаях может полностью заменять шумовой (при измерениях частотных характеристик, оценке помехозащищенности и пр.). Фактическая детерминированность сигнала, как правило, оказывается даже полезной, поскольку облегчает его параметризацию и стабилизацию. Сигнал, имеющий существенные внутренние корреляционные связи, может быть успешно использован и в качестве защитного шума, если перехват ведется на слух, без использования корреляционной обработки принимаемой или предварительно записанной смеси речевой сигнал/шум. Однако при применении относительно несложных методов корреляционной обработки такой «шум» может быть почти полностью подавлен. Следует отметить, что выявить корреляционные связи только по наблюдаемому выходному сигналу используемого генератора довольно сложно. Гораздо проще выявить их, анализируя схему генератора. Поэтому, как уже было сказано выше, крайне желательно затруднить получение злоумышленником информации об используемом оборудовании формирования защитного шума, облегчающей последующее его подавление.

Информация о работе Спектральные методы закрытия речевого сообщения в каналах связи