Идентификация человека по голосу

Автор работы: Пользователь скрыл имя, 17 Декабря 2011 в 13:16, доклад

Описание

Презентация на тему "Идентификация человека по голосу".

Работа состоит из  1 файл

Распознавание голоса человека.pptx

— 1.61 Мб (Скачать документ)

Идентификация человека по голосу:  
 

    • Узнать  собеседника
 
    • Определить  психическое состояние

Методы  идентификации 

    42 фонемы:

    Огласованные

    "э", "о", "л", "и" ,"а" и т.д.

    Шипящие

    "ц", "ч", "ш", "щ" и т.д. 

Пример голосовой  фразы и выделения из неё 8 фрагментов.

     - огласованная фонема

     - шипящая(шумоподобная) 
 

      - колебания одной фонемы для одного человека

     - другого  человека

Биометрическая  идентификация  

    • I подход.

       Индивидуальные различия распределения мощности сигнала по спектру 

Амплитудно-частотная  характеристика 

Ошибки  -  1-5%

  1. Индивидуальные  различия строятся на базе гребёнки узкополосных фильтров, выделяющих из голоса колебания  разных частот.
  2. Полосы пропускания фильтров выбираются оптимальными(16 фильтров), чтобы не зависеть от вариаций частотного спектра голоса.
  3. Системы спектрального анализа голоса обучаются, запоминая распределение энергий с частотой порядка 35 миллисекунд.
  4. Данные снимаются с частотой 16кГц и в 16 разрядов (связано с особенностями фильтров).
  5. Итоговый массив данных маленького размера (нужно записать только 16 координат вершин по одной оси).
  6. Для идентификации можно использовать как статистические методы, так и нейронную сеть(не влияет на результат распознавания).
 
 

Особенности:

Биометрическая  идентификация  

    • II подход

       Использование  аппарата линейного предсказания. 

Использование цифрового  колебательного фильтра в качестве колокола 

Ошибки от 0,00000001%

до 1%

  1. Огласованные колебания звука имитируют периодическими ударами по колебательному звену (колоколу). Период ударов соответствовует периоду основного тона голоса.
  2. Число коэффициентов фильтра колеблется от 10 до 12 (а1,..., а12).
  3. Коэффициенты линейного предсказателя вычисляются на выборке из 180-220 отсчётов ("ударов")
  4. Вычисление параметров предсказателя (цифрового фильтра) находят решением системы из 10...12 линейных уравнений. Для того, чтобы понизить вычислительную нагрузку частоту дискретизации понижают до 8 кГц.
  5. При имитации огласованных звуков на вход фильтра подают периодическую последовательность импульсов, промодулированную по амплитуде, при моделировании шипящих -  случайный шум нужной амплитуды. На выходе -  периодические переходные процессы, повторяющие моделируемый звук(массив данных из последовательности импульсов основного тона и коэффициентов линейного предсказателя)
 

Особенности:

Защита  от перехвата парольной фразы 

    • Использовании речевой информации, вводимой с ларингофона, контактирующего с телом говорящего.

     

        (речевой  сигнал колебаниями распространяется  внутри тела разными путями) 

     - сигнал, снятый с шейной зоны,       - ключичной зоны

Оценка  биометрического метода 

    Достоинства:

    • Привычный для человека способ идентификации.
    • Низкая стоимость (самая низкая среди всех биометрических методов).
    • Бесконтактность.
 

      Недостатки:

    • Высокий уровень ошибок 1 и 2 рода.
    • Прохождения идентификации в шумоизолированном помещении.
    • Возможность перехвата фразы "магнитофоном".
    • Качество распознавания зависит от многих факторов (интонация, скорость произнесения, психологическое состояние, болезни горла).
    • Необходимость подбора специальных фраз (С огласоваными фонемами).

Спасибо за внимание!

Информация о работе Идентификация человека по голосу