Идентификация
человека по голосу:
- Определить
психическое состояние
Методы
идентификации
"э", "о",
"л", "и" ,"а" и т.д.
"ц", "ч",
"ш", "щ" и т.д.
Пример голосовой
фразы и выделения из неё 8 фрагментов.
- огласованная
фонема
- шипящая(шумоподобная)
- колебания одной фонемы
для одного человека
- другого
человека
Биометрическая
идентификация
Амплитудно-частотная
характеристика
Ошибки -
1-5%
- Индивидуальные
различия строятся на базе гребёнки узкополосных
фильтров, выделяющих из голоса колебания
разных частот.
- Полосы пропускания
фильтров выбираются оптимальными(16 фильтров),
чтобы не зависеть от вариаций частотного
спектра голоса.
- Системы спектрального
анализа голоса обучаются, запоминая распределение
энергий с частотой порядка 35 миллисекунд.
- Данные снимаются
с частотой 16кГц и в 16 разрядов (связано
с особенностями фильтров).
- Итоговый массив
данных маленького размера (нужно записать
только 16 координат вершин по одной оси).
- Для идентификации
можно использовать как статистические
методы, так и нейронную сеть(не влияет
на результат распознавания).
Особенности:
Биометрическая
идентификация
Использование цифрового
колебательного фильтра в качестве
колокола
Ошибки от
0,00000001%
до 1%
- Огласованные
колебания звука имитируют периодическими
ударами по колебательному звену (колоколу).
Период ударов соответствовует периоду
основного тона голоса.
- Число коэффициентов
фильтра колеблется от 10 до 12 (а1,..., а12).
- Коэффициенты
линейного предсказателя вычисляются
на выборке из 180-220 отсчётов ("ударов")
- Вычисление параметров
предсказателя (цифрового фильтра) находят
решением системы из 10...12 линейных уравнений.
Для того, чтобы понизить вычислительную
нагрузку частоту дискретизации понижают
до 8 кГц.
- При имитации огласованных
звуков на вход фильтра подают периодическую
последовательность импульсов, промодулированную
по амплитуде, при моделировании шипящих
- случайный шум нужной амплитуды. На
выходе - периодические переходные
процессы, повторяющие моделируемый звук(массив
данных из последовательности импульсов
основного тона и коэффициентов линейного
предсказателя)
Особенности:
Защита
от перехвата парольной фразы
- Использовании
речевой информации, вводимой с ларингофона, контактирующего с
телом говорящего.
- сигнал,
снятый с шейной зоны,
- ключичной зоны
Оценка
биометрического метода
- Привычный
для человека способ идентификации.
- Низкая стоимость
(самая низкая среди всех биометрических
методов).
- Бесконтактность.
- Высокий уровень
ошибок 1 и 2 рода.
- Прохождения
идентификации в шумоизолированном помещении.
- Возможность
перехвата фразы "магнитофоном".
- Качество
распознавания зависит от многих факторов
(интонация, скорость произнесения, психологическое
состояние, болезни горла).
- Необходимость
подбора специальных фраз (С огласоваными
фонемами).
Спасибо
за внимание!