Распознавание символов на номерном знаке автотранспорта

Автор работы: Пользователь скрыл имя, 05 Мая 2013 в 17:33, научная работа

Описание

Данная научно-исследовательская работа посвящена разработке программного обеспечения по распознаванию символов на номерных знаках автотранспорта. На данном этапе НИР проводится обзор существующих методов распознавания символов номерных знаков, анализируется структура методов распознавания на различных этапах процесса распознавания. Итогом данного этапа НИР является наглядное представление сравнительной эффективности существующих методов на каждом этапе процесса распознавания, из которого достаточно легко можно сделать выводы по направлениям проведения дальнейших исследований.

Работа состоит из  1 файл

Распознавание номеров.docx

— 767.79 Кб (Скачать документ)

НИР 
по теме: 
“Распознавание символов на номерном знаке автотранспорта”.

Этап 1.

Данная  научно-исследовательская работа посвящена  разработке программного обеспечения  по распознаванию символов на номерных знаках автотранспорта. На данном этапе  НИР проводится обзор существующих методов распознавания символов номерных знаков, анализируется структура  методов распознавания на различных  этапах процесса распознавания. Итогом данного этапа НИР является наглядное  представление сравнительной эффективности  существующих методов на каждом этапе  процесса распознавания, из которого достаточно легко можно сделать выводы по направлениям проведения дальнейших исследований. 
 Отчет состоит из шести разделов: 
1. Введение. 
2. Предварительная обработка изображения. 
3. Сегментация символов номерного знака. 
4. Распознавание символов номерного знака. 
5. Итоговый анализ направлений дальнейшего исследования, таблицы эффективности методов. 
6. Заключение. 
 Во введении проводится обзор последующих глав данного отчёта, даётся описание ситуации в сфере распознавания номерных знаков автотранспорта на настоящий момент, описывается проблема и объясняется актуальность исследований в рамках выбранной темы. 
 В главе “Предварительная обработка изображений” описывается структура и содержание методов на соответствующей стадии работы с изображением, проводится сравнительный анализ эффективности описываемых методов применительно к задаче обработки изображения номерного знака. 
 В главе “Сегментация символов номерного знака” описывается суть задачи сегментации применительно к распознаванию символов текста и проводится обзор и анализ соответствующих методов применительно к задаче обработки изображения номерного знака. 
 В главе “Распознавание символов номерного знака” проводится анализ существующих классов методов распознавания символов и сравнительный анализ эффективности описываемых методов применительно к задаче обработки изображения номерного знака. 
 В главе “Итоговый анализ направлений дальнейшего исследования, таблицы эффективности методов” приводится наглядное представление сравнительной эффективности методов соответствующих этапов обработки изображения в удобной для восприятия табличной форме, что даёт ясное представление о выгодных направлениях дальнейших исследований.  
 В заключении подытоживаются достигнутые результаты и обобщаются представления о дальнейших направлениях исследований.

 

 

Содержание: 
Введение:…………………………………………………………………………………………3 
1. Предварительная обработка изображения…………………………………………………..4 
1.1. Устранение шума……………………………………………………………………………4 
1.1.1. Модели шума………………………………………………………………………………5 
1.1.2. Усредняющие фильтры…………………………………………………………………...8 
1.1.3. Фильтры, основанные на порядковых статистиках……………………………………..9 
1.1.4. Анализ и сравнение эффективности фильтров………………………………………...10 
1.2. Бинаризация изображений………………………………………………………………...11 
1.2.1. Методы бинаризации…………………………………………………………………….11 
1.2.2. Анализ проблем применения основных методов бинаризации на практике………...12 
1.2.3. Комбинированный метод бинаризации………………………………………………...13 
1.3. Устранение рамки………………………………………………………………………….14 
2. Сегментация символов номерного знака…………………………………………………...15 
2.1. Описание и анализ основных методов сегментации…………………………………….15 
2.2. Комбинированный метод сегментации…………………………………………………..16 
3. Распознавание символов номерного знака. ………………………………………………..18 
3.1. Сравнение с шаблоном…………………………………………………………………….18 
3.2. Выделение характерных признаков………………………………………………………20 
3.3. Сравнение эффективности структурного и шаблонного методов распознавания…….24 
4. Итоговый анализ направлений дальнейшего исследования, таблицы эффективности методов………………………………………………………………………………………….24 
5. Заключение…………………………………………………………………………………...25 
6. Список литературы…………………………………………………………………………..26 
7. Приложение…………………………………………………………………………………..27

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение.

Решение проблемы идентификации автомобиля по регистрационному номерному знаку  является важным аспектом безопасности и контроля. Использовать такой продукт  можно в различных сферах применения, касающихся автотранспорта. 
 В настоящее время существует не так много систем определения номерных знаков, не все из которых являются по-настоящему качественной продукцией. Однако, параллельно с написанием алгоритмов, разрабатываются аппаратные средства именно для этих целей. Системы, обладающие высоким быстродействием и точностью распознавания, как правило, очень дороги. Высокая стоимость существующих продуктов не позволяет осуществить их массовое внедрение. Именно поэтому вопрос создания качественного программного комплекса распознавания номерных знаков транспортных средств в настоящее время достаточно актуален.  
 Задачу идентификации автомобиля можно условно разделить на две подзадачи: локализация номерной пластины и распознавание символов. Данная работа посвящена разработке и реализации алгоритма распознавания номерного знака. 
 В общем случае распознавание реализуется в три этапа: предварительная обработка изображения, сегментация, собственно распознавание символов. 
 Процедура предварительной обработки используется практически всегда после получения информации, и представляет собой применение операций усреднения и выравнивания гистограмм, различного типа фильтров для исключения помех, а также подавления внешних шумов. 
 Под сегментацией понимается процесс разделения изображения на отдельные символы. 
 Конечный этап обработки - распознавание. Для этого этапа входными данными являются изображения, полученные в результате шумоподавления и процесса сегментации. Сегодня известно три подхода к распознаванию символов: шаблонный, структурный и признаковый. 
 Шаблонные методы преобразуют изображение отдельного символа в растровое, сравнивают его со всеми шаблонами, имеющимися в базе и выбирают шаблон с наименьшим количеством точек, отличных от входного изображения. Шаблонные методы довольно устойчивы к дефектам изображения и имеют высокую скорость обработки входных донных, но надежно распознают только те шрифты, шаблоны которых им "известны". И если распознаваемый шрифт хоть немного отличается от эталонного, шаблонные методы могут делать ошибки даже при обработке очень качественных изображений. 
 В структурных методах объект описывается как граф, узлами которого являются элементы входного объекта, а дугами пространственные отношения между ними. Методы реализующие подобный подход, обычно работают с векторными изображениями. Структурными элементами являются составляющие символ линии. Так, для буквы "р" это вертикальный отрезок и дуга. К недостаткам структурных методов следует отнести их высокую чувствительность к дефектам изображения, нарушающим составляющие элементы. Также векторизация может добавить дополнительные дефекты. Кроме того, для этих методов, в отличие от шаблонных и признаковых, до сих пор не созданы эффективные автоматизированные процедуры обучения. Поэтому структурные описания чаще всего приходиться создавать вручную. В данной работе по вышеописанным причинам структурные методы распознавания рассматриваться не будут. 
 В признаковых методах усредненное изображение каждого символа представляется как объект в п-мерном пространстве признаков. Здесь выбирается алфавит признаков, значения которых вычисляются при распознавании входного изображения. Полученный п-мерный вектор сравнивается с эталонными, и изображение относится к наиболее подходящему из них. 
 Ниже рассматриваются самые популярные, хорошо изученные и часто применимые на практике различные методы распознавания символов, проводится анализ и сравнение методов между собой с целью выбрать наиболее перспективные направления для дальнейшего исследования.

1. Предварительная обработка изображения.

Предварительная обработка изображения  необходима для устранения шума[1], присутствующего на снимке, проведения корректной бинаризации[2] изображения и любых действий иного характера, необходимых для дальнейшей работы с данным изображением.

1.1. Устранения шума.

Основные  источники шума на цифровом изображении  — это сам процесс его получения (оцифровки), а также процесс передачи. Работа сенсоров зависит от различных  факторов, таких как внешние условия  в процессе видеосъемки и качество сенсоров. В процессе передачи изображения  могут искажаться помехами, возникающими в каналах связи. Мы предполагаем, что шум не зависит от пространственных координат и не коррелирует с  самим изображением. 
 Модель процесса искажения (см. рисунок ниже) предполагает действие некоторого искажающего оператора h(x,y) на исходное изображение g(x,y.) Задача восстановления изображения на стадии предобработки состоит в построении некоторого приближения  
по заданному (искажённому) изображению g(x,y), некоторой информации по искажающему оператору H и по аддитивному шуму h(x,y).

Предполагается, что H – тождественный оператор, и мы должны работать только с искажениями, вызванными наличием шума. 
 Мы будем иметь дело с описанием поведения шума в пространственной области, которое основано на статистических свойствах значений яркости компоненты шума. Эти значения яркости могут рассматриваться как случайные величины, характеризующиеся функцией плотности распределения вероятностей. 
 В качестве классов фильтров мы рассмотрим усредняющие и основанные на порядковых статистиках фильтры. Это подходящие фильтры для эффективной работы с наиболее вероятными в нашем случае типами шумов. Также, они не слишком трудоёмкие.

 

 

1.1.1. Модели шума.

Ниже  даны примеры функций плотности  распределения вероятностей, которые  наиболее часто встречаются в  приложениях, связанных с первоначальной обработкой изображений.

Гауссов шум.

Математическая  простота, характерная для работы с моделями гауссова шума (также  называемого нормальным шумом) как  в пространственной, так и в  частотной области, обусловила широкое  распространение этих моделей на практике. Функция плотности распределения  вероятностей гауссовой случайной  величины z задается выражением

,

где z представляет собой значение яркости, — среднее значение случайной величины z, — ее среднеквадратическое отклонение. Квадрат среднеквадратического отклонения  
2 называется дисперсией величины z. Когда плотность распределения случайной величины z описывается этой функцией, то приблизительно 70% ее значений попадают в диапазон [( - ), ( + )], и примерно 95% — в диапазон [( -2 ), ( +2 )].

Шум Релея.

Функция плотности распределения вероятностей шума Релея задается выражением

Среднее и дисперсия  для этого распределения имеют  вид

и

Шум Эрланга (гамма шум).

Функция плотности распределения вероятностей шума Эрланга задается выражением

где а > 0, b — положительное целое число.

 

Среднее и дисперсия  для этого распределения имеют  вид

и

Экспоненциальный шум.

Функция плотности распределения вероятностей экспоненциального шума задается выражением

где а > 0. Среднее  и дисперсия для этого распределения  имеют вид

и 

Это распределение является частным случаем распределения Эрланга с b = 1.

Равномерный шум.

Функция плотности распределения вероятностей равномерного шума задается выражением

Среднее значение для этого распределения равно

а дисперсия

Импульсный шум.

Функция плотности распределения вероятностей (биполярного) импульсного шума задается выражением

Если b > a, то пиксель с яркостью b выглядит как светлая точка на изображении. Пиксель с яркостью а выглядит, наоборот, как темная точка. Если одно из значений вероятности (Ра или Рb) равно нулю, то импульсный шум называется униполярным. Если ни одна из вероятностей не равна нулю, и в особенности если они приблизительно равны по величине, импульсный шум походит на крупицы соли и перца, случайно рассыпанные по изображению.

1.1.2. Усредняющие фильтры

Фильтр, основанный на вычислении среднего арифметического.

Такой фильтр, называемый среднеарифметическим, является простейшим среди усредняющих фильтров. Пусть Sxy обозначает прямоугольную окрестность (множество координат точек изображения) размерами mxn с центром в точке (х,у). Процедура фильтрации предполагает вычисление среднего арифметического значения искаженного изображения (х,у) по окрестности Sxy. Значение восстановленного изображения в произвольной точке ((х,у) представляет собой среднее арифметическое значений в точках, принадлежащих окрестности Sxy. Другими словами,

.

Эта операция может  быть реализована в виде свертки  с маской, все коэффициенты которой равны 1/mn. Усредняющий фильтр сглаживает локальные вариации яркости 
на изображении. Уменьшение шума происходит в результате этого сглаживания.

 

Фильтр, основанный на вычислении среднего геометрического.

Изображение, восстановленное с использованием среднегеометрического фильтра, задается выражением

Здесь значение восстановленного изображения  в каждой точке (х,у) является корнем степени mn из произведения значений в точках окрестности Sxy. Применение среднегеометрического фильтра приводит к сглаживанию, сравнимому с тем, которое достигается при использовании среднеарифметического фильтра, но при этом теряется меньше деталей изображения

Фильтр, основанный на вычислении среднего гармонического.

Результат обработки с применением среднегармонического фильтра дается выражением

Среднегармонический фильтр хорошо работает в случае униполярного «белого» импульсного шума (т.е. когда  значение шума соответствует появлению  белых точек на изображении), но не работает в случае униполярного «черного»  импульсного шума (когда значение шума соответствует появлению черных точек). Этот фильтр также хорошо работает для других типов шума, таких как гауссов шум.

1.1.3. Фильтры, основанные на порядковых статистиках.

Фильтры, основанные на порядковых статистиках, представляют собой пространственные фильтры, вычисление отклика которых требует предварительного упорядочивания (ранжирования) значений пикселей, заключенных внутри обрабатываемой фильтром области изображения. Отклик фильтра в любой точке определяется по результатам упорядочивания.

Медианные фильтры.

Наиболее  известным из фильтров, основанных на порядковых статистиках, является медианный  фильтр. Действие этого фильтра, как следует из его названия, состоит в замене значения в точке изображения на медиану значений яркости в окрестности этой точки:

.

При вычислении медианы  значение в самой точке (т.е. в центре окрестности) также учитывается. Широкая популярность медианных фильтров обусловлена тем, что они прекрасно приспособлены для подавления некоторых видов случайных шумов, и при этом приводят к меньшему размыванию по сравнению с линейными сглаживающими фильтрами того же размера. Медианные фильтры особенно эффективны при наличии как биполярного, так и униполярного импульсного шума.

Фильтры, основанные на выборе максимального и минимального значения.

Хотя  медианные фильтры, безусловно, принадлежат  к числу наиболее часто используемых в обработке изображений фильтров, основанных на порядковых статистиках, это отнюдь не единственный пример таких фильтров. Медиана представляет собой 50-ый процентиль упорядоченного набора чисел, однако использование иных статистических характеристик предоставляет много других возможностей. На-пример, использование 100-го процентиля приводит к фильтру, основанному на выборе максимального значения (или фильтру максимума), который задается выражением

Информация о работе Распознавание символов на номерном знаке автотранспорта