Распознавание CAPTCHA-теста средствами библиотеки OpenCV

Автор работы: Пользователь скрыл имя, 15 Октября 2011 в 19:45, творческая работа

Описание

CAPTCHA («Completely Automated Public Turing test to tell Computers and Humans Apart» — «полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей») — тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером.

Работа состоит из  1 файл

Распознавание CAPTCHA-теста средствами библиотеки OpenCV.pptx

— 253.95 Кб (Скачать документ)

Распознавание CAPTCHA-теста средствами библиотеки OpenCV 

Санкт-Петербургский  Государственный  Университет

Аэрокосмического  Приборостроения 

факультет вычислительных систем и программирования 

кафедра компьютерной математики и программирования 

Дипломный проект выполнила студентка группы 4633 Дорожинская  Дарья

Научный руководитель: доцент к.т.н. Леонтьев А. Е. 
 
 

Санкт-Петербург

2011 год

Введение 

    CAPTCHA («Completely Automated Public Turing test to tell Computers and Humans Apart» — «полностью автоматизированный публичный тест Тьюринга для различия компьютеров и людей») —  тест, используемый для того, чтобы определить, кем является пользователь системы: человеком или компьютером. Термин появился в 2000 году. Основная идея теста: предложить пользователю такую задачу, которую с лёгкостью может решить человек, но которую несоизмеримо сложнее решить компьютеру. В основном это задачи на распознавание символов. 

    Целью дипломной  работы является  распознавание  CAPTCHA средствами библиотеки OpenCV, что включает в себя следующие пункты:

    • Получение  и чтение изображения
    • Изменение цветности (пороговая бинаризация)
    • Фильтрация шума (сглаживание)
    • Выделение границ (определение положения символов)
    • Распознавание
 

Слайд 2  из

Функциональные  требования к системе 

Слайд 3 из

Получение и чтение изображения 

Слайд 4 из  

            Первым  этапом распознавания CAPTCHA является загрузка самого изображения.

            Полученные  изображения преобразуются в  удобный для дальнейшей обработки  растровый формат – bmp.

            Для обработки используется библиотека OpenCV - Библиотека компьютерного зрения с открытым исходным кодом (Open Source Computer Vision Library), содержащая более 500 функций, предназначенных для выполнения в реальном времени. Библиотека содержит алгоритмы для обработки, реконструкции и очистки изображений, распознания образов, захвата видео, слежения за объектами, калибровки камер и пр.  
     

Примеры оригинальных CAPTCHA-изображений. 

Изменение цветности 

    Python обладает гибким механизмом работы с изображениями. Модуль PIL(Python Image Library) предоставляет средства обработки изображений, в том числе в его состав входит функция инвертирования цветов. После обработки цветное растровое изображение преобразуется в черно-белое. Изменение цветности применяется в работе дважды: на этапе предварительной обработки и на этапе распознавания.  

Слайд 5 из

Фильтрация  шума 

           В  случае с CAPTHCA под шумом подразумеваются линии.  
    Существует несколько вариантов решения проблемы:

    • Генетические алгоритмы
    • Преобразование Хафа. Можно рассматривать как разновидность автоматической векторизации.
 
 

Слайд 6 из

Преобразование  Хафа 

          Преобразование  Хафа позволяет находить на монохромном  изображении плоские кривые заданные параметрически, например: прямые, окружности, эллипсы.

          Монохромным изображением считается изображение  состоящее из точек двух типов: фоновых  точек и точек интереса.

          Основная  идея преобразования Хафа состоит в  поиске в поиске кривых, проходящих через достаточное количество точек  интереса.

          В дипломной работе используется преобразование Хафа для прямых.

          Алгоритм  заключается в том, что любая  прямая на плоскости может быть задана 2параметрами:углом наклона и  расстоянием от начала координат  (θ, r). 
     
     

Слайд 7 из 
 

 Эти переменные  можно рассмотреть как признаки, они формируют своё собственное  двумерное пространство.(пространство  Хафа). Каждой точке пространства  соответствует набор точек образующих  прямую на изображении. Финальным шагом является обход пространства и выбор максимальных значений, за которые «проголосовало» больше всего пикселей картинки, что и даёт нам параметры для уравнений искомого объекта. 

Выделение границ (разделение символов) 

    Задача  разделения символов усложняется тем, что символы накладываются друг на друга, имеют разный наклон, пересекаются линиями. Для решения задачи разделения используется алгоритм нахождения минимумов. Результаты поиска минимумов можно  видеть на графике. 

Слайд 8 из

Распознавание 

          Распознавание полученных после обработки изображений  выполняет предварительно обученная  искусственная нейронная сеть, построенная  с помощью библиотеки Fast Artificial Neuron Network (FANN).

            Входными данными является массив из 432 элементов  (произведение  ширины распознаваемого изображения и его высоты),каждый элемент задает яркость соответствующего пикселя 0 – фон, 1 – значащий пиксель. На выходе – массив из 10 элементов задающих близость входных данных к соответствующей цифре. 

          Кроме того, между входным и выходным слоями расположены 3 слоя по 144 нейрона. Такое количество промежуточных  слоев и численность нейронов соответствуют требованиям задачи.  

Слайд 9 из

Результаты 
 

    В рамках дипломной работы были разработаны  модули создания и обучения нейронной  сети, обработки изображений, и распознавания  CAPTCHA .

    Достигнута  эффективность  распознавания не является предельным значением, так  как дальнейшее обучение нейронной  сети позволит достичь более высоких  результатов.

    Использование в разработке языка программирования высокого уровня Python позволяет, благодаря легкости встраивания Python-модулей,  использовать  полученные модули в различных программах-загрузчиках, в качестве сервисов на web-сайтах, а так же в качестве примера для создания приложений распознавания CAPTCHA. 
     

Слайд 10 из

Слайд 11 из 
 

СПАСИБО ЗА ВНИМАНИЕ!

Безопасность  и санитарно-гигиенические условия  труда на рабочем месте пользователя ПЭВМ 

    В разделе был  проведен анализ безопасности и санитарно-гигиенических  условий труда на рабочем месте  пользователя ПЭВМ (дана характеристика санитарно-гигиенических условий  труда).

    Были получены оптимальные параметры микроклимата, рассчитаны системы водного и  воздушного и водяного отопления  для холодного периода года и  параметры системы кондиционирования -для теплого.

    Проанализированы  меры обеспечения электробезопасности, установлены необходимые средства защиты.

    Разработаны меры защиты от внешнего шумового воздействия. Составлен комплекс мер по предотвращению шумового загрязнения рабочей среды. 

Слайд 12 из

    • - В результате  проведенных исследований параметров  микроклимата для холодного и  теплого времен года, были выявлены  серьезные нарушения способные,  принести вред здоровью сотрудников  данной организации и привести  к ухудшению условий труда.  Был предпринят комплекс  процедур  для улучшений условий труда.  В частности сменить стеклопакеты  на окнах на стеклопакеты с  более низким коэффициентом теплопередачи.
    • - Было проведено исследование опасности поражения электрическим током рабочей зоны.  В процессе исследования выяснилось, что поражение человека электрическим током в данной области является особо опасным и может убить. Поэтому были предприняты меры, направленные на повышение безопасности рабочего места.
    • - Был рассчитан комплекс мер по снижению уровня шума до удовлетворяющих санитарным  нормам.  Это было реализовано, за счет: высадки широких лесонасаждении, уменьшении скорости движения судов в заданном районе,  уменьшении шума производимый системами вентиляции путем установки на них специальных кожухов и дополнительное остекление цехов заводских корпусов.
    • В результате проделанных работ были улучшены условия, приведены к нормам СанПин  СанПиН 2.2.2.542-96 и ГОСТ Р12.0.006-2002.параметры микроклимата, была оптимизирована система воздухообмена, разработаны мероприятия по обеспечению шумоподавления в зоне жилой застройки.
 
 
 

13

Расчет системы  водяного отопления 
 

     

      Необходимая  теплопроизводительность системы

      водяного отопления  Qот ,кДж/ч                                             3744

      Коэффициент  теплопередачи панельного  

      радиатора  К (30-38), кДж/(м2*град.)                                    33

      Площадь поверхности  нагрева радиатора F (0,6-3), м2  0,8

      Средняя температура  теплоносителя t (85-100), град.   90

      Необходимое  количество радиаторов  n                           2,00

      
     

14

15

Экономический раздел 

Слайд 16 из

Информация о работе Распознавание CAPTCHA-теста средствами библиотеки OpenCV