Автор работы: Пользователь скрыл имя, 09 Декабря 2010 в 13:32, реферат
В практической деятельности часто встречаются ситуации, когда необходимо перевести в электронный вид документ, напечатанный на бумаге. В этом случае можно просто набрать документ на компьютере, что довольно трудно, либо воспользоваться сканером — устройством, специально предназначенным для перевода документов в электронный вид. Для организации сканирования изображения помимо непосредственно сканера требуется одна из специальных программ систем оптического распознавания текста.
Системы оптического распознавания текста (Optical Character Recognition — OCR-системы) предназначены для автоматического ввода печатных документов в компьютер.
Введение…………………………………………………………………………..3
I. Программы для распознавания текстов………………………………………5
II. ABBYY FineReader………………………………………….………………..6
1. Различие версий в семействе FineReader 8.0………………………………...6
2. Возможности ABBYY FineReader 8.0 Professional…………………………7
3. Интерфейс программы ABBYY FineReader 8.0……………………………..9
4. Дополнительные сведения. Сегментация текста на этапе распознавания…..12
III. CuneiForm …………………………………………………………………...14
1. Особенности CuneiForm……………………………………………………...14
IV. Cсравнительный анализ программ для распознавания текста…………..15
1. Скорость и качество………………………………………………………….16
2. Таблицы ………………………………………………………………………18
3. Блоки…………………………………………………………………………..19
4. Распознавание цвета………………………………………………………….20
V. Заключение…………………………………………………………………...23
VI. Список используемой литературы…………………………………………24
Таким образом, мы получили две идентичные таблицы (за исключением форматирования), недостатки которых в наших программах следующие: в Fine Reader 5.0 каждая ячейка заканчивается ненужным вводом (рис. 15), а Cuneiform 2000 (рис. 16) сохраняет разбивку на строки за счет вставки символа "конец строки" (Shift+Enter в MS Word).
Рисунок 15
3.
Блоки
Не последнее место при работе с программами распознавания занимает автоматическая разбивка на блоки. В автоматическом режиме на разбивку тратится несколько секунд, а в ручном - гораздо больше времени.
Для начала возьмем изображение нашего договора. Как уже говорилось, Cuneiform 2000 разбил этот единый документ на множество блоков, а Fine Reader только на 3 части, и в них не вошли лишь последние точки в документе (ей можно в принципе доверять). Для нормального распознавания в наших программах таблицы в тексте (тем более, если она не простая) лучше всего ее выделять самостоятельно. Ну а если она похожа на первый образец, то можно спокойно не обращать на нее внимание, т. к. она правильно определится обеими программами. И все-таки программа Fine Reader здесь тоже выходит на первое место: она наиболее точно определяет тип распознаваемых блоков и распределяет их тоже не плохо.
Рисунок 17
Для примера возьмем разворот учебника
с картинками и посмотрим, как справятся
наши программы с разбивкой на блоки.
Cuneiform 2000 нашел таблицу и около 30 текстовых блоков, причем некоторые выделяли область рисунков. После этого мы ожидали увидеть примерно такую же картину и в Fine Reader 5.0, но все иллюстрации были распознаны правильно (хотя и не совсем точны были определены границы), текстовые блоки были выделены тоже достаточно корректно, ну а мифических таблиц эта программа не обнаружила, т. к. их действительно не было.
Да, для того чтобы нормально распознать текст в Fine Reader, нужно всего лишь немного поправить границы блоков и удалить ненужные, а в Cuneiform 2000 лучше задавать их вручную.
Проведенное испытание показало, что иногда
лучше самому расставить и определить
блоки, т. к. программе может быть не совсем
понятно к какому типу относить получившийся
блок. Наши программы в принципе неплохо
справились с задачей, особенно Fine Reader,
который не совершил грубых ошибок при
распознавании блоков.
4.
Распознавание цвета
Раньше программы распознавания требовали только черно-белых (1-битовых) изображений в разрешениях, близких к 300ґ300 dpi. Теперь программы фирм ABBYY и Cognitive Technologies Ltd., позволяют распознавать серые и цветные изображения с разрешениями от 200 до 600 dpi. Осталось только проверить, насколько хорошо они это делают.
Для проведения данного теста мы возьмем первую страницу цветной газеты, отсканируем ее в 24-битном режиме (16,5 млн цветов) и постепенно будем уменьшать цветность. В данном тесте нас будут интересовать результаты времени распознавания и качество, а также их зависимость от количества цветов.
Рисунок 18
Рис. 18. Так выглядит первая страница газеты в цвете, осталось только ее распознать.
Теперь полученный 23-мегабайтный файл загружаем в наши программы распознавания. Сначала разбиваем его на блоки автоматическим путем. Смотрим, что у нас получилось: Fine Reader без особого труда с маленьким недочетом (упустил одну букву) определил все блоки, причем правильно, а Cuneiform 2000 опять нашел несуществующую таблицу, но в целом все остальное определил неплохо.
Переходим ко второй стадии - распознаванию. Fine Reader - 34 с, Cuneiform - 52 с! Невероятно, но факт. Fine Reader, помимо высокой скорости, еще и очень качественно распознал данную страницу (совершив всего несколько ошибок, распознав даже белый текст на черном фоне), особенно по сравнению с Cuneiform, который не смог распознать большую часть текста. Кроме того, Fine Reader вырезал картинку без примеси текста! Таких результатов от Fine Reader мы не ожидали.
Теперь понижаем цветность с 16,5 млн до 256 цветов и смотрим, изменится ли картина распознавания. Для Fine Reader ситуация с определением блоков не изменилась, а вот у другой тестируемой программы проблема - она, похоже, не нашла текст. Будем считать, что программа Cuneiform 2000 провалила данный тест. Скорость распознавания у Fine Reader изменилась в сторону уменьшения: получилось около 27 с. Да, кстати, на этот раз программа вообще не ошиблась при определении блоков.
Ну и, наконец, последнее распознавание
этого же изображения в режиме 256 градаций
серого. С Cuneiform 2000 опять та же проблема
- не находит текст, опять провал. А вот
Fine Reader не ударил в грязь лицом и спокойно
распределил блоки с той же точностью.
Процесс распознавания занял всего 24 с
- превосходный результат!
Рисунок 19
Рис. 19. Посмотрите, как распознал такой текст (оригинал виден снизу) Coneiform — продукт 2000 года! Рис. 20. Ну а теперь сравните этот распознанный текст с полученным на предыдущей картинке.
Ну а теперь можно подвести итоги проделанной работы. Бесспорным лидером нашего теста оказался Fine Reader 5.0 Pro, который победил почти во всех тестах программу Cuneiform 2000 Master. Качество распознавания у победителя бесспорно выше, особенно при плохих оригиналах. Скорость у него не сильно отстает, а иногда и превосходит своего конкурента. Как показали последние два теста, у Fine Reader отличная система распознавания блоков и цветного изображения.
Есть, конечно, и некоторые неудобства
в обеих программах: надо проверять, а
иногда и исправлять распознанные блоки,
при больших объемах страниц. А в общем
обе программы достаточно конкурентоспособны
и еще будут бороться за первое место,
но на данном этапе, как видите, Fine Reader
лучше.
V.
Зключение
В настоящее время всё больше людей используют
компьютеры в повседневной жизни, даже
работа с текстами проходит через машины.
А программы для работы с текстом улучшаются
на глазах. Написав эту работу, я делаю
вывод – что следует выбирать надежность
и качество при выборе ПО для каждого компьютера
и ни в коем случае не спешить с выбором,
тщательно анализировать ПО.
VI.
Список используемой
литературы:
Информация о работе Приложения для автоматического распознавания текста