Выделяют
три парадигмы обучения: с учителем,
самообучение и смешанная.
При
обучении с учителем нейронной сети
предъявляются значения как входных,
так и выходных параметров, и она
по некоторому внутреннему алгоритму
подстраивает веса своих синаптических
связей.
Обучение
с учителем предполагает, что для
каждого входного вектора существует
целевой вектор, представляющий собой
требуемый выход. Вместе они называются
представительской или обучающей
выборкой. Обычно нейронная сеть обучается
на некотором числе таких выборок.
Предъявляется выходной вектор, вычисляется
выход нейронной сети и сравнивается
с соответствующим целевым вектором, разность
(ошибка) с помощью обратной связи подается
в нейронную сеть, и веса изменяются в
соответствии с алгоритмом, стремящимся
минимизировать ошибку. Векторы обучающего
множества предъявляются последовательно,
вычисляются ошибки и веса подстраиваются
для каждого вектора до тех пор, пока ошибка
по всему обучающему массиву не достигнет
приемлемо низкого уровня.
При
обучении без учителя нейронной
сети предъявляются только входные
сигналы, а выходы сети формируются
самостоятельно с учетом только входных
и производных от них сигналов.
Несмотря на многочисленные прикладные
достижения, обучение с учителем критиковалось
за свою биологическую неправдоподобность.
Трудно вообразить обучающий механизм
в естественном человеческом интеллекте,
который бы сравнивал желаемые и
действительные значения выходов, выполняя
коррекцию с помощью обратной
связи. Если допустить подобный механизм
в человеческом мозге, то откуда тогда
возникают желаемые выходы? Обучение
без учителя является более правдоподобной
моделью обучения в биологической
системе. Развитая Кохоненом и многими
другими, она не нуждается в целевом векторе
для выходов и, следовательно, не требует
сравнения с предопределенными идеальными
ответами. Обучающее множество состоит
лишь из входных векторов. Обучающий алгоритм
подстраивает веса нейронной сети так,
чтобы получались согласованные выходные
векторы, т. е. чтобы предъявление достаточно
близких входных векторов давало одинаковые
выходы. Процесс обучения, следовательно,
выделяет статистические свойства обучающего
множества и группирует сходные векторы
в классы. Предъявление на вход вектора
из данного класса даст определенный выходной
вектор, но до обучения невозможно предсказать,
какой выход будет производиться данным
классом входных векторов. Следовательно,
выходы подобной сети должны трансформироваться
в некоторую понятную форму, обусловленную
процессом обучения. Это не является серьезной
проблемой. Обычно не сложно идентифицировать
связь между входом и выходом, установленную
сетью.
Существует
большое число алгоритмов обучения,
ориентированных на решение разных
задач [4]. Среди них выделяет алгоритм
обратного распространения ошибки,
который является одним из наиболее
успешных современных алгоритмов. Его
основная идея заключается в том,
что изменение весов синапсов
происходит с учетом локального градиента
функции ошибки. Разница между
реальными и правильными ответами
нейронной сети, определяемыми на
выходном слое, распространяется в
обратном направлении – навстречу
потоку сигналов. В итоге каждый
нейрон способен определить вклад каждого
своего веса в суммарную ошибку сети.
Простейшее правило обучения соответствует
методу наискорейшего спуска, то есть
изменения синаптических весов пропорционально
их вкладу в общую ошибку. Конечно, при
таком обучении нейронной сети нет уверенности,
что она обучилась наилучшим образом,
поскольку всегда существует возможность
попадания алгоритма в локальный минимум.
Для этого используются специальные приемы,
позволяющие «выбить» найденное решение
из локального экстремума. Если после
нескольких таких действий нейронная
сеть сходится к тому же решению, то можно
сделать вывод о том, что найденное решение,
скорее всего, оптимально.
Итак,
нейронная сеть представляет собой совокупность
нейроподобных элементов, определенным
образом соединенных друг с другом и с
внешней средой с помощью связей, определяемых
весовыми коэффициентами.
Известные
нейронные сети можно разделить
по типам структур нейронов на гомогенные
(однородные) и гетерогенные. Гомогенные
сети состоят из нейронов одного типа
с единой функцией активации, а в гетерогенную
сеть входят нейроны с различными функциями
активации.
Существуют
бинарные и аналоговые сети. Первые
из них оперируют только двоичными
сигналами, и выход каждого нейрона
может принимать значение либо логического
ноля (заторможенное состояние) либо
логической единицы (возбужденное состояние).
Еще
одна классификация делит нейронные
сети на синхронные и асинхронные.
Выделяют
три парадигмы обучения: с учителем,
самообучение и смешанная.
Потенциальными
областями применения искусственных
нейронных сетей являются те, где
человеческий интеллект малоэффективен,
а традиционные вычисления трудоемки
или физически неадекватны (т.е. не
отражают или плохо отражают реальные
физические процессы и объекты). Действительно,
актуальность применения нейронных сетей
многократно возрастает тогда, когда появляется
необходимость решения плохо формализованных
задач.
Таким,
образом, искусственные нейронные
сети, подобно биологическим, являются
вычислительной системой с огромным
числом параллельно функционирующих
простых процессоров с множеством
связей.
ГЛАВА
2. ПРИМЕНЕНИЕ ИСКУССТВЕННЫХ
НЕЙРОННЫХ СЕТЕЙ
2.1.
Особенности применения
искусственных нейронных
сетей в различных областях
Потенциальными
областями применения искусственных
нейронных сетей являются те, где человеческий
интеллект малоэффективен, а традиционные
вычисления трудоемки или физически неадекватны
(т.е. не отражают или плохо отражают реальные
физические процессы и объекты). Действительно,
актуальность применения нейронных сетей
многократно возрастает тогда, когда появляется
необходимость решения плохо формализованных
задач.
Типовые
задачи, решаемые с помощью нейронных
сетей и нейрокомпьютеров следующие:
- автоматизация
процесса классификации;
- автоматизация
прогнозирования;
- автоматизация
процесса предсказания;
- автоматизация
процесса принятия решений;
- управление;
- кодирование
и декодирование информации;
- аппроксимация
зависимостей и др.
Рассмотрим
особенности применения нейронных
сетей, которые показывают их преимущества
посравнению с другими существующими
методами при выборе модели прогноза.
1.
Результативность при решении
неформализованных или плохо
формализованных задач. Из общеизвестных
преимуществ методов на основе
нейронных сетей следует выделить
одно самое привлекательное –
отсутствие необходимости в строгой
математической спецификации модели,
что особенно ценно при прогнозировании
плохо формализуемых процессов.
Известно, что большинство финансовых,
бизнес и других подобных задач плохо
формализуется.
2.
Устойчивость к частым изменениям
среды. Достоинства нейронных
сетей становятся заметными, когда
часто изменяются «правила игры»:
среда, в которой существует
прогнозируемый процесс, а также
характер воздействия влияющих
факторов. Поэтому, нейронные сети
наилучшим образом подходят для
решений таких задач, как прогнозирование
тенденций фондового рынка, характеризующихся
влиянием целого набора постоянно
изменяющихся факторов.
3.
Результативность при работе
с большим объемом противоречивой
информации. Нейронные сети будут
предпочтительнее там, где имеется
очень много анализируемых данных, в которых
скрыты закономерности. В этом случае
автоматически учитываются также различные
нелинейные взаимодействия между влияющими
факторами. Это особенно важно, в частности,
для предварительного анализа или отбора
исходных данных, выявления «выпадающих
фактов» или грубых ошибок при принятии
решений.
4.
Результативность при работе
с неполной информацией. Целесообразно
использование нейронных сетей
в задачах с неполной или
"зашумленной" информацией,
а также в задачах, для которых
характерны интуитивные решения.
Уже
сегодня искусственные нейронные
сети используются во многих областях.
В последнее время предпринимаются активные
попытки объединения искусственных нейронных
сетей и экспертных систем. В такой системе
искусственная нейронная сеть может реагировать
на большинство относительно простых
случаев, а все остальные передаются для
рассмотрения экспертной системе. В результате
сложные случаи принимаются на более высоком
уровне, при этом, возможно, со сбором дополнительных
данных или даже с привлечением экспертов.
Области
применения нейронных сетей весьма
разнообразны – это распознавание текста
и речи, семантический поиск, экспертные
системы и системы поддержки принятия
решений, предсказание курсов акций, системы
безопасности, анализ текстов. Одной из
наиболее сложных и востребованных способностей
нейронных сетей является прогнозирование.
Ведь оно является важнейшим элементом
современных информационных технологий
принятия решений в управлении. Эффективность
того или иного управленческого решения
оценивается по событиям, возникающим
уже после его принятия. Поэтому прогноз
неуправляемых аспектов таких событий
перед принятием решения позволяет сделать
наилучший выбор, который, без прогнозирования
мог бы быть не таким удачным.
Проблемы
прогнозирования связаны с недостаточным
качеством и количеством исходных
данных, изменениями среды, в которой
протекает процесс, воздействием субъективных
факторов. Прогноз всегда осуществляется
с некоторой погрешностью, которая
зависит от используемой модели прогноза
и полноты исходных данных. При
увеличении информационных ресурсов,
используемых в модели, увеличивается
точность прогноза, а убытки, связанные
с неопределенностью при принятии
решений, уменьшаются. Характер затрат,
связанных с прогнозированием, таков,
что за определенным пределом дополнительные
затраты не приведут к снижению потерь.
Это связано с тем, что объективно
невозможно снизить погрешность
прогнозирования ниже определенного
уровня, вне зависимости от того
насколько хорош примененный
метод прогнозирования. Поэтому
определение погрешности прогноза,
наряду с самим прогнозом, позволяет
значительно снизить риск при
принятии решений.
Рассмотрим
несколько особенно ярких и интересных
примеров использования нейронных сетей
в разных областях.
- Техника и
телекоммуникации. Одна из важнейших задач
в области телекоммуникаций, которая заключается
в нахождении оптимального пути пересылки
трафика между узлами, может быть успешно
решена с помощью нейронных сетей. В данном
случае необходимо принимать во внимание
то, что, во-первых, предложенное решение
должно учитывать текущее состояние сети,
качество связи и наличие сбойных участков,
а во-вторых, поиск оптимального решения
должен осуществляться в реальном времени.
Нейронные сети хорошо подходят для решения
задач такого рода. Кроме управления маршрутизацией
потоков, нейронные сети могут использоваться
и при проектировании новых телекоммуникационных
сетей, позволяя получать весьма эффективные
решения.
- Информационные
технологии. Определение тематики
текстовых сообщений может служить примером
успешного использования искусственных
нейронных сетей.
- Экономика
и финансы. Нейронные сети активно
применяются на финансовых рынках. Это
нейросетевые предсказания, нейросетевые
системы для предварительной обработки
транзакций на валютных биржах ряда стран,
отслеживание подозрительных сделок.
- Реклама и
маркетинг. При ведении бизнеса в условиях
конкуренции компаниям необходимо поддерживать
постоянный контакт с потребителями, обеспечивая
обратную связь. Для этого некоторые компании
проводят опросы потребителей, позволяющие
выяснить, какие факторы являются решающими
при покупке данного товара или услуги.
Анализ результатов подобного опроса—
непростая задача, поскольку необходимо
исследовать большое количество связанных
между собой параметров и выявить факторы,
оказывающие наибольшее влияние на спрос.
Существующие нейросетевые методы позволяют
выяснить это и прогнозировать поведение
потребителей при изменении маркетинговой
политики, а значит, находить оптимальные
стратегии работы компании.
- Здравоохранение.
В медицинской диагностике нейронные
сети нередко используются вместе с экспертными
системами.
Приведенные
примеры показывают, что технологии
нейронных сетей применимы практически
в любой области. Повсеместное проникновение
нейронных технологий в другие области—
только вопрос времени. Конечно, внедрение
новых наукоемких технологий— процесс
сложный, однако практика показывает,
что инвестиции не только окупаются и
приносят выгоду, но и дают тем, кто их
использует, ощутимые преимущества.