Искусственный интеллект и экспертные системы

Автор работы: Пользователь скрыл имя, 11 Декабря 2012 в 13:13, курс лекций

Описание

Достаточно трудно дать точное определение, что такое интеллект человека, потому что интеллект - это сплав многих навыков в области обработки и представления информации. Интеллект ( intelligence ) происходит от латинского intellectus — что означает ум, рассудок, разум; мыслительные способности человека. С большой степенью достоверности интеллектом можно называть способность мозга решать (интеллектуальные) задачи путем приобретения, запоминания и целенаправленного преобразования знаний в процессе обучения на опыте и адаптации к разнообразным обстоятельствам.

Содержание

1.1. Основные понятия искусственного интеллекта
1.2. История развития искусственного интеллекта
1.3. Задачи искусственного интеллекта
1.4. Экспертные системы - направление исследований по искусственному интеллекту
1.5. Классификация и виды экспертных систем
1.6. Область применения экспертных систем
Структура и функционирование экспертных систем
2.1. Типовая структура экспертных систем
2.2. Интерфейс пользователя
2.3. Подсистема приобретения знаний
2.4. База знаний
2.5. База данных
2.6. Механизм логического вывода
2.7. Объяснение решений
2.8. Функционирование экспертных системах
Представление знаний
3.1. Основные понятия и состав знаний
3.2. Модели представления знаний
3.3. Представление нечетких знаний
Методы поиска решений
4.1. Поиск решений в одном пространстве
4.2. Поиск решений в иерархии пространств
4.3. Поиск решений в альтернативных пространствах
4.4. Поиск решений с использованием нескольких моделей
4.5. Выбор метода решения задач

Инструментальные средства разработки экспертных систем
5.1. Классификация инструментальных средств
5.2. Языки программирования
5.3. Языки инженерии знаний
5.4. Средства автоматизации разработки экспертных систем
5.5. Оболочки экспертных систем
Технология разработки экспертных систем
6.1. Стадии создания экспертных систем
6.2. Этапы разработки экспертных систем
6.3. Разработка прототипа экспертной системы

Работа состоит из  1 файл

Искусственный интеллект и экспертные системы.docx

— 150.06 Кб (Скачать документ)

    Понятиями обычно  выступают абстрактные или конкретные  объекты, а отношения - это связи  типа: "это" ("is"), "имеет частью" ("has part"), "принадлежит", "любит" и т.п. Характерной особенностью семантических сетей является обязательное наличие трех типов отношений:

класс - элемент класса;;

свойство – значение;

пример элемента класса.

 

    В качестве  примера на Рисунке 3 показана  весьма простая семантическая  сеть для представления объекта  «чайник».

 

 

 

Рисунок 3.

 

    Наиболее часто  в семантических сетях используются  следующие отношения:

связи типа "часть-целое" ("класс-подкласс", "элемент-множество" и т.п.);

функциональные связи (определяемые обычно глаголами "производит", "влияет"...);

количественные (больше, меньше, равно...);

пространственные (далеко от, близко от, за, под, над...);

временные (раньше, позже, в течение...);

aтрибутивные связи (иметь свойство, иметь значение...);

логические связи (и, или, не) и др.

 

     Можно ввести  несколько классификаций семантических  сетей. 

    Например, по количеству  типов отношений: 

однородные (с единственным типом отношений);

неоднородные (с различными типами отношений).

     По типам  отношений: 

бинарные (в которых отношения  связывают два объекта);

парные (в которых есть специальные отношения, связывающие  более двух понятий).

 

    Проблема поиска  решения в базе знаний типа  семантической сети сводится  к задаче поиска фрагмента  сети, соответствующего некоторой  подсети, соответствующей поставленному  вопросу. Подобного рода задачи  решаются с помощью аппарата  теории графов. Следует особо  отметить роль фундаментальных  признаков связей (рефлексивность, симметричность и транзитивность) в процессе вывода на сети. Так, например, связи вида "это есть" или "иметь частью" транзитивны, что позволяет говорить об установлении с помощью этой связи свойств иерархии наследования в сети. Это означает, что элементы более низкого уровня в сети могут наследовать свойства элементов более высокого уровня в сети.

    Примером простой семантической сети является описание объекта автомобиль и рядя связанных с ним понятий (см. Рисунок 4. Пример простейшей семантической сети.). На этой сети присутствует следующая цепочка понятий: «автомобиль имеет частью двигатель», «двигатель имеет частью стартер». В силу транзитивности отношения "иметь частью" можно вывести следующее утверждение «автомобиль имеет частью стартер». Аналогично можно сделать вполне очевидный вывод, что «Иванов обладает автомобилем» или, что «Mercedes имеет частью двигатель и потребляет топливо».

 

 

 

 

Рисунок 4. Пример простейшей семантической сети [11].

 

    Основное преимущество  этой модели - в соответствии современным  представлениям об организации  долговременной памяти человека. Недостаток модели - сложность поиска  вывода на семантической сети.

Логическая модель.

 

    Традиционно в  представлении знаний выделяют  логические модели, основанные на  классическом исчислении предикатов  первого порядка, когда предметная  область или задача описывается  в виде набора аксиом. Основное  преимущество использования логики  предикатов для представления  знаний заключается в том, что  обладающий хорошо понятными  математическими свойствами мощный  механизм вывода может быть  непосредственно запрограммирован. С помощью этих программ из  известных ранее знаний могут  быть получены новые знания.

    Приведенные ниже  примеры являются логическими  моделями представления фактов  с помощью предикатов и носят  название атомарной формулы. 

 

        Предикат  ЛЮБОВЬ (Виктор, Ирина) означает: Виктор  любит Ирину 

        Предикат  СТОЛИЦА (Москва) означает: Москва - столица 

 

    Преимущества  логической модели:

наличие регулярных методов  вывода, в терминах которого можно  определять процедуры доказательства;

возможности использования  семантики, которая допускает разную трактовку в зависимости от целей  логических представлений. Для понимания  того, что представляет собой предметная область, используется декларативная  семантика, а для понимания того, как выводятся новые утверждения  из данного набора логических формул – процедурная семантика;

простота, лаконичность и  единообразие употребляемой нотации  для представления знаний.

 

    Логические модели  являются наиболее строгим, в  математическом смысле, способом  представления знаний. Но на практике  они не получили большого распространения  из-за малой наглядности базы  знаний. Основная область применения  этих моделей – учебные экспертные  системы. 

 

3.3 Представление нечетких  знаний.[11]

 

    Модели представления  нечетких знаний используются  для формализации человеческих  знаний, описывающих качественные  характеристики (например, большой,  сильный, очень сильный, высокий и т.п.) объектов предметной области, которые могут интерпретироваться неоднозначно, но содержат важную информацию.

    При решении  реальных задач часто возникают  ситуации неопределенности, которые  можно разделить на две категории:  отсутствие достаточно полного  и достоверного знания о предметной  области и отсутствие возможности  получить исчерпывающую информацию  о конкретном состоянии среды,  объекте, ситуации и т.п. В  первом случае речь может идти  о плохо изученных явлениях, противоречивых  теориях или нечетко сформулированных  концепциях. Так, например, применение  в терапии новых препаратов  часто дает совершенно неожиданный  результат, который невозможно  предсказать. Возможна также и  противоположная ситуация: предметная  область хорошо изучена, но  эксперты предпочитают прибегать  к неформальным, но более эффективным,  эвристическим приемам, вместо  использования рутинных точных  методов. Например, при поиске  неисправности в электрической  схеме, как правило, заменяют  несправный блок целиком, вместо  поиска сгоревших узлов. Существуют  и более прозаичные источники  неопределенности знаний. Типичный  пример – это ненадежные или  неточные данные. Любая информация, поступающая с датчиков, обладает  некоторой погрешностью. Социологические  опросы также подразумевают некоторый  процент ошибок, обусловленных «человеческим  фактором». Информация может быть  зашумлена так, что полностью  полезный сигнал невозможно выделить  из общего потока данных. Возможно, также, что приходиться пользоваться  информацией, полученной ранее,  и которую невозможно не проверить,  не дополнить не получить повторно. Для преодоления проблемы неопределенности  знаний в области искусственного  интеллекта были разработаны  различные методы, применяемые при  построении экспертных систем. Наиболее  неформальный подход – это  использование коэффициентов уверенности,  выражающих степень достоверности  знания. Альтернативный способ заключается  в использовании теории вероятности.  Однако не ясно, как с помощью  вероятности представить такие  понятия как «часто», «иногда», «старый», «высокий» и т.п. Кроме  того, теория вероятности подразумевает  значительное количество вычислений, для обновления вероятностных  оценок. Широкое распространение  получили также аппараты нечеткой  логики теории и функций доверия.  Однако в последние годы внимание  исследователей все больше привлекает  теория вероятностей, с ее развитым  и строго формализованным аппаратом. 

Коэффициенты уверенности.

 

 Использование коэффициентов  или степеней уверенности можно  продемонстрировать на примере  системы MYCIN. Типичное правило  этой системы выглядит следующим  образом: 

 

    Если условие1  и…и условиеM, то прийти со степенью уверенности x к заключение1 и … и к заключениеN.

 

    Степень уверенности  характеризует меру правдоподобия  того или иного заключения, изначально  задаваемую экспертом. Истинность  утверждений, содержащихся в предпосылках  правила, может также иметь  нечеткий характер, например, в силу  предыдущих шагов вывода или  из-за неточности источника фактов. После применения подобных правил  к имеющимся фактам формируется  более общее правило, включающее  также оценку истинности соблюдения  условий: 

 

    Если условие1  удовлетворяется с истинностью  x1 и … и условиеM удовлетворяется с истинностью xM, то прийти к заключению1 со степенью уверенности y1 и … и к заключениюN со степенью уверенности yN.

 

    В системе MYCIN коэффициенты уверенности (степени  уверенности, истинность условий)  – CF (certainty factor) – могут принимать значения в диапазоне от -1 до 1. В общем случае можно использовать любой диапазон значений. Положительные значения выражают уверенность в фактах, заключениях и пр. Отрицательные значения, напротив, выражают ошибочность утверждений. Окончательный коэффициент уверенности всего правила вычисляется как произведение:

 

        CF (заключение) = CF (предпосылки) * CF (правила).

 

    Если в БЗ  найдется несколько правил для  данной предпосылки, то в системе  MYCIN заключения этих правил объединяются. Пусть X и Y – коэффициенты уверенности  одинаковых заключений, полученные  при применении разных правил, тогда 

 

 

 

    Очевидно, что  формула обладает свойством коммутативности,  и порядок следования гипотез  не имеет значения. Вычисление  коэффициентов уверенности имеет  модульный характер, то есть при  вычислении достаточно той информации, что уже содержится в правиле.  При этом не имеет значения, как были получены коэффициенты  уверенности, характеризующие исходные  данные. Эта особенность часто  используется при построении  ЭС – предполагается, что для  всех правил, имеющих дело с  определенным параметром, предпосылки  этих правил логически независимы. Если же имеет место зависимость  между условиями правил, то следует  перейти к более общему правилу.  То есть вместо нескольких  правил вида 

 

        Если  условие1,

        то  прийти со степенью уверенности  x1 к заключение.

        … 

        Если  условиеM,

        то  прийти со степенью уверенности  xN к заключение.

 

Следует использовать одно правило вида:

 

        Если  условие1 и … и условиеM, то прийти со степенью уверенности x к заключение.

 

Правило Байеса.

 

    Для представления  неопределенности знаний можно  весьма эффективно использовать  положения теории вероятностей. Подобные представления базируются  на понятии условной вероятности.  Как следует из определения, условная вероятность события d при данном s – это вероятность того, что событие d наступит при условии, что наступило событие s. Например, условной вероятностью является вероятность того, что у пациента действительно имеется заболевание d, если у него обнаружен только симптом s. Для вычисления условной вероятности используется следующая формула:

 

 

     Как видно  из данной формулы, условная  вероятность определяется через  понятие совместности или одновременности  событий, то есть вероятности  совпадения событий d и s, разделенное  на вероятность события s. Из  приведенной формулы очевидно, что вероятность совпадения или произведения двух событий равна произведению вероятности одного из них и условной вероятности другого, вычисленную при условии, что первое имело место:

 

 

     Подставляя  последнюю формулу в определение  условной вероятности можно получить  правило Байеса в простейшем  виде:

 

 

     Это правило  позволяет определить вероятность  P(d | s) появления события d при условии,  что произошло событие s через  заранее известную условную вероятность  P(s | d). В полученном выражении  P(d) – априорная вероятность наступления  события d, а P(d | s) – апостериорная  вероятность, то есть вероятность  того, что событие d произойдет, если  известно, что событие s свершилось. Данное правило иногда называют  инверсной формулой для условной  вероятности, так как она позволяет  вычислить вероятность P(d | s) через  P(s | d).

    Для систем, основанных  на знаниях, правило Байеса  гораздо удобнее формулы определения  условной вероятности через вероятность  одновременного наступления событий  P(d . s).В этом достаточно просто  убедится. Пусть у пациента X имеется  некоторый симптом симптом_Y и необходимо узнать, какова вероятность того, что этот симптом является следствием заболевания заболевание_Z. Для того чтобы непосредственно вычислить P(заболевание_Z | симптом_Y), нужно оценить каким либо образом, сколько человек в мире страдают этим заболеванием, и сколько человек одновременно имеют заболевание_Z и симптом_Y. Такая информация, как правило, недоступна или отсутствует вообще. Особенно, что касается вычисления P(заболевание_Z | симптом_Y).

Информация о работе Искусственный интеллект и экспертные системы