Теоретико-множественная модель представления объектов

Автор работы: Пользователь скрыл имя, 18 Мая 2011 в 15:20, реферат

Описание

Чем дальше развивается цивилизация общества, тем сложнее становятся общественные отношения и создаваемые обществом технические, организационные, информационные, энергетические, транспортные, производственные, военные и другие системы, составляющие суть данной цивилизации.

Работа состоит из  1 файл

Бакалавр.doc

— 111.00 Кб (Скачать документ)

Пусть Ль...,Ai — перечень независимых атрибутов, характеризующих некоторое множество объектов. Поставим в однозначное соответствие каждому атрибуту At многозначный предикат Pit определяющий множество значений Ei = {ai,...,a*}* данного атрибута так, что Vt \ Pi = Ve(Ai(t)) =

Другими словами, в любой момент времени атрибут  А* может принимать только одно какое-нибудь значение ае из множества Тогда класс К есть абстракция, определяемая как декартово произведение {Et х ... х Еп] = {К^,...,Кт}, Kj — код или идентификатор конкретного объекта Qj. По данному определению символы Qj и Kj обозначают понятия, находящиеся в отношении взаимно однозначного соответствия, 0., <=> Kj. Код Kj есть символическая (абстрактная) модель объекта 0^.

8.5 Состояние объекта.  Пространство состояний  объекта

Как уже было сказано, идентификаторы объектов одного класса можно упорядочить по некоторому критерию fi(Kj), определенному на множестве значений одного или нескольких атрибутов, характеризующих этот класс объектов. Например, располагая имена (идентификаторы) объектов по алфавиту, или упорядочивая их по возрастанию цифровых значений какого-нибудь иного атрибута. Если такого атрибута не существует, то в качестве критерия упорядочения может служить комбинации значений нескольких, или даже всех, атрибутов объектов данного класса. Упорядоченные объекты, точнее их идентификаторы, можно изображать точками на одной линии, которую будем называть линией классификации.

Классификационные атрибуты объектов служат для идентификации конкретных объектов. Наряду с классификационными атрибутами, как правило, не меняющими своих значений с течением времени, объекты обладают также атрибутами, которые могут изменять свои значения со временем под воздействием внешних и внутренних факторов, то есть, они являются функциями времени t и других факторов А* = fi(t,X). Символом X здесь обозначено множество всех возможных факторов, воздействующих на объект 9. Набор значений всех атрибутов объекта в в определенный момент времени t называется состоянием данного объекта. Атрибуты At = fi(t,X) характеризуют состояние объекта 0, поэтому они называются параметрами данного объекта, и мы будем обозначать их специальными символами 9t, 6\ = fi(t,X). В отличие от параметрических атрибутов 6it классификационные атрибуты, определяющие идентификатор объекта 9 и его место в некотором классе 9, в дальнейшем будем обозначать символами к^.

Таким образом, множество .4 всех атрибутов объекта 0 разбивается на два подмножества К и Q. Подмножество К содержит статические атрибуты объекта 9, а подмножество О содержит атрибуты, характеризующие поведение данного объекта, т.е. А = К U Q. Значения атрибутов 0t = fi(t,X) также могут быть сформулированы при помощи предикатов и объединены в последовательность переменных, которая представляет собой базу координат пространства состояний определенного объекта.

     Переменные  могут быть многоместными методами или функциями, но в число их аргументов, как правило, должен входить фактор времени. Другими словами, утверждается следующее: методы и функции являются атрибутами, описывающими поведение объекта в пространстве его состояний. Поскольку классификационное пространство (пространство идентификаторов объектов) и пространство состояний объектов (параметрическое пространство) характеризуют одни и те же объекты, первое определяет объекты как экземпляры определенного класса, а второе характеризует поведение каждого объекта данного класса (изменение его состояний), то эти пространства естественно

Моделирование отношений между  объектами и классами объектов

Связующими элементами между моделями различных объектов являются отношения. Рассмотрим приложение данного понятия для формализации объектно-классификационных моделей  объектов и систем. Определяющими  атрибутами любого отношения являются:

• свойство, по которому определяется отношение рассматриваемых  объектов;

• размерность, или, другими словами, мера данного  свойства, определяющая соответствующую  единицу измерения;

• область определения, представляющая собой базовое множество  Е данного свойства;

• область значений отношения, содержащая альтернативные значения — результаты данного отношения;

• семантика, определяющая сущность отношения,

• имя отношения, которое является символическим  ярлыком его сущности. (Сущность есть концентрированное выражение свойств некоторого объекта);

• время, к которому относится отношение (настоящее, прошедшее  или будущее);

• формула, представляющая собой конструкцию из символов определенного  языка, отражающую синтаксис отношения.

Всеобщими свойствами отношений являются:

• истинность —  характеристика реальности отношения  в определенных условиях; отношение, как субъективное отражение объективной  реальности, может быть истинным, ложным или неопределенным, мерой истинности, как правило, служит вероятность;

• местность, по количеству аргументов отношение может быть одноместным, двухместным и так далее, вообще говоря, «n-местным»;

• сущность, как  концентрированное выражение совокупности основных логических свойств отношения: симметричности, транзитивность, рефлексивности, антисимметричности и антирефлексивности;

• предметность, устанавливающая связь отношения  с конкретными свойствами конкретных объектов.

     В математике, отношением называется подмножество R декартового произведения Et х ... х Еп, где Ei — множество значений некоторой переменной Xj, i = 1. п.

     Обычная форма записи простейших отношений  между переменными (формула) имеет  следующий вид:

ИМЯ_ОТНОШЕНИЯ (аргумент , ... , аргумент),

например, РАВНО(х.у), ЛЮБИТ(х,у), ПРИНАДЛЕЖИИТ(А,В) и т.д. На естественном языке такие отношения представляют собой высказывания, указывающие на определенные действия над значениями переменных а;,у,.... При определенных условиях эти высказывания могут быть истинными или ложными. Поэтому множество ИСТИНА, ЛОЖЬ является областью значений любого отношения. Обычно предполагается, что все специфические свойства отношения определены заранее и заданы по умолчанию. Например, предполагается, что подчиненность аргументов, или направленность действия отношения определяется порядком записи аргументов любит у).

Все действия с  отношениями выполняются с учетом этих свойств. Например, из того, что "принадлежит (a, b)l< и "принадлежит^, с)" с учетом свойства транзитивности отношения принадлежит следует отношение "принадлежит (а,с)". Свойство транзитивности было присвоено отношению "принадлежит (х,у)" при определении данного отношения. Формулы более сложных отношений, как правило, составляют из этих простейших формул по правилу подстановки, например так: РАВНО(г),ПРОИЗВЕДЕНИЕ(:г.у))), или РАВНО(ПРОИЗВЕДЕНИЕ x,y),z)) в силу рефлексивности отношения РАВНО {х.у) по определению.

     В прикладной математике, чтобы приблизить формальные выражения к естественному  языку, применяют следующую, более  привычную форму записи отношений:

аргумент ДЕЙСТВИЕ аргумент УКАЗАТЕЛЬ результат.

Здесь слово  ДЕЙСТВИЕ обозначает класс всех функциональных отношений, а слово УКАЗАТЕЛЬ — класс всех отношений типа "причина — следствие", например, х + у = z. Если между значениями атрибутов At объекта 0., установлена какая-нибудь зависимость, то ее можно представить (описать или смоделировать) в виде определенного отношения R. Например, если параметрами объекта прямоугольник являются длина — 0| , ширина — 02 и площадь — 03, то эти параметры связаны следующим отношением:

ПРОИЗВЕДЕНИЕ (0,,02) РАВНО 03.

Как принято  в арифметике, формальная запись этого  отношения имеет вид: 03 = 0, х 02, или 03 = 0, * 02, ИЛИ 0з = 01 • 0о.

Здесь идентификаторами отношения ПРОИЗВЕДЕНИЕ служат символы: "х", "*" или запись аргументов без разделительных знаков; отношение РАВНО обозначается символом "=и.

Вообще формульное представление отношений многообразно и обычно зависит от языка, традиций и вкусов авторов, применяющих те или иные формальные системы. Область  применения отношений также влияет на формы представления и интерпретацию отношений, применяемых в данной области. Например, в естественном языке отношения между объектами описывают с помощью соответствую-

щих предложений (высказываний), в математике используют язык символических формул, в логике применяют свои специальные символы для записи отношений между высказываниями, химия, физика и многие другие научные дисциплины обычно используют специальные символы для записи отношений между объектами в исследуемой предметной области. Однако, в любом случае понятие "отношение" сохраняет вышеизложенные атрибуты, определяющие суть данного понятия. Поэтому можно предложить единый метод определения и формулирования отношений, как класса абстрактных объектов (понятий).

Теоретико-множественные  модели идентификации. Типология и способы задания признаков. Методы абстрагирования.

Бинарная  модель

     Основная  гипотеза информационного поиска: документ содержит те же термы языка, что и запрос. Терм обычно это слово естественного языка, на котором составлен запрос и документы. При первичной обработке документов, среди которых будет производиться поиск, термы-слова? выделяются из обрабатываемых документов.

В бинарной модели каждый терм языка или присутствует или отсутствует в документе.

Модель  с весами слов

     В данной модели документ после обработки становится множеством пар «слово-вес», где вес, в отличие от Бинарная Модель?, характеризует не просто наличие или отсутствие терма в документе, но и говорит о его роли и значимости в описании основного смысла документа. Существует несколько методов определения веса слов:

Статистический  подход. Основан на статистике появления слова(или основы слова) в тексте.

Место появление слова. В зависимости от того где встретилось слово – в заголовке, в начале текста и т.д. определяется его вес.

Оформление слова. Используются данные о выделении слов шрифтом или положением или другим доступным в формате документа способом.

     Как правило, используется некоторый комбинированный вес на основании всех перечисленных признаков.

Модель  с многословными термами

     В данной модели вводятся псевдотермы, состоящие из пар или троек слов, которые находятся рядом и могут формировать устойчивое понятие. Простейший подход – сохранять в качестве такой пары каждую пару слов в документе. Более сложный подход вводит понятие модели языка, который рассматривает документ и запрос как статистическую Марковскую модель, которая генерирует пары или тройки слов. При поиске сравниваются статистические модели запроса и документа и принимается решение о релевантности документа запросу. Пары могут сохраняться как упорядоченные (например для английского языка) так и неупорядоченные (для русского языка и основ слов).. Также, учитывая, что пары могут разбиваться другими термами, можно добавлять в индекса пары «через одно слово» или другие варианты этой идеи.

     Техническая реализация подобного подхода сталкивается с двумя проблемами. В случае хранения пар в классическом инвертированном файле, с сохранением информации о номере слова в документе, низка производительность обработки поискового запроса. Если же хранить пары как псевдотерм, то возрастает в несколько раз требуемая для хранения индекса область памяти. Поэтому используются методы сжатия индексов, фильтрации пар на основе статистических и семантических методик

Модель  с разбиением текста на фрагменты.

Информация о работе Теоретико-множественная модель представления объектов