Семантическая сеть и RDF

Автор работы: Пользователь скрыл имя, 12 Ноября 2010 в 02:25, доклад

Описание

Общие сведения о RDF.

Работа состоит из  1 файл

RDF.docx

— 32.96 Кб (Скачать документ)

Семантическая сеть и RDF

RDF — это универсальный способ разложения любых знаний на маленькие кусочки. Он задаёт определённые правила касательно семантики, т.е. смысла этих кусочков. Идея состоит в том, чтобы одним простым способом можно было бы описать любой факт, притом в таком структурированном виде, чтобы его могли обрабатывать компьютерные программы.

Вот пример RDF:

@prefix : <http://www.example.org/> .

:john    a           :Person .

:john    :hasMother  :susan .

:john    :hasFather  :richard .

:richard :hasBrother :luke . 

С помощью RDF можно описать как документы, отдельные фрагменты знаний внутри документа, так и объекты реального мира, например конкретного живого человека.

Как RDF, так и XML —  простые и универсальные технологии. XML может использоваться для представления  более абстрактных вещей, чем  тот текст с угловыми скобками, которым он записан: им может задаваться DOM какой-либо древовидной структуры. Точно так же, RDF — это не просто формат записи; это формат представления  информации, организованной в виде графов или сетей. Вы можете записывать RDF в виде XML; многие так и поступают. Тогда предыдущий пример выглядел бы так: 

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

        xmlns:ns="http://www.example.org/#">

  <ns:Person rdf:about="http://www.example.org/#john">

    <ns:hasMother rdf:resource="http://www.example.org/#susan" />

    <ns:hasFather>

      <rdf:Description rdf:about="http://www.example.org/#richard">

        <ns:hasBrother rdf:resource="http://www.example.org/#luke" />

      </rdf:Description>

    </ns:hasFather>

  </ns:Person>

</rdf:RDF> 

Как работает RDF:

Пример:

триплет субъект-предикат-объект

<www.example.org/index.html> <www.example.org/terms/creation-date> «August 16, 1999»

www.example.org/index.html имеет свойство www.example.org/terms/creation-date значение которого August 16, 1999 

RDF подходит для  работы с распределёнными знаниями  потому, что приложения могут  собирать воедино RDF-файлы, размещённые  в Интернете разными людьми, и  с лёгкостью узнавать из собранного  документа даже те новые вещи, которых не было ни в одной  из его частей. В RDF предусматривается  два процесса, благодаря которым  это осуществляется, — во-первых, объединяются документы, использующие  общие языки, и во-вторых, допускается использовать любые языки в каждом из документов. Эта гибкость — одна из отличительных черт RDF. 

Зачем же нужен RDF?

  • нужно объединять данные из различных источников, не прибегая к созданию специализированных программ.
  • нужно дать другим доступ к вашим данным
  • нужно децентрализовать ваши данные так, чтобы ими всеми не «владел» кто-то один.
  • нужно сделать что-то особенное с большими объёмами данных — вводить, извлекать, просматривать, анализировать, выполнять поиск, и т.д.
 
 
 

RDF можно определить  как совокупность  трёх простых правил:

  1. Факт выражается тройкой вида (Подлежащее, Сказуемое, Дополнение) — похожей на простое предложение на естественном языке.
  2. Подлежащие, сказуемые и дополнения — это имена сущностей реального мира, конкретных или абстрактных.

Имя может быть :

1) глобальным, ссылающимся на одну и ту же сущность во всех RDF-документах, где оно используется, либо

2) локальным, и тогда на сущность, на которую ссылается это имя, нельзя ссылаться из-за пределов RDF-документа непосредственно.

  1. Дополнения, кроме этого, могут быть текстовыми строками — «литералами».
 

Идентифицируется  все с помощью URI (Универсальных Идентификаторов Ресурсов):

«http://example.org/people#Вася Пупкин»

URI используются для глобальных имён потому, что они позволяют разбить пространство всех возможных имён на блоки, за которыми закреплены владельцы.

Так как URI могут быть довольно длинными, то в форматах, используемых для представления RDF, они обычно сокращаются, используя перенятый  из XML механизм «пространств имён». Именно поэтому в именах :john, :hasMother и других сущностей в приведённых примерах стоят двоеточия — они означают, что используются сокращённые имена. В наших примерах им соответствовали полные имена http://www.example.org/#john, http://www.example.org/#hasMother и т.д. 

RDF в виде графа

Есть два взаимодополняющих  способа рассматривать информацию, представленную в RDF. Первый способ —  считать её набором утверждений, как в примерах выше: каждое утверждение представляет собой факт. Второй способ — считать её графом. 

Граф — это, в  общем, то же самое, что сеть. Граф состоит  из узлов, соединённых рёбрами. Например, в Интернете узлы — это компьютеры, а рёбра — соединяющие их сетевые  шнуры. В RDF узлы — это имена (но не сами сущности), а рёбраутверждения. Например:

Здесь каждая стрелка (ребро) — это RDF-утверждение: имя  у начала стрелки — это подлежащее утверждения, имя у конца стрелки  — его дополнение, и имя у  самой стрелки — сказуемое. Когда RDF представлен в виде графа, он содержит всю ту же информацию, что и выписанный в виде троек-утверждений; но графическое  представление позволяет человеку легче увидеть структуру описываемых  данных.

Информация о работе Семантическая сеть и RDF