Автор работы: Пользователь скрыл имя, 05 Сентября 2012 в 15:16, реферат
Кластерный анализ-совокупность математических методов, предназначенных для формирования отдельных друг от друга групп (кластеров) из схожих по информации, свойствам или по какому либо другому критерию объектов. Кластер-это группа элементов, характеризуемых общим свойством. Фактически кластерный анализ- это обобщенное название достаточно большого набора алгоритмов, используемых при создании классификации.
Алгоритм минимального покрывающего дерева
Алгоритм минимального покрывающего дерева
сначала строит на графе минимальное покрывающее
дерево, а затем последовательно удаляет
ребра с наибольшим весом. На рисунке изображено
минимальное покрывающее дерево, полученное
для девяти объектов.
Путём удаления связи, помеченной CD, с
длиной равной 6 единицам (ребро с максимальным
расстоянием), получаем два кластера: {А,
B, C} и {D, E, F, G, H, I}. Второй кластер в дальнейшем
может быть разделён ещё на два кластера
путём удаления ребра EF, которое имеет
длину, равную 4,5 единицам.
Послойная кластеризация
Алгоритм послойной кластеризации основан
на выделении связных компонент графа
на некотором уровне расстояний между
объектами (вершинами). Уровень расстояния
задается порогом расстояния c. Например,
если расстояние между объектами
, то
.
Алгоритм послойной кластеризации формирует
последовательность подграфов графа G,
которые отражают иерархические связи
между кластерами:
,
где Gt = (V, Et) — граф на уровне сt,
,
сt – t-ый порог расстояния,
m – количество уровней иерархии,
G0 = (V, o), o – пустое множество
ребер графа, получаемое при t0 =
1,
Gm = G, то есть граф объектов
без ограничений на расстояние (длину
ребер графа), поскольку tm = 1.
Контролировать глубину иерархии получаемых
кластеров возможно при изменении порогов
расстояния {с0, …,
сm}, где 0 = с0 < с1 < …< сm = 1. При этом, алгоритм послойной
кластеризации способен создавать как
плоское разбиение данных, так и иерархическое.