Автор работы: Пользователь скрыл имя, 22 Октября 2012 в 17:16, реферат
Актуальность темы. В настоящее время существует большое количество данных.Они представляются как необработанный материал предоставляемый, поставщиками данных и используемый потребителями для формирования информации . Данные бесконечны, и бывают как существенные так и незначащие. Чтобы понять с какими именно данными пользователь должен работать ему приходиться проделывать огромную работу, но со временем человечество изобретает все более упрощенные способы сбора и обработки данных. Так была разработана Data Mining.
Data Mining представляет собой процесс обнаружения в сырых данных ранее неизвестных, практически полезных и доступных знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Задачи, решаемые методами Data Mining, принято разделять на описательные (англ. descriptive) и предсказательные (англ. predictive).
ВВЕДЕНИЕ 4
РАЗДЕЛ 1 6
ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ О ДАННЫХ И ИХ ОБРАБОТКЕ 6
1.1. Кластерный анализ 7
1.2. Теория классификации 9
1.3. Дискриминантный анализ 10
1.4. Факторный анализ 11
1.5. Регрессионный анализ 13
Выводы раздела 1 16
РАЗДЕЛ 2 17
ВЫПОЛНЕНИЕ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА 17
2.1. Создание файлов данных 17
2.2. Обработка многомерных данных в Microsoft Excel 18
2.3. Кластерный анализ 22
2.4. Обработка классифицируемых данных. Теория классификации. 23
2.5. Дискриминантный анализ. 23
2.5. Факторный анализ 25
2.7. Регрессионный анализ 26
Выводы раздела 2 29
ВЫВОД 30
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 32