Автор работы: Пользователь скрыл имя, 24 Января 2011 в 09:32, курсовая работа
В данной работе проведен обзор методов социально-экономического прогнозирования, наиболее часто применяемых в экономической практике. Выбраны четыре модели для прогнозирования потребления мяса на душу населения за год по РФ: метод наименьших квадратов (МНК), экспоненциальное сглаживание, модели Хольта, Бокса и Дженкинса. Выбранные модели дают довольно различные результаты, и лучшие результаты были получены при использовании полиномиальной модели метода наименьших квадратов и модели Хольта. Результаты вычислений представлены в таблицах. Рассчитана абсолютная ошибка прогноза и средняя относительная ошибка прогноза, коэффициент детерминации. Именно эти показатели рассматривались в качестве критерия для выбора модели, дающей наилучшее прогнозное значение интересующей нас переменной, т.е. потребления мяса на душу населения.
Расчеты проводились с помощью программы Excel, которая позволила визуально представить результаты работы. В данной курсовой работе приведено подробное описание этого программного продукта.
Введение 5
1 Описание предметной области и постановка задачи исследования 6
2 Описание используемого математического аппарата при проведении расчетов 10
3 Описание выбранных программных продуктов 15
4 Практическая часть 21
4.1 Метод наименьших квадратов 21
4.1.1 Линейная модель МНК 21
4.1.2 Полиномиальная модель МНК 23
4.1.3 Экспоненциальная модель МНК 24
4.2 Экспоненциальное сглаживание
26
4.2 Двухпараметрическая модель Хольта
30
4.3 Трехпараметрическая модель Бокса и Дженкинса 34
5 Выбор лучшей модели 36
Заключение
38
Список использованных источников
Пакет содержит следующие модули:
Basic Statistic/Tables – Основные статистики и таблицы: позволяет провести предварительную обработку данных, осуществить разведочный анализ, определить зависимости между переменными, разбить их различными способами на группы;
Nonparametrics/Distrib. – Модуль Непараметрическая статистика/Распределеня: дает возможность проверить гипотезы о характере распределения ваших данных;
ANOVA/MANOVA – Модуль дисперсионного анализа: представляет собой набор процедур общего одномерного и многомерного дисперсионного и ковариационного анализа;
Multiple Regression - Модуль Множественная регрессия: помогает построить зависимости между многомерными переменными, подобрать простую линейную модель и оценить ее адекватность;
Nonlinear Estimation – Модуль Нелинейное оценивание: предоставляет возможность определения нелинейной зависимости в данных и подгонки к ним функциональных кривых;
Time Series/Forecasting – Анализ временных рядов и прогнозирование: общее назначение модуля – построить простую модель, описывающую ряд, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых до данного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье – анализ ряда;
Claster Analysis – Модуль Кластерный анализ: позволяет произвести сложную иерархическую классификацию данных или выделить в них кластеры;
Data Management/MFM - Управление данными: специализированный модуль, который содержит большое количество вспомогательных процедур по работе с данными (иерархическая сортировка, проверка, категоризация и ранжирование и др.);
Factor Analysis – Модуль Факторный анализ: дает возможность сжать данные или выделить основные общие факторы, влияющие на наблюдаемые характеристики сложного объекта и объясняющие связи между ними;
Canonical Analysis – Модуль Канонический анализ: включает в себя широкий набор процедур для выполнения канонического корреляционного анализа, исследования связи между двумя множествами переменных;
Multidimensional Scaling – Модуль Многомерное шкалирование: помогает представить данные о близости объектов какой-либо простой пространственной моделью, в которой объекты интерпретируются, например, как города на обычной карте, а различия между ними есть просто расстояния, в частности данные о странах, политических партиях и т.д., и всесторонне диагностировать модель;
SEPATH – Модуль Моделирование структурными уравнениями: позволяет строить и тестировать различные модели, объясняющие структуру связей между наблюдаемыми переменными;
Reliability/Item Analysis – Модуль Анализ надежности: включает широкий набор процедур для разработки и вычислений надежности сложных объектов на основе результатов обследований и диагностики отдельных узлов;
Discriminant Analysis - Модуль Дискриминантный анализ: позволяет построить на основе ряда предположений классификационное правило отнесения объекта к одному из нескольких классов, минимизируя некоторый разумный критерий;
Log-linear Analysis – Модуль Лог-линейный анализ: проводит анализ сложных многоуровневых таблиц;
Survival Analysis – Модуль Анализ длительностей жизни: предлагает обширный набор методов анализа данных из социологии, биологии, медицины, так же, как процедуры, используемые в инженерии и маркетинге;
Commmand Language (SCL) – Командный язык STATISTICA: позволяет автоматизировать рутинные процессы обработки данных в системе;
STATISTICA File Server – позволяет быстро открыть для просмотра/редактирования как графики и таблицы, так и отчеты.
Выбор системы STATISTICA в качестве инструмента для обработки данных может быть обусловлен возможностью проведения наиболее полного анализа, т.к. система содержит все необходимые нам статистические процедуры.
Основные преимущества системы STATISTICA:
4
Практическая часть
У нас имеются данные по потреблению мяса и мясопродуктов в пересчете на мясо на душу населения за последние 20 лет по полугодиям, РФ (кг):
I полуг. 1990 | 75,0 | I полуг. 2000 | 45,0 |
II полуг. 1990 | 72,0 | II полуг. 2000 | 45,0 |
I полуг. 1991 | 69,0 | I полуг. 2001 | 46,0 |
II полуг. 1991 | 64,5 | II полуг. 2001 | 47,0 |
I полуг. 1992 | 60,0 | I полуг. 2002 | 48,5 |
II полуг. 1992 | 59,5 | II полуг. 2002 | 50,0 |
I полуг. 1993 | 59,0 | I полуг. 2003 | 51,0 |
II полуг. 1993 | 58,0 | II полуг. 2003 | 52,0 |
I полуг. 1994 | 57,0 | I полуг. 2004 | 53,0 |
II полуг. 1994 | 56,0 | II полуг. 2004 | 54,0 |
I полуг. 1995 | 55,0 | I полуг. 2005 | 54,5 |
II полуг. 1995 | 53,0 | II полуг. 2005 | 55,0 |
I полуг. 1996 | 51,0 | I полуг. 2006 | 57,0 |
II полуг. 1996 | 50,5 | II полуг. 2006 | 59,0 |
I полуг. 1997 | 50,0 | I полуг. 2007 | 60,5 |
II полуг. 1997 | 50,0 | II полуг. 2007 | 62,0 |
I полуг. 1998 | 49,0 | I полуг. 2008 | 64,0 |
II полуг. 1998 | 48,0 | II полуг. 2008 | 66,0 |
I полуг. 1999 | 46,5 | I полуг. 2009 | 66,5 |
II полуг. 1999 | 45,0 | II полуг. 2009 | 67,0 |
Необходимо
спрогнозировать сколько мяса будет
потреблять россиянин в I и II полугодиях
2010 года. Будем использовать МНК, экспоненциальное
сглаживание, модели Хольта, Бокса и Дженкинса.
4.1
Метод наименьших
квадратов
4.1.1
Линейная модель
МНК
Параметры линейной зависимости определяются в пакете MS Excel. При построении линии тренда была получена следующая зависимость: y= -0,0645*x+57,098 . Коэффициент детерминации для тренда линейного вида составляет 0,0093, что говорит об описании исходных данных линией тренда меньше, чем на 1 %.
Это объясняется тем, что в связи с нестабильной экономической ситуацией в стране, в 2000-е годы резко снизилось потребление мяса.
Расчет средней абсолютной и среднеквадратической ошибок модели:
t | Y | t*t | t*Y | Y* | |Y-Y*| | |Y-Y*|^2 |
1 | 75,0 | 1 | 75 | 57,034 | 17,9665 | 322,8 |
2 | 72,0 | 4 | 144 | 56,969 | 15,031 | 225,93 |
3 | 69,0 | 9 | 207 | 56,905 | 12,0955 | 146,3 |
4 | 64,5 | 16 | 258 | 56,84 | 7,66 | 58,676 |
5 | 60,0 | 25 | 300 | 56,776 | 3,2245 | 10,397 |
6 | 59,5 | 36 | 357 | 56,711 | 2,789 | 7,7785 |
7 | 59,0 | 49 | 413 | 56,647 | 2,3535 | 5,539 |
8 | 58,0 | 64 | 464 | 56,582 | 1,418 | 2,0107 |
9 | 57,0 | 81 | 513 | 56,518 | 0,4825 | 0,2328 |
10 | 56,0 | 100 | 560 | 56,453 | 0,453 | 0,2052 |
11 | 55,0 | 121 | 605 | 56,389 | 1,3885 | 1,9279 |
12 | 53,0 | 144 | 636 | 56,324 | 3,324 | 11,049 |
13 | 51,0 | 169 | 663 | 56,26 | 5,2595 | 27,662 |
14 | 50,5 | 196 | 707 | 56,195 | 5,695 | 32,433 |
15 | 50,0 | 225 | 750 | 56,131 | 6,1305 | 37,583 |
16 | 50,0 | 256 | 800 | 56,066 | 6,066 | 36,796 |
17 | 49,0 | 289 | 833 | 56,002 | 7,0015 | 49,021 |
18 | 48,0 | 324 | 864 | 55,937 | 7,937 | 62,996 |
19 | 46,5 | 361 | 883,5 | 55,873 | 9,3725 | 87,844 |
20 | 45,0 | 400 | 900 | 55,808 | 10,808 | 116,81 |
21 | 45,0 | 441 | 945 | 55,744 | 10,7435 | 115,42 |
22 | 45,0 | 484 | 990 | 55,679 | 10,679 | 114,04 |
23 | 46,0 | 529 | 1058 | 55,615 | 9,6145 | 92,439 |
24 | 47,0 | 576 | 1128 | 55,55 | 8,55 | 73,102 |
25 | 48,5 | 625 | 1212,5 | 55,486 | 6,9855 | 48,797 |
26 | 50,0 | 676 | 1300 | 55,421 | 5,421 | 29,387 |
27 | 51,0 | 729 | 1377 | 55,357 | 4,3565 | 18,979 |
28 | 52,0 | 784 | 1456 | 55,292 | 3,292 | 10,837 |
29 | 53,0 | 841 | 1537 | 55,228 | 2,2275 | 4,9618 |
30 | 54,0 | 900 | 1620 | 55,163 | 1,163 | 1,3526 |
31 | 54,5 | 961 | 1689,5 | 55,099 | 0,5985 | 0,3582 |
32 | 55,0 | 1024 | 1760 | 55,034 | 0,034 | 0,0012 |
33 | 57,0 | 1089 | 1881 | 54,97 | 2,0305 | 4,1229 |
34 | 59,0 | 1156 | 2006 | 54,905 | 4,095 | 16,769 |
35 | 60,5 | 1225 | 2117,5 | 54,841 | 5,6595 | 32,03 |
36 | 62,0 | 1296 | 2232 | 54,776 | 7,224 | 52,186 |
37 | 64,0 | 1369 | 2368 | 54,712 | 9,2885 | 86,276 |
38 | 66,0 | 1444 | 2508 | 54,647 | 11,353 | 128,89 |
39 | 66,5 | 1521 | 2593,5 | 54,583 | 11,9175 | 142,03 |
40 | 67,0 | 1600 | 2680 | 54,518 | 12,482 | 155,8 |
41 | Прогнозн. значения | I полуг. 2010 | 54,454 | |||
42 | II полуг. 2010 | 54,389 | ||||
Средняя абсолютная ошибка | 6,3543 | |||||
Среднеквадратическая ошибка | 59,3 |
4.1.2
Полиномиальная модель
МНК
Полином второго порядка строится аналогично линейной функции с помощью метода наименьших квадратов и встроенным функциям ППП MS Excel. Уравнение тренда имеет вид: y=0,06365*х2 – 2,6703*х + 75,338. Коэффициент детерминации равен 0,9661.
Расчет средней абсолютной и среднеквадратической ошибок модели:
t | Y | t*t | t*Y | Y* | |Y-Y*| | |Y-Y*|^2 | |
I полуг. 1990 | 1 | 75,0 | 1 | 75 | 72,7313 | 2,2687 | 5,1 |
II полуг. 1990 | 2 | 72,0 | 4 | 144 | 70,2518 | 1,7482 | 3,1 |
I полуг. 1991 | 3 | 69,0 | 9 | 207 | 67,8995 | 1,1005 | 1,2 |
II полуг. 1991 | 4 | 64,5 | 16 | 258 | 65,6744 | 1,1744 | 1,4 |
I полуг. 1992 | 5 | 60,0 | 25 | 300 | 63,5765 | 3,5765 | 12,8 |
II полуг. 1992 | 6 | 59,5 | 36 | 357 | 61,6058 | 2,1058 | 4,4 |
I полуг. 1993 | 7 | 59,0 | 49 | 413 | 59,7623 | 0,7623 | 0,6 |
II полуг. 1993 | 8 | 58,0 | 64 | 464 | 58,046 | 0,046 | 0,0 |
I полуг. 1994 | 9 | 57,0 | 81 | 513 | 56,4569 | 0,5431 | 0,3 |
II полуг. 1994 | 10 | 56,0 | 100 | 560 | 54,995 | 1,005 | 1,0 |
I полуг. 1995 | 11 | 55,0 | 121 | 605 | 53,6603 | 1,3397 | 1,8 |
II полуг. 1995 | 12 | 53,0 | 144 | 636 | 52,4528 | 0,5472 | 0,3 |
I полуг. 1996 | 13 | 51,0 | 169 | 663 | 51,3725 | 0,3725 | 0,1 |
II полуг. 1996 | 14 | 50,5 | 196 | 707 | 50,4194 | 0,0806 | 0,0 |
I полуг. 1997 | 15 | 50,0 | 225 | 750 | 49,5935 | 0,4065 | 0,2 |
II полуг. 1997 | 16 | 50,0 | 256 | 800 | 48,8948 | 1,1052 | 1,2 |
I полуг. 1998 | 17 | 49,0 | 289 | 833 | 48,3233 | 0,6767 | 0,5 |
II полуг. 1998 | 18 | 48,0 | 324 | 864 | 47,879 | 0,121 | 0,0 |
I полуг. 1999 | 19 | 46,5 | 361 | 883,5 | 47,5619 | 1,0619 | 1,1 |
II полуг. 1999 | 20 | 45,0 | 400 | 900 | 47,372 | 2,372 | 5,6 |
I полуг. 2000 | 21 | 45,0 | 441 | 945 | 47,3093 | 2,3093 | 5,3 |
II полуг. 2000 | 22 | 45,0 | 484 | 990 | 47,3738 | 2,3738 | 5,6 |
I полуг. 2001 | 23 | 46,0 | 529 | 1058 | 47,5655 | 1,5655 | 2,5 |
II полуг. 2001 | 24 | 47,0 | 576 | 1128 | 47,8844 | 0,8844 | 0,8 |
I полуг. 2002 | 25 | 48,5 | 625 | 1212,5 | 48,3305 | 0,1695 | 0,0 |
II полуг. 2002 | 26 | 50,0 | 676 | 1300 | 48,9038 | 1,0962 | 1,2 |
I полуг. 2003 | 27 | 51,0 | 729 | 1377 | 49,6043 | 1,3957 | 1,9 |
II полуг. 2003 | 28 | 52,0 | 784 | 1456 | 50,432 | 1,568 | 2,5 |
I полуг. 2004 | 29 | 53,0 | 841 | 1537 | 51,3869 | 1,6131 | 2,6 |
II полуг. 2004 | 30 | 54,0 | 900 | 1620 | 52,469 | 1,531 | 2,3 |
I полуг. 2005 | 31 | 54,5 | 961 | 1689,5 | 53,6783 | 0,8217 | 0,7 |
II полуг. 2005 | 32 | 55,0 | 1024 | 1760 | 55,0148 | 0,0148 | 0,0 |
I полуг. 2006 | 33 | 57,0 | 1089 | 1881 | 56,4785 | 0,5215 | 0,3 |
II полуг. 2006 | 34 | 59,0 | 1156 | 2006 | 58,0694 | 0,9306 | 0,9 |
I полуг. 2007 | 35 | 60,5 | 1225 | 2117,5 | 59,7875 | 0,7125 | 0,5 |
II полуг. 2007 | 36 | 62,0 | 1296 | 2232 | 61,6328 | 0,3672 | 0,1 |
I полуг. 2008 | 37 | 64,0 | 1369 | 2368 | 63,6053 | 0,3947 | 0,2 |
II полуг. 2008 | 38 | 66,0 | 1444 | 2508 | 65,705 | 0,295 | 0,1 |
I полуг. 2009 | 39 | 66,5 | 1521 | 2593,5 | 67,9319 | 1,4319 | 2,1 |
II полуг. 2009 | 40 | 67,0 | 1600 | 2680 | 70,286 | 3,286 | 10,8 |
41 | Прогнозн. значения | I полуг. 2010 | 72,7673 | ||||
42 | II полуг. 2010 | 75,3758 | |||||
Средняя абсолютная ошибка | 1,142405 | ||||||
Среднеквадратичская ошибка | 2,0 |