Автор работы: Пользователь скрыл имя, 22 Мая 2012 в 18:44, курсовая работа
Целью данной курсовой работы является анализ исходных данных для прогнозирования.
Для достижения поставленной цели в работе необходимо решить
следующие задачи:
- Изучить теоретические основы методов прогнозирования для анализа
данных;
- Освоить методы прогнозирования на практике.
Вытянутость
облака точек на диаграмме
рассеяния вдоль наклонной прямой
позволяет сделать
Рисунок 5 - Диаграмма рассеивания (корреляционное поле)
Задание 7. Выполнить расчет линейного коэффициента корреляции между зависимыми признаками. Оценить его значимость по критерию t –Стьюдента.
Промежуточные расчеты при вычислении коэффициента корреляции между переменными представлены в Таблице 7.
Таблица 7 - Расчет коэффициента корреляции
№ |
Y |
X |
) |
||||
1 |
51,8 |
29,2 |
-50,9588 |
-89,3294 |
4552,12173 |
7979,744 |
2596,802 |
2 |
59,2 |
35,9 |
-43,5588 |
-82,629 |
3599,239965 |
6827,62 |
1897,371 |
3 |
62,3 |
42,9 |
-40,4588 |
-75,6294 |
3059,877024 |
5719,808 |
1636,916 |
4 |
67,6 |
56,1 |
-35,1588 |
-62,4294 |
2194,944671 |
3897,431 |
1236,143 |
5 |
70,6 |
75,9 |
-32,1588 |
-42,6294 |
1370,9117 |
1817,267 |
1034,19 |
6 |
76,8 |
95,3 |
-25,9588 |
-23,2294 |
603,008200 |
539,6056 |
673,8605 |
7 |
81,3 |
98,1 |
-21,4588 |
-20,4294 |
438,391141 |
417,3609 |
460,4811 |
8 |
98,6 |
123,4 |
-4,15882 |
4,870588 |
-20,25591696 |
23,72263 |
17,29581 |
9 |
109,5 |
131,1 |
6,741176 |
12,57059 |
84,7405536 |
158,0197 |
45,44346 |
10 |
114,5 |
139,5 |
11,74118 |
20,97059 |
246,219377 |
439,7656 |
137,8552 |
11 |
116,8 |
140,4 |
14,04118 |
21,87059 |
307,088788 |
478,3226 |
197,1546 |
12 |
120,8 |
153 |
18,04118 |
34,47059 |
621,8899654 |
1188,221 |
325,484 |
13 |
129,1 |
162,7 |
26,34118 |
44,17059 |
1163,50526 |
1951,041 |
693,8576 |
14 |
134,6 |
168,2 |
31,84118 |
49,67059 |
1581,56996 |
2467,167 |
1013,861 |
15 |
141,7 |
175,1 |
38,94118 |
56,57059 |
2202,92526 |
3200,231 |
1516,415 |
16 |
149,5 |
188,8 |
46,74118 |
70,27059 |
3284,529965 |
4937,956 |
2184,738 |
17 |
162,2 |
199,4 |
59,44118 |
80,87059 |
4807,04290 |
6540,052 |
3533,253 |
Cумма |
174 6,9 |
2015 |
1,14 ∙ 10-13 |
0 |
30097,7505 |
48583,34 |
19201,12 |
Сред. |
102,7588 |
118,5294118 |
0,7 ∙ 10-14 |
0 |
3344,19451 |
5398,148 |
35805,44 |
Средние значения случайных величин X и Y, которые являются наиболее простыми показателями, характеризующими последовательности x1, x2, …, x17 и y1, y2, …, y17, равны соответственно = 102,75882 и = 118,5294118
Дисперсия характеризует степень разброса значений x1, x2, …, x17 (y1, y2, …, y17) вокруг своего среднего (и соответственно ):
= 3036,458 ,
= 1200,07
Стандартные ошибки случайных величин X и Y рассчитаем по формулам соответственно:
= 55,10407 = 34,64203
Коэффициент корреляции рассчитаем по формуле:
Оценим значимость коэффициента корреляции. Для этого рассчитаем значение t-статистики по формуле
= 2,441
Табличное значение критерия Стьюдента равно: tтабл (α = 0,1; k = n - 2 = 18) =1,86. Сравнивая числовые значения критериев, видно, что tрасч > tтабл, т.е. полученное значение коэффициента корреляции значимо.
Задание 8. Провести регрессионный анализ данных. Определения аналитической зависимости признаков в виде уравнения регрессии. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
Для вычисления
коэффициентов регрессии
Построим линейную регрессионную модель методом наименьших
квадратов, используем вычисления, приведенные в Таблице 7.
Вычислим значения коэффициентов линейной модели:
Таким образом, линейная модель имеет вид:
=
Таблица 8 – Результаты вычислений по линейной модели
47,4048 | |
51,5521 | |
55,8851 | |
64,0559 | |
76,3121 | |
88,3207 | |
90,0539 | |
105,7146 | |
110,4809 | |
115,6805 | |
116,2376 | |
124,037 | |
130,0413 | |
133,4458 | |
137,7169 | |
146,1972 | |
152,7586 | |
Cумма |
1745,895 |
Среднее |
102,6997 |
Рисунок 6 – Регрессионный анализ данных (линейная регрессия)
Задание 9. Осуществить проверку значимости параметров уравнения регрессии с помощью t-критерия Стьюдента (α = 0,05).
Проверка значимости каждого коэффициента регрессии осуществляется с помощью t-критерия Стьюдента, расчетное значение которого определяется по формуле:
, где
= 2,282
- дисперсия коэффициента регрессии, наиболее простая формула
которого имеет вид:
k - число факторных признаков в уравнении связи.
При проверке значимости коэффициентов регрессии на основе линейной парной зависимости дисперсия результирующего признака может быть вычислена следующим образом:
где дисперсия факторного признака:
остаточная дисперсия:
Расчетное значение t-критерия Стьюдента сравнивается с критическим, которое определяется по таблице табулированных значений:
, где
- уровень значимости критерия проверки гипотезы о равенстве нулю параметров уравнения регрессии;
v - число степеней свободы, которое характеризует количество свободно варьируемых параметров совокупности;
k - количество параметров в уравнении регрессии.
t табл = 1,734
| tрасч | =2,44
Так как, расчетное значение t-критерия Стьюдента по модулю превышает табличное, то коэффициент регрессии признается значимым.
Задание 10. Проверить адекватности модели регрессии. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (α = 0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.
Коэффициент детерминации вычисляется по формуле:
D = R2 =
В случае линейной зависимости он показывает, какая часть общей дисперсии объясняется за счет вариации линейной комбинации независимых переменных x1, x2,..., xn при данных коэффициентах ,,...,егрессии.
D = 0,96949 ,т.е.
96,95% вариации объясняется
По критерию Фишера оценка качества всей модели:
F = 26,76
Fтабл. = 6,14
F > Fтабл. → гипотеза о заложенных в уравнении регрессии связей принимается в обеих моделях.
Средняя относительная ошибка аппроксимации.
Рассчитаем среднюю арифметическую величину относительной ошибки аппроксимации по формуле:
Получено Eотн = 5,61 %
Учитывая коэффициент детерминации, можно сделать вывод о том, что большая часть общей дисперсии объясняется за счет вариации линейной комбинации независимых переменной X при данных коэффициентах регрессии.
F-критерия
Фишера (α =0,05) показывает
существование заложенных в
уравнении регрессии связей, что
свидетельствует об
Задание 11. Дать сравнительную оценку силы связи факторов результатом с помощью коэффициентов эластичности.
Для нахождения средних по совокупности показателей эластичности получаем формулу:
= 0,619508 ∙
Коэффициент эластичности показывает, что с ростом числа собственных автомобилей в центральном округе на 1% общее число возрастёт на 7,14%.
Задание 12. Выполнить прогнозирование среднего значения показателя Y при уровне значимости α = 0,1, если прогнозное значение фактора X составит 80% от его максимального значения.
max X = 199,4
a0=29,33
a1=0,619
Задание 13. Оценить точность уравнения через среднюю относительную ошибку аппроксимации.
Чем меньше рассеивание уровней ряда вокруг регрессии, тем меньше ошибка аппроксимации. Если ошибка аппроксимации меньше или ровно 7% - то модель считается хорошей.
В нашем случае при Eотн = 5,61%, модель регрессии можно считать соответствует высокой точности оценки.
Задание 14. Рассчитать ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (α = 0,05; α = 0,10).
Рассчитаем ошибки и доверительный интервал прогноза для уровня значимости 5 % (α = 0,05).
Ошибка прогноза – величина, характеризующая расхождение
фактического и прогнозного показателя
Для модели
Для первой модели: МAPE = 0,432
МAPE < 10%. Это свидетельствует о высокой точности обеих моделей.
используется средняя процентная ошибка (MPE)
Для модели: MPE = 0,219
– сумма квадратов ошибок (SSE) и усреднённое значение квадратов ошибок (MSE)
Для модели: SSE= 1847
MSE= 543,1
Для расчёта доверительного интервала используют выражение:
где - СКО тренда
n – количество уровней ряда
k – порядок модели (k=1)
yt - уровни ряда
- выровненные уровни, принадлежащие тренду
- табличное значение t-критерия Стьюдента (ta =1,734 при a = 0,05)
K – коэффициент, зависящий от длины временного ряда и периода
упреждения l =1
K = 2,248
Доверительный интервал прогноза для уровня значимости 5%:
Для модели: U(l) = ± 2,248 ∙38,134∙ta = ± 68,372
Задание 15. Представить графически: фактические и модельные значения Y, точки прогноза.
Представим графически: фактические и модельные значения Y, точки прогноза.
Рисунок 7 –Фактические и модельные значения Y, точки прогноза
ЗАКЛЮЧЕНИЕ
В настоящее время статистические методы прогнозирования заняли видное место в экономической практике. С развитием компьютерной техники, совершенствованием информационных технологий, распространением пакетов прикладных программ эти метода вышли за стены учебных и научно-исследовательских институтов. Они стали важным инструментом в деятельности плановых, аналитических, маркетинговых отделов производственных предприятий и объединений, торговых, страховых компаний, банков, правительственных учреждений.
Информация о работе Анализ и прогнозирование числа собственных легковых автомобилей по субъектам РФ