Анализ и прогнозирование числа собственных легковых автомобилей по субъектам РФ

Автор работы: Пользователь скрыл имя, 22 Мая 2012 в 18:44, курсовая работа

Описание

Целью данной курсовой работы является анализ исходных данных для прогнозирования.
Для достижения поставленной цели в работе необходимо решить
следующие задачи:
- Изучить теоретические основы методов прогнозирования для анализа
данных;
- Освоить методы прогнозирования на практике.

Работа состоит из  1 файл

Курсовая.docx

— 290.29 Кб (Скачать документ)

 

Вытянутость  облака  точек  на  диаграмме  рассеяния  вдоль  наклонной прямой позволяет сделать предположение, что существует некоторая объективная  тенденция  прямой  линейной  связи  между  значениями  переменных  X  —центральный  федеральный  округ  и  Y  —число  собственных  легковых автомобилей.

Рисунок 5 - Диаграмма рассеивания (корреляционное поле)

 

Задание 7. Выполнить расчет линейного коэффициента корреляции между зависимыми признаками. Оценить его значимость по критерию t –Стьюдента.

Промежуточные  расчеты  при вычислении  коэффициента корреляции между переменными представлены в Таблице 7.

 

 

 

 

Таблица 7 - Расчет коэффициента корреляции

 

Y

X

   

)

   

1

51,8

29,2

-50,9588

-89,3294

4552,12173

7979,744

2596,802

2

59,2

35,9

-43,5588

-82,629

3599,239965

6827,62

1897,371

3

62,3

42,9

-40,4588

-75,6294

3059,877024

5719,808

1636,916

4

67,6

56,1

-35,1588

-62,4294

2194,944671

3897,431

1236,143

5

70,6

75,9

-32,1588

-42,6294

1370,9117

1817,267

1034,19

6

76,8

95,3

-25,9588

-23,2294

603,008200

539,6056

673,8605

7

81,3

98,1

-21,4588

-20,4294

438,391141

417,3609

460,4811

8

98,6

123,4

-4,15882

4,870588

-20,25591696

23,72263

17,29581

9

109,5

131,1

6,741176

12,57059

84,7405536

158,0197

45,44346

10

114,5

139,5

11,74118

20,97059

246,219377

439,7656

137,8552

11

116,8

140,4

14,04118

21,87059

307,088788

478,3226

197,1546

12

120,8

153

18,04118

34,47059

621,8899654

1188,221

325,484

13

129,1

162,7

26,34118

44,17059

1163,50526

1951,041

693,8576

14

134,6

168,2

31,84118

49,67059

1581,56996

2467,167

1013,861

15

141,7

175,1

38,94118

56,57059

2202,92526

3200,231

1516,415

16

149,5

188,8

46,74118

70,27059

3284,529965

4937,956

2184,738

17

162,2

199,4

59,44118

80,87059

4807,04290

6540,052

3533,253

Cумма

174 6,9

2015 

1,14 ∙ 10-13

0

30097,7505

48583,34

19201,12

Сред.

102,7588

118,5294118

0,7 ∙ 10-14

0

3344,19451

5398,148

35805,44


 

Средние  значения  случайных  величин  X  и Y,  которые являются  наиболее простыми показателями, характеризующими последовательности x1, x2, …, x17 и y1, y2, …, y17,  равны соответственно  = 102,75882  и = 118,5294118

Дисперсия характеризует степень разброса значений x1, x2, …, x17 (y1, y2, …, y17) вокруг своего среднего  (и соответственно ):

 

= 3036,458 ,

= 1200,07

Стандартные ошибки случайных величин X и Y рассчитаем по формулам соответственно: 

= 55,10407      = 34,64203

Коэффициент корреляции рассчитаем по формуле: 

                                    = 0,985433

Оценим  значимость  коэффициента  корреляции.  Для  этого рассчитаем значение t-статистики по формуле

                              = 2,441

Табличное значение критерия Стьюдента равно: tтабл (α = 0,1; k = n - 2 = 18) =1,86. Сравнивая числовые значения критериев, видно, что tрасч > tтабл, т.е. полученное значение коэффициента корреляции значимо.

Задание 8. Провести регрессионный анализ данных. Определения аналитической зависимости признаков в виде уравнения регрессии. Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.

Для вычисления коэффициентов регрессии линейной модели используем метод наименьших квадратов. 

Построим  линейную  регрессионную  модель  методом  наименьших

квадратов, используем  вычисления, приведенные  в  Таблице 7.

Вычислим  значения коэффициентов линейной модели:

 

            

Таким образом, линейная модель имеет вид:  

=

Таблица 8 – Результаты вычислений по линейной модели

   
 

47,4048

 

51,5521

 

55,8851

 

64,0559

 

76,3121

 

88,3207

 

90,0539

 

105,7146

 

110,4809

 

115,6805

 

116,2376

 

124,037

 

130,0413

 

133,4458

 

137,7169

 

146,1972

 

152,7586

Cумма

1745,895

Среднее

102,6997


 

 

 

 

Рисунок 6 – Регрессионный анализ данных (линейная регрессия)

 

Задание 9. Осуществить проверку значимости параметров уравнения регрессии  с помощью t-критерия Стьюдента (α = 0,05).

Проверка значимости каждого коэффициента регрессии осуществляется с помощью t-критерия Стьюдента, расчетное значение которого определяется по формуле:

, где

= 2,282

- дисперсия коэффициента регрессии, наиболее простая формула

которого  имеет вид:

 

k - число факторных признаков в уравнении связи.

При проверке значимости коэффициентов регрессии на основе линейной парной зависимости дисперсия результирующего признака может быть вычислена следующим образом: 

 

где  дисперсия факторного признака:

         

остаточная  дисперсия:

 

Расчетное значение   t-критерия Стьюдента сравнивается с критическим, которое определяется по таблице табулированных значений:

, где

- уровень  значимости  критерия  проверки  гипотезы  о  равенстве  нулю параметров уравнения регрессии;

v - число степеней свободы, которое характеризует количество свободно варьируемых параметров совокупности;

         k - количество параметров в уравнении регрессии. 

  t табл = 1,734

| tрасч | =2,44

   Так как, расчетное значение t-критерия Стьюдента по модулю превышает табличное, то коэффициент регрессии признается значимым.

 

        Задание 10. Проверить адекватности  модели регрессии. Вычислить коэффициент детерминации, проверить значимость уравнения регрессии с помощью F-критерия Фишера (α = 0,05), найти среднюю относительную ошибку аппроксимации. Сделать вывод о качестве модели.

 

Коэффициент детерминации вычисляется  по формуле:

 

 

D = R2 =

 

  В  случае  линейной  зависимости  он  показывает,  какая  часть  общей дисперсии  объясняется  за  счет  вариации  линейной  комбинации  независимых переменных  x1, x2,..., xn  при данных коэффициентах ,,...,егрессии. 

D = 0,96949 ,т.е.  96,95% вариации объясняется факторами,  включенными в уравнение регрессии,  а 3,05% вариации объясняется прочими,  не включенными в модель факторами. 

По критерию Фишера оценка качества всей модели:

F = 26,76

Fтабл. = 6,14

F > Fтабл. → гипотеза  о  заложенных  в  уравнении  регрессии  связей принимается в обеих моделях.

Средняя относительная ошибка аппроксимации.

Рассчитаем  среднюю  арифметическую  величину  относительной  ошибки аппроксимации  по формуле:

                      

Получено  Eотн  = 5,61 %

Учитывая  коэффициент  детерминации,  можно  сделать  вывод  о  том, что большая  часть  общей  дисперсии  объясняется  за  счет  вариации  линейной комбинации независимых переменной X при данных коэффициентах регрессии.

F-критерия  Фишера  (α  =0,05)  показывает  существование  заложенных  в  уравнении регрессии связей, что  свидетельствует об адекватности  и значимости  уравнения  регрессии.  Средняя  относительная  ошибка  аппроксимации  (5,61%) мала, что говорит  о достаточно высоком качестве  построенной  модели.

 

Задание 11. Дать сравнительную оценку силы связи факторов результатом с помощью коэффициентов эластичности.

  Для  нахождения  средних  по  совокупности  показателей  эластичности получаем формулу:

                          = 0,619508 ∙

Коэффициент  эластичности  показывает,  что  с  ростом числа собственных автомобилей в центральном округе на 1% общее число возрастёт на 7,14%. 

 

Задание 12. Выполнить прогнозирование среднего значения показателя Y при уровне значимости α = 0,1, если прогнозное значение фактора X составит 80% от его максимального значения.

 

 

max X = 199,4

a0=29,33

a1=0,619

 

Задание 13. Оценить точность уравнения через среднюю относительную ошибку аппроксимации.

Чем  меньше  рассеивание  уровней  ряда  вокруг  регрессии,  тем  меньше ошибка аппроксимации. Если ошибка аппроксимации меньше или ровно 7% - то модель считается хорошей.

В нашем случае при  Eотн  = 5,61%, модель регрессии можно считать соответствует высокой точности оценки.

Задание 14. Рассчитать ошибки и доверительный интервал прогноза для уровня значимости 5 или 10% (α = 0,05; α = 0,10).

Рассчитаем  ошибки  и  доверительный  интервал  прогноза  для  уровня значимости 5 % (α = 0,05).

Ошибка  прогноза  –  величина,  характеризующая  расхождение 

фактического  и прогнозного показателя

 

 

  • Средняя абсолютная ошибка прогноза (MAD)
  •                                                 

Для модели

  • На  практике  используются  относительные  ошибки,  выраженные  в процентах

 

  • Средняя абсолютная процентная ошибка (МAPE)

 

Для первой модели: МAPE = 0,432

МAPE < 10%. Это свидетельствует о высокой точности обеих моделей.

 

  • Для  проведения  сравнительной  оценки  нескольких  моделей 

используется  средняя процентная ошибка (MPE)

 

 

Для модели: MPE = 0,219

  • Иногда для оценки моделей используются следующие два показателя

–  сумма    квадратов  ошибок  (SSE)  и усреднённое значение  квадратов ошибок  (MSE)

                    

Для модели: SSE= 1847

                    MSE= 543,1

Для расчёта  доверительного интервала используют выражение:

                                              U(1) =

где -  СКО тренда

n – количество  уровней ряда 

k – порядок модели (k=1)

yt  - уровни ряда

- выровненные  уровни, принадлежащие тренду 

- табличное значение t-критерия Стьюдента (ta =1,734 при a = 0,05)

K – коэффициент,  зависящий от  длины временного  ряда  и периода

упреждения l =1

 

 

K = 2,248

Доверительный интервал прогноза для уровня значимости 5%:

Для модели:  U(l) = ± 2,248 ∙38,134∙ta = ± 68,372

 

Задание 15. Представить графически: фактические и модельные значения Y, точки прогноза.

Представим  графически:  фактические  и  модельные  значения  Y,  точки прогноза. 

 

Рисунок 7 –Фактические и модельные значения Y, точки прогноза

 

 

 

 

 

 

 

 

 

ЗАКЛЮЧЕНИЕ

   В  настоящее  время  статистические  методы  прогнозирования  заняли видное  место в экономической практике.  С развитием  компьютерной  техники, совершенствованием  информационных  технологий,  распространением  пакетов прикладных  программ  эти метода  вышли за  стены учебных и научно-исследовательских институтов. Они стали важным инструментом в деятельности плановых,  аналитических,  маркетинговых  отделов  производственных предприятий  и  объединений,  торговых, страховых компаний,  банков, правительственных учреждений. 

Информация о работе Анализ и прогнозирование числа собственных легковых автомобилей по субъектам РФ