Нарушения допущений классической модели линейной регрессии

Автор работы: Пользователь скрыл имя, 21 Ноября 2012 в 11:20, лабораторная работа

Описание

В лабораторной работе № 1 выявили, что на чистый доход (y) предприятий оказывают влияния такие факторы, как использованный капитал (x2) и численность служащих (x3).
Для нахождения остатков воспользуемся инструментом анализа данных Регрессия.

Работа состоит из  1 файл

лабораторная работа №3.doc

— 1.52 Мб (Скачать документ)

 

Рисунок 7 – Расчетная таблица для проведения теста Спирмена для x2

Тогда

В нашем примере  статистика Стьюдента равна:

Табличное значение статистики Стьюдента составит t(0,05; 23)=2,0687.

Таким образом, мы получили, что расчетное значение больше табличного, следовательно, гипотеза о гетероскедастичности принимается на уровне значимости 5%.

Рассчитаем  теоретические значения для x3 по уравнению регрессии и найдем остатки. Ранжируем совокупность по возрастанию (рисунок 8).

 

№        п/п

y

x3

Теоритическое y

Остатки

Модуль  остатков

Ранг x

Ранг u

d2

1

45,4

1,2

45,680

-0,280

0,280

1

9

64

2

45,6

6,7

45,831

-0,231

0,231

2

7

25

3

45,7

7

45,840

-0,140

0,140

3

6

9

4

46,3

7,8

45,862

0,438

0,438

4

11

49

5

45,8

9,7

45,914

-0,114

0,114

5

4

1

6

46,9

12,4

45,988

0,912

0,912

6

21

225

7

45,9

12,5

45,991

-0,091

0,091

6

3

9

8

46,7

14,6

46,049

0,651

0,651

7

15

64

9

46,9

17,2

46,121

0,779

0,779

8

19

121

10

46,9

17,9

46,140

0,760

0,760

9

18

81

11

46,7

18,8

46,165

0,535

0,535

10

13

9

12

47

19

46,170

0,830

0,830

11

20

81

13

46,3

20,5

46,212

0,088

0,088

12

2

100

14

45,7

23,4

46,292

-0,592

0,592

13

14

1

15

46,6

24,8

46,330

0,270

0,270

14

8

36

16

45,9

27,8

46,413

-0,513

0,513

15

12

9

17

46,3

28

46,418

-0,118

0,118

16

5

121

18

45,4

30,5

46,487

-1,087

1,087

17

23

36

19

47,6

30,7

46,493

1,107

1,107

18

24

36

20

44,1

38

46,694

-2,594

2,594

19

25

36

21

46,1

40,6

46,766

-0,666

0,666

19

16

9

22

46,8

41,2

46,782

0,018

0,018

20

1

361

23

46,4

61,5

47,342

-0,942

0,942

21

22

1

24

49,1

100,6

48,419

0,681

0,681

22

17

25

25

51,9

216,1

51,602

0,298

0,298

23

10

169

             

Сумма:

1678


Рисунок 8 – Расчетная таблица для проведения теста Спирмена для x3

Тогда

В нашем примере  статистика Стьюдента равна:

Табличное значение статистики Стьюдента составит t(0,05; 23)=2,0687.

Таким образом, мы получили, что расчетное значение меньше табличного, следовательно, гипотеза об отсутствии гетероскедастичности принимается на уровне значимости 5%.

 

Тест Уайта (White test).

 

Тест  Уайта позволяет оценить количественно  зависимость дисперсии ошибок регрессии  от значений фактора x, используя квадратичную функцию:

,

где - нормально распределенная ошибка.

Рисунок 9 – Вывод итогов вспомогательной  регрессии теста Уайта

 

Оцениваем вспомогательную регрессию;

Гипотеза об отсутствии гетероскедастичности принимается  в случае незначимости регрессии в целом.

В нашем примере  вспомогательная регрессия принимает  вид:

Уравнение статистически  незначимо на уровне значимости . Следовательно, гипотеза об отсутствии гетероскедастичности принимается.

 

2. По  всем проведенным тестам можно  сделать вывод о гомоскедастичности  регрессионных остатков. В противном  случае для устранения гетероскедастичности необходимо применить к исходным данным обобщенный метод наименьших квадратов в предположении, что .

Рисунок 10 – Вывод итога ОМНК

Исходное уравнение  преобразуем делением правой и левой  частей на x2: . К нему применим МНК. Полученное уравнение имеет вид:

Получены новые  оценки параметров линейного уравнения, в котором смягчена гетероскедастичность.

 

3. Метод рядов

Последовательно определяются знаки остатков .

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда.

Пусть n — объем выборки;

n1 — общее количество знаков «+» при n наблюдениях;

n2 — общее количество знаков «-» при n наблюдениях;

k — количество рядов.

Если при  достаточно большом количестве наблюдений (n1>10, n2>10) количество рядов k лежит в пределах от k1 до k2:

то  гипотеза об отсутствии автокорреляции не отклоняется.

 

Рисунок 11 – Расчет характеристик метода рядов

 

Найдя знаки  отклонений теоретических уровней от фактических, мы получили, что в анализируемой выборке содержится 15 рядов, т.е. k=15 (рисунок 11). Общее количество знаков «+» n1=14, количество знаков «-» n2=11.

Подставим найденные значения в формулу, получим, что k1=7,509, k2=19,131. Следовательно, гипотеза об отсутствии автокорреляции не отклоняется.

 

Критерий  Дарбина – Уотсона

 

Для проверки автокорреляции первого порядка необходимо рассчитать критерий Дарбина—Уотсона. Он определяется так:

Выдвигается гипотеза Н0 об отсутствии автокорреляции остатков. При сравнении расчетного значения статистики (DW<2) с dl и du возможны следующие варианты.

  1. Если DW< dl , то гипотеза Н0 отвергается
  2. Если DW > du, то гипотеза Н0 не отвергается.
  3. Если dl< DW< du, то нельзя сделать определенного вывода по имеющимся исходным данным (зона неопределенности).

При DW > 2, то с табличными значениями сравнивается величина (4-DW).

 

Рисунок 12 – Расчет критерия Дарбина – Уотсона

 

В результате проведенных  расчетов получено значение критерия Дарбина - Уотсона DW=2,203 (рисунок 12). Так как оно больше 2, то с критическими значением сравниваем величину 4-DW=1,797. Оно больше du следовательно мы не можем отвергнуть гипотезу Н0 – в ряду остатков отсутствует автокорреляция первого порядка.

 

Q-тест Льюинга – Бокса

 

Использование данного теста предполагает использование Q- статистики, значение которой определяется по формуле:

где - выборочные значения автокорреляционной функции;

- величина лага;

n – число наблюдений.

Q- статистика имеет - распределение с степенями свободы. Если Q - статистика меньше табличного , то гипотеза об отсутствии автокорреляции принимается.

Рассчитаем  для нашей задачи Q- статистику. Для этого необходимо определить коэффициенты автокорреляции. Максимальная величина лага не должна превышать ¼ числа наблюдений, т.е. в рассматриваемом примере . Следовательно нужно определить автокорреляции до шестого порядка. (рисунок 13).

 

Рисунок 13 – Расчет Q-статистики Льюинга - Бокса

 

Подставив полученное значение в формулу, получим:

.

Табличное значение .

Фактическое значение статистики меньше критического, следовательно, гипотеза принимается, т.е. в ряду остатков отсутствует  автокорреляция.


Информация о работе Нарушения допущений классической модели линейной регрессии