Нарушения допущений классической модели линейной регрессии

Автор работы: Пользователь скрыл имя, 21 Ноября 2012 в 11:20, лабораторная работа

Описание

В лабораторной работе № 1 выявили, что на чистый доход (y) предприятий оказывают влияния такие факторы, как использованный капитал (x2) и численность служащих (x3).
Для нахождения остатков воспользуемся инструментом анализа данных Регрессия.

Работа состоит из  1 файл

лабораторная работа №3.doc

— 1.52 Мб (Скачать документ)

Министерство  образования Российской Федерации

Федеральное агентство  по образованию

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО  ОБРАЗОВАНИЯ

«ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

Финансово экономический факультет

Кафедра финансы и кредит

 

 

 

 

ОТЧЕТ

по лабораторной работе № 3

по курсу Эконометрики

 

Нарушения допущений классической модели

линейной регрессии

ГОУ ОГУ 080105.65.7012.08 О

 

 

 

 

Руководитель   

_______________ Лебедева Т.В.

"___”_______________2012 г.

Исполнитель

студент  гр. 10ФК02  

____________ Елисеева Е.В.

         "___"_______________2012 г.

 

 

Оренбург 2012

Исходные  данные (вариант 3):

№ п/п

Пол руководителя компании

1

2

3

4

5

6

7

8

1

45,9

34

68

12,5

43,3

2,3

муж

2

46,7

16,1

49,3

18,8

42,9

3,9

жен

3

45,7

7,2

66,6

7

41,3

1,7

муж

4

46,7

12,7

17,3

14,6

40,9

2,6

муж

5

47,6

22,7

78,5

30,7

39,7

3,1

муж

6

46,3

17,7

20,9

28

28,9

0,6

жен

7

49,1

139,8

356,4

100,6

39,4

5,1

муж

8

46,6

20,6

72,4

24,8

39,2

2,6

муж

9

51,9

168,1

218,2

216,1

38,7

4,5

муж

10

45,4

4,7

5

1,2

37,7

1,9

жен

11

46,3

9,5

28,8

7,8

37,7

3

жен

12

46,9

29,8

68

12,4

37,4

3,6

жен

13

46,9

16,1

47,5

17,9

28,6

3,7

муж

14

46,4

12,5

45,4

61,5

35,5

2,5

жен

15

45,4

22,2

43,9

30,5

35,1

3,1

жен

16

45,8

9,5

11,5

9,7

34,5

0,3

жен

17

46,8

29,7

46,8

41,2

32,9

2,2

муж

18

45,9

15,1

24,8

27,8

32,2

3,5

жен

19

46,1

20,4

54

40,6

27,8

4,1

жен

20

46,9

15,4

42,8

17,2

31,7

4,3

муж

21

44,1

24,1

5,8

38

31,6

2,9

муж

22

46,3

16,2

31

20,5

31,6

3,5

муж

23

47

16,1

41,4

19

31,5

4

муж

24

45,6

6,9

6,8

6,7

30,3

2,6

жен

25

45,7

18,2

20,9

23,4

29,6

4

жен


 

где  y – чистый доход, млрд. долл.;

x1 – оборот капитала, млрд. долл.;

x2 – использованный капитал, млрд. долл.;

x3 – численность служащих, тыс. чел.;

x4 – рыночная капитализация компаний, млрд. долл.;

x5 – заработная плата служащих, тыс. долл.

 

Задание:

  1. Проведите графический анализ остатков. Проверьте остатки на гетероскедастичность с помощью:

- графического  анализа, 

- теста Голдфелда-Квандта, 

- теста ранговой  корреляции Спирмена,

- теста Уайта (White test).

  1. Если будет обнаружена гетероскедастичность остатков, примените для исходных данных ОМНК, предполагая, что .

3. Проверить  остатки на наличие автокорреляции  первого порядка, используя метод рядов, критерий Дарбина – Уотсона и Q- статистику Льюинга – Бокса. Если гипотеза об отсутствии автокорреляции первого порядка не будет отвергнута, то применить ОМНК для оценивания параметров уравнения регрессии.

 

Реализация  заданий:

В лабораторной работе № 1 выявили, что на чистый доход (y) предприятий оказывают влияния такие факторы, как использованный капитал (x2) и численность служащих (x3).

Для нахождения остатков воспользуемся инструментом анализа данных Регрессия.

Заполним диалоговое окно ввода данных и параметров ввода (рисунок 1):

Входной интервал Y – диапазон, содержащий данные результативного признака, в нашем случае это ячейки с B2 по B26;

Входной интервал Х – диапазон, содержащий данные двух факторов (x2 и x3), в нашем случае это ячейки с D2 по D26 и с E2 по E26;

Метки – флажок, который указывает, содержит ли первая строка названия столбцов или как в нашем случае нет;

Константа – ноль – флажок, указывающий на наличие или отсутствие  свободного члена в уравнении, в нашем случае его нет;

Выходной  интервал – достаточно указать левую верхнюю ячейку будущего диапазона;

Новый рабочий лист - можно задать произвольное имя нового листа в нашем случае выводится на тот же рабочий лист, где находятся исходные данные;

Остаток - флажок, указывает вывод остатков и теоретические значения результативного признака.

 

Рисунок 1 –  Регрессия с остатками

 

Полученные  результаты регрессионного и корреляционного анализа, а также вспомогательные характеристики представлены на рисунке 2.

 

 

Рисунок 2 – Вывод остатков

 

Проверим остатки  полученного уравнения регрессии  на гетероскедастичность.

 

Графический анализ остатков

 

Построим графики остатков для каждого уравнения (рисунок 3 и 4):

 

Рисунок 3 – График остатков для фактора х4

 

Как видно на рисунке отклонения не лежат внутри полуполосы постоянной ширины, это говорит, о зависимости дисперсионных остатков от величины х2 и о их непостоянстве, т.е. о наличии гетероскедастичности.

 

 

Рисунок 4 –  График остатков для фактора х3

 

Как видно на рисунке отклонения не лежат внутри полуполосы постоянной ширины, это говорит, о зависимости дисперсионных остатков от величины х3 и о их непостоянстве, т.е. о наличии гетероскедастичности.

 

Тест  Голфелда-Квандта

 

1) Все n наблюдений упорядочиваются по величине X2 и X3.

Таблица 1 – Упорядоченные значения по фактору  х2:

 

№ п/п

y

x2

1

45,4

5

2

44,1

5,8

3

45,6

6,8

4

45,8

11,5

5

46,7

17,3

6

46,3

20,9

7

45,7

20,9

8

45,9

24,8

9

46,3

28,8

10

46,3

31

11

47

41,4

12

46,9

42,8

13

45,4

43,9

14

46,4

45,4

15

46,8

46,8

16

46,9

47,5

17

46,7

49,3

18

46,1

54

19

45,7

66,6

20

45,9

68

21

46,9

68

22

46,6

72,4

23

47,6

78,5

24

51,9

218,2

25

49,1

356,4


 

Таблица 2 – Упорядоченные значения по фактору х3:

 

№ п/п

y

x3

1

45,4

1,2

2

45,6

6,7

3

45,7

7

4

46,3

7,8

5

45,8

9,7

6

46,9

12,4

7

45,9

12,5

8

46,7

14,6

9

46,9

17,2

10

46,9

17,9

11

46,7

18,8

12

47

19

13

46,3

20,5

14

45,7

23,4

15

46,6

24,8

16

45,9

27,8

17

46,3

28

18

45,4

30,5

19

47,6

30,7

20

44,1

38

21

46,1

40,6

22

46,8

41,2

23

46,4

61,5

24

49,1

100,6

25

51,9

216,1


 

2) Исключим С центральных наблюдений, разобьем совокупность на две части: а) со значениями x ниже центральных; б) со значениями x выше центральных.

Исключение С средних наблюдений в этом упорядочении в целях построения двух независимых "частных" регрессий по данным n' = (n-с)/2 в начале выборки и по данным n' = (n - с)/2 в конце выборки

Пусть С = 5, это наблюдения с порядковыми номерами 11-15.

 

3) Оцениваются отдельные регрессии для первой подвыборки (10 первых наблюдений) и для третьей подвыборки (10 последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям X верно, то дисперсия регрессии по первой подвыборке (сумма квадратов отклонений ) будет существенно меньше дисперсии регрессии по третьей подвыборке (суммы квадратов отклонений ).

 

4) По каждой части находим уравнение регрессии (рисунки 5 и 6)

Рисунок 5 –  Вывод итогов для подвыборок для  фактора х2

 

       

 

Рисунок 6 – Вывод итогов для подвыборок для фактора х3

      

 

5) Для сравнения  соответствующих дисперсий строится следующая F-статистика:

- для х2:

 

- для х3:

При сделанных  предположениях относительно случайных отклонений построенная F-статистика имеет распределение Фишера с числами степеней свободы v1=v2=(n-C-2m)/2. Тогда,

6) Если  , то гипотеза об отсутствии гетероскедастичности отклоняется ( - выбранный уровень значимости).

По проведенным  расчетам в обоих случаях (и для х2, и для х3) мы получили, что следовательно в ряду остатков обнаружена гетероскедастичность.

 

Тест ранговой корреляции Спирмена

 

Значения хi и ui ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции:

где di - разность между рангами хi и ui, i = 1, 2, ..., n;

n - число наблюдений.

Рассчитаем  теоретические значения для x2 по уравнению регрессии и найдем остатки. Ранжируем совокупность по возрастанию (рисунок 7).

 

№        п/п

y

x2

Теоритическое y

Остатки

Модуль  остатков

Ранг x

Ранг u

d2

1

45,4

5

45,768

-0,368

0,368

1

11

100

2

44,1

5,8

45,780

-1,680

1,680

2

22

400

3

45,6

6,8

45,795

-0,195

0,195

3

6

9

4

45,8

11,5

45,864

-0,064

0,064

4

2

4

5

46,7

17,3

45,949

0,751

0,751

5

17

144

6

46,3

20,9

46,002

0,298

0,298

6

9

9

7

45,7

20,9

46,002

-0,302

0,302

6

10

16

8

45,9

24,8

46,059

-0,159

0,159

7

4

9

9

46,3

28,8

46,118

0,182

0,182

8

5

9

10

46,3

31

46,150

0,150

0,150

9

3

36

11

47

41,4

46,303

0,697

0,697

10

16

36

12

46,9

42,8

46,324

0,576

0,576

11

15

16

13

45,4

43,9

46,340

-0,940

0,940

12

20

64

14

46,4

45,4

46,362

0,038

0,038

13

1

144

15

46,8

46,8

46,383

0,417

0,417

14

13

1

16

46,9

47,5

46,393

0,507

0,507

15

14

1

17

46,7

49,3

46,419

0,281

0,281

16

8

64

18

46,1

54

46,488

-0,388

0,388

17

12

25

19

45,7

66,6

46,673

-0,973

0,973

18

21

9

20

45,9

68

46,694

-0,794

0,794

19

19

0

21

46,9

68

46,694

0,206

0,206

19

7

144

22

46,6

72,4

46,759

-0,159

0,159

20

4

256

23

47,6

78,5

46,848

0,752

0,752

21

18

9

24

51,9

218,2

48,901

2,999

2,999

22

24

4

25

49,1

356,4

50,932

-1,832

1,832

23

23

0

             

Сумма:

1509

Информация о работе Нарушения допущений классической модели линейной регрессии