Автор работы: Пользователь скрыл имя, 21 Ноября 2012 в 11:20, лабораторная работа
В лабораторной работе № 1 выявили, что на чистый доход (y) предприятий оказывают влияния такие факторы, как использованный капитал (x2) и численность служащих (x3).
Для нахождения остатков воспользуемся инструментом анализа данных Регрессия.
Министерство образования Российской Федерации
Федеральное агентство по образованию
ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
«ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Финансово экономический факультет
Кафедра финансы и кредит
ОТЧЕТ
по лабораторной работе № 3
по курсу Эконометрики
Нарушения допущений классической модели
линейной регрессии
ГОУ ОГУ 080105.65.7012.08 О
Руководитель
_______________ Лебедева Т.В.
"___”_______________2012 г.
Исполнитель
студент гр. 10ФК02
____________ Елисеева Е.В.
"___"_______________
Оренбург 2012
Исходные данные (вариант 3):
№ п/п |
Пол руководителя компании | ||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
1 |
45,9 |
34 |
68 |
12,5 |
43,3 |
2,3 |
муж |
2 |
46,7 |
16,1 |
49,3 |
18,8 |
42,9 |
3,9 |
жен |
3 |
45,7 |
7,2 |
66,6 |
7 |
41,3 |
1,7 |
муж |
4 |
46,7 |
12,7 |
17,3 |
14,6 |
40,9 |
2,6 |
муж |
5 |
47,6 |
22,7 |
78,5 |
30,7 |
39,7 |
3,1 |
муж |
6 |
46,3 |
17,7 |
20,9 |
28 |
28,9 |
0,6 |
жен |
7 |
49,1 |
139,8 |
356,4 |
100,6 |
39,4 |
5,1 |
муж |
8 |
46,6 |
20,6 |
72,4 |
24,8 |
39,2 |
2,6 |
муж |
9 |
51,9 |
168,1 |
218,2 |
216,1 |
38,7 |
4,5 |
муж |
10 |
45,4 |
4,7 |
5 |
1,2 |
37,7 |
1,9 |
жен |
11 |
46,3 |
9,5 |
28,8 |
7,8 |
37,7 |
3 |
жен |
12 |
46,9 |
29,8 |
68 |
12,4 |
37,4 |
3,6 |
жен |
13 |
46,9 |
16,1 |
47,5 |
17,9 |
28,6 |
3,7 |
муж |
14 |
46,4 |
12,5 |
45,4 |
61,5 |
35,5 |
2,5 |
жен |
15 |
45,4 |
22,2 |
43,9 |
30,5 |
35,1 |
3,1 |
жен |
16 |
45,8 |
9,5 |
11,5 |
9,7 |
34,5 |
0,3 |
жен |
17 |
46,8 |
29,7 |
46,8 |
41,2 |
32,9 |
2,2 |
муж |
18 |
45,9 |
15,1 |
24,8 |
27,8 |
32,2 |
3,5 |
жен |
19 |
46,1 |
20,4 |
54 |
40,6 |
27,8 |
4,1 |
жен |
20 |
46,9 |
15,4 |
42,8 |
17,2 |
31,7 |
4,3 |
муж |
21 |
44,1 |
24,1 |
5,8 |
38 |
31,6 |
2,9 |
муж |
22 |
46,3 |
16,2 |
31 |
20,5 |
31,6 |
3,5 |
муж |
23 |
47 |
16,1 |
41,4 |
19 |
31,5 |
4 |
муж |
24 |
45,6 |
6,9 |
6,8 |
6,7 |
30,3 |
2,6 |
жен |
25 |
45,7 |
18,2 |
20,9 |
23,4 |
29,6 |
4 |
жен |
где y – чистый доход, млрд. долл.;
x1 – оборот капитала, млрд. долл.;
x2 – использованный капитал, млрд. долл.;
x3 – численность служащих, тыс. чел.;
x4 – рыночная капитализация компаний, млрд. долл.;
x5 – заработная плата служащих, тыс. долл.
Задание:
- графического анализа,
- теста Голдфелда-Квандта,
- теста ранговой корреляции Спирмена,
- теста Уайта (White test).
3. Проверить
остатки на наличие
Реализация заданий:
В лабораторной работе № 1 выявили, что на чистый доход (y) предприятий оказывают влияния такие факторы, как использованный капитал (x2) и численность служащих (x3).
Для нахождения остатков воспользуемся инструментом анализа данных Регрессия.
Заполним диалоговое окно ввода данных и параметров ввода (рисунок 1):
Входной интервал Y – диапазон, содержащий данные результативного признака, в нашем случае это ячейки с B2 по B26;
Входной интервал Х – диапазон, содержащий данные двух факторов (x2 и x3), в нашем случае это ячейки с D2 по D26 и с E2 по E26;
Метки – флажок, который указывает, содержит ли первая строка названия столбцов или как в нашем случае нет;
Константа – ноль – флажок, указывающий на наличие или отсутствие свободного члена в уравнении, в нашем случае его нет;
Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист - можно задать произвольное имя нового листа в нашем случае выводится на тот же рабочий лист, где находятся исходные данные;
Остаток - флажок, указывает вывод остатков и теоретические значения результативного признака.
Рисунок 1 – Регрессия с остатками
Полученные результаты регрессионного и корреляционного анализа, а также вспомогательные характеристики представлены на рисунке 2.
Рисунок 2 – Вывод остатков
Проверим остатки
полученного уравнения
Графический анализ остатков
Построим графики остатков для каждого уравнения (рисунок 3 и 4):
Рисунок 3 – График остатков для фактора х4
Как видно на рисунке отклонения не лежат внутри полуполосы постоянной ширины, это говорит, о зависимости дисперсионных остатков от величины х2 и о их непостоянстве, т.е. о наличии гетероскедастичности.
Рисунок 4 – График остатков для фактора х3
Как видно на рисунке отклонения не лежат внутри полуполосы постоянной ширины, это говорит, о зависимости дисперсионных остатков от величины х3 и о их непостоянстве, т.е. о наличии гетероскедастичности.
Тест Голфелда-Квандта
1) Все n наблюдений упорядочиваются по величине X2 и X3.
Таблица 1 – Упорядоченные значения по фактору х2:
№ п/п |
y |
x2 |
1 |
45,4 |
5 |
2 |
44,1 |
5,8 |
3 |
45,6 |
6,8 |
4 |
45,8 |
11,5 |
5 |
46,7 |
17,3 |
6 |
46,3 |
20,9 |
7 |
45,7 |
20,9 |
8 |
45,9 |
24,8 |
9 |
46,3 |
28,8 |
10 |
46,3 |
31 |
11 |
47 |
41,4 |
12 |
46,9 |
42,8 |
13 |
45,4 |
43,9 |
14 |
46,4 |
45,4 |
15 |
46,8 |
46,8 |
16 |
46,9 |
47,5 |
17 |
46,7 |
49,3 |
18 |
46,1 |
54 |
19 |
45,7 |
66,6 |
20 |
45,9 |
68 |
21 |
46,9 |
68 |
22 |
46,6 |
72,4 |
23 |
47,6 |
78,5 |
24 |
51,9 |
218,2 |
25 |
49,1 |
356,4 |
Таблица 2 – Упорядоченные значения по фактору х3:
№ п/п |
y |
x3 |
1 |
45,4 |
1,2 |
2 |
45,6 |
6,7 |
3 |
45,7 |
7 |
4 |
46,3 |
7,8 |
5 |
45,8 |
9,7 |
6 |
46,9 |
12,4 |
7 |
45,9 |
12,5 |
8 |
46,7 |
14,6 |
9 |
46,9 |
17,2 |
10 |
46,9 |
17,9 |
11 |
46,7 |
18,8 |
12 |
47 |
19 |
13 |
46,3 |
20,5 |
14 |
45,7 |
23,4 |
15 |
46,6 |
24,8 |
16 |
45,9 |
27,8 |
17 |
46,3 |
28 |
18 |
45,4 |
30,5 |
19 |
47,6 |
30,7 |
20 |
44,1 |
38 |
21 |
46,1 |
40,6 |
22 |
46,8 |
41,2 |
23 |
46,4 |
61,5 |
24 |
49,1 |
100,6 |
25 |
51,9 |
216,1 |
2) Исключим С центральных наблюдений, разобьем совокупность на две части: а) со значениями x ниже центральных; б) со значениями x выше центральных.
Исключение С средних наблюдений в этом упорядочении в целях построения двух независимых "частных" регрессий по данным n' = (n-с)/2 в начале выборки и по данным n' = (n - с)/2 в конце выборки
Пусть С = 5, это наблюдения с порядковыми номерами 11-15.
3) Оцениваются отдельные регрессии для первой подвыборки (10 первых наблюдений) и для третьей подвыборки (10 последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям X верно, то дисперсия регрессии по первой подвыборке (сумма квадратов отклонений ) будет существенно меньше дисперсии регрессии по третьей подвыборке (суммы квадратов отклонений ).
4) По каждой части находим уравнение регрессии (рисунки 5 и 6)
Рисунок 5 – Вывод итогов для подвыборок для фактора х2
Рисунок 6 – Вывод итогов для подвыборок для фактора х3
5) Для сравнения соответствующих дисперсий строится следующая F-статистика:
- для х2:
- для х3:
При сделанных предположениях относительно случайных отклонений построенная F-статистика имеет распределение Фишера с числами степеней свободы v1=v2=(n-C-2m)/2. Тогда,
6) Если , то гипотеза об отсутствии гетероскедастичности отклоняется ( - выбранный уровень значимости).
По проведенным расчетам в обоих случаях (и для х2, и для х3) мы получили, что следовательно в ряду остатков обнаружена гетероскедастичность.
Тест ранговой корреляции Спирмена
Значения хi и ui ранжируются (упорядочиваются по величинам). Затем определяется коэффициент ранговой корреляции:
где di - разность между рангами хi и ui, i = 1, 2, ..., n;
n - число наблюдений.
Рассчитаем теоретические значения для x2 по уравнению регрессии и найдем остатки. Ранжируем совокупность по возрастанию (рисунок 7).
№ п/п |
y |
x2 |
Теоритическое y |
Остатки |
Модуль остатков |
Ранг x |
Ранг u |
d2 |
1 |
45,4 |
5 |
45,768 |
-0,368 |
0,368 |
1 |
11 |
100 |
2 |
44,1 |
5,8 |
45,780 |
-1,680 |
1,680 |
2 |
22 |
400 |
3 |
45,6 |
6,8 |
45,795 |
-0,195 |
0,195 |
3 |
6 |
9 |
4 |
45,8 |
11,5 |
45,864 |
-0,064 |
0,064 |
4 |
2 |
4 |
5 |
46,7 |
17,3 |
45,949 |
0,751 |
0,751 |
5 |
17 |
144 |
6 |
46,3 |
20,9 |
46,002 |
0,298 |
0,298 |
6 |
9 |
9 |
7 |
45,7 |
20,9 |
46,002 |
-0,302 |
0,302 |
6 |
10 |
16 |
8 |
45,9 |
24,8 |
46,059 |
-0,159 |
0,159 |
7 |
4 |
9 |
9 |
46,3 |
28,8 |
46,118 |
0,182 |
0,182 |
8 |
5 |
9 |
10 |
46,3 |
31 |
46,150 |
0,150 |
0,150 |
9 |
3 |
36 |
11 |
47 |
41,4 |
46,303 |
0,697 |
0,697 |
10 |
16 |
36 |
12 |
46,9 |
42,8 |
46,324 |
0,576 |
0,576 |
11 |
15 |
16 |
13 |
45,4 |
43,9 |
46,340 |
-0,940 |
0,940 |
12 |
20 |
64 |
14 |
46,4 |
45,4 |
46,362 |
0,038 |
0,038 |
13 |
1 |
144 |
15 |
46,8 |
46,8 |
46,383 |
0,417 |
0,417 |
14 |
13 |
1 |
16 |
46,9 |
47,5 |
46,393 |
0,507 |
0,507 |
15 |
14 |
1 |
17 |
46,7 |
49,3 |
46,419 |
0,281 |
0,281 |
16 |
8 |
64 |
18 |
46,1 |
54 |
46,488 |
-0,388 |
0,388 |
17 |
12 |
25 |
19 |
45,7 |
66,6 |
46,673 |
-0,973 |
0,973 |
18 |
21 |
9 |
20 |
45,9 |
68 |
46,694 |
-0,794 |
0,794 |
19 |
19 |
0 |
21 |
46,9 |
68 |
46,694 |
0,206 |
0,206 |
19 |
7 |
144 |
22 |
46,6 |
72,4 |
46,759 |
-0,159 |
0,159 |
20 |
4 |
256 |
23 |
47,6 |
78,5 |
46,848 |
0,752 |
0,752 |
21 |
18 |
9 |
24 |
51,9 |
218,2 |
48,901 |
2,999 |
2,999 |
22 |
24 |
4 |
25 |
49,1 |
356,4 |
50,932 |
-1,832 |
1,832 |
23 |
23 |
0 |
Сумма: |
1509 |
Информация о работе Нарушения допущений классической модели линейной регрессии