Построение и анализ качества регрессионной модели

Автор работы: Пользователь скрыл имя, 15 Мая 2011 в 15:26, курсовая работа

Описание

Цель курсовой работы - построение эконометрической модели высокого качества и проведение ее анализа.

В рамках поставленной цели двигаются следующие задачи:

Построение эконометрической модели по методу наименьших квадратов;
анализ качества модели;
проверка модели на соответствие предпосылкам МНК.

Работа состоит из  1 файл

Реферат.Эстония.doc

— 455.00 Кб (Скачать документ)

    Также предположим, что  n- объем выборки; n1- количество положительных отклонений; n2 – количество отрицательных отклонений;k- количество рядов.

По таблице  критических значений для нахождения АК по методй рядов, определим нижние и верхние границы k.

Для построенной  модели:  

n1 17
n2 15
n 32
   
k 16
 

Следовательно, k1= 11; k2=23 

Т.к. k1< k < k2, то автокорреляция остатков данной модели отсутствует. 

С) графический  метод.

Построим  график зависимости e от e(-1)):

 

Найдем, в каких четвертях сосредоточены  точки на графике: 

I 14
III 12
   
II 3
IV 0
 
 

Преобладание  точек в 1 и 3 четвертях указывает  на наличие положительной зависимости  между отклонениями в текущий и предыдущий моменты времени (т.е. положительной автокорреляции, как и по результатам статистики Дарбина-Уотсона). 

8. Проверим построенную модель на гетероскедастичность остатков. Для этого проведем тест. Парка.

Сущность  теста Парка в том, что если в модели присутствует гетероскедастичность, то вероятно существует линейная зависимость между объясняющими переменными и оценкой дисперсии отклонений.

Проведем  тест в два этапа, отдельно для  каждой переменной. Построим два уравнения, предварительно прологарифмировав переменные и остатки модели: 

Exp 

ВЫВОД ИТОГОВ      
           
Регрессионная статистика        
Множественный R 0,3391        
R-квадрат 0,115        
Нормированный R-квадрат 0,0844        
Стандартная ошибка 1,4034        
Наблюдения 32        
           
Дисперсионный анализ      
  df SS MS F Значимость F
Регрессия 1 7,4195 7,4195 3,767 0,0621
Остаток 29 57,119 1,9696    
Итого 30 64,539      
           
  Коэффициенты Стандартная ошибка t-ст P-зн  
Y-пересечение -3,374 6,5061 -0,519 0,608  
Ln(exp) 1,6806 0,8659 1,9409 0,0621  
 

Коэффициент b1 является недостаточно значимым как по значению t-статистики(<2, следовательно, присутствует слабая связь), так и при анализе P-значения (незначим на 6% уровне значимости, a<P).

Значит между остатками и переменной Exp нет связи(или очень слабая), т.е. оcтатки гомоскедастичны. 
 

Rate

ВЫВОД ИТОГОВ      
         
Регрессионная статистика      
Множественный R 0,1449955      
R-квадрат 0,0210237      
Нормированный R-квадрат -0,0127341      
Стандартная ошибка 1,4760379      
Наблюдения 32      
         
Дисперсионный анализ      
  df SS MS F
Регрессия 1 1,3568437 1,3568437 0,6227803
Остаток 29 63,181944 2,1786877  
Итого 30 64,538788    
         
  Коэффициенты Стандартная ошибка t-статистика P-Значение
Y-пересечение -0,6508347 12,541201 -0,0518957 0,9589676
Ln(rate) 2,1347977 2,7051373 0,7891643 0,4364208
 
 

Коэффициент b1 в данном случае также слабо взаимосвязан с GDP. Кроме того, коэффициент статистически не значим(a=0,6<P), а следовательно гетероскедастичность не выявлена.

Таким образом, между остатками и переменными нет взаимосвязи, а, следовательно, остатки модели гомоскедастичны. 

9. Проверим  модель на отсутствие мультиколлинеарности.

Для этого  используем построенную ранее корреляционную матрицу. Частный коэффициент корреляции между объясняющими переменными высокий(>0,7),а значит в модели присутствует мультиколлинеарность. 

10. Протестируем модель, используя тест Чоу, и таким образом проверим модель на наличие точки разрыва.

 

Для начала, предположим, что разрыв наблюдается на 16 наблюдении. Разделим выборку на две части и найдем для каждой из них и для выборки в целом значение RSS(см. Приложение 5):

Затем рассчитаем по формуле F наблюдаемое:

Fн = ((RSS0-RSS1-RSS2)/(RSS1+RSS2))*((n-2(m+1))/(m+1))

RSS0 646008
RSS1 120416
RSS2 134439
   
9,97627
Fст 8,6

Fн > Fст , следовательно принимаем гипотезу о наличии точки разрыва, следовательно совокупность стоит разбивать. 

11. Можно предположить, что данное уравнение не требует корректировки путем исключения переменной (т.к. обе являются значимыми). Однако, возможно исключение все же улучшит модель.

Проверим  данное предположение с помощью  F-статистики(при этом исключим Rate, как менее значимую).

С помощью Excel построим новую модель (см. Приложение 6). 

GDP= 21,3954 + 1,30361*Export 

Проведем  анализ новой модели: значение t-статистики коэффициента b1 означает наличие очень сильной взаимосвязи(>>3); коэффициент детерминации высокий (переменная Exp более чем на 90% объясняет поведение GDP).

Таким образом, можно утверждать, что путем  исключения переменной исходная модель была улучшена. Таким образом, с первого взгляда, 2-я модель кажется также достаточно качественной.

Проверим  необходимость исключения Rate с помощью F-статистики. Для этого используем гипотезу, предполагающую, что объяснение поведения эндогенной переменной будет адекватнее у новой (короткой) регрессии.

Используя известные значения коэффициентов  детерминации, рассчитаем F-статистику: 

Fн =( ( R1^2-R2^2)/k)/(1-R^1)/(n-m-1)= 15,133

Fст = 62,3 

Т.к. Fн< Fст , то принимается нулевая гипотеза о том, что RSS обеих моделей равны, а значит исключение переменной является целесообразным. 
 

Выводы

Цель  работы (построение качественной эконометрической модели и проведение ее детального анализа) была достигнута во время написания данной работы.

Построенная модель оказалась качественной, но неадекватной, т.к. остатки модели автокоррелированы. Кроме того в ходе работы была найдена очка разрыва для модели (на 16 наблюдении). Корректировка модели путем исключения переменной оказалась необходимой, т.к. оптимальной по итогам оказалась вторая модель (зависимость GDP от Export).

При исследовании модели на предпосылки МНК, в частности на наличие автокорреляции использовались различные тесты и методы. Все  методы подтвердили наличие автокорреляции, но оптимальным по трактовке результатов и использованию оказался графический метод.

   Список  использованных источников

    1. - С.А Бородич. Эконометрика: Учеб. Пособие
    2. – экономические данные по Эстонии(2000-2007 гг)
 

Приложение 

1) 

ВЫВОД ИТОГОВ              
                 
Регрессионная статистика              
Множественный R 0,98323              
R-квадрат 0,96675              
Нормированный R-квадрат 0,96445              
Стандартная ошибка 149,252              
Наблюдения 32              
                 
Дисперсионный анализ            
  df SS MS F Значимость F      
Регрессия 2 1,9E+07 9390880 421,567 3,7E-22      
Остаток 29 646008 22276,2          
Итого 31 1,9E+07            
                 
  Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95% Верхние 95% Нижние 95,0% Верхние 95,0%
Y-пересечение -1230,4 333,901 -3,6848 0,00093 -1913,3 -547,46 -1913,3 -547,46
Exp 1,09944 0,06934 15,8567 7,9E-16 0,95763 1,24125 0,95763 1,24125
Rate 15,8573 4,07652 3,8899 0,00054 7,51985 24,1947 7,51985 24,1947
 
 
    1. DW- статистика
 
e e(-1) e^2 (e-e(-1))^2
18,12 53,645 328,35 1262,01
101,52 18,12 10306 6955,37
107,12 101,52 11474 31,3365
206,21 107,12 42524 9820,06
30,205 206,21 912,32 30979,1
-106,4 30,205 11330 18672,3
-117,5 -106,4 13813 122,941
-205,7 -117,5 42305 7770,62
-170,2 -205,7 28974 1257,71
-95,59 -170,2 9137,1 5569,45
-124,6 -95,59 15519 840,228
-159,5 -124,6 25424 1216,27
-61,83 -159,5 3822,8 9529,88
-23,53 -61,83 553,61 1466,9
35,19 -23,53 1238,4 3447,96
-23,9 35,19 571,09 3491,39
73,019 -23,9 5331,7 9392,74
212,27 73,019 45057 19389,8
102,26 212,27 10457 12101,8
138,55 102,26 19197 1317,34
84,58 138,55 7153,7 2913,11
175,98 84,58 30969 8354,3
166,1 175,98 27588 97,6934
131,71 166,1 17347 1182,62
177,73 131,71 31589 2118,32
156,1 177,73 24367 468,037
-89,84 156,1 8071,8 60487,6
-172,6 -89,84 29791 6848,76
-58,67 -172,6 3442,5 12979,5
-219,1 -58,67 47984 25721,4
-341,4 -219,1 116552 14968,3
-53,65 341,4 643131 280775

Информация о работе Построение и анализ качества регрессионной модели