Автор работы: Пользователь скрыл имя, 15 Мая 2011 в 15:26, курсовая работа
Цель курсовой работы - построение эконометрической модели высокого качества и проведение ее анализа.
В рамках поставленной цели двигаются следующие задачи:
Построение эконометрической модели по методу наименьших квадратов;
анализ качества модели;
проверка модели на соответствие предпосылкам МНК.
Также предположим, что n- объем выборки; n1- количество положительных отклонений; n2 – количество отрицательных отклонений;k- количество рядов.
По таблице критических значений для нахождения АК по методй рядов, определим нижние и верхние границы k.
Для построенной
модели:
n1 | 17 |
n2 | 15 |
n | 32 |
k | 16 |
Следовательно,
k1= 11; k2=23
Т.к. k1<
k < k2, то автокорреляция остатков данной
модели отсутствует.
С) графический метод.
Построим график зависимости e от e(-1)):
Найдем,
в каких четвертях
I | 14 |
III | 12 |
II | 3 |
IV | 0 |
Преобладание
точек в 1 и 3 четвертях указывает
на наличие положительной
8. Проверим построенную модель на гетероскедастичность остатков. Для этого проведем тест. Парка.
Сущность теста Парка в том, что если в модели присутствует гетероскедастичность, то вероятно существует линейная зависимость между объясняющими переменными и оценкой дисперсии отклонений.
Проведем
тест в два этапа, отдельно для
каждой переменной. Построим два уравнения,
предварительно прологарифмировав переменные
и остатки модели:
Exp
ВЫВОД ИТОГОВ | |||||
Регрессионная статистика | |||||
Множественный R | 0,3391 | ||||
R-квадрат | 0,115 | ||||
Нормированный R-квадрат | 0,0844 | ||||
Стандартная ошибка | 1,4034 | ||||
Наблюдения | 32 | ||||
Дисперсионный анализ | |||||
df | SS | MS | F | Значимость F | |
Регрессия | 1 | 7,4195 | 7,4195 | 3,767 | 0,0621 |
Остаток | 29 | 57,119 | 1,9696 | ||
Итого | 30 | 64,539 | |||
Коэффициенты | Стандартная ошибка | t-ст | P-зн | ||
Y-пересечение | -3,374 | 6,5061 | -0,519 | 0,608 | |
Ln(exp) | 1,6806 | 0,8659 | 1,9409 | 0,0621 |
Коэффициент b1 является недостаточно значимым как по значению t-статистики(<2, следовательно, присутствует слабая связь), так и при анализе P-значения (незначим на 6% уровне значимости, a<P).
Значит
между остатками и переменной Exp нет связи(или
очень слабая), т.е. оcтатки гомоскедастичны.
Rate
ВЫВОД ИТОГОВ | ||||
Регрессионная статистика | ||||
Множественный R | 0,1449955 | |||
R-квадрат | 0,0210237 | |||
Нормированный R-квадрат | -0,0127341 | |||
Стандартная ошибка | 1,4760379 | |||
Наблюдения | 32 | |||
Дисперсионный анализ | ||||
df | SS | MS | F | |
Регрессия | 1 | 1,3568437 | 1,3568437 | 0,6227803 |
Остаток | 29 | 63,181944 | 2,1786877 | |
Итого | 30 | 64,538788 | ||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | |
Y-пересечение | -0,6508347 | 12,541201 | -0,0518957 | 0,9589676 |
Ln(rate) | 2,1347977 | 2,7051373 | 0,7891643 | 0,4364208 |
Коэффициент b1 в данном случае также слабо взаимосвязан с GDP. Кроме того, коэффициент статистически не значим(a=0,6<P), а следовательно гетероскедастичность не выявлена.
Таким
образом, между остатками и переменными
нет взаимосвязи, а, следовательно, остатки
модели гомоскедастичны.
9. Проверим модель на отсутствие мультиколлинеарности.
Для этого
используем построенную ранее
10. Протестируем модель, используя тест Чоу, и таким образом проверим модель на наличие точки разрыва.
Для начала, предположим, что разрыв наблюдается на 16 наблюдении. Разделим выборку на две части и найдем для каждой из них и для выборки в целом значение RSS(см. Приложение 5):
Затем рассчитаем по формуле F наблюдаемое:
Fн = ((RSS0-RSS1-RSS2)/(RSS1+RSS2))
RSS0 | 646008 |
RSS1 | 120416 |
RSS2 | 134439 |
Fн | 9,97627 |
Fст | 8,6 |
Fн > Fст
, следовательно принимаем гипотезу о
наличии точки разрыва, следовательно
совокупность стоит разбивать.
11. Можно предположить, что данное уравнение не требует корректировки путем исключения переменной (т.к. обе являются значимыми). Однако, возможно исключение все же улучшит модель.
Проверим данное предположение с помощью F-статистики(при этом исключим Rate, как менее значимую).
С помощью
Excel построим новую модель (см. Приложение
6).
GDP= 21,3954
+ 1,30361*Export
Проведем анализ новой модели: значение t-статистики коэффициента b1 означает наличие очень сильной взаимосвязи(>>3); коэффициент детерминации высокий (переменная Exp более чем на 90% объясняет поведение GDP).
Таким образом, можно утверждать, что путем исключения переменной исходная модель была улучшена. Таким образом, с первого взгляда, 2-я модель кажется также достаточно качественной.
Проверим необходимость исключения Rate с помощью F-статистики. Для этого используем гипотезу, предполагающую, что объяснение поведения эндогенной переменной будет адекватнее у новой (короткой) регрессии.
Используя
известные значения коэффициентов
детерминации, рассчитаем F-статистику:
Fн =( ( R1^2-R2^2)/k)/(1-R^1)/(n-m-1)= 15,133
Fст = 62,3
Т.к. Fн<
Fст , то принимается нулевая гипотеза
о том, что RSS обеих моделей равны, а значит
исключение переменной является целесообразным.
Выводы
Цель работы (построение качественной эконометрической модели и проведение ее детального анализа) была достигнута во время написания данной работы.
Построенная модель оказалась качественной, но неадекватной, т.к. остатки модели автокоррелированы. Кроме того в ходе работы была найдена очка разрыва для модели (на 16 наблюдении). Корректировка модели путем исключения переменной оказалась необходимой, т.к. оптимальной по итогам оказалась вторая модель (зависимость GDP от Export).
При исследовании модели на предпосылки МНК, в частности на наличие автокорреляции использовались различные тесты и методы. Все методы подтвердили наличие автокорреляции, но оптимальным по трактовке результатов и использованию оказался графический метод.
Приложение
1)
ВЫВОД ИТОГОВ | ||||||||
Регрессионная статистика | ||||||||
Множественный R | 0,98323 | |||||||
R-квадрат | 0,96675 | |||||||
Нормированный R-квадрат | 0,96445 | |||||||
Стандартная ошибка | 149,252 | |||||||
Наблюдения | 32 | |||||||
Дисперсионный анализ | ||||||||
df | SS | MS | F | Значимость F | ||||
Регрессия | 2 | 1,9E+07 | 9390880 | 421,567 | 3,7E-22 | |||
Остаток | 29 | 646008 | 22276,2 | |||||
Итого | 31 | 1,9E+07 | ||||||
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | Нижние 95,0% | Верхние 95,0% | |
Y-пересечение | -1230,4 | 333,901 | -3,6848 | 0,00093 | -1913,3 | -547,46 | -1913,3 | -547,46 |
Exp | 1,09944 | 0,06934 | 15,8567 | 7,9E-16 | 0,95763 | 1,24125 | 0,95763 | 1,24125 |
Rate | 15,8573 | 4,07652 | 3,8899 | 0,00054 | 7,51985 | 24,1947 | 7,51985 | 24,1947 |
|
Информация о работе Построение и анализ качества регрессионной модели