Анализ регрессионной модели на наличие гетероскедастичности с помощью тестов Бреуша-Пагана и Парка

Автор работы: Пользователь скрыл имя, 21 Января 2011 в 11:14, курсовая работа

Описание

В данной работе будет построена регрессионная модель, которая основана на реальных статистических данных. Среди основных задач выделяются:

- построение графика показателей и их интепритация;

- запись математической формулы модели, оценка параметров с помощью МНК;

- интепритация статистической характеристики модели;

- исследование на гетероскедастичность остатков с помощью тестов Бреуша-Пагана и Парка;

- проверка остатков модели на автокорреляцию.

Содержание

Введение

Глава 1. Теоретическое обоснование модели и её анализа

1.1 Экономическое обоснование модели

1.2 Гетероскедастичность: теория

Глава 2. Построение регрессионной модели и её анализ на проблему гетероскедастичности

Заключение

Список использованных источников

Приложение 1

Работа состоит из  1 файл

моя курсовая.docx

— 95.26 Кб (Скачать документ)

МИНИСТЕРСТВО  ОБРАЗОВАНИЯ РЕСПУБЛИКИ БЕЛАРУСЬ 
 
 
 
 
 
 
 

Курсовая  работа

Анализ  регрессионной модели на наличие гетероскедастичности с помощью тестов Бреуша-Пагана и Парка 
 
 
 
 
 
 
 
 

Минск, 2010

 

     Содержание

Введение

Глава 1. Теоретическое обоснование модели и её анализа

1.1 Экономическое обоснование модели

1.2 Гетероскедастичность: теория

Глава 2. Построение регрессионной модели и её анализ на проблему гетероскедастичности

Заключение

Список использованных источников

Приложение 1

Приложение 2

Приложение 3

Приложение 4 
 

 

     Введение 

     В данной работе будет построена регрессионная модель, которая основана на реальных статистических данных. Среди основных задач выделяются:

     - построение графика показателей и их интепритация;

     - запись математической формулы модели, оценка параметров с помощью МНК;

     - интепритация статистической характеристики модели;

     - исследование на гетероскедастичность остатков с помощью тестов Бреуша-Пагана и Парка;

     - проверка остатков модели на  автокорреляцию.

     Статистические  данные использованных в работе показателей  были взяты из Системы Национальных Счетов Российской Федерации. Это поквартальные  данные с первого квартала 1999 года по 3-ой квартал 2009 года включительно.

     Целью данной работы является доказательство существования определённой зависимости  между экономическими показателями, а также более глубокое изучение проблемы гетероскедастичности в регрессионной модели.

 

     Глава 1. Теоретическое обоснование  модели и её анализа

     1.1 Экономическое обоснование  модели

 

     Для построения регрессионной модели были выбраны следующие экономические показатели:

     - Х1 – переменная определяется как разность экспорта и импорта страны, и в экономической среде получила название чистого экспорта (E).

     - Х2 - расходы на конечное потребление товаров и услуг (С) - показатель, который включает в себя расходы домашних хозяйств, расходов государственного управления, некоммерческих организаций, обслуживающих домашние хозяйства;

     - Х3 – валовое накопление (I) – включает в себя валовое накопление основного капитала (включая чистое приобретение ценностей) и изменение запасов материальных оборотных средств.

     -   Y – валовый внутренний  продукт (GDP) – ВВП.

     Согласно  методу конечного использования  ВВП определяется как сумма следующих  компонентов: 1) расходы на конечное потребление товаров и услуг; 2) валовое накопление; 3) сальдо экспорта и импорта товаров и услуг.

      GDP = C + I + E,

       где: GDP – валовой внутренний продукт; C – конечное потребление; I –  инвестиции (валовое накопление  основных фонов, прирост запасов  материальных оборотных средств,  чистое приобретение ценностей); E – чистый экспорт.

       Зависимость принимает следующий вид: 

     Y = Х1 + Х2 + Х3    (1)             

     В данной работе зависимость (1) будет использоваться  для построения модели с анализом на гетероскедастичность. 
 

     1.2 Гетероскедастичность: теория

     В этом разделе мы рассмотрим частный  случай обобщенной  регрессионной  модели, а именно, модель с гетероскедастичностью.

     Это означает, что ошибки некоррелированы, но имеют непостоянные дисперсии. (Классическая модель с постоянными дисперсиями ошибок называется гомоскедастичной.) Гетероскедастичность довольно часто возникает, если  анализируемые объекты, говоря нестрого, неоднородны. Например, если  исследуется зависимость прибыли предприятия от каких-либо  факторов, скажем, от размера основного фонда, то естественно  ожидать, что для больших предприятий колебание прибыли будет  выше, чем для малых.

     Часто обобщенный метод наименьших квадратов для системы с гетероскедастичностыо называют  методом взвешенных наименьших квадратов. Можно непосредственно проверить, что применение метода взвешенных наименьших квадратов приводит к уменьшению дисперсий оценок по сравнению с обычным методом наименьших квадратов.

     Коррекция на гетероскедастичность

     Если  числа σ2 неизвестны (что, как правило, и бывает на  практике), необходимо использовать доступный обобщенный метод  наименьших квадратов, который требует оценивания дисперсий σ2t .

     Так как число этих параметров равно  n, то без дополнительных ограничений на структуру матрицы Ώ пет надежды получить приемлемые оценки дисперсий. Ниже мы рассмотрим  несколько классов моделей с гетероскедастичностью, где такие ограничения накладываются и благодаря этому удается построить удовлетворительные оценки матрицы Ώ а следовательно, используя доступный обобщенный метод наименьших квадратов, и оценку βFGLS.

     1. Стандартное отклонение ошибки  пропорционально  независимой  переменной. В некоторых ситуациях априорно можно считать, что стандартное отклонение ошибки прямо  пропорционально одной из независимых переменных, например, Хк  : σt2 = σ2 x2tk.

     Тогда, разделив t-e уравнение на xtk, t= 1,... ,n, и вводя новые независимые переменные х*tj- = xtj/xtk и новую зависимую  переменную yt* = yt/xtk, t = 1,..., n, j = 1,..., к, получим классическую регрессионную модель. МНК-оценки коэффициентов этой модели дают непосредственно оценки исходной модели. Следует только помнить, что если первый регрессор в X есть набор единиц, то оценки свободного члена и коэффициента при х^ = 1/xtk в новой модели являются оценками соответственно коэффициента при xtk и свободного члена в исходной модели.

     Возникает естественный вопрос, при каких обстоятельствах  можно пользоваться описанным выше методом.  

     Если есть предположение о зависимости ошибок от одной из  независимых переменных, то целесообразно расположить наблюдения в порядке возрастания значений этой переменной, а затем  провести обычную регрессию и получить остатки. Если размах их колебаний тоже возрастает (это хорошо заметно при обычном  визуальном исследовании), то это говорит в пользу исходного предположения. Тогда надо сделать описанное выше преобразование, вновь провести регрессию и исследовать остатки. Если теперь их колебание имеет неупорядоченный характер, то это может служить показателем того, что коррекция на гетероскедастичность прошла успешно. Естественно, следует сравнивать и другие  параметры регрессии (значимость оценок, сумму квадратов отклонений и т. п.) и только тогда принимать окончательное решение, какая из моделей более приемлема.

     Тест  Бреуша-Пагана (Breusch-Pagan).

     Этот  тест  применяется в тех случаях, когда априорно предполагается, что  дисперсии σ2 зависят от некоторых дополнительных переменных:

     σ2t = γo + γzt'. t= 1,...,n,

     где Zt = (zt1,..., ztp) '— вектор (наблюдаемых) независимых  переменных, γo, γzt = (γ1…γр)' — неизвестные параметры. В  соответствии с тестом Бреуша-Пагана следует действовать так:

     1) провести обычную регрессию и получить вектор  остатков е = (e1,... ,еn)';

     2) построить оценку ^σ2 = (1/n) ;

     3) провести регрессию    = γo+ zt / γ  + υt   и найти для нее объясненную часть вариации RSS;

     4) построить статистику RSS/2. В работе (Breusch, Pagan,1979) установлено, что если верна гипотеза Но (отсутствие гетероскедастичности), то величина RSS/2 асимптотически имеет распределение χ2(р).

     При выявлении гетероскедастичности с помощью этого теста можно попытаться осуществить коррекцию с помощью метода взвешенных наименьших квадратов, выбирая в качестве весов величины ( o+ zt / )-1/2     где    ( o,      — оценки, полученные в п.З).

     При этом может оказаться, что ( o+ zt / )  < О для некоторых t. Если число таких наблюдений невелико, то их можно просто  выбросить. В противном случае можно попытаться использовать мультипликативную форму гетероскедастичности: t=l,...,n.

     σ2t = ?,        t=l,...,n.

     Процедура теста Бреуша-Пагана тогда выглядит совершенно  аналогично изложенной выше в п.З). Точно так же можно действовать для произвольной формы гетероскедастичности 

σ2t = (γ0+ztγ)

     Выводы:

     1) применение обобщенного метода  наименьших квадратов при наличии  гетероскедастичности сводится к минимизации суммы взвешенных квадратов отклонений;

     2) использование доступного обобщенного  метода наименьших квадратов  в общем случае требует оценивания  n параметров по n наблюдениям, что не позволяет получать  состоятельные оценки;

     3) в некоторых ситуациях (ошибка  пропорциональна одной из независимых  переменных, дисперсии ошибок принимают  два значения) можно применять  доступный обобщенный  метод наименьших  квадратов и получать состоятельные   оценки коэффициентов регрессии; 

     4) если в модели с гетероскедастичностью использовать  обычный метод наименьших квадратов, то для получения состоятельной оценки соответствующей матрицы ковариаций  можно применять оценки ошибок в форме Уайта или Ньюи- Веста.

     Тест  Парка

                                                                              

     Здесь предполагается, что дисперсии          связаны 

      с фактором пропорциональности Z в виде:

     

     Т.к. дисперсии         неизвестны, то их заменяют

     оценками  квадратов отклонений ei2. 
 

      1. Строится уравнение регрессии:

     и вычисляются остатки                                 .

     2. Выбирается фактор пропорциональности  Z и

      оценивают вспомогательное уравнение  регрессии:

     

     3. Проверяют значимость коэффициента  при

                                                                             

 
 
 
 
 
 
 

     Глава 2. Построение регрессионной  модели и ее анализ на проблему гетероскедастичности 

     Поскольку в данной работе при построении уравнения регрессии будут использоваться временные ряды, то перед построением модели следует проверить ряды на стационарность.

     Как видно из Рис.1 Приложения 1 все ряды исследуемых показателей не имеют постоянного математического ожидания, но имеют восходящий линейный тренд, из чего возможно сделать предварительный вывод о том, что ряды будут стационарными относительного тренда.

      ВВП имеет дело с волнообразностью деловой  активности и ряды IG и GDP имеют чётко видную сезонность, что видно на Рисунке 1 Приложения.

Информация о работе Анализ регрессионной модели на наличие гетероскедастичности с помощью тестов Бреуша-Пагана и Парка