Регрессия и корреляция

Автор работы: Пользователь скрыл имя, 05 Марта 2013 в 15:14, задача

Описание

Построение линейной регрессии сводится к оценке ее параметров — а и b. Оценки параметров линейной регрессии могут быть найдены разными методами. Можно обратиться к полю корреляции и, выбрав на графике две точки, провести через них прямую линию (Рис. 2.2). Далее по графику можно определить значения параметров. Параметр а определим как точку пересечения линии регрессии с осью у, а параметр b . оценим, исходя из угла наклона линии регрессии, как dy/dx, где dy — приращение результата у, a dx — приращение фактора х:, т. е.

Содержание

Введение…………………………………………………………………………...3
1. Линейная регрессия и корреляция: смысл и оценка параметров……………4
2. Множественная корреляция……………………………………………….....10
Заключение……………………………………………………………………….12
Список литературы……………………………………………………………....13
Практическая часть………………………………………

Работа состоит из  1 файл

Эконометрика.docx

— 69.47 Кб (Скачать документ)

 

План

 

Введение…………………………………………………………………………...3

1. Линейная регрессия и корреляция: смысл и оценка параметров……………4

2. Множественная корреляция……………………………………………….....10

Заключение……………………………………………………………………….12

Список литературы……………………………………………………………....13

Практическая  часть……………………………………………………………...14

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Введение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  1. Линейная регрессия и корреляция: смысл и оценка параметров

 

Линейная  регрессия находит широкое применение в эконометрике в виде четкой экономической  интерпретации ее параметров. Линейная регрессия сводится к нахождению уравнения вида:

                                    (2.15)

или

                                (2.16)

Уравнение   вида     позволяет   по   заданным   значениям   фактора   х   получить теоретические значения результативного признака, подставляя в него фактические значения фактора х.

На графике  теоретические значения представляют линию регрессии (рис. 2.2).

                             y

                                                                                                                      х          

Рис. 2.2. Графическая оценка параметров линейной регрессии

 

Построение  линейной регрессии сводится к оценке ее параметров — а  и b. Оценки параметров линейной регрессии могут быть найдены разными методами. Можно обратиться к полю корреляции и, выбрав на графике две точки, провести через них прямую линию (Рис. 2.2). Далее по графику можно определить значения параметров. Параметр а определим как точку пересечения линии регрессии с осью у, а параметр b . оценим, исходя из угла наклона линии регрессии, как dy/dx, где dy — приращение результата у, a dx — приращение фактора х:, т. е.

 

Классический  подход к оцениванию параметров линейной регрессии основан на методе наименьших квадратов (МНК).

МНК позволяет получить такие оценки параметров a и b, при которых сумма квадратов отклонений фактических значений результативного признака (у) от расчетных (теоретических) уг минимальна:

 

(2.17)

Иными словами, из всего множества линий линия  регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и  этой линией была бы минимальной (рис. 2.3):

Если то следовательно    .

Рис. 2.3. Линия регрессии с минимальной  дисперсией остатков

 

Чтобы найти  минимум функции (2.1), надо вычислить  частные производные по каждому  из параметров а и b и приравнять их к нулю. Обозначим через S, тогда:

 

             (2.18)

 

 

                                                                                          (2.19)

Преобразуя  формулу (2.2), получим следующую систему  нормальных уравнений для оценки параметров а и b:

                  (2.20)

 

Решая систему  нормальных уравнений (2.3) либо методом  последовательного исключения переменных, либо методом определителей, найдем искомые оценки параметров а и b. Можно воспользоваться следующими готовыми формулами:

 

                      (2.21)

Формула (2.21) получена из первого уравнения  системы (2.20), если все его члены  разделить на п

,

,       (2.22)

где cov (х, у) — ковариация признаков;

-  дисперсия признака х.

Ввиду того, что  , а  получим следующую формулу расчета оценки параметра b:

    (2.23)

 

Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Так, если в функции издержек

 

ух =3000 + 2- х   (2.24)

 

(у — издержки (тыс. руб.), х — количество единиц продукции), то, следовательно, с увеличением объема продукции (х) на 1 ед. издержки производства возрастают

в среднем  на 2 тыс. руб., т. е. дополнительный прирост  продукции на 1 ед. потребует увеличения затрат в среднем на 2 тыс. руб.

Возможность четкой экономической интерпретации  коэффициента регрессии сделала  линейное уравнение регрессии достаточно распространенным в эконометрических исследованиях.

Формально а — значение у при х = 0. Если признак-фактор л: не имеет и не может иметь нулевого значения, то вышеуказанная трактовка свободного члена а не имеет смысла. Параметр а может не иметь экономического содержания. Попытки экономически интерпретировать параметр а могут привести к абсурду, особенно при а < 0.,

Предположим по группе предприятий, выпускающих  один и тот же вид продукции, рассматривается  функция издержек y = a + b-x + s. Информация, необходимая для расчета оценок параметров а и Ь, представлена в табл. 2.1.

Таблица 2.1

Расчетная таблица

предприятия

Выпуск продукции, тыс.ед.(х)

Затраты на производство, млн руб. (у)

ух

х2

y2

Yx

1

1

30

30

1

900

31,1

2

2

70

140

4

4900

67,9

3

4

150

600

16

22500

141,6

4

3

100

300

9

10000

104,7

5

5

170

850

25

28900

178,4

6

3

100

300

9

10000

104,7

7

4

150

600

16

22500

141,6

Итого

22

770

2820

80

99700

770,0


 

Система нормальных уравнений будет иметь  вид:

I 7а + 22b = 710

22а + 80b = 2820

Решая ее, получим: а = - 5,79;  b= 36,84.

Запишем уравнение регрессии:

ух = -5,79 + 36,84 x

Подставив в уравнение значения х, найдем теоретические значения у, (см. последнюю графу табл. 2.1)

В данном случае величина параметра а не имеет экономического смысла. В рассматриваемом примере имеем:

 

; sх =1,25;

. sy =46,29;

Оценку  коэффициента регрессии можно получить проще, не обращаясь к методу наименьших квадратов. Альтернативную оценку параметра b можно найти исходя из содержания данного коэффициента: изменение результата 

сопоставляют  с изменением фактора 

В нашем  примере альтернативная оценка параметра b составит:

 

Эта величина является приближенной, ибо большая  часть информации, имеющейся в  данных, не используется при ее расчете. Она основана только на мини-максных значениях переменных.

Парная линейная регрессия используется в эконометрике нередко при изучении функции потребления:

C=Ky+L         (2.25),

где С   — потребление;

у -доход;

К и L - параметры функции.

Данное  уравнение линейной регрессии используется обычно в увязке с балансовым равенством:

у = С+1-г,  (2.26)

где I - размер инвестиций;

г — сбережения.

Для простоты предположим, что доход расходуется  на потребление и инвестиции. Таким  образом, рассматривается система  уравнений

 C=Ky+L

у=С+1                      (2.27)

Наличие в данной системе балансового  равенства накладывает ограничение  на величину коэффициента регрессии, которая  не может быть больше единицы, т. е. К£ 1. Предположим, что функция потребления составила:

C = 1,9 + 0,65у

Коэффициент регрессии характеризует склонность к потреблению. Он показывает, что  из каждой тысячи дохода на потребление  расходуется в среднем  650 руб., а  350 руб. инвестируются.

Если  рассчитать регрессию размера инвестиций от дохода, т. е.

I=а + bу,

то уравнение  регрессии составит:

I =1,9 + 0,35у.

Это уравнение  можно и не определять, ибо оно  выводится из функции потребления. Коэффициенты регрессии этих двух уравнений  связаны равенством: 0,65 +0,35 =1.

Если  коэффициент регрессии оказывается  больше 1, то у <(С+1), т. е. на потребление расходуются не только доходы, но и сбережения.

Коэффициент регрессии в функции потребления  используется для расчета мультипликатора:

 

        (2.28)

где т — мультипликатор;

b - коэффициент регрессии в функции потребления.

В нашем  примере 

т = 1/(1— 0,65)=2,86.

Это означает, что дополнительные вложения в размере 1 тыс. руб. на длительный срок приведут при прочих равных условиях к дополнительному  доходу в 2,86 тыс. руб.

Уравнение регрессии всегда дополняется показателем  тесноты связи. При использовании  линейной регрессии в качестве такого показателя выступает линейный коэффициент  корреляции гп,. Существуют разные модификации формулы линейного коэффициента

корреляции. Некоторые из них приведены ниже:

   (2.29)

 

Как известно, линейный коэффициент корреляции находится  в границах: –1 < rxv < 1.

Если  коэффициент регрессии b > 0, то 0 ≤ rxv ≤ 1, и, наоборот, при b < 0, –1 ≤ rrv ≤ 0. По данным табл. 2.1 величина линейного коэффициента корреляции составила 0,991, что достаточно близко к 1 и означает наличие очень тесной зависимости затрат на производство от величины объема выпущенной продукции.

Следует иметь в виду, что величина линейного  коэффициента корреляции оценивает  тесноту связи рассматриваемых  признаков в ее линейной форме. Поэтому  близость абсолютной величины линейного  коэффициента корреляции к нулю еще  не означает отсутствие связи между  признаками. При иной спецификации модели связь между признаками может  оказаться достаточно тесной. Для  оценки качества подбора линейной функции  рассчитывается квадрат линейного  коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака:

 

.            (2.30)

 

Соответственно  величина 1 – r2 характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.

В нашем  примере r2 = 0,982. Следовательно, уравнением регрессии объясняется 98,2% дисперсии результативного признака, а на долю прочих факторов приходится лишь 1,8% ее дисперсии (т.е. остаточная дисперсия). Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов, и, следовательно, линейная модель хорошо аппроксимирует исходные данные и ею можно воспользоваться для прогноза значений результативного признака. Так, полагая, что объем продукции предприятия может составить 5 тыс. ед., прогнозное значение для издержек производства окажется 178,4 тыс. руб.

Информация о работе Регрессия и корреляция