Коэффициенты корреляции

Автор работы: Пользователь скрыл имя, 08 Января 2012 в 20:34, курсовая работа

Описание

Цель данной работы заключается в том, что бы рассмотреть степень связи различных факторов с рассматриваемым явлением и выявить факторы, оказывающие достаточное влияние на него.
Для достижения поставленной цели необходимо решить следующие задачи:
– рассмотреть частные коэффициенты корреляции, их сущность и свойства;
– определить методы вычисления частных коэффициентов;
– рассмотреть множественные коэффициенты корреляции, их сущность и свойства;
– определить методы вычисления множественных коэффициентов;
– привести пример отбора факторов с использованием частных и множественных коэффициентов.

Содержание

Введение……………………………………………………………………….2
Глава 1. Исследование линейной зависимости у от нескольких объясняющих, переменных (x(1), x(2),…, x(p)): множественный и частные коэффициенты корреляции.
1.1. Частные коэффициенты корреляции и их выборочные значения .......4
1.2. Процедура присоединения – удаления………………………………….8
1.3. Множественный коэффициент корреляции ............................................9
Глава 2. Пример использования частных и множественных коэффициентов в отборе факторов эконометрической модели
2.1. Задача №1…………………………………………….….………………15
2.2. Задача №2………………………………………………………………..18
Заключение…………………………………………………………………...20
Приложение А………………………………………………………………..21
Приложение Б………………………………………………………………..22
Приложение В………………………………………………………………..23
Приложение Г………………………………………………………………..24
Библиографический список…………………………………………………25

Работа состоит из  1 файл

Kursovaya.doc

— 1.78 Мб (Скачать документ)

     б) минимальное значение коэффициента детерминации (Kd(y;X) = 0) соответствует случаю полного отсутствия корреляционной связи между у и (x(1),…, x(p)), так как это может быть только при , т.е. при независимости значений функции регрессии f от величины ее аргументов X(f(X) = const); это соответствует ситуации, когда усредненная дисперсия «регрессионных остатков» в точности равна общей вариации результирующего показателя;

     в) максимальное значение коэффициента детерминации (Kd(y; X) = 1) соответствует полному отсутствию варьирования «регрессионных остатков» (Еε2 = 0), что означает наличие чисто функциональной связи между у и (x(1),…, x(p)): у =f(x(1),…, x(p)). Следовательно, в этом случае мы имеем возможность точно (детерминированно) восстанавливать условные значения у(Х) = {у | X} по значениям предикторных переменных X, и соответственно общая вариация результирующего показателя у полностью объясняется контролируемой вариацией функции регрессии.

     Сейчас  мы увидим, что свойства многомерных  нормальных совокупностей позволяют вычислять значение Kd(y; X) до проведения регрессионного анализа.

     Множественный коэффициент корреляции Ry.X используется в качестве измерителя статической связи между результирующим показателем у и набором объясняющих переменных x(1), x(2),…, x(p) в моделях линейной регрессии. Он определяется как обычный парный коэффициент корреляции между у и линейной функцией регрессии у по X, т.е.

                                           

, (3)

     где

     

     Ry.X – это парный коэффициент корреляции между у и такой линейной комбинацией x(1), x(2),…, x(p), для которой значение этого парного коэффициента корреляции достигает своего максимума.

     Можно показать, что при статистической обработке выборок, извлеченных  из нормальных генеральных совокупностей, множественный коэффициент корреляции Ry.X и его выборочное значение обладают рядом удобных свойств (приведенные ниже формулы и свойства теоретического множественного коэффициента корреляции Ry.X автоматически переносятся на выборочный заменой участвующих в них теоретических характеристик соответствующими выборочными значениями).

     1. Вычисление Ry.X по матрице парных коэффициентов корреляции. Обозначая, как и прежде, (р + 1)(р + 1)-корреляционную матрицу (rij)ij=o,1,...,p через R, а алгебраическое дополнение элемента rkl в ее определителе через |R|kl, имеем

                                                       

. (4)

     2. Вычисление Ry.X по частным коэффициентам корреляции

                           

. (5)

     3. Множественный коэффициент корреляции мажорирует любой парный или частный коэффициент корреляции, характеризующий статистическую связь результирующего показателя, т. е.

     

,

     где j = 1,2,...,р, a Ij – любое подмножество множества индексов I0 = {1,2,..., р], не содержащее индекса j (это соотношение следует из (5)). Напоминаем, что x0 ≡ у.

     4. Присоединение каждой новой предсказывающей переменной не может уменьшить величины R (независимо от порядка присоединения), т. е.

     

. (6)

     5. Условная дисперсия результирующего  показателя D(у | X) не зависит от условия (т.е. от значения X) и связана со значением множественного коэффициента корреляции Ry.X соотношением

                                         

. (7)

     Последний результат позволяет связать между собой две характеристики степени тесноты статистической связи – коэффициент детерминации Kd (у; Х) и множественный коэффициент корреляции Ry.X. Действительно, учитывая тот факт, что D(y | X) = D(ε | X), а значит, и условная дисперсия остатков не зависит от X, получаем, что безусловная дисперсия Dε (как результат усреднения по X значений условных дисперсий D(ε | X)) равна D(ε | X). Но тогда мы можем подставить в (7) Dε вместо D(y | X) и получим

                                             

, (7')

     откуда,

                                                         

. (8)

     Это означает, что в рамках статистического анализа многомерной нормальной совокупности понятие коэффициента детерминации Kd(y; X) совпадает с квадратом определенного в (3) множественного коэффициента корреляции и что коэффициент детерминации Kd(y; X) может быть вычислен в данном случае до проведения регрессионного анализа (т. е. до оценки функции регрессии f(X)) с помощью формул (4), (5).

     Для проверки гипотезы H0: Ry.X = 0, т.е. для выяснения вопроса, можно ли считать выборочное значение множественного коэффициента корреляции статистически значимо отличающимся от нуля, пользуются фактом F(p,n – p– 1)-распределенности случайной величины

     

,

справедливым  в рамках рассматриваемой многомерной  нормальной совокупности при условии, что истинное значение множественного коэффициента корреляции равно нулю. Если окажется, что , то гипотеза об отсутствии множественной корреляционной связи между у и (x(1), x(2),…, x(p)) отвергается при уровне значимости критерия, равном α.

     Знание  следующих статистических свойств  оценок , определяемых по формулам (4), (5) с заменой участвующих в них парных и частных коэффициентов корреляции их выборочными аналогами, может оказаться полезным при проведении корреляционного и регрессионного анализов:

     –                             , (9)

     что означает наличие положительного смещения (асимптотически устранимого) у оценки коэффициента детерминации ;

     –                        (10)

(дисперсия  D характеризует точность оценивания коэффициента детерминации с помощью и будет использована в регрессионном анализе при определении числа объясняющих переменных, которые следует включить в линейную регрессионную модель);

     – подправленная на несмещенность оценка коэффициента детерминации имеет вид

                                          

. (11)

       Из последней формулы видно,  что «подправленная» оценка  всегда меньше смещенной оценки .

     Отметим, что при малых истинных значениях  и при «не слишком малых» величинах отношения р/п подправленные оценки, подсчитанные по формуле (11), могут принимать отрицательные значения. Можно устранить абсурдность отрицательных значений оценки, используя в качестве «еще раз подправленной» оценки величину

     

(правда, уже не будет несмещенной оценкой).

 

      Глава 2. Пример использования частных и множественных коэффициентов в отборе факторов эконометрической модели

     2.1. Задача №1

     По  данным изучаемых регионов (см. приложение А) изучить зависимость общего коэффициента рождаемости (y) от уровня бедности, % (x1) и среднедушевого дохода, тыс. руб. (x2).

     Для дальнейших расчетов составлена вспомогательная  таблица используемых величин (см. приложение Б).

     Парные  коэффициенты корреляции, необходимые для вычисления частных и множественных коэффициентов, найдем по формуле:

     

.

     Получаем:

      ;

      ;

      .

     Теперь  мы можем вычислить частные коэффициенты по формуле:

     

.

     Получаем:

      ;

      .

     Вывод: общий коэффициент рождаемости обратно пропорционален уровню бедности и прямо пропорционален среднедушевому доходу. Частные коэффициенты корреляции не очень высоки, поэтому зависимость между рассматриваемыми величинами достаточно слабая.

     Проверим  гипотезу Н0 для парных коэффициентов по формуле:

     

, если  tкр=2,405

для : – коэффициент незначимый, так как |tнабл|<tкр;

для : – коэффициент значимый, определим для него уравнение y = α0 + α1x2 + ε:

;

.

     Тогда уравнение имеет вид: y = 6,05 + 0,27x2, где α1 показывает, на сколько единиц изменится y, если x2 изменится на 1, а α0 равно оценке уровня процесса yt в момент t. График приведен в приложении В.

     Проверим  гипотезу Н0 для частных коэффициентов.

для : ;

для : .

     В обоих случаях |tнабл|<tкр, значит эти коэффициенты не значимы.

     Вычислим множественный коэффициент корреляции по формуле:

     

,

где

  ;

.

     Получаем:

      .

     Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком. По итогам вычислений можно сказать, что на общий коэффициент рождаемости влияют такие факторы как уровень бедности и среднедушевой доход, но не очень сильно.

 

      2.2. Задача №2

     По  данным таблицы в приложении Г изучить зависимость чистого дохода государства, млн дол. (y) от оборота капитала, млн дол. (x1) и используемого капитала, млн дол. (x2). Для дальнейших расчетов в таблицу добавлены вспомогательные данные.

     Парные  коэффициенты корреляции, необходимые  для вычисления частных и множественных коэффициентов, можно найти по формуле:

     

.

     Получаем:

     

      ;

      ;

      .

     Теперь  мы можем вычислить частные коэффициенты по формуле:

     

. 

     Получаем:

     

      ;

      .

     Чистый  доход государства обратно пропорционален обороту капитала и прямо пропорционален используемому капиталу. Причем зависимость  чистого дохода от используемого  капитала сильнее, чем от оборота капитала.

     Вычислим  множественный коэффициент корреляции по формуле:

Информация о работе Коэффициенты корреляции