Коэффициенты корреляции

Автор работы: Пользователь скрыл имя, 08 Января 2012 в 20:34, курсовая работа

Описание

Цель данной работы заключается в том, что бы рассмотреть степень связи различных факторов с рассматриваемым явлением и выявить факторы, оказывающие достаточное влияние на него.
Для достижения поставленной цели необходимо решить следующие задачи:
– рассмотреть частные коэффициенты корреляции, их сущность и свойства;
– определить методы вычисления частных коэффициентов;
– рассмотреть множественные коэффициенты корреляции, их сущность и свойства;
– определить методы вычисления множественных коэффициентов;
– привести пример отбора факторов с использованием частных и множественных коэффициентов.

Содержание

Введение……………………………………………………………………….2
Глава 1. Исследование линейной зависимости у от нескольких объясняющих, переменных (x(1), x(2),…, x(p)): множественный и частные коэффициенты корреляции.
1.1. Частные коэффициенты корреляции и их выборочные значения .......4
1.2. Процедура присоединения – удаления………………………………….8
1.3. Множественный коэффициент корреляции ............................................9
Глава 2. Пример использования частных и множественных коэффициентов в отборе факторов эконометрической модели
2.1. Задача №1…………………………………………….….………………15
2.2. Задача №2………………………………………………………………..18
Заключение…………………………………………………………………...20
Приложение А………………………………………………………………..21
Приложение Б………………………………………………………………..22
Приложение В………………………………………………………………..23
Приложение Г………………………………………………………………..24
Библиографический список…………………………………………………25

Работа состоит из  1 файл

Kursovaya.doc

— 1.78 Мб (Скачать документ)

     Содержание

     Введение……………………………………………………………………….2

     Глава 1. Исследование линейной зависимости  у от нескольких объясняющих, переменных (x(1), x(2),…, x(p)): множественный и частные коэффициенты корреляции.

     1.1.  Частные коэффициенты корреляции и их выборочные значения .......4

     1.2. Процедура присоединения – удаления………………………………….8

     1.3. Множественный коэффициент корреляции ............................................9

     Глава 2. Пример использования частных  и множественных коэффициентов  в отборе факторов эконометрической модели

     2.1. Задача №1…………………………………………….….………………15

     2.2. Задача №2………………………………………………………………..18

     Заключение…………………………………………………………………...20

     Приложение А………………………………………………………………..21

     Приложение  Б………………………………………………………………..22

     Приложение В………………………………………………………………..23

     Приложение  Г………………………………………………………………..24

     Библиографический список…………………………………………………25

 

      Введение

     Под эконометрикой понимается раздел науки, изучающий конкретные количественные и качественные взаимосвязи экономических  объектов и процессов с помощью математических и статистических методов и моделей.

     Можно сказать, что главной задачей  эконометрики является количественная оценка имеющихся взаимосвязей между  экономическими явлениями и процессами.

     Важной  составляющей этого процесса является отбор факторов, существенно влияющих на изучаемый показатель и подлежащих включению в разрабатываемую модель. Оптимальный набор факторов определяется на основе качественного и количественного анализа.

     Формальная  проверка существенности вклада фактора  в модель выполняется с помощью оценки значимости соответствующего частного коэффициента корреляции – они характеризуют тесноту связи между результативным признаком и соответствующим факторным признаком при устранении влияния других факторов, включенных в модель, либо значимости коэффициента в уравнении регрессии.

     Показатель  множественной корреляции характеризует  тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного  влияния факторов на результат.

     В данной работе будем рассматривать использование в отборе факторов эконометрической модели  множественных и частных коэффициентов корреляции.

     Проблема рассматриваемой темы заключается в том, что на практике часто необходимо измерить степень тесноты связи между каким-либо явлением и влияющими на него событиями. Для этого целесообразно применять частные и множественные коэффициенты корреляции.

     Цель данной работы заключается в том, что бы рассмотреть степень связи различных факторов с рассматриваемым явлением и выявить факторы, оказывающие достаточное влияние на него.

     Для достижения поставленной цели необходимо решить следующие задачи:

     – рассмотреть частные коэффициенты корреляции, их сущность и свойства;

     – определить методы вычисления частных  коэффициентов;

     – рассмотреть множественные коэффициенты корреляции, их сущность и свойства;

     – определить методы вычисления множественных  коэффициентов;

     – привести пример отбора факторов с  использованием частных и множественных  коэффициентов.

 

      Глава 1. Исследование линейной зависимости у от нескольких объясняющих, переменных (x(1), x(2),…, x(p)): множественный и частные коэффициенты корреляции.

     1.1. Частные коэффициенты корреляции и их выборочные значения

     В анализе множественных корреляционных связей (так называют статистические связи между более чем двумя переменными) есть своя специфика. Эта специфика связана в первую очередь с необходимостью уметь измерять степень тесноты связи между результирующей переменной у и множеством объясняющих переменных (x(1), x(2),…, x(p)), а также с возникающими трудностями в интерпретации парных коэффициентов корреляции между у и обусловленными возможным опосредованным влиянием на эту парную связь других (явно не учтенных в вычислении r(у; х(j))) объясняющих переменных x(i) (i≠ j).

     Последнее обстоятельство, в частности, делает необходимым введение таких измерителей статистической связи, которые были бы «очищены» от опосредованного влияния других переменных, давали бы оценку степени тесноты интересующей нас связи между переменными у и x(j) (или х(i) и х(j)) при условии, что значения остальных переменных зафиксированы на некотором постоянном уровне. В этом случае говорят о статистическом анализе частных (или «очищенных») связей и используют соответственно частные («очищенные») коэффициенты корреляции или другие корреляционные характеристики.

     Поставим  в соответствие каждой парной характеристике статистической связи между переменными x(i) и x(j) (i,j = 0,1,...,р; x(0) ≡ y) частную («очищенную» ) характеристику, определяемую по той же формуле, но только для условного распределения φ(x(i), x(j) | X(i,j) = x). Здесь φ – это функция плотности вероятности переменных x(i) и x(j); X(i,j) – множество переменных, дополняющих пару (x(i), x(j)) до полного набора рассматриваемых (наблюдаемых) переменных X = (x(0), x(1),…, x(p)), а х – (р–1)-мерный вектор, определяющий заданные уровни, на которых фиксируются значения «мешающих» переменных X(i,j). Есть два взаимосвязанных обстоятельства, которые препятствуют широкому практическому использованию частных характеристик статистической связи в общем случае:

     – частные характеристики статистической связи, вообще говоря, зависят от заданных уровней х мешающих переменных (как их выбирать в каждом конкретном случае?);

     – для подсчета выборочных значений частных характеристик статистической связи необходимо иметь выборку специальной структуры, обеспечивающей наличие хотя бы нескольких наблюдений при каждом из заданного ряда фиксированных значений х мешающих переменных.

     Однако  можно показать, что если исследуемые случайные переменные (x(0), x(1),…, x(p)) подчиняются многомерному нормальному закону, то указанные неудобства автоматически исчезают, так как в этом случае частные коэффициенты корреляции не зависят от уровней мешающих переменных х, определяющих условие в соответствующем условном распределении. В частности, имеет место следующая формула (при условии невырожденности (р+1)-мерного нормального закона):

                                 

, (1)

     где   – частный коэффициент корреляции между переменными x(i) и x(j) при фиксированных значениях всех остальных переменных X(i,j), a Rkl – алгебраическое дополнение для элемента rkl в определителе корреляционной матрицы R анализируемых признаков x(0) ≡ y, x(1), x(2),…, x(p),т.е. в определителе

     

, где rij=r(x(i), x(j)).

     Формула (1), примененная к трехмерному признаку (x(0) ≡ y, x(1), x(2)), при i = 0, j = 1 и X(i,i) = х(2) дает:

                            

. (2)

     Значения  лежат в интервале [–1,1], как у обычного коэффициента корреляции. Равенство коэффициента   нулю означает, говоря нестрого, отсутствие прямого (линейного) влияния переменной х1 на у.

     Последовательно присоединяя к мешающим переменным все новые признаки из рассматриваемого набора, можно получить рекуррентные соотношения для подсчета частных коэффициентов корреляции r01(2…k+1) порядка k (т.е. при исключении опосредованного влияния k мешающих переменных) по частным коэффициентам корреляции порядка k–1(k=1,2,...,p–1):

               

. (2')

     Выборочные (эмпирические) значения частных коэффициентов  корреляции вычисляются по тем же формулам (1)–(2') с заменой теоретических значений парных коэффициентов корреляции rij их выборочными аналогами .

     Если  исследователь имеет дело лишь с тремя–четырьмя переменными (р = 2,3), то удобно пользоваться рекуррентными соотношениями (2'). При больших размерностях анализируемого многомерного признака удобнее опираться на формулу (1), использующую расчет соответствующих определителей.

     При исследовании статистических свойств  выборочного частного коэффициента корреляции порядка k (т. е. при исключении опосредованного влияния k мешающих переменных) следует воспользоваться тем, что он распределен точно так же, как и обычный (парный) выборочный коэффициент корреляции между теми же переменными с единственной поправкой: объем выборки надо уменьшить на k единиц, т. е. полагать его равным n – k, а не n.

 

      1.2. Процедура присоединения  – удаления

     На  первом шаге из исходного набора объясняющих переменных выбирается (включается в число регрессоров) переменная, имеющая наибольший по модулю коэффициент корреляции с зависимой переменной у.

     Второй  шаг состоит из двух подшагов. На первом из них, который выполняется, если число регрессоров уже больше двух, делается попытка исключить один из регрессоров. Ищется тот регрессор xs, удаление которого приводит к наименьшему уменьшению коэффициента детерминации. Затем сравнивается значение F-статистики для проверки гипотезы Н0 о незначимости этого регрессора с некоторым заранее заданным пороговым значением Fискл. Если F < Fискл, то xs удаляется из списка регрессоров. Заметим, что гипотеза Н0 о равенстве коэффициента при xs нулю эквивалентна гипотезе о равенстве коэффициентов детерминации до и после удаления регрессора, а также гипотезе о том, что коэффициент частной корреляции xs и у равен 0. Второй подшаг состоит в попытке включения нового регрессора из исходного набора предсказывающих переменных. Ищем переменную хp с наибольшим по модулю частным коэффициентом корреляции (исключается влияние ранее включенных в уравнение регрессоров) и сравниваем значение F-статистики для проверки гипотезы Н0 о незначимости этого регрессора с некоторым заранее заданным пороговым значением Fвкл. Если F > Fвкл, то хp включается в список регрессоров. Обычно выбирают  Fискл < Fвкл. Второй шаг повторяется до тех пор, пока происходит изменение списка регрессоров. Конечно, ни одна из пошаговых процедур не гарантирует получение оптимального по какому-либо критерию набора регрессоров.

     Следует отметить, что пошаговый отбор является формально- аналитической процедурой, и его надо рассматривать как вспомогательный метод. Основным критерием является содержательный экономический смысл модели.

     1.3. Множественный коэффициент корреляции

     Обратимся теперь к задаче измерения статической связи между результирующим показателем у и множеством объясняющих переменных X = (x(1), x(2),…, x(p))T в условиях многомерной нормальной совокупности. В общем случае эта задача решается с помощью коэффициента детерминации Kd(y,X), который по построению обладает следующими свойствами:

     а) ;

Информация о работе Коэффициенты корреляции