Автор работы: Пользователь скрыл имя, 17 Февраля 2012 в 04:23, контрольная работа
Для исследования социально-экономических явлений и процессов общественной жизни следует прежде всего собрать о них необходимые сведения - статистические данные. Под статистическими данными (информацией) понимают совокупность количественных характеристик социально-экономических явлений и процессов, полученных в результате статистического наблюдения, их обработки или соответствующих расчетов.
Для определения степени тесноты парной линейной зависимости служит линейный коэффициент корреляции r, для расчета которого можно использовать, например, две следующие формулы:
(5.59)
Линейный коэффициент корреляции может принимать значения в пределах от -1 до + 1 или по модулю от 0 до 1. Чем ближе он по абсолютной величине к 1, тем теснее связь. Знак указывает направление связи: «+» - прямая зависимость, «-» имеет место при обратной зависимости.
В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.
Наибольшее распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом.
Коэффициенты корреляции, основанные на использовании ранжированного метода, были предложены К. Спирмэном и М. Кендэлом.
Коэффициент корреляции рангов Спирмэна (р) основан на рассмотрении разности рангов значений результативного и факторного признаков и может быть рассчитан по формуле
(5.60)
где d =
Nx - Ny , т.е. разность рангов
каждой пары значений х и у; n - число наблюдений.
Ранговый коэффициент корреляции Кендэла ( ) можно определить по формуле
(5.61)
где S = P + Q.
К непараметрическим методам исследования можно отнести коэффициент ассоциации Кас и коэффициент контингенции Ккон , которые используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков.
Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:
|
Здесь а, b, c, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков ; n - общая сумма частот.
Коэффициент ассоциации можно расcчитать по формуле
(5.62)
Коэффициент контингенции рассчитывается по формуле
(5.63)
Нужно иметь в виду, что для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.
Если необходимо оценить тесноту связи между альтернативными признаками, которые могут принимать любое число вариантов значений, применяется коэффициент взаимной сопряженности Пирсона (КП ).
Для исследования такого рода связи первичную статистическую информацию располагают в форме таблицы:
|
Здесь mij - частоты взаимного сочетания двух атрибутивных признаков; П - число пар наблюдений.
Коэффициент взаимной сопряженности Пирсона определяется по формуле
(5.64)
где - показатель средней квадратической сопряженности:
Коэффициент взаимной сопряженности изменяется от 0 до 1.
Наконец, следует упомянуть коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле
(5.65)
где na - количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; nb - соответственно количество несовпадений.
Коэффициент Фехнера может изменяться в пределах -1,0 Кф +1,0.
Рабочая таблица № 6:
k |
xk | yk | хk2 | yk2 | хkyk |
1 | 8,5 | 14 | 72,25 | 196 | 119 |
2 | 11,5 | 16 | 132,25 | 256 | 184 |
3 | 14,5 | 19 | 210,25 | 361 | 275,5 |
4 | 17,5 | 22 | 306,25 | 484 | 385 |
5 | 20,5 | 25 | 420,25 | 625 | 512,5 |
6 | 23,5 | 27 | 552,25 | 729 | 634,5 |
7 | 26,5 | 31 | 702,25 | 961 | 821,5 |
8 | 29,5 | 35 | 870,25 | 1225 | 1032,5 |
9 | 32,5 | 38 | 1056,25 | 1444 | 1235 |
10 | 35,5 | 40 | 1260,25 | 1600 | 1420 |
итого | 220 | 267 | 5582,5 | 7881 | 6619,5 |
Вычислить коэффициент корреляции можно по следующим формулам:
Rx,y | = |
|
( 5.66 ), где: |
Mx | = |
|
|
xk , | My | = |
|
|
yk , | Mxy | = |
|
|
xkyk ( 5.67 ) |
Sx2 | = |
|
|
xk2 - Mx2 , | Sy2 | = |
|
|
yk2 - My2 ( 5.68 ) |
Mx = 220/10=22 My = 267/10=26,7
Mxy= 6619,5/10=661,95
Вычислим значение Sx2 по формуле (5.68):
5582,5/10=558,25
Вычтем квадрат величины Mx получим
значение для Sx2
Sx2 =
558,25 - 222=558,25 – 484=74,25
Вычислим значение Sy2 по формуле (5.68):
7881/10=788,1
Вычтем квадрат величины My получим
значение для Sy2
Sy2 =788,1 - 26,72=788,1
– 712,89=75,21
Вычислим произведение
величин Sx2 и Sy2.
Sx2Sy2 = 74,25*75,21=5584,3425
Извлечем квадратный корень, получим значение
SxSy.
SxSy = 74,728458
Вычислим значение
коэффициента корреляции (тесноту связи)
по формуле (5.66) Rx,y = (661,95
– 22*26,7)/74,728458=74,55/74,
Уравнение линейной регрессии представляет
собой уравнение прямой, аппроксимирующей
(приблизительно описывающей) зависимость
между случайными величинами X и Y. Если
считать, что величина X свободная, а Y зависимая
от Х, то уравнение регрессии запишется
следующим образом
Y = a + b•X ( 5.69 ),
b = | Rx,y |
|
= | Rx,y |
|
( 5.70 ), |
a = My - b•Mx ( 5.71 )
Рассчитанный
по формуле ( 5.70 ) коэффициент b называют
коэффициентом линейной регрессии. В некоторых
источниках a называют постоянным
коэффициентом регрессии и b соответственно
переменным.
Погрешности предсказания Y по заданному
значению X вычисляются по формулам :
σy/x = σy |
|
= Sy |
|
( 5.72 ) | - абсолютная погрешность, |