Автор работы: Пользователь скрыл имя, 23 Декабря 2011 в 21:55, курс лекций
Термин "статистика" появился в середине 18 века. Означал "государствоведение". Получил распространение в монастырях. Постепенно приобрел собирательное значение. С одной стороны, статистика – это совокупность числовых показателей, характеризующих общественные явления и процессы (статистика труда, статистика транспорта). С другой – под статистикой понимается практическая деятельность по сбору, обработке, анализу данных по различным направлениям общественной жизни. С третьей стороны, статистика – это итоги массового учета, опубликованные в различных сборниках.
Так, при 2%-ной выборке отбирается каждая 50-я единица (1:0,02), при 5%-ной выборке — каждая 20-я единица (1:0,05) и т.д.
Таким образом, в соответствии с принятой долей отбора, генеральная совокупность как бы механически разбивается на равновеликие группы. Из каждой группы в выборку отбирается лишь одна единица.
Важной особенностью механической выборки является то, что формирование выборочной совокупности можно осуществить, не прибегая к составлению списков. На практике часто используют тот порядок, в котором фактически размещаются единицы генеральной совокупности. Например, последовательность выхода готовых изделий с конвейера или поточной линии, порядок размещения единиц партии товара при хранении, транспортировке, реализации и т.д.
Типическая выборка. При типической выборке генеральная совокупность вначале расчленяется на однородные типические группы. Затем из каждой типической группы собственно-случайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.
Типическая выборка обычно применяется при изучении сложных статистических совокупностей. Например, при выборочном обследовании производительности труда работников торговли, состоящих из отдельных групп по квалификации.
Важной особенностью типической выборки является то, что она дает более точные результаты по сравнению с другими способами отбора единиц в выборочную совокупность.
Для
определения средней ошибки типической
выборки используются формулы:
повторный отбор
бесповторный отбор
Дисперсия определяется по следующим формулам:
При одноступенчатой выборке каждая отобранная единица сразу же подвергается изучению по заданному признаку. Так обстоит дело при собственно-случайной и серийной выборке.
При многоступенчатой выборке производят подбор из генеральной совокупности отдельных групп, а из групп выбираются отдельные единицы. Так производится типическая выборка с механическим способом отбора единиц в выборочную совокупность.
Комбинированная
выборка может быть двухступенчатой. При
этом генеральная совокупность сначала
разбивается на группы. Затем производят
отбор групп, а внутри последних осуществляется
отбор отдельных единиц.
Тема
№ 9. Статистическое
изучение взаимосвязи
социально - экономических
явлений.
Различают два типа связи между различными явлениями и их признаками: функциональную или жестко детерминированную и статистическую или стохастически детерминированную с другой стороны.
Если с изменением одной из переменных вторая изменяется строго определенным образом, т.е. значению одной переменной обязательно соответствует одно или несколько точно заданных значений другой переменной, связь между ними является функциональной.
При
стохастически
Частным случаем статистической связи является корреляционная связь.
Корреляционная связь - это связь, где воздействие отдельных факторов проявляется только как тенденция (в среднем) при массовом наблюдении фактических данных.
Наиболее
простым вариантом
Методы изучения статистической связи.
Важнейшей задачей является определение формы связи с последующим расчетом параметров уравнения, или, иначе, нахождение уравнения связи (уравнения регрессии).
Могут иметь место различные формы связи:
прямолинейная
линейные связи являются основными и применяются также и при многофакторном анализе.
криволинейная в виде:
параболы
второго порядка (или высших порядков)
параболической связью описывается взаимосвязь при которой характер связи между факторным и результативным признаком может измениться на противоположный при прохождении некоторого оптимального значения.
гиперболы
гиперболические
зависимости характерны для связей,
в которых результативный признак
не может варьироваться
показательной
функции
Параметры для всех этих уравнений связи, как правило, определяют из системы нормальных уравнений, которые должны отвечать требованию метода наименьших квадратов (МНК):
Другая важнейшая задача - измерение тесноты зависимости - для всех форм связи может быть решена при помощи вычисления эмпирического корреляционного отношения:
где
-
дисперсия
в ряду выравненных значений результативного
показателя ; -
дисперсия
в ряду фактических значений у.
Для
определения степени тесноты парной
линейной зависимости служит линейный
коэффициент корреляции r, для расчета
которого можно использовать следующие
формулы:
Линейный коэффициент корреляции может принимать значения в пределах от -1 до + 1 или по модулю от 0 до 1. Чем ближе он по абсолютной величине к 1, тем теснее связь. Знак указывает направление связи: «+» - прямая зависимость, «-» имеет место при обратной зависимости.
Общий вид многофакторного уравнения регрессии имеет вид:
y = a + b1x1 + .. + bkxk
Многофакторная система требует не одного, а множества показателей тесноты связей. Основой измерения связей является матрица коэффициентов корреляции. На основе этой матрицы судят о тесноте связи факторов с результативным признаком и между собой. Не рекомендуется включать в уравнение регрессии факторы слабо связанные с результативным признаком, но тесно связанные с другими факторами. Множественный коэффициент корреляции определяется как отношение части вариации результативного признака, объясняемой за счет вариации входящих в уравнение факторов, к общей вариации результативного признака за счет всех факторов. Под вариацией понимается сумма квадратов отклонений индивидуальных значений от расчетных по уравнению регрессии (объясненная вариация) или от общей средней величины признака (общая вариация).
Для случая двух факторов коэффициент множественной детерминации вычисляется по формуле из парных коэффициентов корреляции::
Коэффициент частной детерминации фактора xm – это доля вариации у, не объясненной ранее включенными факторами. Если обозначить частный коэффициент детерминации ддя фактора xm как Тогда
Основные задачи применения корреляционно-регрессионного анализа.
В соответствии с сущностью корреляционной связи ее изучение имеет две цели: 1) измерение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной; 2) измерение тесноты связи двух (или большего числа признаков) между собой
Задачи корреляционно-регрессионного анализа:
1.
Задачи выделения важнейших
2. Задачи оценки хозяйственной деятельности по эффективности использования факторов производства. Эта задача решается путем расчета для каждой единицы совокупности тех величин результативного признака, которые были получены при средней по совокупности эффективности использования факторов и сравнивания их с фактическими результатами производства.
3.
Задача прогнозирования
4.
Задача подготовки данных, необходимых
в качестве исходных для
При решении каждой из названных задач нужно учитывать особенности и ограничения корреляционно-регрессионного метода. Всякий раз необходимо специально обосновать возможность причинной интерпретации уравнения как объясняющего связь между вариацией фактора и результата. Трудно обеспечить раздельную оценку влияния каждого из факторов.
Непараметрические методы определения тесноты связи.
В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.
Наибольшее
распространение имеют ранговые
коэффициенты корреляции, в основу
которых положен принцип
Коэффициент корреляции рангов Спирмэна (р) основан на рассмотрении разности рангов значений результативного и факторного признаков и может быть рассчитан по формуле
где d = Nx - Ny , т.е. разность рангов каждой пары значений х и у; n - число наблюдений.
К
непараметрическим методам
Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:
Признаки | А(да) | А(нет) | Итого |
В(да) | a | b | a + b |
В(нет) | c | d | c + d |
Итого | a + c | b + d | n |