Автор работы: Пользователь скрыл имя, 23 Декабря 2011 в 21:55, курс лекций
Термин "статистика" появился в середине 18 века. Означал "государствоведение". Получил распространение в монастырях. Постепенно приобрел собирательное значение. С одной стороны, статистика – это совокупность числовых показателей, характеризующих общественные явления и процессы (статистика труда, статистика транспорта). С другой – под статистикой понимается практическая деятельность по сбору, обработке, анализу данных по различным направлениям общественной жизни. С третьей стороны, статистика – это итоги массового учета, опубликованные в различных сборниках.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Выделяют три формы вариационного ряда: ранжированный ряд, дискретный ряд и интервальный ряд.
Ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака.
Другие формы вариационного ряда - групповые таблицы, составленные по характеру вариации значений изучаемого признака. По характеру вариации различают дискретные (прерывные) и непрерывные признаки.
Дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением (дискретные признаки). К последним можно отнести тарифный разряд, количество детей в семье, число работников на предприятии и т.д. Эти признаки могут принимать только конечное число определенных значений.
Если
признак имеет непрерывное
Величина интервала определяется по формуле , где
xmax, min - максимальное и минимальное значение признака, к – число групп.
Частота (частота повторения) - число повторений отдельного варианта значений признака, обозначается fi , а сумма частот, равная объему исследуемой совокупности, обозначается , где к – число вариантов значения признака.
Частоты ряда f могут заменяться частостями w, выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме, т.е.: , при этом
Основной целью анализа вариационных рядов является выявление закономерности распределения, исключая при этом влияние случайных для данного распределения факторов. Этого можно достичь, если увеличивать объем исследуемой совокупности и одновременно уменьшать интервал ряда.
В практике статистических исследований наиболее часто используются следующие закономерности распределения: нормальное распределение и распределение Пуассона.
Нормальное
распределение зависит от двух параметров:
средней арифметической и среднего
квадратического отклонения. Его
кривая выражается уравнением
где у - ордината кривой нормального распределения; - стандартизованные отклонения; е и π - математические постоянные; x - варианты вариационного ряда; - их средняя величина; - cреднее квадратическое отклонение.
Теоретические частоты при нормальном распределении определяются по формуле: , где N = Sf – сумма всех эмпирических частот вариационного ряда; h – величина интервала в группах.
При помощи этой формулы мы получаем теоретическое (вероятностное) распределение, заменяя им эмпирическое (фактическое) распределение, по характеру они не должны отличаться друг от друга.
Если вариационный ряд представляет собой распределение по дискретному признаку, где при увеличении значений признака х частоты начинают резко уменьшаться, а средняя арифметическая, в свою очередь, равна или близка по значению к дисперсии ( ), такой ряд выравнивается по кривой Пуассона.
Кривую Пуассона можно выразить отношением , где Px - вероятность наступления отдельных значений х; - средняя арифметическая ряда.
Теоретические
частоты при распределении
Для расчета обобщающих показателей и для графического изображения вариационных рядов с неравными интервалами используют плотность распределения, которая определяется по формулам:
,
где - абсолютная плотность распределения в j-м интервале, - относительная плотность распределения в j-м интервале; ij – величина интервала.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Асимметрия распределения определяется на основе расчета коэффициента асимметрии, котрый является мерой несимметричности распределения. Если этот коэффициент отчетливо отличается от 0, распределение является асимметричным. Плотность нормального распределения симметрична относительно среднего.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
Наиболее распространенным является критерий согласия К. Пирсона, который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам:
Вычисленное значение критерия c2расч необходимо сравнить с табличным (критическим) значением c2табл. Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n ³ 50), при этом если в некоторых интервалах теоретические частоты меньше 5, то интервалы объединяют для условия больше 5.
Если c2расч £ c2табл, то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.
В том случае, если отсутствуют таблицы для оценки случайности расхождения теоретических и эмпирических частот, можно использовать критерий согласия В.И. Романовского (КРом), который, используя величину c2, предложил оценивать близость эмпирического распределения кривой нормального распределения при помощи отношения: , где m - число групп; k = (m - 3 ) - число степеней свободы при исчислении частот нормального распределения.
Если вышеуказанное отношение < 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение > 3, то расхождения могут быть достаточно существенными и гипотезу о нормальном распределении следует отвергнуть.
Критерий согласия А.Н. Колмогорова используется при определении максимального расхождения между частотами эмпирического и теоретического распределения, вычисляется по формуле: , где D - максимальное значение разности между накопленными эмпирическими и теоретическими частотами; Sf - сумма эмпирических частот.
По таблицам значений вероятностей l-критерия можно найти величину l, соответствующую вероятности Р. Если величина вероятности Р значительна по отношению к найденной величине , то можно предположить, что расхождения между теоретическим и эмпирическим распределениями несущественны.
Необходимым условием при использовании критерия согласия Колмогорова является достаточно большое число наблюдений (не меньше ста).
При анализе вариационного ряда и его свойств используют графические методы. Интервальный ряд изображаю столбиковой диаграммой или гистограммой, в которой основания столбиков, расположенные на оси – абсцисс – это интервалы значений варьирующего признака, а высоты столбиков – частоты.
Если имеется дискретный вариационный ряд или используются середины интервалов, то графическое изображение такого ряда называют полигоном.
Преобразованной
формой вариационного ряда является
ряд накопленных частот. Это ряд
значений числа единиц совокупности
с меньшими или равными нижней
границе соответствующего интервала
значениями признака. Такой ряд называют
кумулятивным. Можно построить кумулятивное
распределение «не меньше, чем» – кумулята,
и «больше, чем» – огива.
Тема № 8. Выборочное наблюдение.
Выборочное наблюдение – одно из наиболее современных видов статистического наблюдения. Выборочное наблюдение – это такое наблюдение, при котором обследованию подвергается часть единиц изучаемой совокупности, отобранных на основе научно разработанных принципов, обеспечивающих получение достаточного количества достоверных данных, для того чтобы охарактеризовать всю совокупность в целом.
Средние и относительные показатели, полученные на основе выборочных данных, должны достаточно полно воспроизводить или репрезентатировать соответствующие показатели совокупности в целом.
Логика выборочного наблюдения
Основные преимущества
Основные недостатки
Вся совокупность единиц, из которых производится отбор, называется генеральной. Совокупность единиц отобранных называется выборочной.
Чтобы оценить степень точности выборочного наблюдения, необходимо оценить величину ошибок, которые могут возникнуть в процессе проведения выборочного наблюдения.
Основное внимание уделяется случайным ошибкам репрезентативности.
Статистическое исследование может осуществляться по данным несплошного наблюдения, основная цель которого состоит в получении характеристик изучаемой совокупности по обследованной ее части. Одним из наиболее распространенных в статистике методов, применяющих несплошное наблюдение, является выборочный метод.
Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности устанавливаются по некоторой ее части на основе положений случайного отбора. При выборочном методе обследованию подвергается сравнительно небольшая часть всей изучаемой совокупности (обычно до 5 — 10%, реже до 15 — 25%). При этом подлежащая изучению статистическая совокупность, из которой производится отбор части единиц, называется генеральной совокупностью. Отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию, называется выборочной совокупностью или просто выборкой.
Значение
выборочного метода состоит в
том, что при минимальной