Автор работы: Пользователь скрыл имя, 29 Апреля 2012 в 15:57, курсовая работа
Средним называется обобщающий показатель статистической совокупности, характеризующий наиболее типичный уровень явления. Он выражает величину признака, отнесённую к единице совокупности.
Особенности средних показателей заключаются в том, что они, во-первых, отражают то общее, что присуще всем единицам совокупности; во-вторых, в них взаимопогашаются те отклонения значений признака, которые возникают под воздействием случайных факторов. Это означает, что средний показатель отражает типичный уровень признака, формирующийся под воздействием основных доминирующих неслучайных факторов.
Введение
1. Виды и область применения различных видов средних показателей 4
2. Структурные средние в статистическом изучении совокупности 11
2.1. Понятие и расчет структурных средних 11
2.2.Графическое определение моды и медианы 14
2.3.Выбор показателя центра распределения вариационного ряда 16
3.Использование средних структурных показателей для выбранного объекта исследования 21
Заключение 23
Список литературы 24
9
однородным группам.
Как правило, средние величины рассчитываются для получения обобщенных
количественных характеристик уровня какого либо варьирующего признака по
совокупности однородных по основным свойствам единиц конкретного явления или
процесса. В статистике все средние величины обозначаются как `X. Существует
несколько видов средних величин.
Основной средней величиной является средняя степенная. Она имеет следующий вид:
(1)
где `Х - средняя величина;
X - меняющаяся величина признака варианты;
n - число признаков или вариант;
m - показатель степени средней.
В зависимости от величины показателя степени средней она принимает
следующие виды:
а). Средняя арифметическая невзвешенная, где m = 1. Она имеет вид:
(2)
б). Средняя арифметическая взвешенная. Она имеет вид:
(3)
где f - частоты или веса
10
2. Структурные
средние в статистическом
К наиболее часто используемым структурным средним относятся статистическая мода и статистическая медиана.
Статистическая мода
Статистическая мода - это наиболее часто повторяющееся значение величины X в статистической совокупности.
Если X задан дискретно, то мода определяется без вычисления как значение признака с наибольшей частотой. В статистической совокупности бывает 2 и более моды, тогда она считается бимодальной (если моды две) или мультимодальной (если мод более двух), и это свидетельствует о неоднородности совокупности.
Статистическая медиана
Статистическая медиана – это значение величины X, которое делит упорядоченную по возрастанию или убыванию статистическую совокупность на 2 равных по численности части. В итоге у одной половины значение больше медианы, а у другой - меньше медианы.
Если X задан дискретно, то для определения медианы все значения нумеруются от 0 до N в порядке возрастания, тогда медиана при четном числе N будет лежать посередине между X c номерами 0,5N и (0,5N+1), а при нечетном числе N будет соответствовать значению X с номером 0,5(N+1).
2.1 Понятие и расчет структурных средних
Бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном ряду значений признака вполне определенное положение. Примерами таких
11
величин являются средние мода
(
) и медиана (
).
Мода – значение признака, которое имеет наибольшую частоту в статистическом ряду распределения.
Отыскание моды зависит от того, представлен ли варьирующий признак в виде дискретного или интервального ряда. Поиск моды в дискретном ряду происходит путем простого просматривания столбца частот. В этом столбце находится наибольшее число, характеризующее наибольшую частоту. Ей соответствует определенное значение признака, которое и является модой. Может оказаться, что два признака имеют одинаковую частоту. В этом случае ряд будет называться бимодальным.
В интервальном вариационном ряду модой приближенно считают центральный вариант интервала с наибольшей частотой. В таком ряде распределения мода вычисляется по формуле:
Где - нижняя граница модального интервала;
- модальный интервал;
- частота в модальном интервале;
- частота интервала перед
- частота интервала после
Мода широко используется в статистической практике при изучении, например, покупательского спроса, регистрации цен и т.д.
12
Медиана – это вариант, расположенный в центре ранжированного ряда.
Медиана делит ряд на две равные части – со значениями признака меньше медианы и со значениями признака больше медианы. Чтобы найти медиану, необходимо отыскать значение признака, которое находится в середине упорядоченного ряда.
В ранжированных рядах несгруппированных данных нахождение медианы сводится к отысканию порядкового номера медианы по формуле:
,
где n – число членов ряда.
В случае четного объема ряда медиана равна средней из двух вариантов, находящихся в середине ряда.
В интервальных рядах распределения медианное значение оказывается в каком-то из интервалов признака x. Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Значение медианы вычисляется по формуле:
,где - нижняя граница медианного интервала;
- медианный интервал;
- половина от общего числа наблюдений;
- сумма наблюдений, накопленная
до начала медианного
13
- число наблюдений в медианном интервале.
Средний уровень ряда характеризует обобщенную величину абсолютных уровней. Он рассчитывается по средней хронологической, т.е. по средней исчисленной из значений, изменяющихся во времени.
Для моментных рядов динамики
с равностоящими уровнями средний
уровень определяется по формуле
средней хронологической
,
где - уровни периода, за который делается расчет;
-число уровней;
- длительность периода времени.
Для моментных рядов динамики с неравностоящими уровнями средний уровень определяется по формуле средней хронологической взвешенной моментного ряда:
14
,
где -уровни рядов динамики;
- интервал времени между
2.2.Графическое определение моды и медианы
Для определения медианы графическим методом используют накопленные частоты, по которым строится кумулятивная кривая. Вершины ординат,
14
соответствующих накопленным частотам, соединяют отрезками прямой.
Разделив пополам последнюю ординату, которая соответствует общей сумме частот и проведя к ней перпендикуляр пересечения с кумулятивной кривой, находят ординату искомого значения медианы.
Мода — значение
признака, имеющее наибольшую частоту
в статистическом ряду распределения.
Определение моды производится
разными способами, и это зависит от того,
представлен ли варьирующий признак в
виде дискретного или интервального ряда.
Нахождение моды и медианы в контрольных по статистике происходит путем обычного просматривания столбца частот. В этом столбце находят наибольшее число, характеризующее наибольшую частоту. Ей соответствует определенное значение признака, которое и является модой. В интервальном вариационном ряду модой приблизительно считают центральный вариант интервала с наибольшей частотой. В таком ряду распределения мода вычисляется по формуле:
где ХМо — нижняя граница модального
интервала;
imo — модальный интервал;
fм0, fм0-1,, fм0+1 - частоты в модальном, предыдущем
и следующем за модальным интервалах.
Модальный интервал определяется по наибольшей
частоте.
Мода широко используется в статистической
практике при анализе покупательного
спроса, регистрации цен и т. д.
15
2.3.Выбор показателя
центра распределения
К выборочным мерам центра распределения наблюдений случайной выборки принято относить выборочное среднее значение, выборочную медиану и выборочную моду.
Выборочное среднее значение – наиболее часто используемый показатель центра распределения наблюдений. Для наблюдений х(1), х(2),…., х(n) его обычно обозначают (или ) и определяют формулой
Если воспользоваться знаком Σ, то записывают в виде
Например, если в результате опроса девяти учеников на уроке литературы получены оценки 5, 3, 5, 4, 3, 4, 2, 4, 5, то среднее значение оценок
Для дискретного вариационного ряда (см. § 2) можно использовать такую формулу
По этой формуле для предыдущего примера имеем
16
Для выборок большого объема выборочное среднее значение находят лишь после построения интервального вариационного ряда по формуле
где n – общее число наблюдений, k – число интервалов, - середина i-го интервала, ni – частота в i-ом интервале.
Например, для интервального вариационного ряда из 1.3. получаем по этой формуле, что
Следует заметить, что формула для интервального вариационного ряда рекомендуется лишь для симметричного или умеренно симметричного распределения частот по интервалам.
Отметим некоторые свойства выборочных средних значений, применяемых на практике.
1) Если наблюдения выборки имеют вид cх1, cх2,…, cхn , где с – заданное число, то среднее значение имеет вид c , где - среднее значение для х1, х2,…., хn.
2) Если наблюдения выборки имеют вид х1+у1, х2+у2, … , хn+yn , то среднее значение имеет вид x‾+y‾ , где x‾+y‾ - среднее значение для наблюдений х1, х2,…., хn, а x‾+y‾- среднее значение для наблюдений y1, y2,…, yn.
17
3) Если наблюдения выборки объема n являются объединением наблюдений двух выборок объемов n1 и n2 , то выборочное среднее объединенной выборки выражается через выборочные средние x1‾;,x2‾ ее составных частей по формуле
4) Сумма отклонений результатов
наблюдений от среднего
5) Сумма квадратов отклонений
результатов наблюдений от
Выборочное среднее значение является наиболее важной характеристикой наблюдений выборки. Оно является центром рассеяния данных выборки. При сравнении двух выборок значений изучаемого признака, прежде всего, сравнивают между собой средние значения для этих выборок.
Если для наблюдений выборки х1, х2,….,
хnпостроен дискретный вариационный
ряд х(1), х(2),….,
х(n), где х(1), х(2),….,
х(n), то выборочной медианой хmed или хmed(n) назы
число, т.е. n=2k+1, то хmed=х(к+1). Если же объем n выборки четное число,
т.е. n=2k,
В этом случае хmed может не быть наблюдением выборки. Например, для выборки 1, 2, 3, 4, 5 имеем хmed =3, а для выборки 1, 2, 3, 4, 5, 6 имеем
Имеется также формула приближенного вычисления выборочной медианы хmed и для интервального вариационного ряда.
Выборочная медиана в ряде случаев имеет некоторые преимущества по сравнению с выборочным средним. Она может быть вычислена в случаях, когда вычисление выборочного среднего не возможно, например, вследствие неопределенности первого или последнего интервала группировки данных выборки в интервальном вариационном ряде.
Кроме того, выборочную медиану легко вычислять и она более устойчива по сравнению с выборочным средним при резких выбросах в наблюдениях выборки. Однако выборочная медиана имеет и свои недостатки по сравнению с выборочным средним. Например, для выборочной медианы невозможны аналоги свойств 1)-5) для выборочного среднего. Другие различия между и хmed будут ясны далее.
К выборочным характеристикам центра группирования, условно относят и выборочную моду хmоd. Выборочной модой хmоd называется наиболее часто встречающееся значение среди наблюдений выборки.
19
Например, для выборки 1, 2, 5, 5, 5, 4, 4 мода хmоd=5, а для выборки 1, 2, 5, 5, 5, 4, 4, 4 имеем две моды x(1)mod=5 ,x(2)mod=4. Таким образом, в отличие от и хmedвыборочная мода хmod может быть не единственной. В таких случаях говорят об одномодальном, двухмодульном и т.д. распределении наблюдений выборки.
Выбор , хmed и хmоd зависит, с одной стороны, от природы данных, а с другой – от того, как этот показатель будет использоваться. Для дальнейшего теоретик вероятностного и статистического анализа наиболее полезно.