Автор работы: Пользователь скрыл имя, 06 Февраля 2013 в 08:23, курс лекций
Важнейшим этапом исследования социально-экономических явлений и процессов является систематизация первичных данных и получение на этой основе сводной характеристики объекта в целом при помощи обобщающих показателей, что достигается путем сводки и группировки первичного статистического материала.
1. Статистическая сводка и группировка
2. Статистические таблицы
3. Формы выражения статистических показателей
4. Показатели вариации и анализ частотных распределений
5. Выборочное наблюдение
6. Экономические индексы
Список литературных источников
Решение. Для расчета групповых дисперсий вычислим средние по каждой группе:
шт.; шт.
Промежуточные расчеты дисперсий по группам представлены в табл. 4.4. Подставив полученные значения в формулу, получим:
;
.
Средняя из групповых дисперсий
Затем рассчитаем межгрупповую дисперсию. Для этого предварительно определим общую среднюю как среднюю взвешенную из групповых средних:
шт.
Теперь определим межгрупповую дисперсию:
.
Таким образом, общая дисперсия по правилу сложения дисперсий
.
Проверим полученный результат, исчислив общую дисперсию обычным способом:
.
На основании правила сложения
дисперсий можно определить показатель
тесноты связи между
Величина 0,86 характеризует существенную связь между группировочными и результативными признаками.
Характеристики вариационного ряда.
Мода – значение признака, наиболее часто встречающееся в исследуемой совокупности.
Медиана - значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.
Для дискретных вариационных рядов модой будет значение варианта с наибольшей частотой. Вычисление медианы в дискретных рядах распределения имеет специфику. Если такой ряд распределения имеет нечетное число членов, то медианой будет вариант, находящийся в середине ранжированного ряда. Если ранжированный ряд распределения состоит из четного числа членов, то медианой будет средняя арифметическая из двух значений признака, расположенных в середине ряда.
Пример. Рассчитаем моду и медиану по данным табл. 4.5.
Таблица 4.5
Распределение обуви, проданной коммерческой фирмой
в январе 1998 г.
Размер |
34 |
35 |
36 |
37 |
38 |
39 |
40 |
41 |
42 |
43 |
44 и более |
Итого |
Количество проданных пар, % к итогу |
3 |
5 |
7 |
9 |
10 |
13 |
15 |
14 |
20 |
3 |
1 |
100 |
Накопленные частоты |
3 |
8 |
15 |
24 |
34 |
47 |
62 |
76 |
96 |
99 |
100 |
В этом ряду распределения мода равна 42. Именно этот размер обуви в январе 1998 г. пользовался наибольшим спросом.
Для определения медианы надо подсчитать сумму накопленных частот ряда. Наращивание продолжается до получения накопленной суммы частот, впервые превышающей половину. В нашем примере сумма частот составила 100, ее половина - 50.
Накопленная сумма частот ряда равна 62, Ей соответствует значение признака, равное 40. Таким образом, 40-й размер обуви является медианным.
Для интервальных вариационных рядов мода определяется по формуле
,
где xМо – нижняя граница значения интервала, содержащего моду;
iМо – величина модального интервала;
fМо – частота модального интервала;
fМо-1 – частота интервала, предшествующего модальному;
fМо+1 – частота интервала, следующего за модальным.
Медиана интервального ряда распределения определяется по формуле
,
где xМе – нижняя граница значения интервала, содержащего медиану;
iМе – величина медианного интервала;
∑f – сумма частот;
SМе-1 – сумма накопленных частот, предшествующих медианному интервалу;
fМе – частота медианного интервала.
Пример. Рассчитаем моду и медиану по данным табл. 4.11.
руб.
Следовательно, наибольшее
число семей имеют среднедушево
руб.
Таким образом, половина семей города имеет среднедушевой доход менее 780 руб., остальные семьи – более 780 руб.
Таблица 4.6
Распределение семей города по размеру
среднедушевого дохода в январе 1998 г.
Группы семей по размеру дохода, руб. |
Число семей |
Накопленные частоты |
Накопленные частоты, % к итогу |
До 500 |
600 |
600 |
6 |
500-600 |
700 |
1300 |
13 |
600-700 |
1700 |
3000 |
30 |
700-800 |
2500 |
5500 |
55 |
800-900 |
2200 |
7700 |
77 |
900-1000 |
1500 |
9200 |
92 |
Свыше 1000 |
800 |
10000 |
100 |
Итого |
10000 |
- |
- |
;
,
где xQ1 – нижняя граница интервала, содержащего нижний квартиль (интервал определяется по накопленной частоте, первой превышающей 25%);
xQ3 – нижняя граница интервала, содержащего верхний квартиль (интервал определяется по накопленной частоте, первой превышающей 75%);
SQ1-1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль;
SQ3-1 – то же для верхнего квартиля;
fQ1 – частота интервала, содержащего нижний квартиль;
fQ3 – то же для верхнего квартиля.
Рассмотрим расчет нижнего и верхнего квартилей по данным табл. 4.6. Нижний квартиль находится в интервале 600 - 700, накопленная частота которого равна 30%. Верхний квартиль лежит в интервале 800 - 900 с накопленной частотой 77%. Поэтому получим:
руб.
руб.
Итак, 25% семей имеют среднедушевой доход менее 671 руб., 25% семей - свыше 891 руб., а остальные имеют доход в пределах 671 - 891 руб.
ЗАДАЧИ И УПРАЖНЕНИЯ
4.1. Распределение студентов
Возраст студентов, лет |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
Всего |
Число студентов |
20 |
80 |
90 |
110 |
130 |
170 |
90 |
60 |
750 |
Вычислите: а) размах вариации; б) среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; д) относительные показатели вариации возраста студентов.
4.2. Определите среднюю
длину пробега автофургона
Длина пробега за один рейс, км |
Число рейсов за квартал |
30-50 |
20 |
50-70 |
25 |
70-90 |
14 |
90-110 |
18 |
110-130 |
9 |
130-150 |
6 |
Всего |
92 |
4.3. Имеется следующий ряд
Количество слов в телеграмме |
Число телеграмм |
12 |
18 |
13 |
22 |
14 |
34 |
15 |
26 |
16 |
20 |
17 |
13 |
18 |
7 |
Итого |
140 |
Рассчитайте абсолютные и относительные показатели вариации.
4.4. Средняя урожайность
зерновых культур в двух
1991 |
1992 |
1993 |
1994 |
1995 | |
1-й район |
30 |
20 |
23 |
16 |
22 |
2-й район |
25 |
34 |
30 |
28 |
29 |
Рассчитайте все показатели вариации. Определите, в каком районе урожайность зерновых культур более устойчива.
4.5. Имеются следующие данные о распределении скважин в одном из районов бурения по глубине:
Группы скважин по глубине, м |
Число скважин |
До 500 |
4 |
500-1000 |
9 |
1000-1500 |
17 |
1500-2000 |
8 |
Свыше 2000 |
2 |
Итого |
40 |
Определите дисперсию и среднее квадратическое отклонение глубины скважин, применяя способ моментов и отсчета от условного нуля.
4.6. Акционерные общества
области по среднесписочной чис
Группы АО по среднесписочной численности работающих |
До 400 |
400-600 |
600-800 |
800-1000 |
1000-1200 |
1200-1400 |
1400-1600 |
1600-1800 |
Итого |
Количество АО |
11 |
23 |
36 |
42 |
28 |
17 |
9 |
4 |
170 |
Рассчитайте: а) среднее линейное отклонение; б) дисперсию; в) среднее квадратическое отклонение; г) коэффициент вариации.
4.7. По данным о распределении
сельских населенных пунктов
по числу дворов вычислите
общую дисперсию тремя способам
Населенные пункты по числу дворов |
Число населенных пунктов, % к итогу |
До 100 |
15,5 |
100-200 |
28,6 |
201-300 |
21,7 |
301-400 |
20,3 |
Свыше 400 |
13,9 |
Итого |
100,0 |
4.8. Средняя величина признака в совокупности равна 19, а средний квадрат индивидуальных значений этого признака - 397. Определите коэффициент вариации.
4.9. Дисперсия признака равна 9, средний квадрат индивидуальных его значений - 130. Чему равна средняя?
4.10. Средняя величина в совокупности равна 16, среднее квадратическое отклонение - 8. Определите средний квадрат индивидуальных значений этого признака.
4.11. Средний квадрат отклонений индивидуальных значений признака от их средней величины равен 100, а средняя - 15. Определите, чему равен средний квадрат отклонений индивидуальных значений признака от величины, равной 10 и 25.
4.12. Средняя величина признака равна 14, а дисперсия - 60. Определите средний квадрат отклонений вариантов признака от 19.
4.13. Средний квадрат отклонений вариантов признака от произвольной величины равен 300, а сама произвольная величина равна 70 единицам. Определите дисперсию признака, если известно, что средняя величина его варианта равна 80.