Автор работы: Пользователь скрыл имя, 29 Января 2013 в 09:12, контрольная работа
Задача 1 Данные опроса респондентов о доле расходов домохозяйств на алкоголь (% от бюджета): ...
Вычислить: 1) среднее арифметическое значение, моду и медиану;
2) размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации.
Задача 1 2
Задача 2 5
Задача 3 8
Содержание
Задача 1
Данные опроса респондентов о доле расходов домохозяйств на алкоголь (% от бюджета):
Доля расходов на алкоголь, % |
Число домохозяйств |
0,5 |
2 |
1,0 |
7 |
1,5 |
25 |
2,0 |
44 |
2,5 |
50 |
3,0 |
71 |
10,0 |
10 |
Вычислить: 1) среднее арифметическое значение, моду и медиану;
2) размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации.
Решение:
Средняя арифметическая рассчитывается по формуле:
где - знак суммирования от 1 до k; xi-варианты с порядковым номером i;
= (0,5*2 + 1*7 + 1,5*25 + 2*44 + 2,5 * 50 + 3 *71 + 10 * 10) / (2 + 7+ 25 + 44 + 50 + 71 + 10) = 571,5/209 = 2,73 (%),
Модой называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.
В нашем примере мода – 3%, поскольку этому значению соответствует наибольшее число домохозяйств.
Медианной в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.
Чтобы найти медиану в дискретном
вариационном ряд, нужно сумму частот
разделить пополам и к
Доля расходов на алкоголь, % |
Число домохозяйств |
0,5 |
2 |
1 |
7 |
1,5 |
25 |
2 |
44 |
2,5 |
50 |
3 |
71 |
10 |
10 |
итого |
209 |
Так, в распределении 209 домохозяйств по доле расходов на алкоголь медианой будет: 209/2 + ½ = 105, т.е. 105-я варианта, которая делит упорядоченный ряд пополам. Для того чтобы выяснить значение 105 варианты, нужно накапливать частоты, начиная, от наименьшей варианты. Сумма частот 1-й и 2-й вариант равна 9. Ясно, что здесь 105 варианты нет. Если прибавить к 9 частоту 3-й варианты, то получим сумму, равную 9+25 = 34 – здесь 105 варианты также нет. Если прибавить к 34 частоту 4-й варианты, то получим сумму, равную 34+44 = 78 – здесь 105 варианты также нет. Если прибавить к 78 частоту 5-й варианты, то получим сумму, равную 78+50 = 128. Следовательно, 105-я варианта соответствует пятому значению варьирующего признака, и медианой будет домохозяйство, имеющее долю расходов на алкоголь 2,5%.
Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности (R = Хmax- Xmin).
Rрасх = 10-0,5 = 9,5,
Rдомохоз = 71-2 = 69.
Дисперсия - это средний квадрат отклонений, мера характеризующая разброс данных вокруг среднего значения. Математическая формула дисперсии по генеральной совокупности имеет вид:
Где D – дисперсия, x – анализируемый показатель, с черточкой сверху – среднее значение показателя, n – количество значений в анализируемой совокупности данных.
Среднее квадратическое отклонение выборки определяется формулой
σ = .
Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического:
V = Q/х ср * 100%,
Где Q- среднеквадратическое отклонение, Хср – среднее арифметическое.
Хсреднее равно:
20,5/7 = 2,93 (%).
Для расчета составим промежуточную таблицу:
Доля расходов на алкоголь, % (х) |
Число домохозяйств (n) |
х-хср |
(х-хср)2 |
0,5 |
2 |
-2,43 |
5,9049 |
1 |
7 |
-1,93 |
3,7249 |
1,5 |
25 |
-1,43 |
2,0449 |
2 |
44 |
-0,93 |
0,8649 |
2,5 |
50 |
-0,43 |
0,1849 |
3 |
71 |
0,07 |
0,0049 |
10 |
10 |
7,07 |
49,9849 |
итого |
209 |
62,7143 |
D= ((0,5-2,93)2 + (1-2,93)2 + (1,5-2,93)2 + (2,5-2,93)2 + (3-2,93)2 + (10-2,93)2) /6 = 62,714/ 6 = 10,45
σ = = 3,23
V = 3,23/2,93 *100 % = 110,24%
Коэффициент вариации является относительной величиной и изменяется от 1 до 100%. Если коэффициент вариации больше 100%, то это означает, что среднее квадратическое отклонение больше чем средняя величина и, следовательно, распределение результатов отличается от нормального ( Гаусса - Лапласа ) и описывать его средним и среднеквадратическим отклонением неправильно.
Данные о годовой выработке продукции:
Группы рабочих по выработке продукции, тыс. руб. |
Число рабочих, чел. |
До 14,0 |
10 |
14,0 – 16,0 |
15 |
16,0 – 18,0 |
35 |
18,0-20,0 |
25 |
20,0 и более |
15 |
Итого |
100 |
Определить среднюю выработку одного рабочего и моду, медиану.
Решение:
Среднюю выработку одного рабочего найдем при помощи средней арифметической взвешенной.
Для расчёта средней арифметической взвешенной интервального ряда распределения определим центральное (серединное) значение признака в каждом интервале. На каждый открытый интервал условно распространим величину смежного закрытого интервала:
Группы рабочих по выработке продукции, тыс. руб. (Х) |
Число рабочих, чел. (F) |
Центральное (серединное) значение интервала (Xc), руб |
До 14,0 |
10 |
((14-2)+14)/2 = 13 |
14,0 – 16,0 |
15 |
(14+16)/2 = 15 |
16,0 – 18,0 |
35 |
(16+18)/2 = 17 |
18,0-20,0 |
25 |
(18+20)/2 = 19 |
20,0 и более |
15 |
(20+(20+2))/2 = 21 |
Итого |
100 |
Средняя выработка одного работника организации составляет:
Хср. = (13*10+15*15+17*35+19*25+21*
В интервальных вариационных рядах моду определяют приближенно по формуле:
Модой называется величина признака (варианта), которая чаще всего встречается в данной совокупности.
Модальным интервалом будет 16,0-18,0, поскольку вариация числа рабочих с данным признаком чаще других.
Соответственно нижней границей модального интервала будет 16,0 (тыс. руб.).
Мо = 16 + 2* = 16+2*20/30 = 17,33 тыс. руб.
Медиана интервального вариационного ряда распределения определяется по формуле:
Где ХМе – нижняя граница медианного интервала;
hMe – величина медианного интервала;
∑f - сумма частот ряда;
SMe-1-сумма накопленных частот интервала, предшествующего медианному интервалу;
fМе – частота медианного интервала.
Медианной - это варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.
Для интервально вариационного ряда медианой будет являться сумма накопленных частот, превышающих половину суммы всех значений ряда.
Группы рабочих по выработке продукции, тыс. руб. (Х) |
Число рабочих, чел. (F) |
Сумма накопленных частот |
До 14,0 |
10 |
10 |
14,0 – 16,0 |
15 |
25 |
16,0 – 18,0 |
35 |
60 |
18,0-20,0 |
25 |
- |
20,0 и более |
15 |
- |
Итого |
100 |
- |
В данном примере сумма накопленных частот, превышающих половину суммы всех значений ряда, соответствует интервалу 16,0-18,0. .Это и есть медианный интервал, т.е. интервал, в котором находится медиана ряда. Т.е. в нашем случае модальный и медианный интервалы одинаковы.
Определим значение медианы:
Ме = 16 + 2*((100/2 – 25)/35) = 17,43 тыс. руб.
Ответ: Средняя выработка одного рабочего – 17,4 тыс. руб., мода – 17,33 тыс. руб., медиана – 17,43 тыс. руб.
Регионы |
Уровень краж (на 100 000 жителей) |
Уровень доходов (руб./чел.) |
Республика Башкортостан |
507 |
3144 |
Република Марий Эл |
594 |
1769 |
Республика Мордовия |
442 |
2080 |
Республика Татарстан |
570 |
3266 |
Удмурская Республика |
574 |
2467 |
Чувашская Республика |
425 |
2031 |
Кировская область |
560 |
2450 |
Нижегородская область |
642 |
3175 |
Оренбургская область |
578 |
2466 |
Пензенская область |
322 |
2164 |
Пермская область |
962 |
3992 |
Самарская область |
614 |
4239 |
Саратовская область |
512 |
2625 |
Ульяновская область |
449 |
2297 |
Найти результативный признак,
Решение:
Построим график
Наблюдается линейная зависимость показателей – уровень краж зависит от доходов населения.
При прямолинейной форме связи показатель тесноты связи определяется по формуле линейного коэффициента корреляции r:
Построим модель линейной парной регрессии
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 | |
X |
3144 |
1769 |
2080 |
3266 |
2467 |
2031 |
2450 |
3175 |
2466 |
2164 |
3992 |
4239 |
2625 |
2297 |
Y |
507 |
594 |
442 |
570 |
574 |
425 |
560 |
642 |
578 |
322 |
962 |
614 |
512 |
449 |
Уравнение линейной регрессии имеет вид:
Y = a0 + a1*t
Параметры уравнения a0 и a1 определим при помощи системы двух нормальных уравнений, отвечающих требованию метода наименьших квадратов.
Система уравнений примет вид:
Построим таблицу
T |
X |
Y |
Xi * Yi |
X2 |
Y2 |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
3144 |
507 |
1594008 |
9884736 |
257049 |
2 |
1769 |
594 |
1050786 |
3129361 |
352836 |
3 |
2080 |
442 |
919360 |
4326400 |
195364 |
4 |
3266 |
570 |
1861620 |
10666756 |
324900 |
5 |
2467 |
574 |
1416058 |
6086089 |
329476 |
6 |
2031 |
425 |
863175 |
4124961 |
180625 |
7 |
2450 |
560 |
1372000 |
6002500 |
313600 |
8 |
3175 |
642 |
2038350 |
10080625 |
412164 |
9 |
2466 |
578 |
1425348 |
6081156 |
334084 |
10 |
2164 |
322 |
696808 |
4682896 |
103684 |
11 |
3992 |
962 |
3840304 |
15936064 |
925444 |
12 |
4239 |
614 |
2602746 |
17969121 |
376996 |
13 |
2625 |
512 |
1344000 |
6890625 |
262144 |
14 |
2297 |
449 |
1031353 |
5276209 |
201601 |
ИТОГО: |
38165 |
7751 |
22055916 |
111137499 |
4569967 |