Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 29 Января 2013 в 09:12, контрольная работа

Описание

Задача 1 Данные опроса респондентов о доле расходов домохозяйств на алкоголь (% от бюджета): ...
Вычислить: 1) среднее арифметическое значение, моду и медиану;
2) размах вариации, дисперсию, среднее квадратическое отклонение, коэффициент вариации.

Содержание

Задача 1 2
Задача 2 5
Задача 3 8

Работа состоит из  1 файл

Задачи статистика.doc

— 1.12 Мб (Скачать документ)

Содержание

 

 

Задача 1

 

Данные опроса респондентов о доле расходов домохозяйств на алкоголь (% от бюджета):

Доля расходов на алкоголь, %

Число домохозяйств

0,5

2

1,0

7

1,5

25

2,0

44

2,5

50

3,0

71

10,0

10


 

Вычислить: 1) среднее арифметическое значение, моду и медиану;

2) размах вариации, дисперсию, среднее  квадратическое отклонение, коэффициент  вариации.

 

Решение:

 

Средняя арифметическая рассчитывается по формуле:

где   - знак суммирования от 1 до k; xi-варианты с порядковым номером i; 

  = (0,5*2 + 1*7 + 1,5*25 + 2*44 + 2,5 * 50 + 3 *71 + 10 * 10) / (2 + 7+ 25 + 44 + 50 + 71 + 10) = 571,5/209 = 2,73 (%),

 

Модой называется величина признака (варианта), которая чаще всего встречается  в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.

В нашем примере мода – 3%, поскольку  этому значению соответствует наибольшее число домохозяйств.

Медианной в статистике называется варианта, которая находится в  середине вариационного ряда. Медиана  делит ряд пополам, по обе стороны  от нее (вверх и вниз) находится одинаковое количество единиц совокупности.

Чтобы найти медиану в дискретном вариационном ряд, нужно сумму частот разделить пополам и к полученному  результату добавить ½.

 

Доля расходов на алкоголь, %

Число домохозяйств

0,5

2

1

7

1,5

25

2

44

2,5

50

3

71

10

10

итого

209


 

Так, в распределении 209 домохозяйств по доле расходов на алкоголь медианой будет: 209/2 + ½ = 105, т.е. 105-я варианта, которая делит упорядоченный ряд пополам. Для того чтобы выяснить значение 105 варианты, нужно накапливать частоты, начиная, от наименьшей варианты. Сумма частот 1-й и 2-й вариант равна 9. Ясно, что здесь 105 варианты нет. Если прибавить к 9 частоту 3-й варианты, то получим сумму, равную 9+25 = 34 – здесь 105 варианты также нет. Если прибавить к 34 частоту 4-й варианты, то получим сумму, равную 34+44 = 78 – здесь 105 варианты также нет. Если прибавить к 78 частоту 5-й варианты, то получим сумму, равную 78+50 = 128. Следовательно, 105-я варианта соответствует пятому значению варьирующего признака, и медианой будет домохозяйство, имеющее долю расходов на алкоголь 2,5%.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности (R = Хmax- Xmin). 

Rрасх = 10-0,5 = 9,5,

Rдомохоз = 71-2 = 69.

Дисперсия - это средний квадрат отклонений, мера характеризующая разброс данных вокруг среднего значения. Математическая формула дисперсии по генеральной совокупности имеет вид:

Где D – дисперсия, x – анализируемый показатель, с черточкой сверху – среднее значение показателя, n – количество значений в анализируемой совокупности данных.

Среднее квадратическое отклонение выборки определяется формулой

σ = .

Коэффициент вариации характеризует  относительную меру отклонения измеренных значений от среднеарифметического:

V = Q/х ср * 100%,

Где Q- среднеквадратическое отклонение, Хср – среднее арифметическое.

Хсреднее равно:

20,5/7 = 2,93 (%).

Для расчета составим промежуточную  таблицу:

Доля расходов на алкоголь, % (х)

Число домохозяйств (n)

х-хср

(х-хср)2

0,5

2

-2,43

5,9049

1

7

-1,93

3,7249

1,5

25

-1,43

2,0449

2

44

-0,93

0,8649

2,5

50

-0,43

0,1849

3

71

0,07

0,0049

10

10

7,07

49,9849

итого

209

 

62,7143


D= ((0,5-2,93)2 + (1-2,93)2 + (1,5-2,93)2 + (2,5-2,93)2 + (3-2,93)2 + (10-2,93)2) /6 = 62,714/ 6 = 10,45

σ = = 3,23

V = 3,23/2,93 *100 % = 110,24%

Коэффициент вариации является относительной  величиной и изменяется от 1 до 100%. Если коэффициент вариации больше 100%, то это означает, что среднее квадратическое отклонение больше чем средняя величина и, следовательно, распределение результатов отличается от нормального ( Гаусса - Лапласа ) и описывать его средним и среднеквадратическим отклонением неправильно.

Задача 2

 

Данные о годовой выработке  продукции:

Группы рабочих по выработке продукции, тыс. руб.

Число рабочих, чел.

До 14,0

10

14,0 – 16,0

15

16,0 – 18,0

35

18,0-20,0

25

20,0 и более

15

Итого

100


Определить среднюю выработку  одного рабочего и моду, медиану.

 

Решение:

 

Среднюю выработку одного рабочего найдем при помощи средней арифметической взвешенной.

Для расчёта средней арифметической взвешенной интервального ряда распределения определим центральное (серединное) значение признака в каждом интервале. На каждый открытый интервал условно распространим величину смежного закрытого интервала:

Группы рабочих по выработке продукции, тыс. руб. (Х)

Число рабочих, чел. (F)

Центральное (серединное) значение интервала

(Xc), руб

До 14,0

10

((14-2)+14)/2 = 13

14,0 – 16,0

15

(14+16)/2 = 15

16,0 – 18,0

35

(16+18)/2 = 17

18,0-20,0

25

(18+20)/2 = 19

20,0 и более

15

(20+(20+2))/2 = 21

Итого

100

 

 

Средняя выработка одного работника организации составляет:

 

Хср. = (13*10+15*15+17*35+19*25+21*15)/100 = 1740/100 = 17,4 тыс. руб.

 

В интервальных вариационных рядах моду определяют приближенно по формуле:   

  • ХМ– нижняя граница модального интервала;
  • h  - величина (шаг, ширина) модального интервала;
  • f- локальная частота интервала, предшествующего модальному;
  • f- локальная частота модального интервала;
  • f- локальная частота интервала, следующего за модальным.

Модой называется величина признака (варианта), которая чаще всего встречается  в данной совокупности.

Модальным интервалом будет 16,0-18,0, поскольку вариация числа рабочих с данным признаком  чаще других.

Соответственно нижней границей модального интервала будет 16,0 (тыс. руб.).

Мо = 16 + 2* = 16+2*20/30 = 17,33 тыс. руб.

 

Медиана интервального вариационного  ряда распределения определяется по формуле:

Где  ХМе – нижняя граница медианного интервала;

hMe – величина медианного интервала;

∑f  - сумма частот ряда;

SMe-1-сумма накопленных частот интервала, предшествующего медианному интервалу;

fМе – частота медианного интервала.

Медианной - это варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее (вверх и вниз) находится одинаковое количество единиц совокупности.

Для интервально вариационного  ряда медианой будет являться сумма накопленных частот, превышающих половину суммы всех значений ряда.

Группы рабочих по выработке продукции, тыс. руб. (Х)

Число рабочих, чел. (F)

Сумма накопленных частот

До 14,0

10

10

14,0 – 16,0

15

25

16,0 – 18,0

35

60

18,0-20,0

25

-

20,0 и более

15

-

Итого

100

-


 

В данном примере сумма накопленных  частот, превышающих половину суммы всех значений ряда, соответствует интервалу 16,0-18,0. .Это и есть медианный интервал, т.е. интервал, в котором находится медиана ряда. Т.е. в нашем случае модальный и медианный интервалы одинаковы.

Определим значение медианы:

Ме = 16 + 2*((100/2 – 25)/35) = 17,43 тыс. руб.

 

Ответ: Средняя выработка одного рабочего – 17,4 тыс. руб., мода – 17,33 тыс. руб., медиана – 17,43 тыс. руб.

Задача 3

 

Регионы

Уровень краж (на 100 000 жителей)

Уровень доходов (руб./чел.)

Республика Башкортостан

507

3144

Република Марий Эл

594

1769

Республика Мордовия

442

2080

Республика Татарстан

570

3266

Удмурская Республика

574

2467

Чувашская Республика

425

2031

Кировская область

560

2450

Нижегородская область

642

3175

Оренбургская область

578

2466

Пензенская область

322

2164

Пермская область

962

3992

Самарская область

614

4239

Саратовская область

512

2625

Ульяновская область

449

2297


 Найти результативный признак,  по формуле найти коэффициент,  по результативному признаку  найти Xmin и Xmax.

 

Решение:

Построим график

 

Наблюдается линейная зависимость  показателей – уровень краж зависит  от доходов населения.

При прямолинейной форме связи  показатель тесноты связи определяется по формуле линейного коэффициента корреляции r:

 

Построим модель линейной парной регрессии

 

1

2

3

4

5

6

7

8

9

10

11

12

13

14

X

3144

1769

2080

3266

2467

2031

2450

3175

2466

2164

3992

4239

2625

2297

Y

507

594

442

570

574

425

560

642

578

322

962

614

512

449


 

Уравнение линейной регрессии имеет  вид:

Y = a0 + a1*t

Параметры уравнения a0 и a1 определим при помощи системы двух нормальных уравнений, отвечающих требованию метода наименьших квадратов.

Система уравнений примет вид:

Построим таблицу предварительных  расчетов:

T

X

Y

Xi * Yi

X2

Y2

1

2

3

4

5

6

1

3144

507

1594008

9884736

257049

2

1769

594

1050786

3129361

352836

3

2080

442

919360

4326400

195364

4

3266

570

1861620

10666756

324900

5

2467

574

1416058

6086089

329476

6

2031

425

863175

4124961

180625

7

2450

560

1372000

6002500

313600

8

3175

642

2038350

10080625

412164

9

2466

578

1425348

6081156

334084

10

2164

322

696808

4682896

103684

11

3992

962

3840304

15936064

925444

12

4239

614

2602746

17969121

376996

13

2625

512

1344000

6890625

262144

14

2297

449

1031353

5276209

201601

ИТОГО:

38165

7751

22055916

111137499

4569967

Информация о работе Контрольная работа по "Статистике"