Контрольная работа по "Статистике"

Автор работы: Пользователь скрыл имя, 05 Февраля 2013 в 17:17, контрольная работа

Описание

В таблицах № 1-8 (Приложение) имеются данные выборочного обследования предприятий. По региону, номер которого соответствует номеру варианта студента, провести группировку предприятий по факторному признаку, разбив совокупность на 4 группы. Результаты группировки представить в сводной таблице. После таблицы представить выводы в письменной форме.
Вывод: существует сильная зависимость между стажем работы и средней заработной платой. Зависимость прямая, т.е. чем выше стаж, тем выше средний заработок.

Работа состоит из  1 файл

Статистика (решение).doc

— 221.00 Кб (Скачать документ)

ЗАДАНИЕ № 1

В таблицах № 1-8 (Приложение) имеются  данные выборочного обследования предприятий. По региону, номер которого соответствует номеру варианта студента, провести группировку предприятий по факторному признаку, разбив совокупность на 4 группы. Результаты группировки представить в сводной таблице. После таблицы представить выводы в письменной форме.

Вывод: существует сильная зависимость между стажем работы и средней заработной платой. Зависимость прямая, т.е. чем выше стаж, тем выше средний заработок.

Регион  №16

Средняя заработная плата

Средний стаж работы, лет

Средняя заработная плата, тыс. руб.

Группы по средней  плате, тыс. руб.

Количество  рабочих, чел.

Средний стаж работы, лет

Средняя заработная плата, тыс. руб.

Всего, тыс. руб.

В среднем одного рабочего в год, тыс.руб.

2

8

от 8  до 10

8

2

8

68,5

8,56

4

8

4

8

13

10

7

8

9

8,5

9

8,5

20

14

10

8,5

   

8

8,5

   

11

9

   

13

10

   

Всего

 

64

68,5

   

16

12

от 10 до 12

4

14

10,5

46,5

11,63

24

15,5

16

12

17

12

17

12

25

15,5

15

12

14

10,5

   
       
   

Всего

 

62

46,5

   

7

8

от 12 до 14

2

18

13

27

13,50

8

8,5

20

14

20

14,5

   

10

8,5

   

11

9

   
   

Всего

 

38

27

   

18

13

от 14 до 16

6

20

14,5

92,5

15,42

23

16

19

15

19

15

24

15,5

26

16

25

15,5

15

12

23

16

   

26

16

   

Всего

 

137

92,5

   

Итого:

   

20 

   

234,5

49,11


 

ЗАДАНИЕ № 2

По результатам группировки (задание №1) рассчитайте среднее  значение факторного признака, а  также  проведите расчет структурных средних величин (моды и медианы). Сделайте выводы.

Мо=10+2*(8-0)/((8-0)*(8-4))=10,5

Больше всего  рабочих имею среднюю заработную плату в 10,5 тыс.руб.

Ме=10+(2*0,5*20-8)/8=11,5

Половина рабочих  имеют средний доход менее 11,5 тыс.руб., а вторая половина более 11,5 тыс.руб.

 

ЗАДАНИЕ № 3

По данным группировки (задание №1) проведите анализ колеблемости результативного признака, рассчитав  показатели вариации. Рассчитайте общую  дисперсию по правилу сложения дисперсий. Сделайте выводы по результатам расчетов.

R=Xmax-Xmin=16-8=8

d=∑|Xi-X|/n=|8,56-2.5|+|11.63-2.5|+|13.5-2.5|+|15.42-2.5|/4=2 тыс. руб.

 

Ϭ=√((8,56-2.5)2+(11.63-2.5)2+(13.5-2.5)2+(15.42-2.5)2/20)=15,8 тыс.руб.

=(8,56-2.5)2+(11.63-2.5)2+(13.5-2.5)2+(15.42-2.5)2/20=20,4 тыс.руб.

 

        ЗАДАНИЕ № 4

По данным таблиц 1 – 8 (Приложение)  в соответствии со своим номером варианта постройте  линейное уравнение регрессии и  оцените тесноту связи между  факторным и результативным признаками с помощью  линейного коэффициента корреляции. Сделайте выводы.

Регион  №16

Средний стаж работы, лет

Средняя заработная плата, тыс. руб.

2

8,0

4

8,0

13

10,0

9

8,5

20

14,0

16

12,0

24

15,5

17

12,0

25

15,5

14

10,5

7

8,0

8

8,5

20

14,5

10

8,5

11

9,0

18

13,0

23

16,0

19

15,0

26

16,0

15

12,0


Выборочные средние:

xср = ∑x/ n = 301 / 20 = 15.05; yср = ∑y/ n = 234.5 / 20 = 11.73; xyср = ∑xiy/ n = 3918 / 20 = 195.9

Выборочные  дисперсии:

S2(x) = ∑x2/ n - x2ср = 5461 / 20 - 15.05= 46.55

S2(y) = ∑y2/ n - y2ср = 2924.75 / 20 - 11.73= 8.76

Коэффициент корреляции rxy = 0.96

Линейное уравнение  регрессии имеет вид y = 0.42 x + 5.44

Коэффициент детерминации R= 0.93

Уравнение парной регрессии.

На основании  поля корреляции можно выдвинуть  гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.

Линейное уравнение  регрессии имеет вид y = bx + a + ε

Система нормальных уравнений.

a•n + b∑x = ∑y

a∑x + b∑x2 = ∑y•x

Для наших данных система  уравнений имеет вид

20a + 301 b = 234.5

301 a + 5461 b  = 3918

Из первого уравнения  выражаем а и подставим во второе уравнение:

Получаем эмпирические коэффициенты регрессии: b = 0.42, a = 5.44

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 0.42 x + 5.44

Эмпирические  коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.

1. Параметры  уравнения регрессии.

Выборочные  средние.

 

 

 

Выборочные  дисперсии:

 

 

Среднеквадратическое отклонение

 

 

1.1. Коэффициент  корреляции

Ковариация.

 

Рассчитываем  показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

 

1.2. Уравнение  регрессии (оценка уравнения регрессии).

 

Линейное уравнение  регрессии имеет вид y = 0.42 x  + 5.44

1.3. Коэффициент  эластичности.

Коэффициент эластичности находится по формуле:

 

 

1.4. Ошибка  аппроксимации.

 

Ошибка аппроксимации  в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

 

1.5. Эмпирическое  корреляционное отношение.

Эмпирическое  корреляционное отношение вычисляется  для всех форм связи и служит для  измерение тесноты зависимости. Изменяется в пределах [0;1].

 

 

где

 

Индекс  корреляции.

Для линейной регрессии  индекс корреляции равен коэфииценту  корреляции rxy = 0.96.

Для любой формы  зависимости теснота связи определяется с помощью множественного коэффициента корреляции:

 

1.6. Коэффициент  детерминации.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= 0.962 = 0.93

Для расчета  параметров линейной регрессии построим расчетную таблицу (табл.)

 

x

y

x2

y2

x • y

y(x)

(yi-ycp)2

(y-y(x))2

(xi-xcp)2

|y - yx|:y

2

8

4

64

16

6.28

13.88

2.98

170.3

0.22

4

8

16

64

32

7.11

13.88

0.79

122.1

0.11

13

10

169

100

130

10.87

2.98

0.75

4.2

0.0869

9

8.5

81

72.25

76.5

9.2

10.4

0.49

36.6

0.0822

20

14

400

196

280

13.79

5.18

0.0432

24.5

0.0148

16

12

256

144

192

12.12

0.0756

0.0148

0.9

0.0101

24

15.5

576

240.25

372

15.46

14.25

0.0014

80.1

0.00241

17

12

289

144

204

12.54

0.0756

0.29

3.8

0.0449

25

15.5

625

240.25

387.5

15.88

14.25

0.14

99

0.0245

14

10.5

196

110.25

147

11.29

1.5

0.62

1.1

0.0749

7

8

49

64

56

8.36

13.88

0.13

64.8

0.0454

8

8.5

64

72.25

68

8.78

10.4

0.0789

49.7

0.033

20

14.5

400

210.25

290

13.79

7.7

0.5

24.5

0.0488

10

8.5

100

72.25

85

9.62

10.4

1.25

25.5

0.13

11

9

121

81

99

10.03

7.43

1.07

16.4

0.11

18

13

324

169

234

12.96

1.63

0.00185

8.7

0.00331

23

16

529

256

368

15.05

18.28

0.91

63.2

0.0597

19

15

361

225

285

13.37

10.73

2.64

15.6

0.11

26

16

676

256

416

16.3

18.28

0.0887

119.9

0.0186

15

12

225

144

180

11.7

0.0756

0.0875

0.0025

0.0247

301

234.5

5461

2924.75

3918

234.5

175.24

12.88

930.95

1.26


2. Оценка  параметров уравнения регрессии.

2.1. Значимость  коэффициента корреляции.

 

По таблице  Стьюдента с уровнем значимости α=0.05 и степенями свободы k=18 находим tкрит:

tкрит (n-m-1;α/2) = (18;0.025) = 2.101

где m = 1 - количество объясняющих переменных.

2.2. Интервальная  оценка для коэффициента корреляции (доверительный интервал).

 

r(0.93;1)

2.3. Анализ  точности определения оценок коэффициентов регрессии.

Несмещенной оценкой  дисперсии возмущений является величина:

 

 

S2y = 0.72 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

 

Sy = 0.85 - стандартная ошибка оценки (стандартная ошибка регрессии).

Sa - стандартное отклонение случайной величины a.

 

 

Sb - стандартное отклонение случайной величины b.

 

 

2.4. Доверительные  интервалы для зависимой переменной.

(a + bxp ± ε)

где

 

Рассчитаем  границы интервала, в котором  будет сосредоточено 95% возможных  значений Y при неограниченно большом числе наблюдений и Xp = 17

 

Индивидуальные  доверительные интервалы для Y при  данном значении X.

(a + bxi ± ε)

где

 

 

tкрит (n-m-1;α/2) = (18;0.025) = 2.101

2.5. Проверка  гипотез относительно коэффициентов  линейного уравнения регрессии.

1) t-статистика. Критерий Стьюдента.

tкрит (n-m-1;α/2) = (18;0.025) = 2.101

 

 

 

 

Доверительный интервал для коэффициентов уравнения  регрессии.

(b - tкрит Sb; b + tкрит Sb)

(a - tкрит Sa; a + tкрит Sa)

2) F-статистика. Критерий Фишера.

 

 

 

Табличное значение критерия со степенями свободы k1=1 и k2=18, Fтабл = 4.41

 

            ЗАДАНИЕ № 5

По данным таблицы 5.1 выбрать ряд динамики для анализа. Номер ряда соответствует порядковому номеру студента в группе.

 Для  всех вариантов:

1) Рассчитать  цепные и базисные показатели  динамики: абсолютный прирост, коэффициент  роста, темп роста, темп прироста, абсолютное значение одного процента прироста. А также средний уровень ряда динамики, средний абсолютный прирост, средний темп роста, средний темп прироста. По результатам расчетов сделать выводы.

2) В ряду динамики  выявить основную тенденцию тремя  способами: укрупнения интервалов, скользящей средней, аналитического выравнивания. По результатам проведения аналитического выравнивания фактические и выровненные уровни ряда изобразить графически. На основе уравнения тренда сделать прогноз на следующие 3 месяца.

 

№ месяца

Вариант №16

Средняя заработная плата, тыс. руб.

∆Y, тыс.руб.

Тр

Тпр

∆1%, тыс.руб.

   

Цеп.

Баз.

Цеп.

Баз.

Цеп.

Баз.

Цеп.

Баз.

Цеп.

Баз.

1.         

8

1

1

1

1

 

1,00

       

2.         

8

0

0

0

0

1,00

1,00

0,00

0,00

   

3.         

10

2

2

-

-

1,25

1,25

0,25

0,25

8,00

8,00

4.         

8,5

-1,50

-0,50

-0,75

-0,50

0,85

1,06

-0,15

0,06

10,00

-8,00

5.         

10

1,50

2,00

-1,00

2,00

1,18

1,25

0,18

0,25

8,50

8,00

6.         

12

2,00

4,00

1,33

4,00

1,20

1,50

0,20

0,50

10,00

8,00

7.         

12,5

0,50

4,50

0,25

4,50

1,04

1,56

0,04

0,56

12,00

8,00

8.         

12

-0,50

4,00

-1,00

4,00

0,96

1,50

-0,04

0,50

12,50

8,00

9.         

12,5

0,50

4,50

-1,00

4,50

1,04

1,56

0,04

0,56

12,00

8,00

10.      

10,5

-2,00

2,50

-4,00

2,50

0,84

1,31

-0,16

0,31

12,50

8,00

11.      

12

1,50

4,00

-0,75

4,00

1,14

1,50

0,14

0,50

10,50

8,00

12.      

12,5

0,50

4,50

0,33

4,50

1,04

1,56

0,04

0,56

12,00

8,00

Итого

128,50

5,50

32,50

-5,58

30,50

11,54

16,06

0,54

4,06

108,00

64,00

Информация о работе Контрольная работа по "Статистике"