Автор работы: Пользователь скрыл имя, 05 Февраля 2013 в 17:17, контрольная работа
В таблицах № 1-8 (Приложение) имеются данные выборочного обследования предприятий. По региону, номер которого соответствует номеру варианта студента, провести группировку предприятий по факторному признаку, разбив совокупность на 4 группы. Результаты группировки представить в сводной таблице. После таблицы представить выводы в письменной форме.
Вывод: существует сильная зависимость между стажем работы и средней заработной платой. Зависимость прямая, т.е. чем выше стаж, тем выше средний заработок.
ЗАДАНИЕ № 1
В таблицах № 1-8 (Приложение) имеются данные выборочного обследования предприятий. По региону, номер которого соответствует номеру варианта студента, провести группировку предприятий по факторному признаку, разбив совокупность на 4 группы. Результаты группировки представить в сводной таблице. После таблицы представить выводы в письменной форме.
Вывод: существует
сильная зависимость между
Регион №16 |
Средняя заработная плата | ||||||
Средний стаж работы, лет |
Средняя заработная плата, тыс. руб. |
Группы по средней плате, тыс. руб. |
Количество рабочих, чел. |
Средний стаж работы, лет |
Средняя заработная плата, тыс. руб. |
Всего, тыс. руб. |
В среднем одного рабочего в год, тыс.руб. |
2 |
8 |
от 8 до 10 |
8 |
2 |
8 |
68,5 |
8,56 |
4 |
8 |
4 |
8 | ||||
13 |
10 |
7 |
8 | ||||
9 |
8,5 |
9 |
8,5 | ||||
20 |
14 |
10 |
8,5 | ||||
8 |
8,5 | ||||||
11 |
9 | ||||||
13 |
10 | ||||||
Всего |
64 |
68,5 |
|||||
16 |
12 |
от 10 до 12 |
4 |
14 |
10,5 |
46,5 |
11,63 |
24 |
15,5 |
16 |
12 | ||||
17 |
12 |
17 |
12 | ||||
25 |
15,5 |
15 |
12 | ||||
14 |
10,5 |
||||||
Всего |
62 |
46,5 |
|||||
7 |
8 |
от 12 до 14 |
2 |
18 |
13 |
27 |
13,50 |
8 |
8,5 |
20 |
14 | ||||
20 |
14,5 |
||||||
10 |
8,5 |
||||||
11 |
9 |
||||||
Всего |
38 |
27 |
|||||
18 |
13 |
от 14 до 16 |
6 |
20 |
14,5 |
92,5 |
15,42 |
23 |
16 |
19 |
15 | ||||
19 |
15 |
24 |
15,5 | ||||
26 |
16 |
25 |
15,5 | ||||
15 |
12 |
23 |
16 | ||||
26 |
16 | ||||||
Всего |
137 |
92,5 |
|||||
Итого: |
20 |
234,5 |
49,11 |
ЗАДАНИЕ № 2
По результатам группировки (задание №1) рассчитайте среднее значение факторного признака, а также проведите расчет структурных средних величин (моды и медианы). Сделайте выводы.
Мо=10+2*(8-0)/((8-0)*(8-4))=
Больше всего рабочих имею среднюю заработную плату в 10,5 тыс.руб.
Ме=10+(2*0,5*20-8)/8=11,5
Половина рабочих имеют средний доход менее 11,5 тыс.руб., а вторая половина более 11,5 тыс.руб.
ЗАДАНИЕ № 3
По данным группировки (задание №1) проведите анализ колеблемости результативного признака, рассчитав показатели вариации. Рассчитайте общую дисперсию по правилу сложения дисперсий. Сделайте выводы по результатам расчетов.
R=Xmax-Xmin=16-8=8
d=∑|Xi-X|/n=|8,56-2.5|+|11.63-
Ϭ=√((8,56-2.5)2+(11.63-2.5)2+(
=(8,56-2.5)2+(11.63-2.5)2+(13.
ЗАДАНИЕ № 4
По данным таблиц 1 – 8 (Приложение) в соответствии со своим номером варианта постройте линейное уравнение регрессии и оцените тесноту связи между факторным и результативным признаками с помощью линейного коэффициента корреляции. Сделайте выводы.
Регион №16 | |
Средний стаж работы, лет |
Средняя заработная плата, тыс. руб. |
2 |
8,0 |
4 |
8,0 |
13 |
10,0 |
9 |
8,5 |
20 |
14,0 |
16 |
12,0 |
24 |
15,5 |
17 |
12,0 |
25 |
15,5 |
14 |
10,5 |
7 |
8,0 |
8 |
8,5 |
20 |
14,5 |
10 |
8,5 |
11 |
9,0 |
18 |
13,0 |
23 |
16,0 |
19 |
15,0 |
26 |
16,0 |
15 |
12,0 |
Выборочные средние:
xср = ∑xi / n = 301 / 20 = 15.05; yср = ∑yi / n = 234.5 / 20 = 11.73; xyср = ∑xiyi / n = 3918 / 20 = 195.9
Выборочные дисперсии:
S2(x) = ∑x2i / n - x2ср = 5461 / 20 - 15.052 = 46.55
S2(y) = ∑y2i / n - y2ср = 2924.75 / 20 - 11.732 = 8.76
Коэффициент корреляции rxy = 0.96
Линейное уравнение регрессии имеет вид y = 0.42 x + 5.44
Коэффициент детерминации R2 = 0.93
Уравнение парной регрессии.
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + ε
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
20a + 301 b = 234.5
301 a + 5461 b = 3918
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.42, a = 5.44
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.42 x + 5.44
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов βi, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
1. Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
1.1. Коэффициент корреляции
Ковариация.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
1.2. Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = 0.42 x + 5.44
1.3. Коэффициент эластичности.
Коэффициент эластичности находится по формуле:
1.4. Ошибка аппроксимации.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
1.5. Эмпирическое корреляционное отношение.
Эмпирическое корреляционное отношение вычисляется для всех форм связи и служит для измерение тесноты зависимости. Изменяется в пределах [0;1].
где
Индекс корреляции.
Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 0.96.
Для любой формы
зависимости теснота связи
1.6. Коэффициент детерминации.
Чаще всего,
давая интерпретацию
R2= 0.962 = 0.93
Для расчета параметров линейной регрессии построим расчетную таблицу (табл.)
x |
y |
x2 |
y2 |
x • y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
(xi-xcp)2 |
|y - yx|:y |
2 |
8 |
4 |
64 |
16 |
6.28 |
13.88 |
2.98 |
170.3 |
0.22 |
4 |
8 |
16 |
64 |
32 |
7.11 |
13.88 |
0.79 |
122.1 |
0.11 |
13 |
10 |
169 |
100 |
130 |
10.87 |
2.98 |
0.75 |
4.2 |
0.0869 |
9 |
8.5 |
81 |
72.25 |
76.5 |
9.2 |
10.4 |
0.49 |
36.6 |
0.0822 |
20 |
14 |
400 |
196 |
280 |
13.79 |
5.18 |
0.0432 |
24.5 |
0.0148 |
16 |
12 |
256 |
144 |
192 |
12.12 |
0.0756 |
0.0148 |
0.9 |
0.0101 |
24 |
15.5 |
576 |
240.25 |
372 |
15.46 |
14.25 |
0.0014 |
80.1 |
0.00241 |
17 |
12 |
289 |
144 |
204 |
12.54 |
0.0756 |
0.29 |
3.8 |
0.0449 |
25 |
15.5 |
625 |
240.25 |
387.5 |
15.88 |
14.25 |
0.14 |
99 |
0.0245 |
14 |
10.5 |
196 |
110.25 |
147 |
11.29 |
1.5 |
0.62 |
1.1 |
0.0749 |
7 |
8 |
49 |
64 |
56 |
8.36 |
13.88 |
0.13 |
64.8 |
0.0454 |
8 |
8.5 |
64 |
72.25 |
68 |
8.78 |
10.4 |
0.0789 |
49.7 |
0.033 |
20 |
14.5 |
400 |
210.25 |
290 |
13.79 |
7.7 |
0.5 |
24.5 |
0.0488 |
10 |
8.5 |
100 |
72.25 |
85 |
9.62 |
10.4 |
1.25 |
25.5 |
0.13 |
11 |
9 |
121 |
81 |
99 |
10.03 |
7.43 |
1.07 |
16.4 |
0.11 |
18 |
13 |
324 |
169 |
234 |
12.96 |
1.63 |
0.00185 |
8.7 |
0.00331 |
23 |
16 |
529 |
256 |
368 |
15.05 |
18.28 |
0.91 |
63.2 |
0.0597 |
19 |
15 |
361 |
225 |
285 |
13.37 |
10.73 |
2.64 |
15.6 |
0.11 |
26 |
16 |
676 |
256 |
416 |
16.3 |
18.28 |
0.0887 |
119.9 |
0.0186 |
15 |
12 |
225 |
144 |
180 |
11.7 |
0.0756 |
0.0875 |
0.0025 |
0.0247 |
301 |
234.5 |
5461 |
2924.75 |
3918 |
234.5 |
175.24 |
12.88 |
930.95 |
1.26 |
2. Оценка
параметров уравнения
2.1. Значимость коэффициента корреляции.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=18 находим tкрит:
tкрит (n-m-1;α/2) = (18;0.025) = 2.101
где m = 1 - количество объясняющих переменных.
2.2. Интервальная
оценка для коэффициента
r(0.93;1)
2.3. Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2y = 0.72 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
Sy = 0.85 - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
2.4. Доверительные
интервалы для зависимой
(a + bxp ± ε)
где
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 17
Индивидуальные доверительные интервалы для Y при данном значении X.
(a + bxi ± ε)
где
tкрит (n-m-1;α/2) = (18;0.025) = 2.101
2.5. Проверка
гипотез относительно
1) t-статистика. Критерий Стьюдента.
tкрит (n-m-1;α/2) = (18;0.025) = 2.101
Доверительный интервал для коэффициентов уравнения регрессии.
(b - tкрит Sb; b + tкрит Sb)
(a - tкрит Sa; a + tкрит Sa)
2) F-статистика. Критерий Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=18, Fтабл = 4.41
ЗАДАНИЕ № 5
По данным таблицы 5.1 выбрать ряд динамики для анализа. Номер ряда соответствует порядковому номеру студента в группе.
Для всех вариантов:
1) Рассчитать
цепные и базисные показатели
динамики: абсолютный прирост,
2) В ряду динамики
выявить основную тенденцию
№ месяца |
Вариант №16 | ||||||||||
Средняя заработная плата, тыс. руб. |
∆Y, тыс.руб. |
Kр |
Тр |
Тпр |
∆1%, тыс.руб. | ||||||
Цеп. |
Баз. |
Цеп. |
Баз. |
Цеп. |
Баз. |
Цеп. |
Баз. |
Цеп. |
Баз. | ||
1. |
8 |
1 |
1 |
1 |
1 |
1,00 |
|||||
2. |
8 |
0 |
0 |
0 |
0 |
1,00 |
1,00 |
0,00 |
0,00 |
||
3. |
10 |
2 |
2 |
- |
- |
1,25 |
1,25 |
0,25 |
0,25 |
8,00 |
8,00 |
4. |
8,5 |
-1,50 |
-0,50 |
-0,75 |
-0,50 |
0,85 |
1,06 |
-0,15 |
0,06 |
10,00 |
-8,00 |
5. |
10 |
1,50 |
2,00 |
-1,00 |
2,00 |
1,18 |
1,25 |
0,18 |
0,25 |
8,50 |
8,00 |
6. |
12 |
2,00 |
4,00 |
1,33 |
4,00 |
1,20 |
1,50 |
0,20 |
0,50 |
10,00 |
8,00 |
7. |
12,5 |
0,50 |
4,50 |
0,25 |
4,50 |
1,04 |
1,56 |
0,04 |
0,56 |
12,00 |
8,00 |
8. |
12 |
-0,50 |
4,00 |
-1,00 |
4,00 |
0,96 |
1,50 |
-0,04 |
0,50 |
12,50 |
8,00 |
9. |
12,5 |
0,50 |
4,50 |
-1,00 |
4,50 |
1,04 |
1,56 |
0,04 |
0,56 |
12,00 |
8,00 |
10. |
10,5 |
-2,00 |
2,50 |
-4,00 |
2,50 |
0,84 |
1,31 |
-0,16 |
0,31 |
12,50 |
8,00 |
11. |
12 |
1,50 |
4,00 |
-0,75 |
4,00 |
1,14 |
1,50 |
0,14 |
0,50 |
10,50 |
8,00 |
12. |
12,5 |
0,50 |
4,50 |
0,33 |
4,50 |
1,04 |
1,56 |
0,04 |
0,56 |
12,00 |
8,00 |
Итого |
128,50 |
5,50 |
32,50 |
-5,58 |
30,50 |
11,54 |
16,06 |
0,54 |
4,06 |
108,00 |
64,00 |