Автор работы: Пользователь скрыл имя, 24 Июля 2011 в 19:21, контрольная работа
Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу. результаты группировки необходимо представить в таблице и сделать выводы.
Задание №1 3
Задание №2 8
Задание №3 27
Задание №4 32
Задание №5 46
Список литературы 52
Для того чтобы вычислить
внутригрупповую дисперсию
Теперь мы можем
сосчитать внутригрупповую
На основе дисперсионного анализа определяют силу связимежду факторным и результативным признаком. Для этого используется эмпирический коэффициент детерминации , а на основе его рассчитывают эмпирическое корреляционное соотношение . Из чего можно сделать вывод, что связь между признаками носит умеренный характер (по соотношению Чеддоко).
4. Для определения параметров уравнения линейной регрессии строим расчетную таблицу 2.6.
Пусть - среднемесячная номинальная начисленная заработная плата работников организации,
- число собственных легковых автомобилей.
Таблица 2.7.
№ наблюдения | Число собственных легковых автомобилей на 1000 человек населения, у | Среднемесячная
номинальная заработная плата работников
организаций, тыс.руб.
х |
|||
Мурманская область | 185,3 | 23,76 | 564,538 | 4402,728 | 34336,090 |
Новгородская область | 196,7 | 13,69 | 187,416 | 2692,823 | 38690,890 |
Псковская область | 202,4 | 11,38 | 129,504 | 2303,312 | 40965,760 |
Республика Дагестан | 67,9 | 7,60 | 57,760 | 516,040 | 4610,410 |
Кабардино-Балкарская Республика | 138,6 | 9,03 | 81,541 | 1251,558 | 19209,960 |
Краснодарский край | 238,6 | 13,16 | 173,186 | 3139,976 | 56929,960 |
Ставропольский край | 206,2 | 11,11 | 123,432 | 2290,882 | 42518,440 |
Астраханская область | 203,7 | 12,34 | 152,276 | 2513,658 | 41493,690 |
Волгоградская область | 189,8 | 12,0 | 144,000 | 2277,600 | 36024,040 |
Ростовская область | 209,1 | 12,5 | 156,250 | 2613,750 | 43722,810 |
Продолжение таблицы 2.7. | |||||
Республика Башкортостан | 218,5 | 14,0 | 196,000 | 3059,000 | 47742,250 |
Республика Мордовия | 156,1 | 10,5 | 110,250 | 1639,050 | 24367,210 |
Республика Татарстан | 185,6 | 14,9 | 222,010 | 2765,440 | 34447,360 |
Удмуртская Республика | 182,8 | 12,2 | 148,840 | 2230,160 | 33415,840 |
Чувашская Республика | 124,9 | 11,1 | 123,210 | 1386,390 | 15600,010 |
Пермский край | 178,6 | 14,8 | 219,040 | 2643,280 | 31897,960 |
Кировская область | 177,8 | 10,9 | 118,810 | 1938,020 | 31612,840 |
Нижегородская область | 185,6 | 13,5 | 182,250 | 2505,600 | 34447,360 |
оренбургская область | 218,0 | 12,1 | 146,410 | 2637,800 | 47524,000 |
Пензенская область | 180,3 | 11,7 | 136,890 | 2109,510 | 32508,090 |
Самарская область | 234,1 | 14,7 | 216,090 | 3441,270 | 54802,810 |
Ульяновская область | 183,3 | 10,9 | 118,810 | 1997,970 | 33598,890 |
Курганская область | 211,4 | 11,3 | 127,690 | 2388,820 | 44689,960 |
Свердловская область | 234,6 | 17,5 | 306,250 | 4105,500 | 55037,160 |
Тюменская область | 252,7 | 33,8 | 1142,440 | 8541,260 | 63857,290 |
Челябинская область | 202,9 | 14,8 | 219,040 | 3002,920 | 41168,410 |
Алтайский край | 193,9 | 9,7 | 94,090 | 1880,830 | 37597,210 |
Забайкальский край | 188,8 | 15,1 | 228,010 | 2850,880 | 35645,440 |
Красноярский край | 208,3 | 18,9 | 357,210 | 3936,870 | 43388,890 |
Иркутская область | 183,9 | 8,3 | 68,890 | 1526,370 | 33819,210 |
Итого: | 5740,4 | 407,27 | 6252,132 | 80589,267 | 1135670,240 |
Среднее значение: | 191,347 | 13,576 | 208,404 | 2686,309 | 37855,675 |
Предположим, что связь между признаками выражается через линейную функцию . Тогда для того, чтобы составить уравнение регрессии нам необходимо найти параметры a0 и а1, что можно сделать на основе системы нормальных уравнений:
Получено уравнение регрессии: .
С увеличением среднемесячной номинальной начисленной заработной платы работников организации на 1 тыс.руб., число собственных легковых автомобилей уменьшается на 3,678 авт. на 1000 человек населения.
3.
Для оценки тесноты связи
Коэффициент детерминации:
Коэффициент корреляции, равный 0,512, показывает, что между рассматриваемыми признаками существует умеренная взаимосвязь, поскольку . Коэффициент детерминации, равный 0,262, устанавливает, что вариация числа собственных автомобилей на 26,2% из 100% предопределена вариацией среднемесячной заработной платой; роль прочих факторов, влияющих на числа собственных легковых автомобилей, определяется в 73,8%.
Рис. 2.5.
Вывод:
Колеблемости признака в совокупности
признак-фактора составляет 34%, признак-результата
– 18,2%. Внутригрупповая дисперсия, отражающая
влияние неучтенных причин вариации признака-результата
меньше чем, межгрупповая дисперсия, которая
объясняется влиянием рассматриваемого
признака-фактора.
Задание № 3.
1.Используя результаты расчетов, выполненных в задании 2 курсовой работы по признаку 1, и полагая, что эти данные получены при помощи собственно-случайного 40% бесповторного отбора, определить:
а) пределы, за которые с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности;
б) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.
2. Используя результаты расчетов, выполненных в задании № 2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:
а) пределы, за которые в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду (уровень доверительной вероятности установите по своему усмотрению);
б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 30%.
Решение:
1. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода отбора.
При бесповторном отборе,
при котором повторное
Средняя ошибка выборки для признака № 1:
(авт.)
Т.к. величина выборки: n = 30 регионов – 40%
Значит: N = 75 регионов – 100%
Теория устанавливает соотношение между предельной и средней ошибкой выборки, гарантируемое с некоторой вероятностью:
∆ = µ * t, где
∆ - предельная ошибка выборки
µ - средняя ошибка выборки
t - коэффициент доверия.
При этом, коэффициент
доверия определяется в зависимости
от того, с какой достоверной
Таблица3.1.
Доверительная вероятность | Коэффициент доверия |
0,683 | 1 |
0,954 | 2 |
0,990 | 2,5 |
0,997 | 3 |
Предельная ошибка выборки для признак-фактора
∆ = 3,789*2 = 7,521 авт.
Таким образом, границы доверительного интервала признак фактора могут быть представлены как:
то есть
– среднее значение переменной в выборке (выборочное среднее)
- среднее генеральной совокупности.
Границы доверительного
интервала признак-фактора
то есть
Вывод: На основании проведённого выборочного обследования с вероятностью 0,954 можно заключить, что средние количество легковых автомобилей на 1000 человек населения, колеблется от 180 до 196 машин на 1000 человек населения.
б) Чтобы снизить предельную ошибку средней величины на 50% (в 2 раза) необходимо, чтобы предельная ошибка выборки (∆) уменьшилась в два раза, поэтому необходимая численность выборки составит:
регионов
Следовательно, снизить предельную ошибку средней величины на 50% для данной совокупности невозможно, поскольку необходимая численность выборки должна составлять 30 регионов, что соответствует первоначальным условиям задания.
2. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода обора.
Доля альтернативного признака в выборочной совокупности определяется по формуле:
w = m / n, где
m – число элементов совокупности, которые больше моды (мода=12,59 тыс.руб.: Мурманская область, Новгородская область, Краснодарский край, Астраханская область, Волгоградская область, Ростовская область, Республика Башкортостан, Республика Татарстан, Удмуртская республика, Пермский край, Нижегородская область, Оренбургская область, Пензенская область, Самарская область, Свердловская область, Тюменская область, Челябинская область, Забайкальский край, Красноярский край, m =19 ).
n – объем выборочной совокупности
w = 19 / 30 = 0,63*100%=63%
При повторном отборе, когда каждая отобранная и обследованная единица возвращается в генеральную совокупность, где ей опять предоставляется возможность попасть в выборку, средняя ошибка выборки определяется следующим образом:
Теория устанавливает соотношения между предельной и средней ошибкой выборки, гарантируемая с некоторой вероятностью. Выберем доверительную вероятность 0,954. Значит, коэффициент доверия равен 2.
∆ = µ * t, где
∆ - предельная ошибка выборки
µ - средняя ошибка выборки
t - коэффициент доверия.
∆ =0,088*2= 0,176
Определим пределы, за которые не выйдет значение доли регионов, в которых среднемесячная номинальная начисленная заработная плата работников организаций выше моды:
Вывод: С вероятностью 0,954 можно утверждать, что доля регионов, в которых среднемесячная номинальная начисленная заработная плата выше 11,53 тыс. руб., в общем числе регионов находится в пределах от 45% до 81%.
б) При повторном отборе необходимая численность выборки: