Статистика регионов РФ

Автор работы: Пользователь скрыл имя, 24 Июля 2011 в 19:21, контрольная работа

Описание

Структурную равноинтервальную группировку по обоим признакам. Если вариация группировочного признака значительна, то при построении группировки по признаку № 1 необходимо определить оптимальное число равноинтервальных групп, а по признаку № 2 разбить совокупность на четыре группы. При небольшом числе вариант признака, положенного в основу группировки, каждая варианта представляет отдельную группу. результаты группировки необходимо представить в таблице и сделать выводы.

Содержание

Задание №1 3

Задание №2 8

Задание №3 27

Задание №4 32

Задание №5 46

Список литературы 52

Работа состоит из  1 файл

Статистика.doc

— 1.27 Мб (Скачать документ)

      

       

       

       

           Для того чтобы вычислить  внутригрупповую дисперсию необходимо найти дисперсию по каждой из четырёх групп:

           

           

           

           

           

           Теперь мы можем  сосчитать внутригрупповую дисперсию:

           

           

           На основе дисперсионного анализа определяют силу связимежду факторным и результативным признаком. Для этого используется эмпирический коэффициент детерминации , а на основе его рассчитывают эмпирическое корреляционное соотношение . Из чего можно сделать вывод, что связь между признаками носит умеренный характер (по соотношению Чеддоко).

           4.  Для определения параметров уравнения линейной регрессии строим расчетную таблицу 2.6.

           Пусть - среднемесячная номинальная начисленная заработная плата работников организации,

                           - число собственных легковых автомобилей.

    Таблица 2.7.

№ наблюдения Число собственных  легковых автомобилей на 1000 человек  населения, у  Среднемесячная  номинальная заработная плата работников организаций, тыс.руб.

х

Мурманская  область 185,3 23,76 564,538 4402,728 34336,090
Новгородская  область 196,7 13,69 187,416 2692,823 38690,890
Псковская область 202,4 11,38 129,504 2303,312 40965,760
Республика  Дагестан 67,9 7,60 57,760 516,040 4610,410
Кабардино-Балкарская Республика 138,6 9,03 81,541 1251,558 19209,960
Краснодарский край 238,6 13,16 173,186 3139,976 56929,960
Ставропольский  край 206,2 11,11 123,432 2290,882 42518,440
Астраханская  область 203,7 12,34 152,276 2513,658 41493,690
Волгоградская область 189,8 12,0 144,000 2277,600 36024,040
Ростовская  область 209,1 12,5 156,250 2613,750 43722,810
Продолжение таблицы 2.7.
Республика Башкортостан 218,5 14,0 196,000 3059,000 47742,250
Республика  Мордовия 156,1 10,5 110,250 1639,050 24367,210
Республика  Татарстан 185,6 14,9 222,010 2765,440 34447,360
Удмуртская  Республика 182,8 12,2 148,840 2230,160 33415,840
Чувашская Республика 124,9 11,1 123,210 1386,390 15600,010
Пермский  край 178,6 14,8 219,040 2643,280 31897,960
Кировская область 177,8 10,9 118,810 1938,020 31612,840
Нижегородская область 185,6 13,5 182,250 2505,600 34447,360
оренбургская  область 218,0 12,1 146,410 2637,800 47524,000
Пензенская  область 180,3 11,7 136,890 2109,510 32508,090
Самарская область 234,1 14,7 216,090 3441,270 54802,810
Ульяновская область 183,3 10,9 118,810 1997,970 33598,890
Курганская  область 211,4 11,3 127,690 2388,820 44689,960
Свердловская область 234,6 17,5 306,250 4105,500 55037,160
Тюменская область 252,7 33,8 1142,440 8541,260 63857,290
Челябинская область 202,9 14,8 219,040 3002,920 41168,410
Алтайский край 193,9 9,7 94,090 1880,830 37597,210
Забайкальский край 188,8 15,1 228,010 2850,880 35645,440
Красноярский  край 208,3 18,9 357,210 3936,870 43388,890
Иркутская область 183,9 8,3 68,890 1526,370 33819,210
Итого: 5740,4 407,27 6252,132 80589,267 1135670,240
Среднее значение: 191,347 13,576 208,404 2686,309 37855,675

         Предположим, что связь между признаками выражается через линейную функцию . Тогда для того, чтобы составить уравнение регрессии нам необходимо найти параметры a0 и а1, что можно сделать на основе системы нормальных уравнений:

         

         

         

         

         

         

         

         Получено  уравнение регрессии:  .

         С увеличением среднемесячной номинальной начисленной заработной платы работников организации на 1 тыс.руб., число собственных легковых автомобилей уменьшается на 3,678 авт. на 1000 человек населения.

         3. Для оценки тесноты связи рассчитаем  линейный коэффициент парной  корреляции:

                      

         

         

        

           Коэффициент детерминации:

     

           Коэффициент корреляции, равный 0,512, показывает, что между рассматриваемыми признаками существует умеренная взаимосвязь, поскольку . Коэффициент детерминации, равный 0,262, устанавливает, что вариация числа собственных автомобилей на 26,2% из 100% предопределена вариацией среднемесячной заработной платой; роль прочих факторов, влияющих на числа собственных легковых автомобилей, определяется в 73,8%.

Рис. 2.5.

           Вывод: Колеблемости признака в совокупности признак-фактора составляет 34%, признак-результата – 18,2%. Внутригрупповая дисперсия, отражающая влияние неучтенных причин вариации признака-результата меньше чем, межгрупповая дисперсия, которая объясняется влиянием рассматриваемого признака-фактора. 

           Задание № 3.

           1.Используя результаты  расчетов, выполненных в задании  2 курсовой работы по признаку 1, и полагая, что эти данные получены при помощи собственно-случайного 40% бесповторного отбора, определить:

           а) пределы, за которые  с доверительной вероятностью 0,954 не выйдет среднее значение признака, рассчитанное по генеральной совокупности;

           б) как нужно изменить объем выборки, чтобы снизить предельную ошибку средней величины на 50%.

           2. Используя результаты расчетов, выполненных в задании № 2 курсовой работы по признаку 2 и полагая, что эти данные получены при помощи повторного отбора, определить:

           а) пределы, за которые  в генеральной совокупности не выйдет значение доли предприятий, у которых индивидуальные значения признака превышают моду (уровень доверительной вероятности установите по своему усмотрению);

           б) как изменить объем выборки, чтобы снизить предельную ошибку доли на 30%.

           Решение:

           1. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода отбора.

           При бесповторном отборе, при котором повторное попадание  в выборку одних и тех же единиц исключено, средняя ошибка выборки  определяется следующим образом:

           

           Средняя ошибка выборки для признака № 1:

            (авт.)

           Т.к. величина выборки: n = 30 регионов – 40%

           Значит: N = 75 регионов – 100%

           Теория устанавливает  соотношение между предельной и  средней ошибкой выборки, гарантируемое  с некоторой вероятностью:

           ∆ = µ * t, где

           ∆ - предельная ошибка выборки

           µ - средняя ошибка выборки

           t - коэффициент доверия.

           При этом, коэффициент  доверия определяется в зависимости  от того, с какой достоверной вероятностью надо гарантировать результаты выборочного  исследования. Для определения коэффициента доверия пользуются готовыми таблицами. Некоторые наиболее часто встречающиеся значения этого коэффициента приведены ниже:

           Таблица3.1.

Доверительная вероятность Коэффициент доверия
0,683 1
0,954 2
0,990 2,5
0,997 3
 

           Предельная  ошибка выборки для признак-фактора

           ∆ = 3,789*2 = 7,521 авт.

           Таким образом, границы  доверительного интервала признак  фактора могут быть представлены как:

           

    ,

           то есть

    ,где

            – среднее значение переменной в выборке (выборочное среднее)

               - среднее генеральной совокупности.

           Границы доверительного интервала признак-фактора могут  быть определены:

           

    ,

           то есть

    , или

           Вывод: На основании проведённого выборочного обследования с вероятностью 0,954 можно заключить, что средние количество легковых автомобилей на 1000 человек населения, колеблется от 180 до 196 машин на 1000 человек населения.

           б) Чтобы снизить предельную ошибку средней величины на 50% (в 2 раза) необходимо, чтобы предельная ошибка выборки (∆) уменьшилась в два раза, поэтому необходимая численность выборки составит:

           

            регионов

           Следовательно, снизить  предельную ошибку средней величины на 50% для данной совокупности невозможно, поскольку необходимая численность выборки должна составлять 30 регионов, что соответствует первоначальным условиям задания.

           2. а) Возможные расхождения между характеристиками выборочной и генеральной совокупности измеряются средней ошибкой выборки, которая представляет собой среднее квадратическое отклонение возможных значений выборочных характеристик (оценок) от генеральных. Она определяется в зависимости от метода обора.

           Доля альтернативного  признака в выборочной совокупности определяется по формуле:

           w = m / n, где

           m – число элементов совокупности, которые больше моды (мода=12,59 тыс.руб.: Мурманская область, Новгородская область, Краснодарский край, Астраханская область, Волгоградская область, Ростовская область, Республика Башкортостан, Республика Татарстан, Удмуртская республика, Пермский край, Нижегородская область, Оренбургская область, Пензенская область, Самарская область, Свердловская область, Тюменская область, Челябинская область, Забайкальский край, Красноярский край, m =19 ).

           n – объем выборочной совокупности

           w = 19 / 30 = 0,63*100%=63%

           При повторном отборе, когда каждая отобранная и обследованная  единица возвращается в генеральную  совокупность, где ей опять предоставляется  возможность попасть в выборку, средняя ошибка выборки определяется следующим образом:

           

           

           

           Теория устанавливает  соотношения между предельной и  средней ошибкой выборки, гарантируемая  с некоторой вероятностью. Выберем  доверительную вероятность 0,954. Значит, коэффициент доверия равен 2.

           ∆ = µ * t, где

           ∆ - предельная ошибка выборки

           µ - средняя ошибка выборки

           t - коэффициент доверия.

           ∆ =0,088*2= 0,176

           Определим пределы, за которые не выйдет значение доли регионов, в которых среднемесячная номинальная начисленная заработная плата работников организаций выше моды:

           

           

           

           Вывод: С вероятностью 0,954 можно утверждать, что доля регионов, в которых среднемесячная номинальная начисленная заработная плата выше 11,53 тыс. руб., в общем числе регионов находится в пределах от 45% до 81%.

           б) При повторном отборе необходимая  численность выборки:

           

Информация о работе Статистика регионов РФ