Анализ статистической совокупности по показателю

Автор работы: Пользователь скрыл имя, 05 Января 2011 в 11:43, курсовая работа

Описание

В данном курсовом проекте была произведена обработка и анализ статистических данных, полученных в результате статистического наблюдения над показателем, который характеризует оборот розничной торговли в 2009г. Для исследования статистических данных были использованы следующие статистические методы: вариационный анализ, проверка гипотезы о нормальном распределении, используя критерий Пирсона, корреляционно-регрессионный анализ, анализ рядов динамики, проведена собственно-случайная бесповторная выборка.
Цель курсовой работы заключается в освоении инструментов статистики для дальнейшего применения их в решении управленческих задач.

Содержание

ВВЕДЕНИЕ 4
1 Сводка и группировка данных статистического наблюдения 5
2 Вариационный анализ 12
3 Моделирование ряда распределения 17
4 Корреляционный анализ 20
5 Оценка параметров генеральной совокупности на основе выборочных данных 29
6 Показатели ряда динамики и тенденции динамики 34
ЗАКЛЮЧЕНИЕ 42
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 43
ПРИЛОЖЕНИЕ А 44
ПРИЛОЖЕНИЕ Б 45
ПРИЛОЖЕНИЕ В 47
ПРИЛОЖЕНИЕ Г 62
ПРИЛОЖЕНИЕ Д 63

Работа состоит из  1 файл

Курсовая.docx

— 272.13 Кб (Скачать документ)

     Для однородности ряда, исключим один из регионов: г.Москва.

     На  этот раз возьмем за минимальное  значение 3479,  максимальное 887417. Длину интервала возьмем 115000.

 

     

     Таблица 2.2-Сгруппированные исходные данные

            Значение  оборота розничной торговли Количество  регионов
            3000-118000 53
            118000-233000 15
            233000-348000 6
            348000-463000 5
            463000-578000 2
            578000-693000 1
            693000-808000 -
            808000-923000 1
            Итого: 82

   Для однородности ряда, исключим регион: Московская область.

   Снова определим длину интервала по формуле Стержесса. Полученное значение 7.33, следовательно, будет 8 интервалов. Минимальное значение равно 3479,  максимальное 582235. Длину интервала возьмем за 75000.

     Таблица 2.3-Сгруппированные исходные данные

            Значение  оборота розничной торговли Количество  регионов
            3000-78000 34
            78000-153000 25
            153000-228000 8
            228000-303000 5
            303000-378000 3
            378000-453000 3
            453000-528000 2
            528000-603000 1
            Итого: 81

       
 
 
 
 

     Рисунок 2.1-Распределение регионов по показателю оборот розничной торговли

     

   Анализируя  диаграмму можно выявить, что  распределение не подчиняется нормальному  закону. Явно выражена правосторонняя асимметрия, из чего можно сказать, что большинство значений признака сконцентрировано слева от средней величины и имеет значение, меньшее, чем средняя. По гистограмме можно приблизительно определить моду, значение которой попадает в правый край первого интервала и приблизительно составляет 62000.

   Рисунок 2.2- Кумулята и Огива

   

   Рассчитаем  показатели вариации (приложение А), полученные результаты представим в таблице:

     Таблица 2.4 - Показатели вариации

Показатель Значение
Среднее значение (млн. руб) 134944,4
Мода (млн. руб) 62302,32
Медиана (млн. руб) 97500
Размах  вариации (млн. руб) 578756
Среднее линейное отклонение  
(млн. руб)
91289,42
Среднее квадратическое отклонение (млн. руб) 122914,7
Дисперсия (млн. руб)2 15108024691
Относительный размах вариации (…) 4,29
Относительное линейное отклонение % 0,68
Коэффициент вариации % 0,91
Коэффициент асимметрии % 1,63
Коэффициент эксцесса % 2,11
 

   Проанализировав таблицу можно сделать следующие  выводы:

   В среднем по России оборот розничной  торговли составил  134944,4. Медиана равна 97500, это значит что, половина единиц совокупности имеет значение показателя ниже медианного, а вторая половина – больше. Мода равна 62302,32,  она указывает на наиболее часто встречающееся значение признака, но так ряд интервальный следует сказать, что вокруг данного значения сконцентрировано наибольшее число регионов. В рассматриваемой совокупности имеет место соотношение: Xср>Me>Mo, что обусловлено выраженной правосторонней асимметрии. Таким образом, нельзя утверждать, что распределение подчиняется нормальному закону.

   Размах  вариации равен 578756, но он дает лишь общее представление о размахе вариации, т.к. показывает только разницу между крайними значениями. Относительный размах вариации равен 4,29. Отсюда можно сделать вывод, что так как значение размаха вариации достаточно велико и относительный размах вариации намного больше единицы, большинство значений колеблются в большом интервале.

   Среднее линейное отклонение составило 91289,42. В среднем на это значение отклоняется значение показателя от средней величины. Среднее квадратическое отклонение равно 122914,7.

   Дисперсия – это средний квадрат отклонений индивидуальных значений признака от их средней величины, она равна 15108024691.

   Относительное линейное отклонение, равное 0,68, показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 68%.

   Коэффициент Асимметрии равен 1,63. Это говорит о правосторонней асимметрии, и большинство значений признака имеет значение ниже среднего.

   Показатель  эксцесса положительный (2,11), это свидетельствует о слабой вариации. Хвосты распределения «легче», а пик острее, чем у нормального распределения.

 

   

      Моделирование ряда распределения

   В законе о нормальном характере распределения показателя выражается закономерность взаимодействия множества случайных величин, не имеющих преобладающего влияния друг на друга. Проверка распределения на выполнение закона о нормальном распределении помогает определить его характер и свойства. Для проверки гипотезы о нормальном характере распределения рассматриваемого признака используем критерий Пирсона. Необходимо рассчитать и оценить отклонения фактических значений частот появления признака от тех значений, которые могли бы быть в случае нормального распределения (теоретическая частота).

     Таблица 3.1-Расчет данных для определения критерия Пирсона

Интервал Середина интервала fф t f(t)
3000-78000 40500 34 -0,77 0,2966 15
78000-153000 115500 25 -0,16 0,3939 19
153000-228000 190500 8 0,45 0,3605 18
228000-303000 265500 5 1,06 0,2275 11
303000-378000 340500 3 1,67 0,0989 5
378000-453000 415500 3 2,28 0,0355 2
453000-528000 490500 2 2,89 0,0061 0
528000-603000 565500 1 3,50 0,0009 0

   Видно, что для последних двух интервалов округленная теоретическая частота, статистически незначима.  Для интервала 378000-453000 теоретическая частота равна 2, что тоже достаточно невысокий показатель. Объединим последние 4 интервала в один. Так же необходимо заново рассчитать среднюю величину и среднее квадратическое отклонение они равны 138185,18 и 111542,54 соответственно. 

     Таблица 3.2-Расчет данных для определения критерия Пирсона

Интервал Середина интервала fф t f(t)
3000-78000 40500 34 -0,88 0,2709 15
78000-153000 115500 25 -0,20 0,391 21
153000-228000 190500 8 0,47 0,3572 19
228000-303000 265500 5 1,14 0,2083 11
303000-603000 453000 9 2,82 0,0075 0
 

   Для интервала 303000-603000 теоретическая частота равна 0. Объединим его с предыдущим интервалом. Средняя величина равна 143277,78 СКО равно 137529,57.

     Таблица 3.3-Расчет данных для определения критерия Пирсона

Интервал Середина интервала fф t f(t)
 
 
3000-78000 40500 34 -0,75 0,3011 13 441 33,16
78000-153000 115500 25 -0,20 0,391 17 64 3,71
153000-228000 190500 8 0,34 0,3765 17 81 4,87
228000-60300 415500 14 1,98 0,0562 12 4 0,32
 

   В данной таблице отсутвуют статистически  не значимые величины, следовательно, можно рассчитать c2. Полученное значение критерия Пирсона равно 42,26. Определяем теоретическое значение критерия Пирсона по таблице «Распределение Пирсона» на основании уровня значимости α = 0,05 и значения d.f. равного числу интервалов минус 3, в нашем случае равном единице. Табличное значение c2 равно 3,841. Итак, расчетное значение критерия Пирсона c2 больше теоретического, значит, гипотеза о нормальном характере распределения не подтверждается.

Корреляционный  анализ

     Задача  корреляционного анализа – установить связь между двумя признаками, факторным и результативным. Для  нашего случая мы будем рассматривать  связь показателя ««Оборот розничной торговли по субъектам Российской Федерации в 2008 году, миллионов рублей» с такими показателями как «Численность экономически активного населения, занятого в экономике по субъектам Российской Федерации в 2008 году, тыс. человек» и «Распределение предприятий и организаций по субъектам Российской Федерации»

    1. Взаимосвязь с показателем: «Численность экономически активного населения, занятого в экономике, тыс. человек»

     Здесь факторным признаком выступает  показатель  «Численность экономически активного населения, занятого в экономике по субъектам Российской Федерации в 2008 году, тыс. человек», а результативным - «Оборот розничной торговли по субъектам Российской Федерации в 2008 году, миллионов рублей».

       Используя данные об индивидуальных значениях факторного признака и соответствующих ему значения результативного признака строим в прямоугольных координатах точечный график – поле корреляции. 

     Рисунок 4.1 - Поле корреляции. Взаимодействие показателей: оборот розничной торговли и численность экономически активного населения, занятого в экономике

    Учитывая большой отрыв значения показателя «Численность экономически активного населения, занятого в экономике по субъектам Российской Федерации в 2008 году, тыс. человек» для Москвы от основной массы значений, мы приняли решение исключить данный субъект из анализа.

Таким образом  поле корреляции принимает вид:

Информация о работе Анализ статистической совокупности по показателю