Автор работы: Пользователь скрыл имя, 05 Января 2011 в 11:43, курсовая работа
В данном курсовом проекте была произведена обработка и анализ статистических данных, полученных в результате статистического наблюдения над показателем, который характеризует оборот розничной торговли в 2009г. Для исследования статистических данных были использованы следующие статистические методы: вариационный анализ, проверка гипотезы о нормальном распределении, используя критерий Пирсона, корреляционно-регрессионный анализ, анализ рядов динамики, проведена собственно-случайная бесповторная выборка.
Цель курсовой работы заключается в освоении инструментов статистики для дальнейшего применения их в решении управленческих задач.
ВВЕДЕНИЕ 4
1 Сводка и группировка данных статистического наблюдения 5
2 Вариационный анализ 12
3 Моделирование ряда распределения 17
4 Корреляционный анализ 20
5 Оценка параметров генеральной совокупности на основе выборочных данных 29
6 Показатели ряда динамики и тенденции динамики 34
ЗАКЛЮЧЕНИЕ 42
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 43
ПРИЛОЖЕНИЕ А 44
ПРИЛОЖЕНИЕ Б 45
ПРИЛОЖЕНИЕ В 47
ПРИЛОЖЕНИЕ Г 62
ПРИЛОЖЕНИЕ Д 63
Для однородности ряда, исключим один из регионов: г.Москва.
На этот раз возьмем за минимальное значение 3479, максимальное 887417. Длину интервала возьмем 115000.
Таблица 2.2-Сгруппированные исходные данные
Значение оборота розничной торговли | Количество регионов |
3000-118000 | 53 |
118000-233000 | 15 |
233000-348000 | 6 |
348000-463000 | 5 |
463000-578000 | 2 |
578000-693000 | 1 |
693000-808000 | - |
808000-923000 | 1 |
Итого: | 82 |
Для однородности ряда, исключим регион: Московская область.
Снова определим длину интервала по формуле Стержесса. Полученное значение 7.33, следовательно, будет 8 интервалов. Минимальное значение равно 3479, максимальное 582235. Длину интервала возьмем за 75000.
Таблица 2.3-Сгруппированные исходные данные
Значение оборота розничной торговли | Количество регионов |
3000-78000 | 34 |
78000-153000 | 25 |
153000-228000 | 8 |
228000-303000 | 5 |
303000-378000 | 3 |
378000-453000 | 3 |
453000-528000 | 2 |
528000-603000 | 1 |
Итого: | 81 |
Рисунок 2.1-Распределение регионов по показателю оборот розничной торговли
Анализируя диаграмму можно выявить, что распределение не подчиняется нормальному закону. Явно выражена правосторонняя асимметрия, из чего можно сказать, что большинство значений признака сконцентрировано слева от средней величины и имеет значение, меньшее, чем средняя. По гистограмме можно приблизительно определить моду, значение которой попадает в правый край первого интервала и приблизительно составляет 62000.
Рисунок 2.2- Кумулята и Огива
Рассчитаем показатели вариации (приложение А), полученные результаты представим в таблице:
Таблица 2.4 - Показатели вариации
Показатель | Значение |
Среднее значение (млн. руб) | 134944,4 |
Мода (млн. руб) | 62302,32 |
Медиана (млн. руб) | 97500 |
Размах вариации (млн. руб) | 578756 |
Среднее
линейное отклонение (млн. руб) |
91289,42 |
Среднее квадратическое отклонение (млн. руб) | 122914,7 |
Дисперсия (млн. руб)2 | 15108024691 |
Относительный размах вариации (…) | 4,29 |
Относительное линейное отклонение % | 0,68 |
Коэффициент вариации % | 0,91 |
Коэффициент асимметрии % | 1,63 |
Коэффициент эксцесса % | 2,11 |
Проанализировав
таблицу можно сделать
В среднем по России оборот розничной торговли составил 134944,4. Медиана равна 97500, это значит что, половина единиц совокупности имеет значение показателя ниже медианного, а вторая половина – больше. Мода равна 62302,32, она указывает на наиболее часто встречающееся значение признака, но так ряд интервальный следует сказать, что вокруг данного значения сконцентрировано наибольшее число регионов. В рассматриваемой совокупности имеет место соотношение: Xср>Me>Mo, что обусловлено выраженной правосторонней асимметрии. Таким образом, нельзя утверждать, что распределение подчиняется нормальному закону.
Размах вариации равен 578756, но он дает лишь общее представление о размахе вариации, т.к. показывает только разницу между крайними значениями. Относительный размах вариации равен 4,29. Отсюда можно сделать вывод, что так как значение размаха вариации достаточно велико и относительный размах вариации намного больше единицы, большинство значений колеблются в большом интервале.
Среднее линейное отклонение составило 91289,42. В среднем на это значение отклоняется значение показателя от средней величины. Среднее квадратическое отклонение равно 122914,7.
Дисперсия
– это средний квадрат
Относительное линейное отклонение, равное 0,68, показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 68%.
Коэффициент Асимметрии равен 1,63. Это говорит о правосторонней асимметрии, и большинство значений признака имеет значение ниже среднего.
Показатель эксцесса положительный (2,11), это свидетельствует о слабой вариации. Хвосты распределения «легче», а пик острее, чем у нормального распределения.
Моделирование ряда распределения
В законе о нормальном характере распределения показателя выражается закономерность взаимодействия множества случайных величин, не имеющих преобладающего влияния друг на друга. Проверка распределения на выполнение закона о нормальном распределении помогает определить его характер и свойства. Для проверки гипотезы о нормальном характере распределения рассматриваемого признака используем критерий Пирсона. Необходимо рассчитать и оценить отклонения фактических значений частот появления признака от тех значений, которые могли бы быть в случае нормального распределения (теоретическая частота).
Таблица 3.1-Расчет данных для определения критерия Пирсона
Интервал | Середина интервала | fф | t | f(t) | |
3000-78000 | 40500 | 34 | -0,77 | 0,2966 | 15 |
78000-153000 | 115500 | 25 | -0,16 | 0,3939 | 19 |
153000-228000 | 190500 | 8 | 0,45 | 0,3605 | 18 |
228000-303000 | 265500 | 5 | 1,06 | 0,2275 | 11 |
303000-378000 | 340500 | 3 | 1,67 | 0,0989 | 5 |
378000-453000 | 415500 | 3 | 2,28 | 0,0355 | 2 |
453000-528000 | 490500 | 2 | 2,89 | 0,0061 | 0 |
528000-603000 | 565500 | 1 | 3,50 | 0,0009 | 0 |
Видно,
что для последних двух интервалов
округленная теоретическая
Таблица 3.2-Расчет данных для определения критерия Пирсона
Интервал | Середина интервала | fф | t | f(t) | |
3000-78000 | 40500 | 34 | -0,88 | 0,2709 | 15 |
78000-153000 | 115500 | 25 | -0,20 | 0,391 | 21 |
153000-228000 | 190500 | 8 | 0,47 | 0,3572 | 19 |
228000-303000 | 265500 | 5 | 1,14 | 0,2083 | 11 |
303000-603000 | 453000 | 9 | 2,82 | 0,0075 | 0 |
Для интервала 303000-603000 теоретическая частота равна 0. Объединим его с предыдущим интервалом. Средняя величина равна 143277,78 СКО равно 137529,57.
Таблица 3.3-Расчет данных для определения критерия Пирсона
Интервал | Середина интервала | fф | t | f(t) | |
| |
3000-78000 | 40500 | 34 | -0,75 | 0,3011 | 13 | 441 | 33,16 |
78000-153000 | 115500 | 25 | -0,20 | 0,391 | 17 | 64 | 3,71 |
153000-228000 | 190500 | 8 | 0,34 | 0,3765 | 17 | 81 | 4,87 |
228000-60300 | 415500 | 14 | 1,98 | 0,0562 | 12 | 4 | 0,32 |
В
данной таблице отсутвуют
Корреляционный анализ
Задача
корреляционного анализа –
Здесь факторным признаком выступает показатель «Численность экономически активного населения, занятого в экономике по субъектам Российской Федерации в 2008 году, тыс. человек», а результативным - «Оборот розничной торговли по субъектам Российской Федерации в 2008 году, миллионов рублей».
Используя данные об индивидуальных значениях
факторного признака и соответствующих
ему значения результативного признака
строим в прямоугольных координатах точечный
график – поле корреляции.
Рисунок 4.1 - Поле корреляции. Взаимодействие показателей: оборот розничной торговли и численность экономически активного населения, занятого в экономике
Учитывая большой отрыв значения показателя «Численность экономически активного населения, занятого в экономике по субъектам Российской Федерации в 2008 году, тыс. человек» для Москвы от основной массы значений, мы приняли решение исключить данный субъект из анализа.
Таким образом поле корреляции принимает вид:
Информация о работе Анализ статистической совокупности по показателю