Автор работы: Пользователь скрыл имя, 11 Декабря 2012 в 12:02, курсовая работа
Целью курсового проекта является изучение статистических рядов динамики и какое место они занимают в статистике как науке.
Даная тема является актуальной т.к. общественные явления, изучаемые статистикой, претерпевают непрерывные изменения во времени. В процессе исторического развития изменяются как их объем, уровень, так и состав, структура. Выявление и измерение этих изменений представляют одну из самых важных задач статистики.
Введение……………………………………………………………….
1 Теоретическая часть…………………………………………………..
1.1 Общие понятия, краткое описание показателей рядов динамики…
1.2 Система статистических показателей, характеризующих аналитические показатели рядов динамики…………………………
1.3 Статистические методы, применяемые при изучении рядов динамики……………………………………………………………….
2 Расчетная часть……………………………………………………….
3 Аналитическая часть…………………………………………………
Заключение……………………………………………………………
Список используемой литературы…………………………………
Тенденции развития явлений изучают методами выравнивания рядов динамики:
Метод укрупнение интервалов - наиболее простой способ. Он заключается в преобразовании первоначальных рядов динамики в более крупные по продолжительности временных периодов, что позволяет более четко выявить действие основной тенденции (основных факторов) изменения уровней.
По интервальным рядам итоги исчисляются путем простого суммирования уровней первоначальных рядов. Для других случаев расcчитывают средние величины укрупненных рядов (переменная средняя). Переменная средняя рассчитывается по формулам простой средней арифметической.[2, c. 125]
Метод скользящей средней
Метод скользящей средней заключается в следующем: формируются укрупненные интервалы, состоящие из одинакового числа уровней. Каждый последующий интервал получаем, постепенно сдвигаясь от начального уровня ряда на один уровень. По укрупненным интервалам определяем среднюю из уровней, входящих в каждый интервал.
Пример:
Для того, чтобы рассчитать прогнозное
значение необходимо:
1. Определить величину интервала сглаживания,
например равную 3(n=3).
2. Рассчитать скользящую среднюю для первых
трех периодов:
m2002=(У2001+У2002+У2003)/3=(
m2003=(У2002+У2003+У2004)/3=(
m2004=(У2003+У2004+У2005)/3=(
m2005=(У2004+У2005+У2006)/3=(
m2006=(У2005+У2006+У2007)/3=(
m2007=(У2006+У2007+У2008)/3=(
m2008=(У2007+У2008=У2009)/3=(
Для решения задачи составим таблицу:
Годы |
Данные численности наличного населения, тыс.чел. |
Скользящая средняя |
Расчет средней отно-сительной
ошибки |
2001 |
106,8 |
- |
- |
Итого |
1,34 | ||
Прогноз | |||
2010 2011 |
102,57 102,52 |
Таблица 1 С расчетам
3. Рассчитав скользящую среднюю для всех периодов строим прогноз на 2010 год:
У2010=102,6+1/3(102,5-102,6)=
Определяем скользящую среднюю m для 2010
года:
m=(102,6+102,5+102,57)/3=102,5
Строим прогноз на 2011 год
У2011=102,5+1/3(102,57-102,5)=
Заносим полученный результат в таблицу.
Рассчитываем среднюю относительную ошибку
ε =1,34/7=0,19
Метод наименьших квадратов — один из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным. Метод основан на минимизации суммы квадратов остатков регрессии.
Необходимо отметить, что собственно
методом наименьших квадратов можно
назвать метод решения задачи
в любой области, если решение
заключается или удовлетворяет
некоторому критерию минимизации суммы
квадратов некоторых функций
от искомых переменных. Поэтому метод
наименьших квадратов может применяться
также для приближённого
Пример:
Годы |
Численность населения тыс.чел. |
Условное обо-значение |
Уф*Х |
Х^2 |
Ур |
Расчет средней относительной ошибки |
2001 |
106,8 |
1 |
106,8 |
1 |
105,8 |
0,9 |
Итого |
934,5 |
45 |
4639,4 |
285 |
934,2 |
5,69 |
прогноз | ||||||
2010 |
Таблица 2 С расчетами.
Определим условное обозначение времени как последовательную нумерацию периодов базы прогноза. Рассчитаем графы 4 и 5.
4639,4-(45*934,5)/9
a= 285-45^2/9=-0,5
b=934,5/9-(-0,5*45/9)=106,3
У2001=-0,5*1+106,3=105,8
2002=-0,5*2+106,3=105,3
2003=-0,5*3+106,3=104,8
2004=-0,5*4+106,3=104,3
2005=-0,5*5+106,3=103,8
2006=-0,5*6+106,3=103,3
2007=-0,5*7+106,3=102,8
2008=-0,5*8+106,3=102,3
2009=-0,5*9+106,3=101,8
Заносим полученные
результаты в таблицу. Определяем прогнозное
значение:
У2010=-0,5*10+106,3=101,3
У2011=-0,5*11+106,3=100,8
ε = 5,69/9=0,63%.
Каждый из трех рассмотренных методов
имеет свои достоинства, но в большинстве
случаев метод аналитического выравнивания
предпочтителен. Однако его применение
связано с большими вычислительными
работами: решение системы уравнений;
проверка обоснованности выбранной
функции (формы связи); вычисление уровней
выравненного ряда; построение графика,
Для успешного выполнения таких
работ целесообразно
2. Расчетная часть
С целью изучения расходов населения на платные услуги в отчетном периоде по региону была произведена 25%-ная механическая выборка, в результате которой получены следующие данные:
№ района |
Численность населения, тыс. чел. |
Объем платных услуг, млн руб. |
№ района |
Численность населения, тыс. чел. |
Объем платных услуг, млн руб. |
1 |
31,9 |
119,5 |
16 |
25,3 |
93,3 |
2 |
25,7 |
95,7 |
17 |
34,4 |
129,4 |
3 |
19,4 |
71,4 |
18 |
25,9 |
95,8 |
4 |
27,2 |
94,0 |
19 |
14,7 |
51,0 |
5 |
23,5 |
86,8 |
20 |
26,6 |
98,5 |
6 |
23,2 |
85,7 |
21 |
25,5 |
94,2 |
7 |
13,4 |
56,3 |
22 |
24,7 |
90,5 |
8 |
26,0 |
96,1 |
23 |
19,5 |
70,1 |
9 |
25,0 |
92,8 |
24 |
27,9 |
103,6 |
10 |
20,8 |
75,2 |
25 |
24,8 |
91,4 |
11 |
24,3 |
89,3 |
26 |
26,1 |
96,0 |
12 |
28,9 |
107,8 |
27 |
22,3 |
84,3 |
13 |
29,0 |
77,3 |
28 |
13,8 |
47,6 |
14 |
30,0 |
112,2 |
29 |
33,8 |
101,1 |
15 |
21,4 |
77,7 |
30 |
22,6 |
81,4 |
Задание 1
Сделайте выводы по результатам выполнения пунктов 1, 2, 3 задания;
Решение
а) Построить ранжированный ряд
по численности населения и
Таблица 1 Ранжированный ряд по группировочному признаку.
б) Определить шаг группировки:
h = (xmax-xmin)/n,
где – наибольшее и наименьшее значения признака в исследуемой совокупности, n - число групп интервального ряда,
где n=5
h = (34.4-13.4)/5=4.2.
в) Определить границы групп:
1 группа – (13,4+4,2) = 17,6;
2 группа – (17,6+4,2) = 21,8;
3 группа – (21,8+4,2) = 26,0;
4 группа – (26,0+4,2) = 30,2;
5 группа – (30,2+4,2) = 34,4.
г) Оформить результаты группировки в виде таблицы:
Таблица 2 Простая группировка
д) Вывод:
По результатам видно, что при росте численности населения объем платных услуг сначала начинает увеличиваться, а затем снова идет на убыль.
2. Определяем значение моды и медианы:
а) Для определения моды графическим методом строим график по данным табл.2
Рис. 1 Определение моды графическим методом
Расчет конкретного значения моды для интервального ряда распределения производится по формуле:
где хМo – нижняя граница модального интервала,
h – величина модального интервала,
fMo – частота модального интервала,
fMo-1 – частота интервала, предшествующего модальному,
fMo+1 – частота интервала, следующего за модальным.
Расчет моды:
Вывод. Модальный интервал находится в пределах численности населения 21,8-26 тыс. чел., так как на этот интервал приходится наибольшая частота (13). Это значит, что модальный объем платных услуг равен 16,744 млн. руб.
б) Расчет конкретного значения медианы для интервального ряда распределения производится по формуле
,
где хМе - нижняя граница медианного интервала,
h - величина медианного интервала,
- сумма всех частот,
fМе - частота медианного интервала,
SMе-1 - сумма накопленных частот до медианного интервала.
Расчет медианы:
Вывод. Это значит, что одна половина населения имеет объем платных услуг до 19,5 млн. руб., а другая свыше 19,5 млн. руб.
3. Рассчитываем характеристики интервального ряда распределения:
Для расчета характеристик ряда распределения , σ, σ2, Vσ на основе табл. 2 строим вспомогательную таблицу 3 ( – середина интервала).
Таблица 3 Расчетная таблица для нахождения характеристик ряда распределения
Рассчитаем среднюю арифметическую взвешенную:
Рассчитаем среднее квадратическое отклонение:
Рассчитаем дисперсию:
σ2 = 111,755 = 223,5
Рассчитаем коэффициент
Вывод. Анализ полученных значений показателей и σ говорит о том, что средняя объем платных услуг составляет 459,5 млн.руб., отклонение от этой величины в ту или иную сторону составляет в среднем 111,755 млн. руб. Расхождение между значениями , Мо и Ме незначительно ( =24,32 млн. руб., Мо=16,744 млн. руб., Ме=19,5 млн. руб.), что подтверждает вывод об однородности. Таким образом, найденное среднее значение среднесписочной численности населения (16,744 млн. руб.) является типичной, надежной характеристикой исследуемой совокупности платных услуг.
4. Вычисляем среднюю арифметическую:
Для расчета применяется формула средней арифметической простой:
,
Причина расхождения средних величин, рассчитанных по исходным данным (729,6 тыс. чл.) и по интервальному ряду распределения (693,6 тыс. чл.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти районов, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают, что говорит о достаточно равномерном распределении численности населения внутри каждой группы интервального ряда.
Задание 2
По исходным данным с использованием результатов выполнения задания 1:
Оцените статистическую значимость показателя силы связи. Сделайте выводы по результатам выполнения задания.
1. Установим наличие и характер корреляционной связи:
Аналитическая группировка строится по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.