Автор работы: Пользователь скрыл имя, 09 Февраля 2013 в 14:51, курсовая работа
Целью курсовой работы является более глубокое изучение теоретических положений и приобретение практических навыков статистического анализа по различным аспектам функционирования социально-экономических систем мезо-макроуровней, на примере анализа урожайности зерновых культур. Наряду с этим должно быть освоено использование статистических инструментариев, реализованных в Microsoft Excel.
ВВЕДЕНИЕ
Глава I ТЕОРЕТИЧЕСКИЕ ОСНОВЫ УРОВНЯ ДЕМОГРАФИЧЕСКОЙ НАГРУЗКИ
1.1 Общая характеристика уровня демографической нагрузки
Глава II ЭКОНОМИКО – СТАТИСТИЧЕСКИЙ АНАЛИЗ УРОВНЯ ДЕМОГРАФИЧЕСКОЙ НАГРУЗКИ
2.1 Группировка регионов по уровню демографической нагрузки
2.2 Показатели вариации уровня демографической нагрузки
2.3 Взаимосвязь между демографической нагрузкой и трудоспособным населением
2.4 Ошибка выборки и границы средней уровня демографической нагрузки в генеральной совокупности
Глава III АНАЛИЗ РЯДА ДИНАМИКИ УРОВНЯ ДЕМОГРАФИЧЕСКОЙ НАГРУЗКИ В 2000 – 2010 гг.
3.1 Показатели ряда динамики по годам и среднегодовые
3.2 Выявление тенденции развития ряда динамики. Механическое выравнивание. Аналитическое выравнивание
3.3 Показатели колеблемости и точечный прогноз демографической нагрузки
3.4 Прогнозирование на будущее
Глава ΙV ИНДЕКСНЫЙ АНАЛИЗ
4.1 Индексный анализ изменения численности занятого населения и производительности их труда
4.2 Определение существенность структурных сдвигов в возрастном составе населения , используя индексы А. Салаи и К. Гатева
Глава V КОРРЕЛЯЦИОННО – РЕГРЕССИОННЫЙ АНАЛИЗ
Заключение
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ
В MS EXEL воспользуемся командой:
Сервис анализ данных корреляция.
В соответствии с сущностью корреляционной связи ее изучение имеет две цели:
– измерение параметров уравнения,
выражающего связь средних
–измерение тесноты и формы связи двух и более признаков между собой.
Выполним корреляционно-
Таблица 5.2 Корреляционная матрица
У |
Х1 |
Х2 |
Х3 | |
У |
1 |
|||
Х1 |
-0,30131976 |
1 |
||
Х2 |
0,678767597 |
-0,28607 |
1 |
|
Х3 |
0,135878161 |
0,319837 |
-0,20683 |
1 |
Корреляционная матрица (таблица 5.2) содержит частные коэффициенты корреляции. Коэффициенты второго столбца матрицы характеризуют степень тесноты связи между результативным (У) и факторными признаками (Х1, Х2, Х3). Например, связь между уровнем урожайностью и хлебных продуктов (rУХ1 = -0,301) обратная, слабая; связь между урожайностью и внесением удобрений (rУХ2 = 0,678) прямая, слабая; связь между урожайностью и посевной площадью (rУХ3 = 0,135) прямая, слабая. Коэффициенты корреляции между факторами свидетельствуют об отсутствии мультиколлинеарности.
Множественный R |
0,761393985 |
R-квадрат |
0,579720801 |
Нормированный R-квадрат |
0,540319626 |
Стандартная ошибка |
3,961780675 |
Наблюдения |
36 |
Множественный коэффициент корреляции R = 0,761 показывает, что теснота связи между уровнем урожайности зерновых культур и факторами, включенными в модель, сильная. Множественный коэффициент детерминации (R-квадрат) D = 0,54, т.е. 54% вариации урожайности зерновых культур объясняется вариацией изучаемых факторов.
Таблица 5.4 Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F | |
Регрессия |
3 |
692,806293 |
230,935431 |
14,71328714 |
3,40167E-06 |
Остаток |
32 |
502,2625959 |
15,69570612 |
||
Итого |
35 |
1195,068889 |
Проверим значимость коэффициента множественной корреляции, для этого воспользуемся F-критерием, для чего сравним фактическое значение F с табличным значением Fтабл. При вероятности ошибки α = 0,05 и степенях свободы v1=k-1=3-1=2, v2=n-k=36-3=33, где k – число факторов в модели, n – число наблюдений, Fтабл =3,15 . Так как Fфакт = 14,71 > Fтабл =3,15 , то коэффициент корреляции значим, следовательно, построенная модель в целом адекватна.
Таблица 5.5 Коэффициенты регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение | |
Y-пересечение |
20,69128242 |
6,2888673 |
3,290144541 |
0,002442215 |
Переменная X 1 |
-0,087154543 |
0,050408402 |
-1,728968578 |
0,093452857 |
Переменная X 2 |
0,188237797 |
0,032942249 |
5,714175584 |
2,48686E-06 |
Переменная X 3 |
0,0022374 |
0,000785739 |
2,847510252 |
0,007634689 |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% | |
Y-пересечение |
7,881278978 |
33,50128586 |
7,881278978 |
33,50128586 |
Переменная X 1 |
-0,189833096 |
0,015524011 |
-0,189833096 |
0,015524011 |
Переменная X 2 |
0,121136631 |
0,255338963 |
0,121136631 |
0,255338963 |
Переменная X 3 |
0,000636902 |
0,003837897 |
0,000636902 |
0,003837897 |
Используя таблицу 22 составим уравнение регрессии:
У = 20,69 + (-0,08Х1 )+ 0,18Х2 +0,002Х3.
Интерпретация полученных параметров следующая:
а0 = 20,69 – свободный член уравнения регрессии, содержательной интерпретации не подлежит;
а1 = -0,08 – коэффициент чистой регрессии при первом факторе свидетельствует о том, что при увеличении экономически активного населения, демографическая нагрузка уменьшается на 0,08%, при условии, что другие факторы остаются постоянными;
а2 = 0,18 – коэффициент чистой регрессии при втором факторе свидетельствует о том, что при увеличении экономически активного населения по возрастам, демографическая нагрузка увеличится на 0,18%, при условии, что другие факторы остаются постоянными;
а3 = 0,002 – коэффициент чистой регрессии при третьем факторе свидетельствует о том, что при увеличении площади, демографическая нагрузка увеличится на 0,002%, при условии, что другие факторы остаются постоянными.
Проверку значимости коэффициентов регрессии осуществим с помощью t-критерия Стьюдента; для этого сравним фактические значения t-критерия с табличным значением t-критерия. При вероятности ошибки α = 0,05 и степени свободы v= n-k-1=36-3-1 =32, где k – число факторов в модели, n – число наблюдений, tтабл =1,476 . Получим
t1факт = 0,485 > tтабл;
t2факт = 1,342< tтабл;
t3факт = 1,491 > tтабл .
Значит, статистически значимыми являются первый и третий факторы. В этом случае модель пригодна для принятия решений, но не для прогнозов.
Таблица 5.6 Описательная статистика
У |
Х1 |
Х2 |
Х3 | |
Среднее |
16,05555556 |
122,2777778 |
22,65 |
785,6222222 |
Стандартная ошибка |
0,973892896 |
2,405552806 |
3,564715755 |
151,1447919 |
Медиана |
15,4 |
122 |
14,8 |
426,85 |
Мода |
15,4 |
122 |
12,2 |
#Н/Д |
Стандартное отклонение |
5,843357374 |
14,43331684 |
21,38829453 |
906,8687516 |
Дисперсия выборки |
34,1448254 |
208,3206349 |
457,4591429 |
822410,9326 |
Эксцесс |
1,274327422 |
1,944635765 |
1,916388342 |
2,671142034 |
Асимметричность |
0,896287525 |
0,699297484 |
1,534201268 |
1,675734205 |
Интервал |
26,8 |
73 |
82 |
3781,3 |
Минимум |
7 |
96 |
2,2 |
0,3 |
Максимум |
33,8 |
169 |
84,2 |
3781,6 |
Сумма |
578 |
4402 |
815,4 |
28282,4 |
Счет |
36 |
36 |
36 |
36 |
Средние значения признаков, включенных в модель У = 16,05 ц с 1 га.; Х1 = 122,27 кг за чел.; Х2 = 22,65 кг; Х3 = 785,622 тыс.га.
Стандартные ошибки коэффициентов регрессии Sа0 = 0,97; Sа1 = 2,40; Sа2 = 3,56; Sа3 = 151,14.
Средние квадратические отклонения признаков σУ = 5,8 ц с 1 га; σХ1 = 14,43 кг за чел.; σХ2 = 21,38 кг; σХ3 = 906,86 тыс. га.
Зная средние значения и средние квадратические отклонения признаков, рассчитаем коэффициенты вариации для оценки однородности исходных данных
Вариация факторов, включенных в модель не превышает допустимых значений (33-35%), а демографическая нагрузка характеризуется 36,1%. В данном случае необходимо проверить исходную информацию и исключить те значения, которые значительно отличаются от средних значений.
Разные единицы измерения
Каждый из β-коэффициентов показывает,
на сколько средних квадратических
отклонений изменится уровень
При увеличении потребления хлебной продукции на 1 среднее квадратическое отклонение демографическая нагрузка увеличивается на 51,31 своего среднего квадратического отклонения; при увеличении внесении удобрении и посевной площади на 1 свое среднее квадратическое отклонение демографической нагрузки уменьшается на 0,29 и увеличивается на 0,31 своего среднего квадратического отклонения.
Сопоставление β-коэффициентов показывает, что наиболее сильное влияние на варьирование демографической нагрузки оказывает площадь тыс.кв.км, вторым – экономически активное население, третьим – экономически активное население по возрастам.
Каждый из коэффициентов эластичности показывает, на сколько ц изменится в среднем демографическая нагрузка.
При увеличении экономически активного населения на 1 тыс. демографическая нагрузка уменьшается на 0,6%; при увеличении площади на 1 тыс.кв.км демографическая нагрузка увеличивается соответственно на 0,25 % и 0,097%.
В таблице 5.7 приведены расчетные значения урожайности демографической нагрузки и отклонения фактических значений от расчетных. Расчетные значения получены путем подстановки значений факторов демографической нагрузки в уравнение регрессии.
Если расчетное значение демографической нагрузки превышает фактическое значение (остатки отрицательные), то в данном есть резервы повышения демографической нагрузки р за счет факторов включенных в модель, в противном случае (остатки положительные) у региона отсутствуют резервы повышения демографической нагрузки за счет факторов, включенных в модель.
Таблица 5.7 Остатки
Наблюдение |
Предсказанное Y |
Остатки |
1 |
17,63341639 |
8,766583608 |
2 |
11,96521574 |
2,234784258 |
3 |
25,95593447 |
1,444065531 |
4 |
29,63096395 |
4,169036048 |
5 |
14,20525422 |
1,194745777 |
6 |
17,46860292 |
4,531397084 |
7 |
13,36952767 |
-0,469527671 |
8 |
14,87371334 |
0,626286657 |
9 |
23,90098127 |
-1,900981269 |
10 |
17,47539842 |
-4,675398415 |
11 |
16,95398898 |
2,346011015 |
12 |
15,61742113 |
0,782578875 |
13 |
18,51172003 |
-2,711720029 |
14 |
19,59951264 |
0,300487356 |
15 |
16,50346964 |
-1,803469641 |
16 |
15,35571377 |
-0,655713769 |
17 |
18,4185671 |
1,181432896 |
18 |
13,10623146 |
-0,806231459 |
19 |
8,675866964 |
-1,675866964 |
20 |
12,19274341 |
-0,092743408 |
21 |
10,12510391 |
-1,325103906 |
22 |
10,6409955 |
-0,6409955 |
23 |
14,85606188 |
-3,556061877 |
24 |
11,69581118 |
1,504188818 |
25 |
17,08003933 |
5,319960673 |
26 |
16,06799993 |
3,532000066 |
27 |
13,43237714 |
6,067622858 |
28 |
14,04309283 |
1,656907173 |
29 |
13,55502395 |
-2,155023953 |