Автор работы: Пользователь скрыл имя, 23 Февраля 2012 в 12:43, научная работа
В работе в качестве факторных признаков, влияющих на валовой сбор сельскохозяйственных культур Республики Казахстан, взяты: посевная площадь, число сельскохозяйственных предприятий, количество удобрений и число комбайнов.
Задание
1. Построение модели множественной регрессии
1.1. Анализ факторов на мультиколлинеарность
1.2. Отбор существенных факторов
2. Пошаговая регрессия
2.1. Первый шаг
2.2. Второй шаг
3. Динамический ряд
3.1. Абсолютный прирост
3.2. Темп роста
3.3. Темп прироста
4. Методы выявления основной тенденции в рядах динамики
4.1. Метод укрупнения интервалов
4.2. Метод скользящей средней
4.3. Аналитическое выравнивание
Казахский Экономический Университет им. Т. Рыскулова
Факультет Управления
Кафедра Прикладной математики
ПРОЕКТ
Влияние различных факторов на валовой сбор сельскохозяйственных культур (по данным статистики Республики Казахстан)
(дисциплина: «Эконометрика»)
Выполнили: Омарова Арзигуль
СКС-205
Научный руководитель: Мадиярова К. З.
Алматы 2011
Задание
Введение
Сельскохозяйственные культуры – это культурные растения, возделываемые с целью получения продуктов питания, технического сырья и корма для скота.
Валовой сбор сельскохозяйственных культур - есть объём фактически произведённой (собранной) продукции сельскохозяйственных культур, обычно учитывается по отдельным культурам, либо по некоторым группам культур со всей площади посева.
В работе в качестве факторных признаков, влияющих на валовой сбор сельскохозяйственных культур Республики Казахстан, взяты: посевная площадь, число сельскохозяйственных предприятий, количество удобрений и число комбайнов.
Статистические данные отобраны за последние 16 лет (1995 – 2010гг.). Методами множественной (многофакторной) корреляции необходимо определить форму и тесноту связи между результативным фактором (валовым сбором) и факторными признаками.
Многофакторный корреляционно-
Целью исследования является анализ статистических данных за последние 16 лет и прогнозирование данных валового сбора сельскохозяйственных культур в РК на ближайшие годы.
Задача состоит в проведении многофакторного корреляционно-регрессионного анализа, на основе которого можно будет определить тесноту связи между факторами.
Включение в уравнение множественной регрессии того или иного набора факторов обусловлено тем, что факторы не должны быть мультиколлинеарными. Чем она сильнее, тем ненадежнее результаты множественной регрессии. Она определяется коэффициентом парной корреляции r>0,7.
Включение в модель факторов
с высокой
Отбор факторов, включаемых
в уравнение множественной
Отбор факторов включает этапы,
которые будут описываться
На этом этапе проводится анализ значений коэффициентов парной корреляции между всеми факторами (Таблица 1)
Таблица 1 – Корреляционная матрица
Столбец 1 |
Столбец 2 |
Столбец 3 |
Столбец 4 |
Столбец 5 | |
Валовый сбор |
1 |
||||
Число комбайнов |
0,92018879 |
1 |
|||
Количество удобрений |
0,62485472 |
0,772899985 |
1 |
||
Посевная площадь |
0,936833973 |
0,679628923 |
0,540136171 |
1 |
|
Число с/х предприятий |
0,744248945 |
0,833060425 |
0,546897268 |
0,569071147 |
1 |
Если в матрице содержатся
коэффициенты корреляции, превышающие
значения 0,75-0,8, то это свидетельствует
о присутствии
Первый столбец показывает
корреляцию, а последующие
Отбор существенных факторов осуществляется с помощью коэффициентов β факторов, которые потенциально могут быть исключены.
Коэффициент β показывает, насколько изменяется функция с изменением аргумента на одну величину при фиксированном значении остальных аргументов. Коэффициент β вычисляется для каждых факторов по следующей формуле:
, или
- коэффициент β фактора хi;
bхi – коэффициент регрессии фактора хi;
δхi – среднеквадратическое отклонение фактора хi;
δу – среднеквадратическое отклонение функции.
Из всех факторов может быть исключен тот фактор, который имеет меньшее значение β. Если даже коэффициенты r первого фактора больше чем второй.
В нашем случае значения β для каждых факторов равны:
Таблица 2 – Отбор факторов
Число комбайнов |
βx1= |
0,56162125 |
количество удобрений |
βx2= |
-0,1220024 |
посевная площадь |
βx3= |
0,54665217 |
число с/х предприятий |
βx4= |
0,03202331 |
Большее значение β имеют факторы: количество комбайнов и размер посевных площадей, которые воздействуют на сбор сельскохозяйственных культур больше, чем оставшиеся 2 фактора.
Отбор факторов можно осуществить
с помощью пошаговой регрессии.
Сущность этого метода заключается
в последовательном включении факторов
в уравнение регрессии и
В данной работе изучаем зависимость валового сбора сельскохозяйственных культур (У) от факторов за 16 лет (Таблица 3 представлена в приложении работы).
Х1 – Число комбайнов, тыс. ед.;
Х2 – Количество удобрений, тыс. тонн;
Х3 – Посевная площадь, тыс. га;
Х4 – Число сельскохозяйственных предприятий, единиц.
Заключение
Проведя корреляционно-регрессионный анализ над моделью, мы выявили следующее:
– Количество собранного урожая зависит от размеров посевной площади, чем больше посевная площадь, тем больше урожай. Исходя из этого у нас: посевная площадь - это факторный признак Х, урожайность –результативный признак У.
– В ходе исследования мы выявили, что теснота связи этих факторов тесная и положительная, так как r=0,83313.
– Далее, построив график, мы увидели, что зависимость урожайности (У) от посевной площади (Х) характеризуется линейной функцией у=а+вх. На графике видно что урожайность имеет тенденцию роста.
– Затем, определяем параметры модели регрессии. Они равны: а=-62,379 и в=2,260 → отсюда уравнение регрессии имеет вид: у=-62,379+2,260*х. Значение параметра b говорит о том, что при увеличении площади посева на 1 гектар, урожайность повысится на 2,260 центнеров.
– Затем мы проверили модель регрессии на адекватность при помощи:
Отсюда следует, что модель регрессии надежна и уравнение регрессии является адекватным. Т. е. полученное уравнение достоверно описывает количественную зависимость факторов у и х.
– Для того чтобы проверить значимость параметров модели регрессии, мы определили стандартные ошибки: ,
– Нашли статистическую значимость параметров модели регрессии:
,
– Затем нашли доверительные интервалы параметров регрессии: -132,425<а<7,667 и 1,540<в<2,982
– Мы также составили прогноз значений зависимой переменной у на 2 года вперед
Посмотрев на прогнозные значения,
можно сделать вывод, что через
год, т.е. в 2011 году, урожайность
Относительно всей модели в целом, можно сказать что она вполне адекватна, и очень надежна.
Список используемой литературы
Алматы. 2008.-78с.
207с
вероятностей и математическая статистика»/ М., 1991.
пакета Microsoft Excel»/ М., 1997.
Алматы. 2008. – 78с.
анализ в экономических приложениях»/ М., 1987.
экономистов-статистиков»/ М., 1990.