Автор работы: Пользователь скрыл имя, 26 Февраля 2012 в 22:04, контрольная работа
По исходным данным, характеризующим территории региона за 199х год необходимо1:
Построить поле корреляции.
Для характеристики зависимости у от х:
а) построить линейное уравнение парной регрессии у от х;
б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации;
1.2.
Типовой пример выполнения
Задание:
По исходным данным, характеризующим территории региона за 199х год необходимо1:
а) построить линейное уравнение парной регрессии у от х;
б) оценить
тесноту связи с помощью
в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации;
г) дать оценку силы связи с помощью среднего коэффициента эластичности;
д) оценить статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера;
е) оценить статистическую значимость параметров регрессии и корреляции.
3) Проверить результаты, полученные в п.2 с помощью ППП Exel.
4) Рассчитать
параметры показательной
5. Обосновано
выбрать лучшую модель и
Решение:
Для нашего примера
Результативный признак (у) – урожайность картофеля, ц/га
Факторный признак (х) – доза внесения органических удобрений, ц/га
Таблица 1.1. – Исходные данные для анализа
№ региона |
Доза внесения удобрений, ц/га х |
Урожайность картофеля, ц/га у |
1 |
115 |
250 |
2 |
98 |
249 |
3 |
105 |
242 |
4 |
109 |
193 |
5 |
102 |
256 |
6 |
116 |
215 |
7 |
97 |
200 |
8 |
92 |
240 |
9 |
112 |
228 |
10 |
110 |
230 |
11 |
104 |
235 |
12 |
100 |
221 |
13 |
95 |
249 |
14 |
98 |
220 |
15 |
107 |
245 |
16 |
106 |
260 |
Рис. 1.1. Поле корреляции
Расположение
точек на графике не позволяет
точно определить тип уравнения
регрессии. Для выявления типа зависимости
воспользуемся
2. Для расчета
параметров линейной регрессии
построим расчетную таблицу (
Таблица 1.2. – Расчетные значения
№ |
х |
у |
xy |
х2 |
у2 |
(Ai, %) |
|
|
|
||
1 |
115 |
250 |
28750 |
13225 |
62500 |
230,464 |
7,814 |
381,657 |
118,266 |
8,114 |
278,473 |
2 |
98 |
249 |
24402 |
9604 |
62001 |
234,917 |
5,656 |
198,335 |
37,516 |
2,574 |
246,098 |
3 |
105 |
242 |
25410 |
11025 |
58564 |
233,083 |
3,685 |
79,507 |
0,766 |
0,053 |
75,473 |
4 |
109 |
193 |
21037 |
11881 |
37249 |
232,036 |
20,226 |
1523,775 |
23,766 |
1,631 |
1625,098 |
5 |
102 |
256 |
26112 |
10404 |
65536 |
233,869 |
8,645 |
489,776 |
4,516 |
0,310 |
514,723 |
6 |
116 |
215 |
24940 |
13456 |
46225 |
230,202 |
7,071 |
231,101 |
141,016 |
9,675 |
335,348 |
7 |
97 |
200 |
19400 |
9409 |
40000 |
235,179 |
17,589 |
1237,547 |
50,766 |
3,483 |
1109,723 |
8 |
92 |
240 |
22080 |
8464 |
57600 |
236,488 |
1,463 |
12,331 |
147,016 |
10,087 |
44,723 |
9 |
112 |
228 |
25536 |
12544 |
51984 |
231,250 |
1,425 |
10,561 |
62,016 |
4,255 |
28,223 |
10 |
110 |
230 |
25300 |
12100 |
52900 |
231,774 |
0,771 |
3,146 |
34,516 |
2,368 |
10,973 |
11 |
104 |
235 |
24440 |
10816 |
55225 |
233,345 |
0,704 |
2,738 |
0,016 |
0,001 |
2,848 |
12 |
100 |
221 |
22100 |
10000 |
48841 |
234,393 |
6,060 |
179,372 |
17,016 |
1,167 |
151,598 |
13 |
95 |
249 |
23655 |
9025 |
62001 |
235,703 |
5,340 |
176,819 |
83,266 |
5,713 |
246,098 |
14 |
98 |
220 |
21560 |
9604 |
48400 |
234,917 |
6,780 |
222,513 |
37,516 |
2,574 |
177,223 |
15 |
107 |
245 |
26215 |
11449 |
60025 |
232,559 |
5,078 |
154,768 |
8,266 |
0,567 |
136,598 |
16 |
106 |
260 |
27560 |
11236 |
67600 |
232,821 |
10,453 |
738,678 |
3,516 |
0,241 |
712,223 |
Итого |
1666 |
3733 |
388497 |
174242 |
876651 |
3733,000 |
108,761 |
5642,625 |
769,750 |
52,813 |
5695,438 |
Ср.знач |
104,125 |
233,313 |
24281,063 |
10890,125 |
54790,6875 |
233,313 |
6,798 |
352,664 |
48,109 |
||
σ |
6,936 |
|
|||||||||
σ2 |
48,109 |
355,965 |
2а. Построим
линейное уравнение парной
β= =-0,2619
a = =
Тогда линейное уравнение парной регрессии имеет вид:
Полученное уравнение показывает, что с увеличением дозы внесения органических уравнений на l ц/га урожайность картофеля уменьшается в среднем на 0,2619 ц/га.
Рис. 1.2. Зависимость между дозой внесения органических удобрений и урожайностью картофеля (линейная регрессия).
Подставляя в полученное уравнение регрессии значения xi из исходных данных определяем теоретические (выровненные) значения результативного признака (табл.1.2).
2б. При линейной корреляции между х и у исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи.
Учитывая:
,
оценим тесноту линейной связи с помощью линейного коэффициента парной корреляции
Связь между факторами обратная. В соответствии со шкалой Чеддока теснота характеризуется как слабая.
Изменение результативного признака у обусловлено вариацией факторного признака х. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D. Коэффициент детерминации – квадрат коэффициента корреляции.
R2=rху2·100%
R2= (-0,1105)2 ∙100%=0,0122∙100%=1,22%
Следовательно, вариация урожайности картофеля на 1,22 % объясняется вариацией дозы внесения удобрений, а остальные 98,78% вариации урожайности обусловлены изменением других, не учтенных в модели факторов.
= =
В среднем расчетные значения отклоняются от фактических на 6,113%. Это значение не превышает допустимый предел, следовательно качество построенной модели высокое.
Для оценки силы связи признаков у и х найдем средний коэффициент эластичности:
.= =
Таким образом, в среднем на -0,129% по совокупности изменится урожайность картофеля от своей средней величины при изменении дозы внесения удобрений на 1% от своего среднего значения.
2д) Для
оценки статистической
Выдвигаем нулевую гипотезу Но о статистической незначимости полученного уравнения регрессии.
Fфакт = = · (n-2)
Fфакт= =0,1732
Сравним фактическое значение критерия Фишера с табличным. Для этого выпишем значения критерия Фишера из таблицы «Значения F-критерия Фишера при уровне значимости a=0.05» (приложение 1).
В нашем примере k1=1; k=12-1-1=10.
Таким образом. Fтабл.= 4,6 при =0,05.
Т.к. Fфакт.< Fтабл., то при заданном уровне вероятности g=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.
2е) Для
оценки статистической
Выдвигаем гипотезу Но о статистически незначимом отличии показателей регрессии от нуля a=b=rух =0.
Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:
; ;
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и критическое (табличное) значения t-статистики принимаем или отвергаем гипотезу Но.
Если tтабл < tфакт, то Но отклоняется, т.е. a, b, r не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если tтабл > tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования a, b, r.
; ;
tтабл при уровне значимости g=0,05 и числе степеней свободы равных 12-2=10 равно 2,2281 (приложение 2).
< tтабл, < tтабл, < tтабл,
следовательно нулевая гипотеза о несущественности коэффициентов корреляции и регрессии принимается , т. е. r, b и a статистически незначимы.
Для расчета доверительного интервала определяем предельную ошибку ∆ для каждого показателя:
∆a = tтабл ma=2,2281∙29,92=66,654
∆b = tтабл mb=2,2281∙0,3388=0,7541
Доверительные интервалы:
Для параметра a: (-5,304; 128,011)
Для параметра b: (-0,029; 1,479)
Анализ верхних и нижних границ доверительных интервалов приводит к выводу, что с вероятностью p = 1–γ = 0,95 параметры a и b находятся в указанных пределах, причем оба параметра являются статистически незначимыми, т.к. в границы доверительного интервала попадает ноль.
3. Проверим результаты, полученные в п.2 с помощью ППП Exel.
Встроенная функция ЛИНЕЙН определяет параметры линейной регрессии. В ходе анализа придерживайтесь следующего порядка вычислений:
а) в главном меню выберите Вставка/Функция;
б) на панели инструментов Стандартная щелкните по кнопке Вставка функции;
4) в окне Категория (рис. 1.3) выберите Статистические, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК.
5) Заполните аргументы функции (рис. 1.4):
известные_значения_у – диапазон, содержащий данные результативного признака;
известные_значения_х – диапазон, содержащий данные факторов независимого признака;
константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член = 0;
Рис. 1.3. Диалоговое окно «Мастер функций».
статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.
Щелкните по кнопке ОК.
6) В левой
верхней ячейке выделенной
Дополнительная регрессионная статистика будет выводится в порядке, указанном в следующей таблице:
Таблица 1.3.– Регрессионная статистика
Значение коэффициента β |
Значение коэффициента α |
Среднеквадратическое отклонение β |
Среднеквадратическое отклонение α |
Коэффициент детерминации R2 |
Среднеквадратическое отклонение у |
F– статистика |
Число степеней свободы |
Регрессионная сумма квадратов |
Остаточная сумма квадратов |
Информация о работе Влияние факторного признака на результаивный