Влияние факторного признака на результаивный

Автор работы: Пользователь скрыл имя, 26 Февраля 2012 в 22:04, контрольная работа

Описание

По исходным данным, характеризующим территории региона за 199х год необходимо1:
Построить поле корреляции.
Для характеристики зависимости у от х:
а) построить линейное уравнение парной регрессии у от х;
б) оценить тесноту связи с помощью показателей корреляции и коэффициента детерминации;

Работа состоит из  1 файл

эконометика.docx

— 136.23 Кб (Скачать документ)

1.2. Типовой пример выполнения индивидуальной работы по теме 1

 

Задание:

По исходным данным, характеризующим территории региона за 199х год необходимо1:

  1. Построить поле корреляции.
  2. Для характеристики зависимости у от х:

а) построить  линейное уравнение парной регрессии у от х;

б) оценить  тесноту связи с помощью показателей  корреляции и коэффициента детерминации;

в) оценить  качество линейного уравнения с  помощью средней ошибки аппроксимации;

г) дать оценку силы связи с помощью среднего коэффициента эластичности;

д) оценить статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера;

е) оценить  статистическую значимость параметров регрессии и корреляции.

3) Проверить  результаты, полученные в п.2 с  помощью ППП Exel.

4) Рассчитать  параметры показательной парной  регрессии. Проверить результаты  с помощью ППП Exel. Оценить статистическую надежность указанной модели с помощью F-критерия Фишера.

5. Обосновано  выбрать лучшую модель и рассчитать  по ней прогнозное значение  результата, если прогнозное значение  фактора увеличится на 5% от среднего  уровня. Определить доверительный  интервал прогноза при уровне  значимости γ = 0,05.

 

Решение:

Для нашего примера 

Результативный  признак (у) – урожайность картофеля, ц/га

Факторный признак (х) – доза внесения органических удобрений, ц/га

 

Таблица 1.1. – Исходные данные для анализа

№ региона

Доза внесения удобрений, ц/га

х

Урожайность картофеля, ц/га

у

1

115

250

2

98

249

3

105

242

4

109

193

5

102

256

6

116

215

7

97

200

8

92

240

9

112

228

10

110

230

11

104

235

12

100

221

13

95

249

14

98

220

15

107

245

16

106

260


 

              1. Построим поле корреляции, для чего отложим на плоскости в прямоугольной системе координат точки (xi  yi) (рис.1.1).

 

Рис. 1.1. Поле корреляции

Расположение  точек на графике не позволяет  точно определить тип уравнения  регрессии. Для выявления типа зависимости  воспользуемся экспериментальным  методом.

 

2. Для расчета  параметров линейной регрессии  построим расчетную таблицу (табл.1.2)

 

Таблица 1.2. – Расчетные значения

х

у

xy

х2

у2

,

·100%,

(Ai, %)

 

1

115

250

28750

13225

62500

230,464

7,814

381,657

118,266

8,114

278,473

2

98

249

24402

9604

62001

234,917

5,656

198,335

37,516

2,574

246,098

3

105

242

25410

11025

58564

233,083

3,685

79,507

0,766

0,053

75,473

4

109

193

21037

11881

37249

232,036

20,226

1523,775

23,766

1,631

1625,098

5

102

256

26112

10404

65536

233,869

8,645

489,776

4,516

0,310

514,723

6

116

215

24940

13456

46225

230,202

7,071

231,101

141,016

9,675

335,348

7

97

200

19400

9409

40000

235,179

17,589

1237,547

50,766

3,483

1109,723

8

92

240

22080

8464

57600

236,488

1,463

12,331

147,016

10,087

44,723

9

112

228

25536

12544

51984

231,250

1,425

10,561

62,016

4,255

28,223

10

110

230

25300

12100

52900

231,774

0,771

3,146

34,516

2,368

10,973

11

104

235

24440

10816

55225

233,345

0,704

2,738

0,016

0,001

2,848

12

100

221

22100

10000

48841

234,393

6,060

179,372

17,016

1,167

151,598

13

95

249

23655

9025

62001

235,703

5,340

176,819

83,266

5,713

246,098

14

98

220

21560

9604

48400

234,917

6,780

222,513

37,516

2,574

177,223

15

107

245

26215

11449

60025

232,559

5,078

154,768

8,266

0,567

136,598

16

106

260

27560

11236

67600

232,821

10,453

738,678

3,516

0,241

712,223

Итого

1666

3733

388497

174242

876651

3733,000

108,761

5642,625

769,750

52,813

5695,438

Ср.знач

104,125

233,313

24281,063

10890,125

54790,6875

233,313

6,798

352,664

48,109

   

σ

                   6,936  

                                                                 18,867  

                 

σ2

48,109

355,965

                 

 

2а. Построим  линейное уравнение парной регрессии у по х. Используя данные таблицы 2, имеем:

β= =-0,2619

 

a = =

 

Тогда линейное уравнение парной регрессии имеет  вид:

 

 

Полученное  уравнение показывает, что с увеличением  дозы внесения органических уравнений на l ц/га урожайность картофеля уменьшается  в среднем на 0,2619 ц/га.

Рис. 1.2. Зависимость  между дозой внесения органических удобрений и урожайностью картофеля (линейная регрессия).

 

Подставляя  в полученное уравнение регрессии  значения xi из исходных данных определяем теоретические (выровненные) значения результативного признака (табл.1.2).

2б.  При  линейной корреляции между х и у исчисляют парный линейный коэффициент корреляции r. Он принимает значения в интервале –1 £ r £ 1. Знак коэффициента корреляции показывает направление связи: «+» – связь прямая, «–» – связь обратная. Абсолютная величина характеризует степень тесноты связи.

Учитывая:

      ,

оценим тесноту  линейной связи с помощью линейного  коэффициента парной корреляции

 

Связь между  факторами обратная. В соответствии со шкалой Чеддока теснота характеризуется как слабая.

Изменение результативного  признака у обусловлено вариацией факторного признака х. Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации D. Коэффициент детерминации – квадрат коэффициента корреляции.

R2=rху2·100%

R2= (-0,1105)2 ∙100%=0,0122∙100%=1,22%

Следовательно, вариация урожайности картофеля на 1,22 % объясняется вариацией дозы внесения удобрений, а остальные 98,78% вариации урожайности обусловлены изменением других, не учтенных в модели факторов.

= =

В среднем  расчетные значения отклоняются от фактических на 6,113%. Это значение не превышает допустимый предел, следовательно качество построенной модели высокое.

 

 Для оценки  силы связи признаков у и х найдем средний коэффициент эластичности:

.= =

Таким образом, в среднем на -0,129% по совокупности изменится урожайность картофеля от своей средней величины при изменении дозы внесения удобрений на 1% от своего среднего значения.

 

2д) Для  оценки статистической надежности  результатов используем F-критерий Фишера.

Выдвигаем нулевую  гипотезу Но о статистической незначимости полученного уравнения регрессии.

Fфакт = = · (n-2)

Fфакт= =0,1732

 

Сравним фактическое  значение критерия Фишера с табличным. Для этого выпишем значения критерия Фишера из таблицы «Значения F-критерия Фишера при уровне значимости a=0.05» (приложение 1).

В нашем примере  k1=1;  k=12-1-1=10.

Таким образом. Fтабл.= 4,6 при =0,05.

Т.к. Fфакт.< Fтабл., то при заданном уровне вероятности g=0,05 следует принять нулевую гипотезу о статистической незначимости уравнения регрессии и показателя тесноты связи.

 

2е) Для  оценки статистической значимости  коэффициентов регрессии и корреляции  рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей.

Выдвигаем гипотезу Но о статистически незначимом отличии показателей регрессии от нуля a=b=rух =0.

Вероятностная оценка параметров корреляции производится по общим правилам проверки статистических гипотез, разработанным математической статистикой, в частности путем сравнения оцениваемой величины со средней случайной ошибкой оценки:

; ;

Случайные ошибки параметров линейной регрессии и  коэффициента корреляции определяются по формулам:

 

Сравнивая фактическое и критическое (табличное) значения t-статистики принимаем или отвергаем гипотезу Но.

Если tтабл < tфакт, то Но отклоняется, т.е. a, b, r не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если tтабл > tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования a, b, r.

 

; ;

tтабл при уровне значимости g=0,05 и числе степеней свободы равных 12-2=10 равно 2,2281 (приложение 2).

< tтабл,    < tтабл,      < tтабл,

следовательно нулевая гипотеза о несущественности коэффициентов корреляции и регрессии  принимается , т. е. r, b и a статистически незначимы.

Для расчета  доверительного интервала определяем предельную ошибку ∆ для каждого  показателя:

∆a = tтабл ma=2,2281∙29,92=66,654

∆b = tтабл mb=2,2281∙0,3388=0,7541

Доверительные интервалы:

Для параметра a: (-5,304;  128,011)

Для параметра b: (-0,029;  1,479)

Анализ верхних  и нижних границ доверительных интервалов приводит к выводу, что с вероятностью p = 1–γ = 0,95 параметры a и b находятся в указанных пределах, причем оба параметра являются статистически незначимыми, т.к. в границы доверительного интервала попадает ноль.

3. Проверим  результаты, полученные в п.2 с  помощью ППП Exel.

Встроенная  функция ЛИНЕЙН определяет параметры линейной регрессии. В ходе анализа придерживайтесь следующего  порядка вычислений:

  1. введите исходные данные или откройте существующий файл, содержащий исходную информацию для анализа;
  2. выделите область пустых ячеек 5Í2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики;
  3. активизируйте Мастер функций одним из способов:

а) в главном  меню выберите Вставка/Функция;

б) на панели инструментов Стандартная щелкните по кнопке Вставка функции;

 

4) в  окне  Категория (рис. 1.3) выберите Статистические, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК.

5) Заполните  аргументы функции (рис. 1.4):

известные_значения_у – диапазон, содержащий данные результативного признака;

известные_значения_х – диапазон, содержащий данные факторов независимого признака;

константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член = 0;

 

 

Рис. 1.3. Диалоговое окно «Мастер функций».

 

статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.

Щелкните  по кнопке ОК.

6) В левой  верхней ячейке выделенной области  появится первый элемент итоговой  таблицы. Чтобы раскрыть всю  таблицу, нажмите на клавишу  <F2>, а затем – на комбинацию клавиш <CTRL>,<SHIFT>,<ENTER>.

Дополнительная  регрессионная статистика будет  выводится в порядке, указанном в следующей таблице:

Таблица 1.3.–  Регрессионная статистика

Значение  коэффициента β

Значение  коэффициента α

Среднеквадратическое  отклонение β

Среднеквадратическое  отклонение α

Коэффициент детерминации R2

Среднеквадратическое  отклонение у

F– статистика

Число степеней свободы

Регрессионная сумма квадратов

Остаточная  сумма квадратов

Информация о работе Влияние факторного признака на результаивный