Двухфакторный дисперсионный анализ

Автор работы: Пользователь скрыл имя, 15 Мая 2011 в 12:42, курсовая работа

Описание

Цель работы: ознакомиться с таким статистическим методом, как дисперсионный анализ, в общем, и двухфакторный дисперсионный анализ в частности.

Работа состоит из  1 файл

КУРСОВАЯ РАБОТА !!!!!!!!!!!!!!.docx

— 112.80 Кб (Скачать документ)

Мнк-оценки (6) можно записать в виде

, , ,

,

а SS в (4) как

  Ψ=  .

Подставим теперь в  Ψ

.

Если  при возведении в квадрат и  суммировании по i, j, k сохранить скобки, то учитывая дополнительные условия

=0,  =0, =0 при всех j,

=0 при всех i

и аналогичные условия на , , {, можно проверить, что попарные произведения различных скобок дадут нуль и, значит,

Ψ= SSe+IJK +JK +IK + K  (7)

Из этого  выражения следует, что при исключении параметров, которые равны нулю, по гипотезам НАВ и НАВ соответственно получим по этим гипотезам такие же мнк-оценки, как в предложениях Ώ. Например, при НА формула (7) запишется в следующем виде

Ψ= SSe+IJK +JK +IK + K

Двухфакторный анализ с К наблюдениями в ячейке

Источник  дисперсии SS Степень свободы ES M(ES)
Главные эффекты А SSA=JK I-1   σ2+JK σ2A
Главные эффекты В SSB=IK J-1   σ2+IK σ2B
Главные эффекты АВ SSAB=K (I-1)(J-1)   σ2+K σ2AB
Ошибки SSe= IJ(K-1)   σ2
«Полная»  сумма квадратов SSn= IJK-1 - -

Не указанный  в таблице столбец средних  квадратов вычисляется делением SS на соответствующее число степеней свободы. 

Двухфакторный анализ с неравными  числами наблюдений в ячейках.

Здесь опустим наше обычное соглашение по которому генеральное среднее, главные  эффекты и взаимодействия определяются только с использованием равных весов {vi} и {wj}. Но статистические выводы остаются справедливыми, независимо от того сформулированы ли они для произвольной системы весов или для равных весов. [13]

Мы принимаем  такие же Ώ-предположения. Также  ранее мы определили Ψ Ώ (обозначали SSe) следующей формулой:

Ψ Ώ=   (1)

Эта сумма  квадратов имеет n—р степеней свободы, где n- число наблюдений, р- число непустых ячеек.

Критерий  для взаимодействий

Гипотезу  НАВ отсутствия взаимодействий, или гипотезу аддитивности, можно записать в виде

НАВ: M (yijk)=µ+αij.

Вопрос  об истинности НАВ или ее ошибочности не зависит от весов {vi} и {wj} (следуя теореме 1), используемых в определении генерального среднего µ и главных эффектов {αi} и {βj}. С таким же смыслом остается символ w:

w=Ώ∩НАВ.

При w влияние выбора весов {vi} и {wj} проявляется только в дополнительных условиях =0 и 0.

Сначала найдем нормальные уравнения в предположениях w, а затем выберем подходящие дополнительные условия.

При w мы должны минимизировать:

.

Приравнивая к нулю производные , ,   от этого выражения, получим

n=+= ,        (2)

Gi + Gi +=gi   (i= 1,…,I)         (3)

Hj + Hj +=hj   (j=1,…,J)         (4)

В выше представленных формулах индекс w указывает, что соответствующие оценки являются мнк-оценками при w; через {gi} и {hj} обозначены соответственно суммы наблюдений строки и столбца.

gi= ,   hj=                            (5)

а через  Gi  Hj – суммы чисел наблюдений в ячейках

Gi= , Hj=                                         (6)

Оценки  не будут единственными, пока не будут  выбраны дополнительные условия, тем  не менее различные SS, содержащие оценки, будут единственными.

Из (4) находим:

= -                 (7)

Подставим это выражение в (3) и получим  следующую систему уравнений

= Ϊi         (i=1,…,I),                            (8)

 
где 

,

Ϊi=gi-.                       (9)                                                                          

Исключение  {} несет за собой и исключение . Если из нормальных уравнений вместо {} исключить {}, то найдем

           j      (j=1,…,J)                       (10)

где

,

Zj=hj -.                     (11)

Если  применить теорию наименьших квадратов, то Ψw можно представить в виде:

Ψw=        (12) 
 
 
 
 
 
 
 
 
 

    1. Выполнение  дисперсионного анализа

В основе дисперсионного анализа лежит закон  разложения дисперсий (вариаций) признака на составляющие.

Общая вариация Dо результативного признака при группировке может быть разложена на следующие составные части:

- на  межгрупповую Dм, связанную с группировочным признаком

- на  остаточную (внутригрупповую) Dв, не связанную с группировочным признаком

Соотношение между этими показателями выражается формулой:

Dо= Dм+ Dв .

По данным таблицы, требуется доказать, влияют ли сроки посева на урожайность пшеницы. (в тыс. тонн)

Сроки посева пшеницы и влияющие факторы (для однофакторного анализа)

Группы  по срокам посева 1 2 3 4 5 6 7 8  
5-10 мая 24 27 27 22 26 25 29 28 26
10-15 мая 25 26 30 27 31 28 27 30 28
15-20 мая 23 27 25 25 28 27 26 27 26
20-25 мая 25 22 23 22 24 27 25 24 24
  24 26 26 24 27 27 27 26 -26

Здесь N=32, K=4, l=8.

Du= ,

где N- число единиц совокупности, Yi - индивидуальные значения урожайности, - общая средняя урожайности по всей совокупности.

=1/4(26+28+26+24)=26

Du= (24-26)2 + (27-26)2 + …+(29-26)2 + (28-26)2 + (25-26)2 + (26-26)2 + …+ (27-26)2 + (30-26)2 + (23-26)2 + (27-26)2 +…+ (26-26)2 + (27-26)2 + (25-26)2 + (22-26)2 +…+ (25-26)2 + (24-26)2 = 170

Для определения  межгрупповой суммарной вариации, определяющей вариацию результативного признака за счет изучаемого фактора, необходимо знать средние значения результативного  признака по каждой группе. Эта суммарная  вариация равна сумме квадратов  отклонений групповых средних величин  от общей средней величины признака, взвешенной на число единиц совокупности в каждой из групп:

Dм= ;

Dм=== 64

Внутригрупповая суммарная вариация равна сумме  квадратов отклонений индивидуальных значений признака от групповых средних  по  каждой группе, суммированной  по всем группам совокупности. [6]

Dв= .

Dв= (24-26)2 + (27-26)2 + …+ (29-26)2 + (28-26)2 + (25-28)2 + (26-28)2 + …+ (27-28)2 + (30-28)2 + (23-26)2 + (27-26)2 + …+ (26-26)2 + (27-26)2 + (25-24)2 + (22-24)2 + …+ (25-24)2 + (24-24)2 =106.

Влияние фактора на результативный признак  проявляется в соотношении между  Dм и Dв: чем сильнее влияние фактора на величину изучаемого признака, тем больше Dм и меньше Dв.

Для проведения дисперсионного анализа нужно установить источники варьирования признака, объем  вариации по источникам, определить число  степеней свободы для каждой компоненты вариации.

Объем вариации уже установлен, теперь нужно  определить число степеней свободы  вариации. Число степеней свободы- это  число независимых отклонений индивидуальных значений признака от его среднего значения. Общее число степеней свободы, соответствующее общей сумме  квадратов отклонений в дисперсионном  анализе, разлагается по составляющим вариации. Так, общей сумме квадратов  отклонений Dо соответствует число степеней свободы вариации, равное N-1=31. Групповой вариации Dм соответствует число степеней свободы вариации, равное К-1=3. Внутригрупповой остаточной вариации соответствует число степеней свободы вариации, N-К=28.

Теперь, зная суммы квадратов отклонений и число степеней свободы, можно  определить дисперсии для каждой составляющей. Обозначим эти дисперсии: dм- групповые и dв- внутригрупповые.

dм= =21,3 ;

dв= =3,8.

После вычисления этих дисперсий приступим  к установлению значимости влияния  фактора на результативный признак. Для этого находим отношение:

dм/ dв= Fф.

Величина  Fф , называемая критерием Фишера, сравнивается с табличным, Fтабл. Если Fф >Fтабл , то влияние фактора на результативный признак доказано. Если Fф <Fтабл , то можно утверждать, что различие между дисперсиями находится в пределах возможных случайных колебаний и, значит, не доказывает с достаточной вероятностью влияние изучаемого фактора.

Повышение уровня вероятности требует для сравнения более высокого значения Fтабл .

Величина  Fтабл также зависит от числа степеней свободы двух сравниваемых дисперсий. Если число степеней свободы стремится к бесконечности, то Fтабл стремится к единице.

Здесь Fф=21,3/3,8=5,6. Табличное же значение Fтабл для теории вероятности 0,95 и степеней свободы, соответственно равных 3 и 28, Fтабл =2,95.

Значение  Fф , полученное в опыте, превышает теоретическое значение даже для вероятности 0,99. Значит, опыт с вероятностью более 0,99 доказывает влияние изучаемого фактора на урожайность, т.е. опыт можно считать надежным, доказанным, а значит, сроки посева оказывают существенное влияние на урожайность пшеницы. Оптимальным сроком посева следует считать период с 10 по 15 мая, так как именно при этом сроке посева получены наилучшие результаты урожайности.

Выше  рассмотрена методика дисперсионного анализа при группировке по одному признаку и случайному распределению  повторностей внутри группы. Однако часто  бывает так, что опытный участок  имеет какие-то различия в плодородии почвы и т.д. В связи с этим может возникнуть такая ситуация, что большее число делянок одного из вариантов попадет на лучшую часть, и его показатели будут завышены, а другого варианта- на худшую часть, и результаты в этом случае, очевидно, будут хуже, т.е. занижены.

Информация о работе Двухфакторный дисперсионный анализ