Автор работы: Пользователь скрыл имя, 15 Мая 2011 в 12:42, курсовая работа
Цель работы: ознакомиться с таким статистическим методом, как дисперсионный анализ, в общем, и двухфакторный дисперсионный анализ в частности.
Общая сумма квадратов отклонений подразделяется в этом случае уже на 3 составляющие:
Dо= Dм+ Dповт+Dост .
Для представленных данных сумма квадратов отклонений, вызванная повторностями, будет равна:
Dповт = .
Dповт = [(24-26)2 + (26-26)2 + (26-26)2 + (24-26)2 + (27-26)2 + (27-26)2 + (27-26)2 + (26-26)2] × 4= 44.
Значит,
случайная сумма квадратов
Dост =Dв –Dповт ; Dост =106-44= 62.
Для остаточной дисперсии число степеней свободы равно 28-7=21. Представим результаты дисперсионного анализа в виде таблицы:
Результаты однофакторного дисперсионного анализа
Источники вариации | Сумма квадратичных отклонений | Степени свободы вариации | Дисперсии | F-критерии | |
фактические | р=0,95 теоретические | ||||
Сроки посева | 64 | 3 | 21,3 | 8,9 | 3,07 |
Повторности | 44 | 7 | 6,3 | 2,6 | 2,49 |
Остаточная | 62 | 21 | 2,4 | 1 | Х |
Общая | 170 | 31 | Х | Х | Х |
Поскольку фактические значения F-критерия для вероятности 0,95 превышают табличные, то влияние сроков посева и повторностей на урожайность пшеницы следует считать существенным. Рассмотренный способ построения опыта, когда участок предварительно делится на блоки с относительно выравненными условиями, а проверяемы варианты распределяются внутри блока в случайном порядке, называется способом рендомизированных блоков.
Рассмотрим, теперь, дисперсионный анализ опыта, в котором следует выявить влияние не только сроков посева, но и сортов на урожайность пшеницы.
Сроки посева пшеницы и влияющие факторы (для двухфакторного анализа)
Группы по срокам посева | Подгруппы по сортам | Урожайность по повторностям, ц/га | Сумма | Средние
по подгруппам
Yпс |
Средние по группам Yп | |||
1 | 2 | 3 | 4 | |||||
5-10 мая | А
Б |
24
26 |
27
25 |
27
29 |
22
28 |
100
108 |
25
27 |
26 |
10-15 мая | А
Б |
25
31 |
26
28 |
30
27 |
27
30 |
108
116 |
27
29 |
28 |
15-20 мая | А
Б |
23
28 |
27
27 |
25
26 |
25
27 |
100
108 |
25
27 |
26 |
20-25 мая | А
Б |
25
24 |
22
27 |
23
25 |
22
24 |
92
100 |
23
25 |
24 |
По всем группам | А | 100 | +108 | +100 | +92 | -400 | 25 | Yc |
Б | 108 | +116 | +108 | +100 | -432 | 27 | ||
Всего: |
400 +432 |
D0= =170 - это сумма квадратов отклонений индивидуальных значений от общей средней.
Вариация по совместному влиянию сроков посева и сорта Dпс==96 – это сумма квадратов отклонений средних по подгруппам от общей средней, взвешенных на число повторностей, т.е. на 4.
Вычисление вариации по влиянию только сроков посева:
Dc== [(26-26)2 + (28-26)2 + (26-26)2 + (24-26)2] ×8= 64
Вычисление вариации только по влиянию сорта пшеницы:
Dy== [(25-26)2 + (27-26)2] ×16=32.
Остаточная
вариация определяется как разность
между общей вариацией и
Dост=Dо -Dпс=170-96=74
Результаты, вновь, приведем в виде таблицы:
Результаты двухфакторного дисперсионного анализа
Влияние факторов | Общая вариация | Число степеней свободы | Дисперсия на 1 степень свободы | Fфакт | Fтабл для р=0,99 |
Совместное сроков посева и сорта | 96 | 7 | 13,7 | 4,42 | 3,4 |
В том
числе:
сроков посева |
64 | 3 | 21,3 | 6,88 | 4,7 |
сорта | 32 | 1 | 32,0 | 10,3 | 7,7 |
Сочетание факторов | 4 | Х | Х | ||
Остаточное | 74 | 24 | 3,1 | Х | Х |
Общая вариация | 170 | 31 | 5,5 | Х | Х |
Результаты
дисперсионного анализа показывают,
что влияние изучаемых
А теперь проделаем то же самое, но при помощи компьютерной программы. Если дисперсионный анализ мы выполнили правильно, то результаты нашего решения и результаты, полученные при помощи компьютерной программы должны совпасть.
2-ФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ. Файл:
Факторный план: неповторяемый
Источник Сум.квадр Ст.своб Ср.квадр F Значимость Сила влияния
Факт.1 32 4 6,6428571 4,3445378 0,06147341 -0,2416484
Факт.2 64 3 21,333333 7,5294118 0,0016169693 0,072777869
Остат. 74 24 2,8333333
Общая 170 31 5,483871
F(фактор1)=4,3445378, Значимость=0,06147341, степ.своб = 4,21
Гипотеза 0: <Есть влияние фактора на отклик>
F(фактор2)=7,5294118, Значимость=0,0016169693, степ.своб = 3,21
Гипотеза 1: <Есть влияние фактора на отклик>
Параметры модели:
Среднее = 26, доверит.инт.=0,76405521
Эффект1-1 = -1,75, доверит.инт.=2,2210286
Эффект1-2 = -0,5, доверит.инт.=2,2210286
Эффект1-3 = 0,25, доверит.инт.=2,2210286
Эффект1-4 = -2, доверит.инт.=2,2210286
Эффект1-5 = 1,25, доверит.инт.=2,2210286
Эффект1-6 = 0,75, доверит.инт.=2,2210286
Эффект1-7 = 0,75, доверит.инт.=2,2210286
Эффект1-8 = 1,25, доверит.инт.=2,2210286
Эффект2-1 = 0, доверит.инт.=2,0957353
Эффект2-2 = 2, доверит.инт.=2,0957353
Эффект2-3 = 0, доверит.инт.=2,0957353
Эффект2-4 = -2, доверит.инт.=2,0957353
Проанализируя полученные результаты (решение одной задачи двумя способами) мы теперь можем придти к выводу, что результаты решения вручную и результаты компьютерной программы совпадают (т.е. оба фактора имеют влияние) и значит мы правильно провели анализ данных.
Аналогично двухфакторному выполняется и многофакторный анализ. При росте количества факторов увеличивается объем расчетных работ, и кроме того, становится затруднительно оформлять исходную информацию в комбинационную таблицу. Отсюда следует, что врятли целесообразно изучать влияние многочисленных факторов на результат с использованием дисперсионного анализа; лучше взять меньшее их число, но выбрать наиболее существенные факторы с точки зрения экономики и сделать их анализ.
Рассмотрим еще одни данные и применим дисперсионный анализ.
Рассматривается
применение дисперсионного анализа
для обработки результатов
При планировании эксперимента была выдвинута гипотеза о влиянии на качество усвоения учебного материала двух факторов: уровня математической подготовки обучаемых и технологии обучения (с использованием и без использования интегративных занятий).
Схема формирования экспериментальной и контрольной групп в педагогическом эксперименте состоит в следующем. Были выделены семь учебных групп (175 обучаемых), четыре из которых предполагалось обучать с использованием интегративных занятий, а три – без использования. На первом этапе из выбранных учебных групп были сформированы экспериментальная и контрольная группы (по 60 обучаемых каждая), которые и образовали статистический комплекс для обработки результатов эксперимента. Чтобы повысить достоверность результатов эксперимента, в контрольную и экспериментальную группы были отобраны обучаемые с примерно одинаковым уровнем математической подготовки (по 20 обучаемых с высоким, средним и низким уровнем математической подготовки в каждой группе). Формирование таких групп осуществлялось на основе оценок, полученных по математике на Едином государственном экзамене. Обучаемые, получившие 70 баллов и выше, были отнесены к подгруппе с высоким уровнем математической подготовки; обучаемые, получившие от 55 до 69 баллов включительно, – к подгруппе со средним уровнем математической подготовки; и обучаемые, получившие менее 55 баллов, – к подгруппе с низким уровнем математической подготовки.