Автор работы: Пользователь скрыл имя, 18 Января 2013 в 17:20, курсовая работа
Генеральной совокупностью называется совокупность всех возможных наблюдений, проводимых в одинаковых условиях над некоторыми случайными величинами.
Отобранные из генеральной совокупности объекты называются выборкой.
Число объектов данной выборки называется объемом выборки (n).
Дана выборка из генеральной совокупности случайной величины X:
Наиболее употребляемым и простым критерием для проверки статистических гипотез является критерий Пирсона (χ2).
1. Исходные данные
2. Вариационный ряд
3. Интервальный вариационный ряд
4. Гистограмма. Выдвижение гипотезы о законе распределения генеральной совокупности X
5. Теоретическая функция плотности рассмотренного закона. Оценки числовых характеристик и оценки параметров закона
6. Проверка критерия Пирсона
ФБГОУ ВПО «Сибирская
государственная автомобильно-
академия (СибАДИ)»
Кафедра «Высшая математика»
РАСЧЕТНО-ГРАФИЧЕСКАЯ РАБОТА
по дисциплине «Высшая математика»
на тему: «Проверка гипотезы о законе распределения генеральной совокупности X по критерию Пирсона» (Вариант №58)
Выполнил: студент гр. ПГСб-11В1
Остапченко М. И.
Проверила: Мирошниченко Т. П.
Омск-2012
Содержание
1. Исходные данные
Математической статистикой называется наука о методах получения и обработки результатов наблюдений (измерений) для установления закономерностей в массовых случайных явлениях. В математической статистике решается 2 типа задач:
Генеральной совокупностью называется совокупность всех возможных наблюдений, проводимых в одинаковых условиях над некоторыми случайными величинами.
Отобранные из генеральной совокупности объекты называются выборкой.
Число объектов данной выборки называется объемом выборки (n).
Дана выборка из генеральной совокупности случайной величины X:
Табл. 1
Генеральная совокупность
0,569 |
1,986 |
3,399 |
0,136 |
1,526 |
0,546 |
0,582 |
0,340 |
0,438 |
0,138 |
1,536 |
0,089 |
1,414 |
0,450 |
0,336 |
3,986 |
1,454 |
0,254 |
1,104 |
0,920 |
0,733 |
0,084 |
0,366 |
1,312 |
1,517 |
2,112 |
0,530 |
2,075 |
0,976 |
0,206 |
0,542 |
0,418 |
1,593 |
0,275 |
0,098 |
1,227 |
0,978 |
0,298 |
0,025 |
0,308 |
0,870 |
1,728 |
2,277 |
0,250 |
0,271 |
0,453 |
0,101 |
1,308 |
1,779 |
1,401 |
n= 50-объем выборки.
После того как из генеральной совокупности извлечена выборка, ее объекты обследуют по отношению к генеральной совокупности, для этого их подвергают обработке.
Операция заключается в том, что элементы выборки располагают в порядке их возрастания, называемое ранжированием, а последовательность элементов называется вариационным рядом, а элементы называются вариантами.
Табл. 2
Ранжированный ряд
0,025 |
0,084 |
0,089 |
0,098 |
0,101 |
0,136 |
0,138 |
0,206 |
0,250 |
0,254 |
0,271 |
0,275 |
0,298 |
0,308 |
0,336 |
0,340 |
0,366 |
0,418 |
0,438 |
0,450 |
0,453 |
0,530 |
0,542 |
0,546 |
0,569 |
0,582 |
0,733 |
0,870 |
0,920 |
0,976 |
0,978 |
1,104 |
1,227 |
1,308 |
1,312 |
1,401 |
1,414 |
1,454 |
1,517 |
1,526 |
1,536 |
1,593 |
1,728 |
1,779 |
1,986 |
2,075 |
2,112 |
2,277 |
3,399 |
3,986 |
Диапазон наблюденных значений случайной величины X укладывается в интервал (0,025; 3,986). Ранжированные опытные данные объединяем в группы.
Если выборка содержит много вариантов, то для простоты изучения варианты разбивают на отдельные интервалы, т.е. проводят группировку и получают группированный вариационный ряд (статистический ряд).
Численность отдельной группы сгруппированного ряда опытных данных называется выборочной частотой соответствующей варианты X(i) и обозначается: - выборочная частота,
При этом
Отношение выборочной частоты данной варианты к объему выборки называется относительной выборочной частотой и находится по формуле:
, где i-номер варианта, причем
3. Интервальный вариационный ряд
Интервальным вариационным рядом распределения называется упорядоченная совокупность частичных интервалов значений случайных величин, с соответствующими им частотами или относительной частотой.
Для построения вариационного
ряда выполняются следующие
1. Находим размах выборки:
R=Xнаиб.-Xнаим.
R=3,986 – 0,025 = 3,961
2. Назначаем количество частичных интервалов k=8
Находим шаг разбиения ∆:
При этом округление производим до ближайшего целого числа или до ближайшей простой дроби.
3. После разбиения
на частичные интервалы
4. Гистограмма. Выдвижение гипотезы о законе распределения генеральной совокупности X
Гистограмма – это
изображение интервального
Вариационный ряд является статистическим аналогом распределения случайной величины X, а гистограмма – статистическим аналогом функции плотности. По гистограмме будет выдвигаться гипотеза о законе распределения случайной величины X.
Рис. 1- Гистограмма и выравнивающая ее кривая
Вид данной гистограммы позволяет выдвинуть гипотезу о нормальном законе распределения исследуемой случайной величины.
Результаты расчетов в столбцах хi и f(xi) дают возможность построить на гистограмме выравнивающую кривую функции плотности (прод. табл. 3).
Табл. 3
Интервальный вариационный ряд
xi – xi+1 |
mi* частота |
pi*= mi*/n |
hi*= pi*/∆ |
e - xi |
f(xi) = |
pi= f(xi) . ∆ |
npi |
mi*- npi |
(mi*- npi)2 |
(mi*- npi)2 npi | ||
0 – 0,5 |
0,25 |
21 |
0,42 |
0,84 |
0,26 |
0,7710 |
0,810 |
0,405 |
20,25 |
0,75 |
0,563 |
0,028 |
0,5 – 1,0 |
0,75 |
10 |
0,20 |
0,40 |
0,79 |
0,4538 |
0,476 |
0,238 |
11,90 |
-1,90 |
3,610 |
0,303 |
1,0 – 1,5 |
1,25 |
7 |
0,14 |
0,28 |
1,31 |
0,2698 |
0,283 |
0,119 |
5,95 |
1,05 |
1,103 |
0,185 |
1,5 – 2,0 |
1,75 |
7 |
0,14 |
0,28 |
1,84 |
0,1588 |
0,167 |
0,084 |
4,20 |
2,80 |
7,840 |
1,867 |
2,0 - 2,5 |
2,25 |
3 |
0,06 |
0,12 |
2,36 |
0,0944 |
0,099 |
0,050 |
2,50 |
0,50 |
0,250 |
0,100 |
2,5 – 3,0 |
2,75 |
0 |
0 |
0 |
2,89 |
0,0556 |
0,058 |
0,029 |
1,45 |
1,45 |
2,103 |
1,450 |
3,0 – 3,5 |
3,25 |
1 |
0,02 |
0,04 |
3,41 |
0,0330 |
0,035 |
0,018 |
0,90 |
0,10 |
0,010 |
0,011 |
3,5 – 4,0 |
3,75 |
1 |
0,02 |
0,04 |
3,94 |
0,0195 |
0,020 |
0,010 |
0,50 |
0,50 |
0,250 |
0,500 |
∑ mi*=50 |
∑ pi=1 |
∑ pi=1 |
Х2в=4,4 |
Где - середина i-ого интервала;
ti –нормированная нормальная случайная величина i-ого интервала;
pi – вероятность попадания возможных значений случайной величины в i-ый интервал.
Предварительно для вычислений значений функции плотности (табл. 3) были найдены точечные оценки математического ожидания и дисперсии, что позволило получить оценки параметров µ и σ ( ).
5. Теоретическая функция плотности рассмотренного закона.
Оценки числовых характеристик и оценки параметров закона
Показательный закон распределения
Главная особенность этого закона – это то, что он является предельным законом, к которому приближаются другие законы распределения.
Непрерывная случайная величина X распределена по нормальному закону (закону Гаусса) с параметрами µ и σ2 ( ), если ее функция плотности имеет вид:
Найдем оценки М(х) и D(х).
Оценками математической статистики называют приближенные значения числовых характеристик или параметров законов распределения генеральной совокупности X, вычисленные на основе выборки.
Оценка называется точечной, если она определяется одним числом или точкой на числовой оси.
При вычислении точечных оценок для удобства берут не сами элементы выборки, а середины частичных интервалов (х͂i) из интервального вариационного ряда.
Выборочной средней (оценкой математического ожидания) называется среднее арифметическое значение признака выборочной совокупности.
Выборочная дисперсия (оценка дисперсии) – это среднее арифметическое квадратов отклонений вариант от их выборочной средней.
Среднее квадратическое отклонение:
Коэффициент вариации
Оценка параметра
закона распределения
6. Проверка критерия Пирсона
Наиболее употребляемым и простым критерием для проверки статистических гипотез является критерий Пирсона (χ2).
Распределение χ2 зависит от параметра r, который называют числом степеней свободы:
где k- количество объединенных интервалов;
q – число независимых условий («связей»), наложенных на относительные частоты pi* (для нормального закона распределения q=3).
Для практических целей величину χ2 считают по формуле:
Метод проверки гипотезы с помощью критерия χ2 можно сформулировать следующим образом:
Если же χ2в ≤ χ2 α,r, то гипотеза с вероятностью P=1- α принимается.
Проверим гипотезу о нормальном распределении исследуемой нами величины:
1.
2. r= k – q= 5 - 2= 3
3. Выбираем уровень значимости α = 0,05 и соответствующее значение χ2 0,05; 3 = 7,8
4. χ2< χ2 0,05; 5 (3,8<7,8), т.е. гипотеза о показательном распределении не противоречит опытным данным, поэтому должна быть принята.
Найдем доверительные интервалы для MX и DX. По формуле и по формуле
Тогда для доверительной вероятности p = 0,95 найдем значение up по табл. П.2 как значение аргумента функции Лапласа, при котором она равна ; u 0,95 = 1,96.
Получаем соответственно
0,95-1,96*0,117<MX<0,95+1,96*