Автор работы: Пользователь скрыл имя, 20 Июня 2012 в 00:30, задача
Пусть задана выборка
Xn = {21,2; 32,6; 44,4; 64,4; 39,5; 32,1; 31,7; 30,2; 33,5; 22,7; 21,2; 20,4; 15,7; 36,6; 48,7; 36,5; 42,8; 38,1; 35,4; 40; 34,2; 33,8; 64,5; 40,5; 40; 22; 31; 45; 36; 28} объема n=30, полученная при наблюдении за случайной величиной X (признак выборки). Заданы так же надежность γ=0,99 для построения доверительных интервалов оценок параметров распределения случайной величиной X, уровень значимости α1=0,05 для проверки статистических гипотез.
Пусть задана выборка
Xn = {21,2;
32,6; 44,4; 64,4; 39,5; 32,1; 31,7; 30,2; 33,5; 22,7; 21,2; 20,4; 15,7;
36,6; 48,7; 36,5; 42,8; 38,1; 35,4; 40; 34,2; 33,8; 64,5; 40,5; 40;
22; 31; 45; 36; 28} объема n=30, полученная
при наблюдении за случайной величиной
X (признак выборки). Заданы так же надежность
γ=0,99 для построения доверительных интервалов
оценок параметров распределения случайной
величиной X, уровень значимости
α1=0,05 для проверки статистических
гипотез.
Задание 1
1.1. Наблюдаемая выборка может представлять собой стаж работы по специальности сотрудников строительного предприятия.
xj | 15,7 | 20,4 | 21,2 | 22,0 | 22,7 | 28,0 | 30,2 | 31,0 |
nj | 1 | 1 | 2 | 1 | 1 | 1 | 1 | 1 |
ωj | 0,033 | 0,033 | 0,067 | 0,033 | 0,033 | 0,033 | 0,033 | 0,033 |
nj*xj | 15,7 | 20,4 | 42,4 | 22,0 | 22,7 | 28,0 | 30,2 | 31,0 |
nj - Xср | -34,423 | -34,423 | -33,423 | -34,423 | -34,423 | -34,423 | -34,423 | -34,423 |
nj*(xj - Xср)2 | 388,997 | 225,691 | 404,587 | 180,177 | 161,875 | 55,101 | 27,280 | 19,563 |
31,7 | 32,1 | 32,6 | 33,5 | 33,8 | 34,2 | 35,4 | 36,0 |
1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 |
0,033 | 0,033 | 0,033 | 0,033 | 0,033 | 0,033 | 0,033 | 0,033 |
31,7 | 32,1 | 32,6 | 33,5 | 33,8 | 34,2 | 35,4 | 36,0 |
-34,423 | -34,423 | -34,423 | -34,423 | -34,423 | -34,423 | -34,423 | -34,423 |
13,861 | 11,042 | 7,969 | 3,698 | 2,634 | 1,496 | 0,001 | 0,333 |
36,5 | 36,6 | 38,1 | 39,5 | 40,0 | 40,5 | 42,8 | 44,4 |
1 | 1 | 1 | 1 | 2 | 1 | 1 | 1 |
0,033 | 0,033 | 0,033 | 0,033 | 0,067 | 0,033 | 0,033 | 0,033 |
36,5 | 36,6 | 38,1 | 39,5 | 80,0 | 40,5 | 42,8 | 44,4 |
-34,423 | -34,423 | -34,423 | -34,423 | -33,423 | -34,423 | -34,423 | -34,423 |
1,160 | 1,385 | 7,166 | 16,622 | 41,898 | 25,776 | 54,420 | 80,587 |
45,0 | 48,7 | 64,4 | 64,5 | Σ |
1 | 1 | 1 | 1 | 30 |
0,033 | 0,033 | 0,033 | 0,033 | 1 |
45,0 | 48,7 | 64,4 | 64,5 | 1062,700 |
-34,423 | -34,423 | -34,423 | -34,423 | |
91,719 | 176,279 | 839,667 | 845,472 | 3686,454 |
Рис. 1
1.3. Подсчитаем выборочные параметры.
Выборочное среднее , .
Выборочную дисперсию , .
Выборочное среднеквадратическое отклонение , .
Утонченную выборочную дисперсию .
Выборочный
стандарт
=11,275.
Задание 2
Величины Xср, DУТ, S случайные и являются точечными оценками математического ожидания M|X| дисперсии D|X| и среднеквадратического отклонения наблюдаемой в выборке случайной величины X.
2.1. Предполагая, что наблюдаемая величина X имеет нормальное распределение, построим доверительные интервалы для математического ожидания a=M|X| и среднеквадратического отклонения при уровне надежности γ=0,99.
Поскольку известно, что величина t=(Xср – a) /S имеет распределение Стьюдента с n-1 степенью свободы, то решая уравнение P(|t|<t1)= γ относительно t1, можно построить симметричный интервал XВ-εγ <a< XВ+εγ , в котором с вероятностью γ находится математическое ожидание a. Величина εγ = tγ S/ представляет собой точность оценки. Решение tγ =t(γ, n-1) есть обращенное распределение Стьюдента, оно протабулировано и может быть найдено из таблиц, например из [1,2 приложение 3].
В рассматриваемом примере tγ = t(0,99; 29)=2,756, εγ = 2,756*11,275/ = =5,674 и тогда доверительный интервал для математического ожидания будет 35,423-5,674<a<35,423+5,674 или 29,749<a<41,097.
Для
нахождения доверительного интервала
оценки среднеквадратического отклонения
σ воспользуемся тем, что величина
имеет распределение «Хи»
с n-1 степенью свободы. Задавшись надежностью
интервальной оценки γ и решая уравнение
P( |σ - S | < εγ ) =
γ относительно εγ можно
построить доверительный интервал. Переходя
к эквивалентному уравнению
, где qγ=εγ/S
, найдем его решение qγ=q(γ,n-1)
из таблиц, например [1,2 приложение 4], тогда
точность оценки εγ=qγ
S. доверительный интервал строится
таким образом:
S-εγ<σ<S+
εγ, или S(1-
qγ) < σ < S(1+ qγ)
, причем если
qγ <1, то 0< σ < S(1+ qγ).
В нашем примере qγ =q(0,99;29)=0,43 тогда εγ =0,43*11,275=4,848 и доверительный интервал будет следующий 11,275-4,848< σ < 11,275+4,848 или 6,427< σ <16,123
В
нем оцениваемый параметр σ находится
с вероятностью γ=0,99.
2.2. Отметим, что построенные доверительные интервалы являются областями принятия гипотез H0={a=Xср} и H0={σ=S} при их проверке с уровнем значимости α=1-γ. Теперь проверим гипотезу о равенстве математического ожидания и дисперсии наблюдаемой случайной величины указанным в задании гипотетическим значениям σ=0,8S, a=1,2Xср.
Проверим сначала гипотезу о том, что истинная дисперсия наблюдаемой величины равна σ=0,8S, т.е. H0={σ =0,8*11,275=9,02}. Зададимся уровнем значимости гипотезы α1=0,05 и альтернативными гипотезами H1={σ≠9,02} или H2={σ>9,02}. Для проверки основной гипотезы воспользуемся критерием «Хи-квадрат» K=(n-1)(S/σ)2.
Наблюдаемое значение критерия kнабл = (30-1) (11,275/9,02)2 = 45,313. Критическая область Ккр при альтернативной гипотезе Н1 двухсторонняя, а критические точки найдем из таблиц kкр.л = χ2кр (1-0,025;29) =16,047, kкр.п=χ2кр(0,025;29)=45,722. Видим, что kнабл не принадлежит критической области и значит, гипотеза принимается, т.е. отличие наблюдаемого значения дисперсии от гипотетического незначительны. Если в качестве альтернативной рассматривать гипотезу H2, поскольку σ<S значительно (20%),то при этом критическая область будет правосторонней, а критическую точку kкр.п=χ2кр(0,05;29)=42,6 найдем из таблиц. Тогда наблюдаемое значение критерия kнабл = 45,313 попадает в критическую область и проверяемая гипотеза отвергается. Результат проверки гипотезы при различных альтернативах оказался разным, в итоге гипотеза отвергается.
Проверим
теперь гипотезу о том, что истинное
математическое ожидание наблюдаемой
величины равна a=1,2Xср, т.е. H0={a=1,2*35,423=42,508}.
Зададимся уровнем значимости гипотезы
α1=0,05 и альтернативными гипотезами
H1={a≠42,508} или H2={a<42,508}. Для
проверки основной гипотезы воспользуемся
критерием Стьюдента
K=(Xср-a)
/S.
Наблюдаемое
значение критерия kнабл=(35,423-42,508)
/11,275=-3,442. Критическая область Ккр
при альтернативной гипотезе Н1
двухсторонняя, а критические точки найдем
из таблиц kкр.л
=-Tкр(0.025;29)=-2,045,
kкр.п =Tкр(0.025;29)=2,045. Видим, что kнабл
принадлежит критической области и значит,
гипотеза отвергается, т.е. значение наблюдаемого
значения от гипотетического значительны.
Если в качестве альтернативной рассматривать
гипотезу Н2, поскольку a>Xср
значительно (20%), то критическая область
левосторонняя, а критическая точка kкр=-Tкр(0.05;
29)=-1,699, тогда наблюдаемое значение критерия
kнабл =-3,442 попадает в критическую
область и проверяемая гипотеза отвергается.
Задание 3
3.1. Построим гистограмму выборки Хв как удобную форму представления выборочного распределения. Для этого разобьем наблюдаемый интервал значений в выборке на m равновеликих интервалов
xmin=17,7; xmax=64,5; m=5; Δ= =9.76
Количество интервалов разбиения m выбирается исходя из свойств выборки, рекомендуется использовать формулу m=1+3,2*lg(n), m=5,73 примем m=5. Граничные точки интервалов hj=[xj,xj+1], j=1,…,m и их центры xj+0,5 вычисляем по формулам следующим образом:
xj=xmin+(j-1)*Δ; xj+0.5=(xj+xj+1)/2.
Подсчитав для каждого интервала частоты попадания в него элементов выборки nj и относительные частоты ωj =nj/n, сведем все результаты расчета наблюдаемых частот nj , ωj в следующую таблицу 3 и построим гистограмму частот рис.3
hj | 15,7 – 22,7 | 22,7 – 32,6 | 32,6 - 36,5 | 36,5 - 40,5 | 40,5-64,5 | Σ |
xj+0.5 | 19,2 | 27,65 | 34,55 | 38,5 | 52,5 | |
nj | 4 | 7 | 7 | 5 | 7 | 30 |
ωj | 0,133333 | 0,233333 | 0,233333 | 0,166667 | 0,233333 | 1 |