Автор работы: Пользователь скрыл имя, 19 Марта 2012 в 21:00, курсовая работа
Математическая статистика, раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. При этом статистическими данными называются сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками.
Цель работы: исследование эмпирических данных методами теории вероятности и математической статистики.
Введение ………………………………………………………………………. ….3
Цель работы ………………...………………………………………………..…...3
Поставленные задачи………………………………..…………………..…….…3
1. Распределение вероятностей
1) распределение Вейбулла………………………...……….……….….4
2) Задача .....................................................................................................8
2. Исследование методами математической статистики
1) Общие методы математической статистики…………………………11
2) Исследование выборочных статистических данных……………….13
3. Корреляция величин
1) Корреляция величин…….…...……………………………………….24
2) Задача…………………………………………………………………..25
Заключение…………………………………………………………………………28
Список использованной литературы………………………..……………………29
Большой раздел современной математической статистики — статистический последовательный анализ, фундаментальный вклад в создание и развитие которого внес А. Вальд во время Второй мировой войны. В отличие от традиционных (непоследовательных) методов статистического анализа, основанных на случайной выборке фиксированного объема, в последовательном анализе допускается формирование массива наблюдений по одному (или, более общим образом, группами), при этом решение об проведении следующего наблюдения (группы наблюдений) принимается на основе уже накопленного массива наблюдений. Ввиду этого, теория последовательного статистического анализа тесно связана с теорией оптимальной остановки.
В математической статистике есть общая теория проверки гипотез и большое число методов, посвящённых проверке конкретных гипотез. Рассматривают гипотезы о значениях параметров и характеристик, о проверке однородности (то есть о совпадении характеристик или функций распределения в двух выборках), о согласии эмпирической функции распределения с заданной функцией распределения или с параметрическим семейством таких функций, о симметрии распределения и др.
Большое значение имеет раздел математической статистики, связанный с проведением выборочных обследований, со свойствами различных схем организации выборок и построением адекватных методов оценивания и проверки гипотез.
Задачи восстановления зависимостей активно изучаются более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов.
Разработка методов аппроксимации данных и сокращения размерности описания была начата более 100 лет назад, когда К. Пирсон создал метод главных компонент. Позднее были разработаны факторный анализ[2] и многочисленные нелинейные обобщения[3].
Различные методы построения (кластер-анализ), анализа и использования (дискриминантный анализ) классификаций (типологий) именуют также методами распознавания образов (с учителем и без), автоматической классификации и др.
В настоящее время компьютеры играют большую роль в математической статистике. Они используются как для расчётов, так и для имитационного моделирования (в частности, в методах размножения выборок и при изучении пригодности асимптотических результатов).
Объем продаж компьютерной техники в магазине «Горбушкин двор» изменяется в зависимости от времени года, ассортимента товаров, цен производителя и т.д. Известны статистические данные этого показателя в течение некоторого времени.
Найдем эмпирическую функцию распределения по формуле:
а) нормальном распределении выборки
б) показательном распределении выборки
в) равномерном распределении выборки
[3;5) |
[5;7) |
[7;9) |
[9;11) |
[11;13) |
[13;15) |
[15;17) |
[17;19] | |
1 |
1 |
4 |
9 |
17 |
12 |
4 |
1 |
Найдем распределение частот:
4 |
6 |
8 |
10 |
12 |
14 |
16 |
18 | |
1 |
1 |
4 |
9 |
17 |
12 |
4 |
1 |
Найдем распределение относительных частот
n= 1+1+4+9+17+12+4+1=49
4 |
6 |
8 |
10 |
12 |
14 |
16 |
18 | |
0.02 |
0.02 |
0.08 |
0.18 |
0.35 |
0.24 |
0.082 |
0.02 |
0
=0.02
=0.02+0.02=0.04
=0.04+0.08=0.12
=0.12+0.18=0.3
=0.3+0.35=0.65
=0.65+0.24=0.89
0.89+0.082=0.972
0.97+0.02=1
Итак, эмпирическая функция распределения будет выглядеть так
Построим эмпирическую функцию распределения
Полигон распределения
Гистограммой – называется фигура состоящая из прямоугольника . Основания прямоугольников – интервальные задания случайной величины, высота прямоугольников
=0.5
=0.5
Метод моментов применяется для оценки неизвестных параметров распределения, суть методов заключается в том, что приравниваются теоретические и эмпирические моменты. Если закон распределения содержит 1 параметр, то для оценки этого параметра составляется одно уравнение, в котором теоретический момент приравнивают к эмпирическому моменту. Если распределение случайной величины содержит 2 параметра, то составляют два уравнения и т.д.
Считая распределение
равномерным на заданном
запишем дифференциальный закон:
2 параметра распределения a и b
M(x)=
D(x)=
(4+6+32+90+204+168+64+18)==11.
=
Доверительным называют интервал который с заданной надежностью показывает заданный параметр.
Истинное значение измеряемой величины равно ее математическому ожиданию a. Поэтому задача сводится к оценке математического ожидания (при известном ) при помощи доверительного интервала
= 2.009
Все величины кроме S(среднеквадратического отклонения) известны. Для нахождения S сначала найдем (исправленную дисперсию).
*175.4=3.58
=1.89
7. а) 1.
2. Вычислим теоретические частоты, учитывая, что n=49, h=1, =2.6,
по формуле:
i |
||||
1 |
4 |
-3,06 |
0.0037 |
0,07 |
2 |
6 |
-2,29 |
0.0290 |
0,55 |
3 |
8 |
-1,52 |
0.1257 |
2,37 |
4 |
10 |
-0,75 |
0.3011 |
5,67 |
5 |
12 |
0,015 |
0.3989 |
7,52 |
6 |
14 |
0,78 |
0.2943 |
5,55 |
7 |
16 |
1,55 |
0.1200 |
2,26 |
8 |
18 |
2,32 |
0.0270 |
0,51 |
3. Сравним эмпирические и теоретические частоты
I) составим расчетную таблицу, из которой найдем наблюдаемое значение критерия
1 |
1 |
0,07 |
0,93 |
0,86 |
12,2 |
2 |
1 |
0,55 |
0,45 |
0,2 |
0,36 |
3 |
4 |
2,37 |
1,63 |
2,66 |
1,12 |
4 |
9 |
5,67 |
3,33 |
11,09 |
1,95 |
5 |
17 |
7,52 |
9,48 |
89,87 |
11,95 |
6 |
12 |
5.55 |
6,45 |
61,15 |
11,02 |
7 |
4 |
2,26 |
1,74 |
3,03 |
1,1 |
8 |
1 |
0,51 |
0,49 |
0,24 |
0,47 |
Из таблицы найдем
II) по таблице критических точек распределения , по уровню значимости k=s-3=8-3=5
Т.к. - гипотезу о нормальном распределении генеральной совокупности отвергаем. Другими словами, эмпирические и теоретические частоты различаются значимо.
б) объединим малочисленные частоты (4+6=10), (16+18=34) и соответствующие им теоретические частоты (16,17+5,88=22,05), (1,96+1,96=3,92)
3-5 |
1 |
5-7 |
1 |
7-9 |
4 |
9-11 |
9 |
11-13 |
17 |
13-15 |
12 |
15-17 |
4 |
17-19 |
1 |
объединив малочисленные интервалы получим
3-9 |
6 |
9-11 |
9 |
11-13 |
17 |
13-15 |
12 |
15-19 |
5 |
1.
2. Найдем оценку параметра предполагаемого показательного распределения
Т.о. плотность
предполагаемого
(x>0)
3. Найдем вероятности попадания X в каждый из интервалов по формуле:
Например, для первого интервала:
⅀=1
4. , где -й интервал
Например, для первого интервала
1 |
17 |
25,48 |
-8,48 |
71,91 |
2,82 |
2 |
12 |
14,7 |
-2,7 |
7,29 |
0,5 |
3 |
9 |
3,92 |
5,08 |
25,8 |
8,6 |
4 |
6 |
2,45 |
3,55 |
12,6 |
5,14 |
5 |
5 |
2,45 |
2,55 |
6,5 |
2,6 |
49 |
Информация о работе Статистическое изучение выборочных данных экономических показателей