Автор работы: Пользователь скрыл имя, 18 Января 2011 в 20:19, контрольная работа
Распределения вероятностей имеют числовые характеристики. Введем некоторые понятия и перечислим функции Excel для вычисления числовых характеристик распределения вероятностей. Они входят в группу Статистические. При вычислении функций в качестве случайных величин используйте следующие значения:
Основы случайных процессов
Биномиальное распределение
Нормальное распределение
Генерация случайных чисел
Основы статистического анализа
Построение выборочной функции распределения
Расчет элементарных статистических характеристик
Определение доверительных интервалов
Подбор типа распределения
Сравнение и анализ двух выборок
Дисперсионный анализ
Поиск статистических зависимостей. Корреляция
Инструмент Описательная статистика вычисляет полный доверительный интервал выборки: на рис. 2.84 он равен 31. Таким образом, можно утверждать, что в 95% случаев значения выборки попадут в доверительный интервал [228.2-15.5, 228.2+15.5].
Функция ДОВЕРИТ вычисляет полуширину доверительного интервала среднего по заданному уровню значимости, стандартному отклонению и числу значений в выборке. Пусть требуется найти границы доверительного интервала для среднего с 95% надежностью (уровень значимости a=0.05) для 50 отправлений по электронной почте, если известно среднее время доставки сообщения m=30сек, стандартное отклонение r=3сек.
Введите
статистическую функцию ДОВЕРИТ
и заполните параметры, как показано
на рис. 2.85. После нажатия ОК, вы получите
значение ДОВЕРИТ(0,05;3;50)=0.83154. Это означает,
что с уверенностью 95% среднее арифметическое
времени доставки сообщения по E-mail для
генеральной совокупности будет находиться
в интервале [30-0.83154, 30+0.83154].
Рис. 2.85
ДОВЕРИТ(0,01;3;50) = 1.09283
ДОВЕРИТ(0,05;5;50) = 1.3859
ДОВЕРИТ(0,05;3;150)
= 0.48009
Выше
рассчитаны доверительные интервалы
среднего для различных значений
параметров. Как видно, доверительный
интервал шире для больших значений
уровня значимости a и стандартного отклонения
r; и – уже при большем размере
выборки.
Подбор
типа распределения
Одной из задач статистического анализа является оценка степень соответствия выборки известному теоретическому распределению, в частности нормальному распределению. Для этих целей применяют:
Рассмотрим
применение функции ХИ2ТЕСТ, дающей
наиболее убедительную оценку меры соответствия
выборки нормальному
Поскольку
критерий ХИ-квадрат основан на сравнении
частот интервалов, то для функции ХИ2ТЕСТ
должны быть предварительно подготовлены
выборочное и теоретическое распределения
частот по интервалам с помощью функции
ЧАСТОТА или инструмента Гистограмма.
На рис. 2.86 дана некоторая выборка, к ней
вычислены частоты и теоретические частоты,
на основе которых вычислена вероятность
совпадения распределений 0.989531786. Это
значение говорит о высокой степени соответствия
выборки нормальному распределению.
Рис. 2.86
Последовательность действий результата на рис. 2.86 следующая:
Рис. 2.87
Для
графической оценки постройте графики
выборочного (I4:I14) и теоретического (J4:J14)
распределения вероятностей – рис. 2.88.
Сравнение графиков не опровергает результата
работы функции ХИ2ТЕСТ: выборка в целом
соответствует нормальному распределению
Рис. 2.88
Функцию
ХИ2ТЕСТ применяют также в случаях,
когда требуется выявить
Рис. 2.89
На рис. 2.89 приведены результаты опроса трех возрастных групп в баллах. Необходимо определить, есть ли достоверные отличия в ответах в группах.
Поскольку ожидаемые значения не заданы, то в качестве ожидаемых, рассчитаем средние значения трех выборок по каждому вопросу, которые и примем за генеральную совокупность – рис. 2.90.
Рис. 2.90
Далее
применим функцию =ХИ2ТЕСТ(B3:D12;E3:G12). Результат
0.868486 (>0.05) говорит о том, что
различия между выборками случайны
и не выявлено достоверных отличий
выборок друг от друга.
Сравнение
и анализ двух выборок
Для
выявления различий между двумя
выборками с известным законом
распределения применяют t-
Рассмотрим использование t-критерия Стьюдента для определения наличия различий между двумя выборками. При этом выборки могут быть:
Включенная в Excel функция ТТЕСТ для оценки отличий по t-критерия Стьюдента имеет параметр Тип для настройки на один из видов t-теста: 1 – парный тест, 2 - двухвыборочный t-тест с одинаковыми дисперсиями, 3 - двухвыборочный t-тест с разными дисперсиями.
На
рис. 2.91 приведены данные о месячных
продажах хлебцев Burger, продаваемых
без рекламы, и хлебцев Finn Crisp, продаваемых
с рекламной поддержкой. Необходимо выявить
достоверность различий в этих данных.
Здесь же приведены результаты функции
ТТЕСТ (ячейка В14) и инструмента Двухвыборочный
t-тест с различными
дисперсиями.
Рис. 2.91
Полученное
с помощью функции ТТЕСТ
Воспроизведите
полученные результаты. В ячейку В14
введите функцию ТТЕСТ из группы
Статистические, заполните параметры,
как на рис. 2.92 и нажмите ОК. Здесь выбран
Тип=3, поскольку выборки не связаны, независимы
и с разным числом значений.
Рис. 2.92
Далее
вызовите инструмент Двухвыборочный
t-тест с различными
дисперсиями через меню СервисàАнализ
данных…. На рис. 2.93 показано заполнение
параметров инструмента.
Интервал переменной
1 $А$2:$A$10 и интервал
переменной 2 $B$2:$B$12 это диапазоны
анализируемых данных. Выходной
интервал $D$1 – это ячейка, начиная с
которой будет выведен результат. Поле
Альфа позволяет установить требуемый
уровень значимости a=0.05.
Рис. 2.93
Отметим
важность правильного подбора типа
t-теста, поскольку для одних и тех же
данных они могут давать разные результаты.
Если выбор типа t-теста не очевиден,
то правильным будет применение двухвыборочного
t-теста с разными дисперсиями как общий
случай анализа; если выборки зависимы
и связаны, то применяют парный t-тест.
Дисперсионный
анализ
Часто
требуется оценить
Рассмотрим
однофакторный дисперсионный
В
качестве примера проведем анализ влияния
фактора цены комплексного обеда на
дневную посещаемость кафе – рис. 2.94. На
рис. 2.95 приведен результат анализа:
Р-значение=0.00068257 <0.05. Это доказывает
влияние фактора цены на посещаемость
кафе.
Рис. 2.94
Рис. 2.95
Воспроизведите
полученные результаты. Введите данные
и вызовите инструмент Однофакторный
дисперсионный анализ через меню СервисàАнализ
данных…. На рис. 2.96 показано заполнение
параметров инструмента.
Входной интервал
$В$2:$I$4 это диапазон исследуемых данных.
Переключатель Группирование
установлен по строкам, т.к. выборки
располагаются по строкам. Выходной
интервал $J$1 – это ячейка, начиная с
которой будет выведен результат. Поле
Альфа позволяет установить требуемый
уровень значимости, здесь a=0.05.