Автор работы: Пользователь скрыл имя, 18 Января 2011 в 20:19, контрольная работа
Распределения вероятностей имеют числовые характеристики. Введем некоторые понятия и перечислим функции Excel для вычисления числовых характеристик распределения вероятностей. Они входят в группу Статистические. При вычислении функций в качестве случайных величин используйте следующие значения:
Основы случайных процессов
Биномиальное распределение
Нормальное распределение
Генерация случайных чисел
Основы статистического анализа
Построение выборочной функции распределения
Расчет элементарных статистических характеристик
Определение доверительных интервалов
Подбор типа распределения
Сравнение и анализ двух выборок
Дисперсионный анализ
Поиск статистических зависимостей. Корреляция
Рис. 2.75
Отметим,
что на практике закон распределения
вероятностей для данных, полученных
в результате наблюдения, редко известен
заранее. Его устанавливают с помощью
статистических методов и процедур.
Основы
статистического
анализа
Статистический анализ охватывает методы описания и представления статистических данных (описательная статистика) и методы обработки этих данных (аналитическая статистика) с целью изучения, формулирования выводов, принятия решений и прогнозирования.
Статистический анализ строится на большом объеме данных, сплошном и полном охвате всех событий, называемой генеральной совокупностью. Часто генеральная совокупность слишком многочисленна или малодоступна, поэтому для исследования из нее делают выборки (выборочная совокупность), по которым судят обо всей генеральной совокупности. Для наилучшего представления информации о генеральной совокупности выборка должна быть представительной (репрезентативной). Иногда лучшим способом получения представительной выборки является многократный случайный отбор данных или повторение опыта. Если генеральная совокупность доступна, то для получения представительной выборки можно воспользоваться инструментом Выборка из Пакета анализа Excel. На основе полученной выборки приблизительно устанавливают выборочный закон (выборочную функцию) распределения и другие характеристики случайной величины.
Статистическая вероятность или статистическая частота есть отношение число успешных исходов m к общему числу испытаний n (m/n). Статистическая частота события стремится к теоретической вероятности p при большом числе испытаний. Выборочная функция распределения также стремится к теоретической функции распределения F(x) при больших n. Для построения выборочных функций распределения в Excel используется функция ЧАСТОТА и инструмент Гистограмма из Пакета анализа.
Случайные выборки значений из генеральной совокупности всех событий имеют числовые статистические характеристики. Среднее арифметическое случайных значений (СРЗНАЧ). Медиана есть число, которое является серединой множества чисел, т.е. половина чисел больше медианы, а половина меньше; вычисляется функцией МЕДИАНА. Мода есть наиболее часто встречающееся значение; вычисляется функцией МОДА. Среднее гармоническое есть величина обратная среднему арифметическому обратных величин (СРГАРМ). Среднее геометрическое используется для вычисления средних темпов роста и есть корень n-ой степени из произведения n положительных значений (СРГЕОМ). Дисперсия – функция ДИСП. Стандартное отклонение – функция СТАНДОТКЛОН. Эксцесс характеризует степень остроконечности (>0) или сглаженности (<0) «хвостов» распределения, т.е. частоты появления удаленных от среднего значений (ЭКСЦЕСС). Асимметрия характеризует степень несимметричности распределения относительно среднего вправо (>0) и влево (<0), вычисляется функцией СКОС. Подробнее см. справку по F1, введя для поиска имя функции.
При обработке случайных выборок в первую очередь вычисляют их числовые статистические характеристики и группируют по каждому параметру: по среднему значению, по разбросу от среднего, ошибке среднего и др. Кроме перечисленных выше функций, для работы с несколькими выборками и вычисления их статистических характеристик, Excel содержит инструмент Описательная статистика из Пакета анализа.
При обработке случайных выборок, кроме получения статистических характеристик, обычно решаются следующие задачи:
Ниже
будут рассмотрены
Подробное описание каждого инструмента
из Пакета анализа Вы найдете в справке
по F1, введя для поиска строку «О средствах
статистического анализа данных».
Наиболее распространенными пакетами
статистического анализа и прогнозирования
являются Statistica, Statgraphics, NCSS, SPSS, Project
Expert (финансовое планирование). Извеcтны
также пакеты SAS, SYSTAT, SigmaStat, SigmaPlot, ESB Stats,
MVSP, Chameleon Statistics, Leo Statistic, Simca-P и другие.
Перспективным инструментом решения трудноформализуемых
задач прогнозирования, статистического
и регрессионного анализа являются пакеты,
построенные по технологии обучающихся
нейронных сетей, в частности пакет
STATISTICA Neural Network. Известны применения нейрокомпьютеров
(CNAPS PC/128), имитаторов нейронных сетей (Qnet
for WIndows) для прогнозирования финансовой
деятельности и пр. Найти описания возможностей
этих пакетов можно в поисковых системах
Интернет (Yandex, Rambler, Google) по названию пакета.
Построение
выборочной функции
распределения
Для построения выборочных функций распределения в Excel используют инструмент Гистограмма из Пакета анализа или функция ЧАСТОТА. При этом весь диапазон изменения случайной величины разбивают на интервалы равной ширины, называемые карманами. Число карманов обычно 5-15. Вычисляется число попаданий значений случайной величины в каждый карман. По ним вычисляются статистические (относительные) частоты - отношение числа попаданий в карман m к общему числу испытаний n (m/n), по которым и строится гистограмма выборочной функции распределения статистических вероятностей.
В
качестве примера построим выборочное
распределение по данным о ежедневных
продажах некоторого товара – на рис.
2.76 показана выборка за 2 месяца. Здесь
же заведен диапазон карманов – граничных
значений. Данные будут группироваться
в интервалы 0-170, 171-175, 176-180 и т.д.: при подсчете
в карман включаются значения на правой
(нижней) границе и не включаются значения
на левой (верхней) границе.
Рис. 2.76
Построим
выборочное распределение дневных продаж
инструментом Гистограмма: вызов через
меню СервисàАнализ
данных….
Рис. 2.77
На
рис. 2.77 показано заполнение параметров
инструмента. Входной
интервал $А$3:$Е$14 - это диапазон исследуемых
данных. Интервал карманов $G$2:$G$14 -
это границы, в которые группируются входные
данные. Выходной интервал $I$1 – это
ячейка, начиная с которой будет выведен
результат. Установите также флажок
Вывод графика - гистограммы. Флажок
Интегральный процент устанавливают,
если надо вычислить проценты частот с
накоплением и вывести график интегральных
процентов. Результат работы инструмента
показан на рис. 2.78.
Рис. 2.78
Теперь
построим выборочное распределение
дневных продаж, воспользовавшись функцией
ЧАСТОТА. Результат показан на рис.
2.79. Здесь функцией ЧАСТОТА подсчитывается
лишь колонка Частота; колонки I и
J следует вычислить вручную и построить
график.
Рис. 2.79
Проделайте следующие действия:
Рис. 2.80
Рис. 2.81
Расчет
элементарных статистических
характеристик
При обработке случайных выборок в первую очередь вычисляют их числовые параметры, характеризующие тенденции, разброс и изменчивость данных. Их можно рассчитывать как с помощью перечисленных в предыдущих разделах функций, так и с применением инструмента Описательная статистика из Пакета анализа, который позволяет получить единый статистический отчет по всем характеристикам входных данных.
Применим
инструмент Описательная
статистика к выборкам сезонных результатов
двух прыгунов в высоту разными способами:
фосбюри-флопом и перекидным – рис. 2.82.
Рис. 2.82
Вызовите
инструмент Описательная
статистика через меню СервисàАнализ
данных…. На рис. 2.83 показано заполнение
параметров инструмента. Входной
интервал $А$2:$D$11 - это диапазон анализируемых
данных. Здесь данные выборки расположены
по столбцам, поэтому установлен переключатель
По столбцам. Выходной
интервал $D$1 – это ячейка, начиная с
которой будет выведен результат. Установите
также флажок Итоговая
статистика - в выходном интервале для
каждого столбца будут рассчитаны все
статистические показатели. Поле Уровень
надежности позволяет установить требуемый
уровень доверительной вероятности; по
умолчанию 95%, что соответствует уровню
значимости 0.05. Результат работы инструмента
показан на рис. 2.84.
Рис. 2.83
Рис. 2.84
Определение
доверительных интервалов
Важная характеристика выборки – среднее арифметическое – обычно не совпадает со средним арифметическим генеральной совокупности. Поэтому актуальным является определение приемлемых границ изменения среднего арифметического выборок – доверительного интервала среднего. Для этого вычисляют средние арифметические нескольких выборок; вычисленные значения рассматривают как случайные величины, распределенные по нормальному закону относительно среднего арифметического генеральной совокупности. Известно, что в пределы [m-r,m+r] нормально распределенная случайная величина попадает с доверительной вероятностью 0,683 (68.3%) в пределы [m-2r,m+2r] - с вероятностью 0,955 (95.5%), в пределы [m-3r,m+3r] - с вероятностью 0,997 (99.7%) – где m среднее, а r стандартное отклонение от среднего (рис. 2.71).