Методы математической статистики Excel

Автор работы: Пользователь скрыл имя, 18 Января 2011 в 20:19, контрольная работа

Описание

Распределения вероятностей имеют числовые характеристики. Введем некоторые понятия и перечислим функции Excel для вычисления числовых характеристик распределения вероятностей. Они входят в группу Статистические. При вычислении функций в качестве случайных величин используйте следующие значения:

Содержание

Основы случайных процессов

Биномиальное распределение

Нормальное распределение

Генерация случайных чисел

Основы статистического анализа

Построение выборочной функции распределения

Расчет элементарных статистических характеристик

Определение доверительных интервалов

Подбор типа распределения

Сравнение и анализ двух выборок

Дисперсионный анализ

Поиск статистических зависимостей. Корреляция

Работа состоит из  1 файл

excel13.doc

— 349.00 Кб (Скачать документ)

Рис. 2.75 

  Отметим, что на практике закон распределения  вероятностей для данных, полученных в результате наблюдения, редко известен заранее. Его устанавливают с помощью статистических методов и процедур. 
 
 

Основы  статистического  анализа 

  Статистический  анализ охватывает методы описания и  представления статистических данных (описательная статистика) и методы обработки этих данных (аналитическая статистика) с целью изучения,  формулирования выводов, принятия решений и прогнозирования.

  Статистический  анализ строится на большом объеме данных, сплошном и полном охвате всех событий, называемой генеральной совокупностью. Часто генеральная совокупность слишком многочисленна или малодоступна, поэтому для исследования из нее делают выборки (выборочная совокупность), по которым судят обо всей генеральной совокупности. Для наилучшего представления информации о генеральной совокупности выборка должна быть представительной (репрезентативной). Иногда лучшим способом получения представительной выборки является  многократный случайный отбор данных или повторение опыта. Если генеральная совокупность доступна, то для получения представительной выборки можно воспользоваться инструментом Выборка из Пакета анализа Excel. На основе полученной выборки приблизительно устанавливают выборочный закон (выборочную функцию) распределения и другие характеристики случайной величины.

  Статистическая вероятность или статистическая частота есть отношение число успешных исходов m к общему числу испытаний n (m/n). Статистическая частота события стремится к теоретической вероятности p при большом числе испытаний. Выборочная функция распределения также стремится к теоретической функции распределения F(x) при больших n. Для построения выборочных функций распределения в Excel используется функция ЧАСТОТА и инструмент Гистограмма из Пакета анализа.

  Случайные выборки значений из генеральной  совокупности всех событий имеют числовые статистические характеристики. Среднее арифметическое случайных значений (СРЗНАЧ). Медиана есть число, которое является серединой множества чисел, т.е. половина чисел больше медианы, а половина меньше; вычисляется функцией МЕДИАНА. Мода есть наиболее часто встречающееся значение; вычисляется функцией МОДА. Среднее гармоническое есть величина обратная среднему арифметическому обратных величин (СРГАРМ). Среднее геометрическое используется для вычисления средних темпов роста и есть корень n-ой степени из произведения n положительных значений (СРГЕОМ). Дисперсия – функция ДИСП. Стандартное отклонение – функция СТАНДОТКЛОН. Эксцесс характеризует степень остроконечности (>0) или сглаженности (<0) «хвостов» распределения, т.е. частоты появления удаленных от среднего значений (ЭКСЦЕСС). Асимметрия характеризует степень несимметричности распределения относительно среднего вправо (>0) и влево (<0), вычисляется функцией СКОС. Подробнее см. справку по F1, введя для поиска имя функции.

  При обработке случайных выборок в первую очередь вычисляют их числовые статистические характеристики и группируют по каждому параметру: по среднему значению, по разбросу от среднего, ошибке среднего и др. Кроме перечисленных выше функций, для работы с несколькими выборками и вычисления их статистических характеристик, Excel содержит инструмент Описательная статистика из Пакета анализа.

  При обработке случайных выборок, кроме  получения статистических характеристик, обычно решаются следующие задачи:

  1. Определение степени достоверности выборки, отнесение или не отнесение событий выборки к некоторой статистической совокупности. Определяется с помощью доверительных интервалов – интервалов, в который события попадают с заданной доверительной вероятностью p=1–a. a - есть уровень значимости – максимальное значение вероятности, при котором появление события практически невозможно. Достаточным обычно считается a=0.05 – ей соответствует доверительная вероятность 0.95. Для повышения надежности статистических выводов берут a=0.01, чему соответствует доверительная вероятность 0.99. Вычисление границ доверительного интервала в Excel используется функция ДОВЕРИТ и инструмент Описательная статистика.
  2. Определение меры соответствия выборки какому-либо теоретическому распределению. Выполняется с использованием критериев согласия, в частности ХИ-квадрат – функция ХИ2ТЕСТ в Excel. Ориентировочная оценка может быть выполнена с помощью построения графиков и визуального сравнения расхождений и совпадений выборочного и теоретического распределений.
  3. Выявление различий между выборками выполняется с использованием критериев различия, в частности t-критерия Стьюдента (функция ТТЕСТ) и критерия Фишера (функция ФТЕСТ). Можно использовать инструменты из Пакета анализа Excel: Двухвыборочный t-тест с различными дисперсиями Двухвыборочный F-тест для дисперсий, а также Парный двухвыборочный t-тест для средних и Двухвыборочный t-тест с одинаковыми дисперсиями.
  4. Оценка влияния на выборки одного, двух или более факторов – однофакторный, двухфакторный и т.д. дисперсионный анализ. Инструменты Excel: Однофакторный дисперсионный анализ, Двухфакторный дисперсионный анализ с повторениями и Двухфакторный дисперсионный анализ без повторений.
  5. Выявление степени связи между выборками (переменными) - корреляционный анализ. В качестве меры связи двух случайных величин используют коэффициент корреляции R. Если R=0 – зависимости нет, R>0 – зависимость прямо пропорциональная, R<0 – зависимость обратно пропорциональная. В Excel используется функция КОРРЕЛ и инструмент Корреляция.
  6. Установление формы зависимости (уравнения регрессии) между выборкой (случайной переменной Y) и одной или несколькими независимыми переменными величинами – регрессионный анализ, с целью оценки достоверности принятой математической модели статистическим данным. Инструменты регрессионного анализа были рассмотрены ранее.
 

  Ниже  будут рассмотрены перечисленные  средства Excel для статистической обработки данных. Они достаточны для статистического анализа большинства экономических и других типов данных. В тоже время полноценный статистический анализ данных и прогнозирование выполняют в специализированных пакетах программ. Однако большинство из них требует соответствующей математической подготовки и глубокого знания пакетов.

    Подробное описание каждого инструмента из Пакета анализа Вы найдете в справке по F1, введя для поиска строку «О средствах статистического анализа данных». 

    Наиболее распространенными пакетами статистического анализа и прогнозирования являются  Statistica, Statgraphics, NCSS, SPSS, Project Expert (финансовое планирование). Извеcтны также пакеты SAS, SYSTAT, SigmaStat, SigmaPlot, ESB Stats, MVSP, Chameleon Statistics, Leo Statistic, Simca-P и другие. Перспективным инструментом решения трудноформализуемых задач прогнозирования, статистического и регрессионного анализа являются пакеты, построенные по технологии обучающихся нейронных сетей, в частности пакет STATISTICA Neural Network. Известны применения нейрокомпьютеров (CNAPS PC/128), имитаторов нейронных сетей (Qnet for WIndows) для прогнозирования финансовой деятельности и пр. Найти описания возможностей этих пакетов можно в поисковых системах Интернет (Yandex, Rambler, Google) по названию пакета. 
 

Построение  выборочной функции  распределения 

  Для построения выборочных функций распределения  в Excel используют инструмент Гистограмма из Пакета анализа или функция ЧАСТОТА. При этом весь диапазон изменения случайной величины разбивают на интервалы равной ширины, называемые карманами. Число карманов обычно 5-15. Вычисляется число попаданий значений случайной величины в каждый карман. По ним вычисляются статистические (относительные) частоты - отношение числа попаданий в карман m к общему числу испытаний n (m/n), по которым и строится гистограмма выборочной функции распределения статистических вероятностей.

  В качестве примера построим выборочное распределение по данным о ежедневных продажах некоторого товара – на рис. 2.76 показана выборка за 2 месяца. Здесь  же заведен диапазон карманов – граничных значений. Данные будут группироваться в интервалы 0-170, 171-175, 176-180 и т.д.: при подсчете в карман включаются значения на правой (нижней) границе и не включаются значения на левой (верхней) границе. 

Рис. 2.76 

  Построим  выборочное распределение дневных продаж инструментом Гистограмма: вызов через меню СервисàАнализ данных…. 

Рис. 2.77 

  На  рис. 2.77 показано заполнение параметров инструмента. Входной интервал $А$3:$Е$14 - это диапазон исследуемых данных. Интервал карманов $G$2:$G$14 - это границы, в которые группируются входные данные. Выходной интервал $I$1 – это ячейка, начиная с которой будет выведен результат. Установите также флажок Вывод графика - гистограммы. Флажок Интегральный процент устанавливают, если надо вычислить проценты частот с накоплением и вывести график интегральных процентов. Результат работы инструмента показан на рис. 2.78. 

Рис. 2.78 

  Теперь  построим выборочное распределение  дневных продаж, воспользовавшись функцией ЧАСТОТА. Результат показан на рис. 2.79. Здесь функцией ЧАСТОТА подсчитывается лишь колонка Частота; колонки I и J следует вычислить вручную и построить график. 

Рис. 2.79 

  Проделайте  следующие действия:

  1. Выделите диапазон H1:H14 и вызовите функцию ЧАСТОТА из группы Статистические и заполните параметры – рис. 2.80. После нажатия ОК встаньте на строку формул и нажмите Ctrl+Shift+Enter. Карманы будут заполнены частотами появления значений.
  2. В ячейку H15 введите формулу вычисления общего числа испытаний n: =СУММ(H2:H14).
  3. В ячейку I2 введите формулу вычисления статистической частоты =I2/H$15 и размножьте ее на весь диапазон I3:I14.
  4. В ячейку J2 запишите значение из I2, в ячейку J3 – формулу =J2+I3, которую следует размножить на весь диапазон J4:J14.
  5. Выделите диапазон I2:J14 для построения графика и вызовите мастер диаграмм: выберите нестандартный тип График | гистограмма 2. Построенный график (рис. 2.81) должен быть идентичен предыдущему (рис. 2.78).
 

Рис. 2.80 

Рис. 2.81 
 

Расчет  элементарных статистических характеристик 

  При обработке случайных выборок в первую очередь вычисляют их числовые параметры, характеризующие тенденции, разброс и изменчивость данных. Их можно рассчитывать как с помощью перечисленных в предыдущих разделах функций, так и с применением инструмента Описательная статистика из Пакета анализа, который позволяет получить единый статистический отчет по всем характеристикам входных данных.

  Применим  инструмент Описательная статистика к выборкам сезонных результатов двух прыгунов в высоту разными способами: фосбюри-флопом и перекидным – рис. 2.82. 

Рис. 2.82 

  Вызовите  инструмент Описательная статистика через меню СервисàАнализ данных…. На рис. 2.83 показано заполнение параметров инструмента. Входной интервал $А$2:$D$11 - это диапазон анализируемых данных. Здесь данные выборки расположены по столбцам, поэтому установлен переключатель По столбцам. Выходной интервал $D$1 – это ячейка, начиная с которой будет выведен результат. Установите также флажок Итоговая статистика - в выходном интервале для каждого столбца будут рассчитаны все статистические показатели. Поле Уровень надежности позволяет установить требуемый уровень доверительной вероятности; по умолчанию 95%, что соответствует уровню значимости 0.05. Результат работы инструмента показан на рис. 2.84. 

Рис. 2.83 

Рис. 2.84 
 

Определение доверительных интервалов 

  Важная  характеристика выборки – среднее  арифметическое –  обычно не совпадает  со средним арифметическим генеральной  совокупности. Поэтому актуальным является определение приемлемых границ изменения  среднего арифметического выборок – доверительного интервала среднего. Для этого вычисляют средние арифметические нескольких выборок; вычисленные значения рассматривают как случайные величины, распределенные по нормальному закону относительно среднего арифметического генеральной совокупности. Известно, что в пределы [m-r,m+r] нормально распределенная случайная величина попадает с доверительной вероятностью 0,683 (68.3%) в пределы [m-2r,m+2r]  - с вероятностью 0,955 (95.5%), в пределы [m-3r,m+3r]  - с вероятностью 0,997 (99.7%) – где m среднее, а r стандартное отклонение от среднего (рис. 2.71).

Информация о работе Методы математической статистики Excel