Средние и структурные средние величины как обобщающие характеристики совокупности

Автор работы: Пользователь скрыл имя, 05 Января 2012 в 13:42, курсовая работа

Описание

Средняя величина - это обобщающая количественная характеристика совокупности однотипных явлений по одному варьирующему признаку. Важнейшее свойство средней величины заключается в том, что она представляет значение определенного признака во всей совокупности одним числом, несмотря на количественные различия его у отдельных единиц совокупности, и выражает то общее, что присуще всем единицам изучаемой совокупности. Таким образом, через характеристику единицы совокупности она характеризует всю совокупность в целом.

Содержание

ВВЕДЕНИЕ………………………………………………………………..4
1. ОБЩИЕ ПОНЯТИЯ О СРЕДНИХ ВЕЛИЧИНАХ……………...........6
2. СТЕПЕННЫЕ СРЕДНИЕ ВЕЛИЧИНЫ……………………………….7
1.2. Средняя арифметическая ……………………………………..10
1.2. Средняя гармоническая ………………………………………………12
1.3. Средняя квадратическая xq...........................................................13
1.4. Средняя кубическая ……………………………………….13
1.5. Средняя геометрическая …………………………………..13
3. СТРУКТУРНЫЕ СРЕДНИЕ И СПОСОБЫ ИХ ВЫЧИСЛЕНИЯ……13
3.1. Медиана (Me)…………………………………………………..13
3.2. Мода (Мо)……………………………………………………15
3.3. Квантили……………………………………………………….17
5. ПРАКТИЧЕСКАЯ ЧАСТЬ…………………………………………….19
ЗАКЛЮЧЕНИЕ…………………………………………………………....31
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ……

Работа состоит из  1 файл

Курсовая работа_ср.doc

— 351.50 Кб (Скачать документ)

   Мода  и медиана, как правило, являются дополнительными к средней характеристиками совокупности и используются в математической статистике для анализа формы рядов распределения.

3.3. Квантили

      Наряду  с медианой и модой к структурным  характеристикам вариационного ряда относятся так называемые квантили, отсекающие в пределах ряда определенную часть его членов. К ним относятся квартили, децили и перцентили (процентили). Квартили — это три значения признака (Q1, Q2, Q3), делящие ранжированный вариационный ряд на четыре равные части. Аналогично, девять децилей делят ряд на 10 равных частей, а 99 перцентилей — на 100 равных частей.

      В практике используют обычно перцентили Рз, Р10, P25, P50, Р75, P90 и Р97- Причем P25 и Р75 соответствуют первому и третьему квартилям, между которыми находится 50% всех членов ряда, а Р50 соответствует второму квартилю и равен медиане, т. е. Р50=Ме. Любой перцентиль определяется рядом последовательных действий, которые можно выразить в виде Следующей формулы:

      

 

      где хн — нижняя граница класса, содержащего перцентиль Рi она определяется по величине K=Lin/100, превосходящей или равной ∑fi в ряду накопленных частот. Здесь Рi— выбранный перцентиль; п—общее число наблюдений;

      λ — ширина классового интервала;

        fp— частота класса, содержащего искомый перцентиль;

      Li—-так называемый порядок перцентиля, показывающий, какой процент наблюдений имеет меньшую величину, чем Рi. Например, для Р25 и Р75 порядки окажутся соответственно равными 25 и 75%.

      Таким образом, как и при определении медианы, нахождение того или иного перцентиля связано с кумуляцией частот вариационного ряда в направлении от низшего (начального) класса к высшему. 
 
 

 

      

      ПРАКТИЧЕСКАЯ  ЧАСТЬ

  1. Из генеральной совокупности я выбрал 100 случайных величин и проранжировал их при помощи соответствующей команды Excel.

Таблица 1. Выборка 

12,28 18,14 19,1 19,88 20,56 21,2 21,76 23,26 24,3 25,55
13,25 18,14 19,1 19,88 20,6 21,2 21,76 23,48 24,3 25,55
13,25 18,24 19,1 20 20,6 21,2 21,88 23,48 24,45 26,54
13,25 18,24 19,29 20 20,6 21,5 21,88 23,48 24,45 26,54
15 18,25 19,29 20 21,01 21,5 21,88 23,78 24,78 26,98
15 18,25 19,29 20,15 21,01 21,5 21,89 23,78 24,78 26,98
15 18,5 19,88 20,15 21,01 21,72 21,89 23,78 25,2 28,1
15 18,5 19,88 20,15 21,18 21,72 21,89 24,15 25,2 28,1
15,8 19 19,88 20,56 21,18 21,72 23,26 24,15 25,4 29,17
15,8 19 19,88 20,56 21,18 21,76 23,26 24,15 25,4 29,88
 
      
  1. Следующим этапом работы было разбиение имеющейся  выборки на интервалы с последующим  построением вариационного ряда. Сначала рассчитали количество классовых интервалов

      

      Так как количество интервалов должно быть целым, то, округлив полученное значение, имеем К = 8.

      После этого определили размах вариации по формуле 

      

 

      Затем нашли величину классового интервала

      

 
 
 
 

Нашли верхние и нижние границы интервалов:

Таблица 2. Верхние  и нижние границы интервалов

            11,13-13,33
            13,43-15,64
            15,74-17,94
            18,04-20,24
            20,34-22,55
            22,65-24,85
            24,95-27,15
            27,25-31,76
 

Затем определили частоты каждого из интервалов.

      Таблица 3. Частоты

       

        Интервалы Частоты
        11,13-13,33 4
        13,43-15,64 4
        15,74-17,94 2
        18,04-20,24 28
        20,34-22,55 31
        22,65-24,85 18
        24,95-27,15 10
        27,25-31,76 3
 

    Нашел срединные значения классов

    Таблица 4. Срединные значения  классов.

            Xi
            12,23
            14,54
            16,84
            19,14
            21,45
            23,75
            26,05
            29,51
 
 

Построили гистограмму  распределения. 
 

Рисунок 1. Гистограмма  распределения

Определил числовые характеристики выборки, применив метод условной средней. Для этого выбрал одно из средних значений классовых интервалов с наибольшей частотой и принял его за условную среднюю A=21,45. Посчитал для каждого из средних значений вспомогательную величину по формуле а=(xi – A)/l. Вычислил величины и .

      Таблица 5. Метод условной средней

        средние значения a
         
         
        12,23 -4 -16 64
        14,54 -3 -12 36
        16,84 -2 -4 8
        19,14 -1 -28 28
        21,45 0 0 0
        23,75 1 18 18
        26,05 2 20 40
        29,51 3 9 27
 

      

=-13

=221 

      

Теперь непосредственно  рассчитал среднее арифметическое по формуле: 

      

      

Определил величину дисперсии по формулам: 

      

      

Следует отметить, что расчёт дисперсии проводился с учётом поправки Бесселя. Оценки параметров должны отвечать нижеперечисленным требованиям.

      

Несмещённость. Это означает, что при проведении очень большого количества испытаний  с выборками одинакового размера  среднее значение каждой выборки  стремится к истинному значению генеральной совокупности. Смещённость обычно обусловлена наличием систематической ошибки.

      

Состоятельность. С ростом размера выборки оценка должна стремиться к значению соответствующего параметра генеральной совокупности с вероятностью, стремящейся к 1.

      

Достаточность. Оценка должна содержать всю необходимую информацию и не требовать дополнительной.

      

При разработке оценок обычно выдвигают некоторые  предпосылки. Поэтому оценки, как  правило, отвечают приведённым требованиям  только при выполнении этих предпосылок. Об этом следует помнить при использовании оценок.

      

Для оценивания параметров используются различные  методы, особое место среди них  занимает метод максимального правдоподобия.

      

Он применяется  в тех случаях, когда известен закон распределения. Суть его в  том, что оценки должны быть равны значениям, при которых выборках имеет максимальную вероятность появления.

Вычислил значение СКО:

Определил коэффициент  вариации 

=

15,48

Построил график закона распределения 

 

Рисунок 2. Закон  распределения 

    Вычислил  структурные средние – моду и медиану по формулам: 

 

 

Вычислил квантили 50, 25, 75 порядка по формуле: 
 

     
     
     
     

    Соответственно  получил следующие результаты: 

    P25 = 18,24

    P50 = 19,29

    P75 = 20,20 

Информация о работе Средние и структурные средние величины как обобщающие характеристики совокупности