Ряды распределения, корреляционно-регрессионный анализ

Автор работы: Пользователь скрыл имя, 16 Июля 2011 в 18:11, контрольная работа

Описание

1. Построить ряд распределения по первичным данным о стоимости квартир.
2. Определить количество групп, величину интервала, показатели структуры, кумулятивную численность, середину интервала.
3. Построить гистограмму, полигон, кумуляту распределения квартир по стоимости.
4. Определить характеристики центра распределения.
5. Определить медиану и моду графически.
6. Рассчитать абсолютные и относительные показатели вариации.
7. Определить коэффициент асимметрии, охарактеризовать асимметричность с помощью характеристик центра распределения.
8. Определить межгрупповую, среднюю из групповых и общую дисперсии, коэффициент детерминации.
9. На основе полученных абсолютных, относительных и средних величин выполните качественный анализ количественных оценок.

Работа состоит из  1 файл

статистика.doc

— 531.00 Кб (Скачать документ)

     Задание №1

     Первичные данные о стоимости 30 квартир (тыс. ден.ед.):

     Хі: 28; 28; 28; 79; 48; 36; 34; 32; 84; 60; 29; 41; 36; 65; 32; 29; 48; 82; 37; 27; 60; 65; 58; 29; 30; 62; 27; 60; 29; 83. 

  1. Построить ряд распределения по первичным  данным о стоимости квартир.
  2. Определить количество групп, величину интервала, показатели структуры, кумулятивную численность, середину интервала.
  3. Построить гистограмму, полигон, кумуляту распределения квартир по стоимости.
  4. Определить характеристики центра распределения.
  5. Определить медиану и моду графически.
  6. Рассчитать абсолютные и относительные показатели вариации.
  7. Определить коэффициент асимметрии, охарактеризовать асимметричность с помощью характеристик центра распределения.
  8. Определить межгрупповую, среднюю из групповых и общую дисперсии, коэффициент детерминации.
  9. На основе полученных абсолютных, относительных и средних величин выполните качественный анализ количественных оценок.
 
 
  
    1. Преобразуем первичные (исходные) данные стоимости  квартир (тыс. ден. ед.) в ряд распределения.

    Первым шагом в построении ряда распределения является его ранжирование, то есть размещение значений признака в возрастающем порядке:

    27; 27; 28; 28; 28; 29; 29; 29; 29; 30; 32; 32; 34; 36; 36; 37; 41; 48; 48; 58; 60; 60; 60; 62; 65; 65; 79; 82; 83; 84. 

  
    1. Ряд распределения, построенный по количественному признаку, называется вариационным. Построим ряд распределения, выраженный в виде интервалов.

Такой ряд характеризует  состав (структуру) исследуемого явления, а также позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

     Определим количество групп, величину интервала, показатели структуры, кумулятивную численность, середину интервала.

     Количество  групп определяем по формуле Стерджесса:

          n = 1 + 3,322 lg N,

     где N – число единиц совокупности (=30).

     n=1 + 3,322 lg30=5,9. Принимаем n=6.

     Тогда размер интервала можно вычислить  по формуле:

      ,

     где n – число интервалов;

     X – значение варьирующего признака.

     Принимаем размер интервала за 9,5. 

     В результате получим следующий интервальный ряд распределения квартир по стоимости: 

xi 27-36,5 36,5-46 46-55,5 55,5-65 65-74,5 74,5-84
fi 15 2 2 5 2 4
 

     Как видно по данному ряду распределения, стоимость квартир в основном размещена в границах 27-36,5тыс. ден. ед. 

Результаты построения ряда распределения оформляются  в виде таблицы. 

     Таблица 1.1.

     Распределение квартир по стоимости 

Стоимость квартир, тыс. ден.ед., xi Количество  квартир, шт, fi Середина интервала xi’ Структура распределения, %, di Кумулятивная численность,

Si

27-36,5 15 31,75 50 15
36,5-46 2 41,25 6,67 17
46-55,5 2 50,75 6,67 19
55,5-65 5 60,25 16,66 24
65-74,5 2 69,75 6,67 26
74,5-84 4 79,25 13,33 30
Итого: 30 - 100% -
 

     Как видно по данному ряду распределения, стоимость квартир в основном размещена в границах 27-36,5тыс. ден. ед. 

     Середина  интервала:

       

     Показатели  структуры рассчитываются по формуле: 

       
 
 
 
 
 

  
  1. Построение  гистограммы, полигона распределения  и кумуляты стоимости квартир:

     Рис.1.1.Гистограмма  распределения квартир по стоимости. 
 

     

     Рис.1.2.Полигон  распределения квартир по стоимости. 
 
 
 
 

     

    Рис.1.3.Кумулята распределения квартир по стоимости. 
     

  
  1. К характеристикам  центрального распределения относятся: среднее значение, мода и медиана, которые используются для характеристики среднего значения признака в вариационном ряду.

         Средняя величина характеризует типичный уровень  признака в совокупности.

         Для сгруппированных данных среднее значение рассчитывается по формуле средней арифметической взвешенной:

         

         где      - сумма произведений величины признаков на их частоты;

                - общая численность единиц совокупности.

    (тыс.ден.ед.) 
     

          Для несгруппированных данных среднее  значение рассчитывается по формуле  средней арифметической простой.

         

         Модаэто наиболее распространенное значение признака, т.е. варианта, которая в ряду распределения имеет наибольшую частоту.

     Модальный интервал - { =6} – 172-388

     Точное  значение моды в интервальном ряду определяется по формуле: 

     

     где -нижняя граница модального интервала; i – размер интервала;

      - частота модального, предмодального  и послемодального         интервала.

     

          В данном случае, самой распространенной стоимостью квартир является 32,09 тыс.ден.ед.

          Медианаэто варианта, выпадающая на середину ранжированного ряда распределения и делят его на две равные части.

          Точное  значение медианы для интервального ряда распределения рассчитывается по формуле:

           ,

          где  - нижняя граница медианного интервала; - кумулятивная численность предмедианного интервала; -частота медианного интервала. 

          Медианный интервал  { } - ≥27-36,5

          

          Это означает, что половина квартир имеет стоимость меньше 36,5 тыс.ден.ед., а половина – больше. 

  
  1. Мода  определяется по гистограмме,  для этого правую вершину модального прямоугольника соединяем с правым верхнем углом  предыдущего прямоугольника, а левую  вершину модального прямоугольника с левым верхнем углом последующего прямоугольника. Абсцисса точки пересечения этих прямых будет модой распределении.
 

           Мо=32,09 

          Рис.1.4.Построение моды по гистограмме распределения  квартир по стоимости. 

          Медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует общей численности совокупности делят пополам, через полученную точку проводят линию параллельную оси абсцисс до ее пересечения с кумулятой. Абсцисса точки пересечения будет медиана. 
     

          Рис.1.5.Построение медианы по кумуляте распределения  квартир по стоимости.

  1. Вариация – это значение признака по отдельной единице совокупности.
 

Абсолютные  показатели вариации 

   
  • размах  вариации

 

   
  • среднее линейное отклонение

  • среднее квадратичное отклонение:

     

     где  -дисперсия.

      

     По сгруппированным  данным: 

     

     

           

Относительные показатели вариации 
 

    • коэффициент осцилляции:

       

       

  • относительное линейное отклонение:

       

       

  • коэффициент вариации:

       

       

     Совокупность {V=34,7} качественно неоднородна 

     Показатели  асимметрии 

  • коэффициент асимметрии:

       

     

     Рис.1.6. Эмпирическая кривая распределения  квартир по стоимости 

     Коэффициент асимметрии As=0,6>0, эмпирическая кривая (ри.1.6), а так же соотношение < <

     Совокупность имеет правостороннюю асимметрию  As>0   < <

  1. Для выделения силы влияния  группировочного фактора целесообразно общую дисперсию разложить на межгрупповую и внутригрупповую.

      Общая дисперсия определяет вариацию под  влиянием всех факторов, обусловивших эту вариацию.

      σ²=321,8.

      Межгрупповая дисперсия характеризует систематическую вариацию признака, обусловленную влиянием фактора, положенного в основу группировки.

      Таблица1.2.

Количество  домохозяйств

Общий денежный доход, д.е. 

Средний доход, д.е.

 
15 27*2,  28*3,  29*4,  30,  32*2,  34, 36*2 30,27 128,86
2 37,  41 39 8
2 48*2 48 0
5 58, 60*3,  62 60 8
2 65*2 65 0
4 79, 82, 83, 84 82 14
30 - - 158,86

Информация о работе Ряды распределения, корреляционно-регрессионный анализ