Корреляционный анализ

Автор работы: Пользователь скрыл имя, 03 Сентября 2011 в 13:42, курсовая работа

Описание

Построение рядов распределения по факторному и результативному признакам

Содержание

1. Корреляционный анализ
1.1. Построение рядов распределения по факторному и результатив-ному признакам
1.2. Построение корреляционной таблицы
1.3. Расчет эмпирической линии регрессии
1.4. Расчет теоретической линии регрессии
1.5. Построение исходной, теоретической и эмпирической линии ре-грессии
1.6. Измерение тесноты связи
1.7. Проверка правильности гипотезы о прямолинейной форме
корреляционной связи
1.8. Заключение по разделу «Корреляционный ана-лиз»………………..
2. Определение показателей вариации…………………………....
2.1. Вычисление групповой дисперсии…………………………………..
2.2. Вычисление средней из групповых………………………………….
2.3. Вычисление межгрупповой дисперсии……………………………...
2.4. Вычисление общей дисперсии……………………………………….
2.5. Вычисление среднеквадратического отклонения………… ……..
2.6. Вычисление показателя вариации…………………………………...
2.7. Вычисление эмпирического коэффициента детерминации……….
2.8. Вычисление эмпирического корреляционного отношения ……..
2.9. Заключение по разделу «Определение показателей вариации»…..
3. Анализ динамических рядов……………………………………… …
3.1 Определение данных для 3-го динамического ряда по двум ис-ходным дан-ным……………………………………………………………………...
3.2. Установление вида ряда динамики………………………………… .
3.3. Определение среднего уровня ряда динамики……………………..
3.4. Определение показателей изменения уровня динамики: базисный и цепные абсолютные приросты, темпы роста и прироста, абсолютное значение приро-ста…………………………………………………………………...
3.5. Вычисление средний абсолютный прирост……………………… ...
3.6. Вычисление среднегодовых темпов роста и прироста……………..
3.7. Графическое изображение показателей динамических рядов: ба-зисные и цепные темпы роста по трем динамическим рядам…… ………...
3.8. Выявление основной тенденции развития одного из динамиче-ских рядов методом скользящей средней (трехчленный) ……………………….
3.9. Аналитическое выравнивание ряда ………………………………..
3.10. Графическое изображение скользящей прямой, прямой по ис-ходным данным, выровненной прямой ………………………............................
4.0. Анализ полученных показателей динамических рядов… …….
Список использованной литературы

Работа состоит из  1 файл

курсовик - Лилия.docx

— 250.96 Кб (Скачать документ)

    Если рассматривать другой ряд,  то там вывод такой: ряд распределения по численности работников показывает, что наиболее характерными являются группа с центральными значениями интервала 118, так как они составляют 27,273% всей численности работников.

   Следующим шагом было построение корреляционной таблицы с помощью которой мы пришли к выводу, что при переходе слева на право в сторону больших значений факторного признака , соответствующие ряды распределения функционального признака смещаются снизу вверх, т.е. в сторону больших значений функции. Следовательно, накладные расходы находится в корреляционной зависимости от численности работников.

   Далее последовал расчет эмпирической линии  регрессии, значения, по определяющему признаку которой мы записали в четвертой итоговой строке таблицы 1.6.. после окончания расчетов, мы сделали вывод, что расчет эмпирической линии регрессии вновь подтвердил наличие корреляционной зависимости между накладными расходами и численностью работников.

   Затем мы совершили расчеты по определению  теоретической линии регрессии, она еще раз подтвердила наличие корреляционной связи между изучаемыми признаками. После решения системы, мы получили уравнение теоретической линии в виде:

                                 y=15,0152+1,3024x        

   С целью определить тесноту связи  между определяющим и факторным  признаком высчитали коэффициент корреляции . Он показал,  что между накладными расходами и численностью работников существует положительная корреляция, которая говорит о том, что  с увеличением факторного признака x функциональный признак y тоже увеличивается.

  Знак  при корреляции совпадает со знаком регрессии  , что свидетельствует о правильности произведенных вычислений. Чем ближе к 1, тем сильнее связь между факторным признаком x функциональным признаком y.

   В нашем  случае она весьма тесная. 
 
 

 

       2. Определение показателей  вариации 

   Прежде  чем начать определение показателей  вариации, дадим объяснение данному  термину.

   Вариация  – это различия в значении какого-либо признака у разных единиц изучаемой совокупности в один и тот же момент времени.

   Из  исходных данных, которые мы взяли  из первого раздела (Корреляционный анализ) выделим три группы по результативному  признаку y:

                                       Таблица 2.1.

     

Накладные расходы, тыс. руб. Численность работников, чел.
  Y2   X1
    112   70
  113   76
  122   83
  153   120
  156   122
  158   112
  165   116
  168   115
  170   119
  190     126
    200   130
 

     тыс. руб.

  Получаются интервалы:   112-141,33

                                             141,33-170,66

                                             170,66-199,99

     

   Группы построенные по результативному признаку

   Таблица 2.2.

1 группа 2 группа 3группа
Наклад-

ные расходы,

тыс.руб.

 

Наклад-

ные расходы,

тыс.руб

Наклад-

ные расходы,

тыс.руб

1 112 -3,33 11,09 1 153 -8,67 75,17 1 190 -5       25
2 113 -2,33 5,43 2 156 -5,67 32,15 2 200 5 25
3 122 6,67 44,49 3 158 -3,67 13,45        
        4 165 3,33 11,09        
        5 168 6,33 40,07        
        6 170 8,33 63,4        
  346   61,01   970   235,33   390   50
 

  Для определения среднего объема накладных расходов ( ), воспользуемся формулой средней арифметической простой, которая равна сумме отдельных значений признака деленных на число этих значений, т.е:

  

 

  где:  - значения результативного признака;

         n – количество наблюдений в выборке. 

      И по данной формуле определим средние  значения результативного признака для каждой из данных групп:

       тыс. руб.

       тыс. руб.

       тыс. руб.

   В статистике очень часто используется показатель под названием дисперсия, которая представляет собой среднеквадратическое отклонение индивидуальных значений признака от средней величины. Дисперсия - неименованная величина, т.е. она не имеет единиц измерения. Она рассчитывается как для сгруппированных данных, когда имеет частоты признака , так и для несгруппированных данных.

   Если  всю статистическую совокупность разложить  на группы по какому - либо признаку, то для каждой группы можно определить следующие величины:

   - групповую дисперсию;

   - среднюю из групповых;

   - межгрупповую дисперсию. 

   2.1. Вычисление групповой дисперсии 

   Групповая дисперсия отражает случайную вариацию, обусловленную влиянием неучтенных факторов и независящую от признака фактора положенного в основание группировки.

   Она рассчитывается как для сгруппированных  данных, когда имеет частоты признака , так и для несгруппированных данных.

   Для сгруппированных данных:  

   Для несгруппированных данных:

   где:

        - значение признака;

        - среднее значение в выборке;

        - число наблюдений в выборке;

         - частоты признака.  
     

   В данном случае вычисляем групповую  дисперсию по формуле для несгруппированных (невзвешенных) данных, так как у нас не имеется частоты признака .

   Подставив данные в таблице 2.2. значения, найдем дисперсию каждой из трех групп: 
 
 

   Вывод: групповые дисперсии, вычисленные по трем группам, отражают действие всех факторов влияющих на накладные расходы. 

   2.2. Вычисление средней из групповых 

   На  основе частных дисперсий можно  определить среднюю из групповых дисперсий. В данном случае она отражает изменение накладных расходов, под действием всех факторов влияющих на него, но в среднем по всей совокупности. Среднюю из групповых дисперсий, так же как и групповая дисперсия не имеет единицы измерения.

   Среднюю из групповых вычисляем по формуле:

   

   где: f – частота

        - групповая дисперсия 

   Если  подставить все значения в данную формулу, то получим: 

   Вывод: данная величина показывает зависимость всех рядов совокупности от неучтенных факторов, которые могут воздействовать на эту совокупность. 

   2.3. Вычисление межгрупповой  дисперсии 

   Межгрупповая  дисперсия характеризует вариацию результативного признака, обусловленную  влиянием факторного признака положенного  в основу группировки, она равна среднеквадратичному отклонению групповых (частных) средних величин от общей средней величины для всей изучаемой совокупности. Она так же не имеет единицы измерения.

   Межгрупповую  дисперсию определяют по формуле:

   

   Первым  делом нужно определить общее среднее значение в выборке для всех рядов:

    тыс. руб.

   Следующим шагом будет подстановка данных в формулу и определение числового значения межгрупповой дисперсии: 
 

   Вывод: чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние факторного признака на результативный признак, т.е. на накладные расходы. Но для того, чтобы узнать долю межгрупповой дисперсии в общей, нужно определить величину последней. 

   2.4. Вычисление общей  дисперсии 

   Зная  среднюю из групповых дисперсий  и межгрупповую дисперсию, можно  определить по правилу сложения общую  дисперсию исследуемой совокупности. Общая дисперсия тоже не имеет  единицы измерения.

   

   Подставим данные в формулу и найдем численное  значение общей дисперсии 

   где:  - средняя из групповых;

        - межгрупповая дисперсия. 

    Для проверки расчетов найдем общую дисперсию  обычным способом по формуле: 

    Подставив в эту формулу значения получим 
 
 

   Вывод: так как мы вычислили общую дисперсии, то в дальнейшем можно будет определить эмпирический  коэффициент детерминации, который поможет нам в определении доли межгрупповой дисперсии в общей. 

   2.5. Вычисление среднеквадратического  отклонения 

   Мы  уже рассмотрели несколько показателей  вариации, но самым ярким показателем её является среднеквадратическое отклонение. Эта величина показывает то, насколько в среднем отклоняются конкретные варианты от их средней величины. Среднеквадратическое отклонение есть корень квадратный из общей дисперсии. Оно измеряется в тех же единицах измерения, что и изучаемый признак

                            тыс. руб.

   Вывод: среднеквадратическое отклонение показывает, что накладные расходы отклоняется от средней величины на 27,85 тыс.руб., т.е. чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает всю представляемую совокупность. 

   2.6. Вычисление показателя  вариации 

   Для сравнения участи одного итого же признака в нескольких совокупностях  с различными средними величинами используют относительный показатель вариации – коэффициент вариации. Он представляет собой выражение в процентах отношения среднеквадратического отклонения к средней величине:

   ,  18%<33%

   Вывод: измеряемая совокупность является однородной, если коэффициент вариации не превышает 33%.  
 

Информация о работе Корреляционный анализ