Статистика, основные положения

Автор работы: Пользователь скрыл имя, 05 Декабря 2011 в 21:22, реферат

Описание

Статистика как наука представляет собой целостную систему научных дисциплин: теория статистики, экономическая статистика и ее отрасли, социальная статистика, отраслевые и специальные статистики.
Общая теория статистики является наукой о наиболее общих принципах и методах статистического исследования социально-экономических явлений и решает другие общественные вопросы.
Она разрабатывает понятийный аппарат и систему категорий статистической науки, ра

Работа состоит из  1 файл

СТАТИСТИКА.docx

— 195.80 Кб (Скачать документ)

Под классификацией обычно понимается устойчивая номенклатура классов и групп, образованных на основе сходства и различия единиц изучаемого объекта.

Используются  классификации в течение длительного  времени, хотя со временем, отразив  происходящие изменения в объекте  наблюдения, классификации могут  подвергаться более или менее  существенным изменениям. Утверждаются классификации, как правило, в качестве национального или международного стандарта. Широко используются классификации  отраслей народного хозяйства, отраслей промышленности, основных фондов, промышленно-производственного  персонала и т.д. Любая классификация  может состоять из нескольких уровней, т.е. выделенная на первом этапе классификационная  группа может в дальнейшем детализироваться и т.д.

Необходимость и степень детализации классификационных  групп определяется целью и задачами статистического исследования.

Рассмотрим в  качестве примера классификацию  элементов затрат рабочего времени. В целях изучения структуры затрат внутрисменного рабочего времени можно  ограничиться такими видами затрат:

  1. Время работы;
  2. Время, неиспользованное по уважительным причинам;
  3. Потери рабочего времени.

Однако если ставится задача разработки мероприятий, направленных на сокращение потерь рабочего времени, необходимо использовать более  развернутую классификацию фонда  рабочего времени и, в частности, третьего элемента вышеприведенной  классификации. Так, могут быть выделены потери рабочего времени по организационно-техническим  причинам и потери по вине рабочего. В свою очередь, в составе потерь по организационно-техническим причинам могут быть выделены простои из-за отсутствия материалов, заготовок, инструмента  и технической документации; простои  из-за текущего ремонта оборудования и т.д.

Всестороннее  статистическое изучение социально-экономических  процессов и явлений наиболее плодотворно в том случае, если в основе его лежит система  группировок. Система группировок - это ряд взаимосвязанных статистических группировок по наиболее существенным признакам, всесторонне отражающим важнейшие стороны изучаемых явлений.

Техника выполнения группировок 

При составлении  структурных группировок на основе варьирующих количественных признаков  необходимо определить количество групп  и интервалы группировки.

Интервал - количественное значение, отделяющее одну единицу (группу) от другой, т.е. он очерчивает количественные границы группы.

Как правило, величина интервала представляет собой разность между максимальным и минимальным  значениями признака в каждой группе.

Вопрос о количестве групп и величине интервала следует  решать с учетом множества обстоятельств, прежде всего, исходя из целей исследования, значения изучаемого признака и т.д.

Количество групп  и величина интервала связаны  между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа  единиц исследуемого объекта и степени  колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число  групп, так как группы будут малочисленными.

При определении  количества групп необходимо стремиться к тому, чтобы были учтены особенности  изучаемого явления. Поэтому количество групп должно быть оптимальным, в  каждую группу должно входить достаточно большое число единиц совокупности, что отвечает требованию закона больших  чисел. Однако, в отдельных случаях  представляют интерес и малочисленные  группы: новое, передовое, пока не оно  станет массовым, проявляется в незначительном числе фактов; поэтому задача статистики - выделить эти факты, изучить их.

Таким образом, при решении вопроса о численности  единиц в группах нужно руководствоваться  не формальными признаками, а знанием  сущности изучаемого явления.

На количество выделяемых групп существенное влияние  оказывает степень колеблемости группировочного признака: чем она  больше, тем больше следует образовывать групп.

Ориентировочно  определить оптимальное количество групп с равными интервалами  можно по формуле американского  ученого Стерджесса:

n=1+3,322 lgN,

где N - число  единиц совокупности.

Используя эту  формулу получим следующее соотношение:

Таблица 3.1.1.

N 15-24 25-44 45-89 90-179 180-359 360-719
n 5 6 7 8 9 10

Формула Стерджесса пригодна при условии, что распределение  единиц совокупности по заданному признаку приближается к нормальному, и при  этом применяются равные интервалы  в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления. Интервалы могут быть равные и неравные. При исследовании экономических  явлений могут применяться неравные (прогрессивно возрастающие или прогрессивно убывающие) интервалы. Например, по численности  работающих промышленные предприятия  могут быть разбиты на группы: до 100 человек, 100 - 200, 200 - 300, 300 - 500, 500 - 1000, 1000 и более человек. Это объясняется  тем, что количественные изменения  размера признака имеют неодинаковые значения в низших и высших по размеру  признака группах: изменение количества работающих на 50-100 человек имеет  существенное значение для мелких предприятий, а для крупных - не имеет.

Группировки с  равными интервалами целесообразны  в тех случаях, когда вариация проявляется в сравнительно узких  границах и распределение является практически равномерным (например, при группировке рабочих одной  профессии по размеру заработной платы, посевов пшеницы - по урожайности).

Для группировок  с равными интервалами величина интервала составляет

i=(xmax-xmin)/n

где xmax, xmin - наибольшее и наименьшее значение признака соответственно;

n - число групп.

Если в результате деления получится дробное число  и возникнет необходимость в  округлении, то округлять нужно, как  правило, в большую сторону.

Интервалы групп  могут быть открытыми и закрытыми.

В закрытых интервалах указаны нижняя и верхняя границы интервала.

В открытых интервалах указана лишь одна из границ (первый или последний интервалы). Величина открытых интервалов принимается равной величине смежных с ними интервалов.

При анализе  разнородных данных, например, при  анализе материала, собранного в  различные периоды времени, относящегося к различным отраслям промышленности, возникает необходимость применения вторичной группировки.

Вторичная группировка - образование новых групп на основе ранее осуществленной группировки.

Получение новых  групп на основе имеющихся возможно двумя способами перегруппировки: объединение первоначальных интервалов путем их укрупнения и долевой  перегруппировкой на основе закрепления  за каждой группой определенной доли единиц совокупности.  
 

7. показатели вариации признаков. Средние величины и показатели вариации признаков. средние величины.

Показатели вариации (колеблемости) признака

Для суждения о  размере вариации признака в статистике используются абсолютные и относительные показатели. К абсолютным показателям вариации относятся:

  • размах колебаний;
  • среднее линейное отклонение;
  • среднее квадратическое отклонение:
  • дисперсия;
  • квартальное отклонение.

Размах колебаний (размах вариации) определяется по формуле:   

Величина показателя зависит от величины только двух крайних вариант и не учитывает степени колеблемости основной массы членов ряда.

Среднее линейное отклонение (d) и среднее квадратическое отклонение (а) показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.

Среднее линейное отклонение определяется по формулам:

а) для несгруппированных  данных (первичного ряда):  

б) для вариационного  ряда:   
 

Среднее квадратическое отклонение (а) и дисперсия (а2) определяются так:

а) для несгруппированных  данных:   
 

б) для вариационного  ряда:  

Формула для  расчета дисперсии может быть преобразована:   
 

To есть дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины. Следовательно,

Среднее квадратическое отклонение по своей величине всегда превышают значение среднего линейного  отклонения в соответствии со свойствоА1 мажорантности средних.

Квартильное отклонение (dk) применяется вместо размаха вариации, чтобы избежать недостатков, связанных с использованием крайних значений:   

Квартиль —  это значения признака, которые делятранжированный ряд на четыре равные по численности  части. Таких величин будет три: первая квартиль (Q\), вторая квартиль (Qo). третья квартиль (Q3). Вторая квартиль является медианой. Вычисление квартилей аналогично вычислению медианы.

Сначала определяют положение или место квартили:    
 

Затем по накопленным  частотам в дискретном ряду определяют численное значение.

В интервальном ряду распределения сначала указывают  интервал, в котором лежит квартиль, затем определяют ее численное значение по формуле:     
 
 

При сравнении  колеблемости различных признаков  в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической используются относительные показатели вариации. Они вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане) и чаще всего выражаются в процентах. Используются следующие формулы расчета относительных показателей вариации:

  • коэффициент осцилляции:
 

 

  • относительное линейное отклонение:
 

 

  • коэффициент вариации:
 

 

  • относительный показатель квартильной вариации:
 

 

Наиболее часто  применяется коэффициент вариации. Его применяют не только для сравнительной  оценки вариации, но и для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений, близких к нормальному). 

Понятие и виды средних  величин

Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.

Существует  2 класса средних величин: степенные и структурные.

К структурным  средним относятся мода и медиана, но наиболее часто применяются степенные средние различных видов.

Степенные средние величины

Степенные средние  могут быть простыми и взвешенными.

Простая средняя величина рассчитывается при наличии двух и более несгруппированных статистических величин, расположенных в произвольном порядке по следующей общей формуле:

Информация о работе Статистика, основные положения