Показатели симметрии, асимметрии и эксцесса

Автор работы: Пользователь скрыл имя, 21 Февраля 2012 в 06:12, контрольная работа

Описание

Метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений. По своей роли в процессе исследования метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках: посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере ею определяемых. При использовании метода группировок появляется возможность проследить взаимоотношение различных факторов и определить силу их влияния на результативные показатели.

Содержание

1. Интервалы группировки……………………………………...………....4

2. Показатели симметрии, асимметрии и эксцесса……………………....8

Задачи…………...........................................................................................12
Список использованной литературы….………..…………

Работа состоит из  1 файл

Кр по статистике вар5.doc

— 220.00 Кб (Скачать документ)


15

 

Содержание

 

 

 

1. Интервалы группировки……………………………………...………....4

 

2. Показатели симметрии, асимметрии и эксцесса……………………....8

 

Задачи…………...........................................................................................12

Список использованной литературы….………..……………………….18

 


1. Интервалы группировки

Под группировкой в статистике понимают расчленение единиц статистической совокупности на группы, однородные в каком-либо существенном отношении, и характеристику таких групп системой показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей.

Метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений. По своей роли в процессе исследования метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках: посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере ею определяемых. При использовании метода группировок появляется возможность проследить взаимоотношение различных факторов и определить силу их влияния на результативные показатели.

В развитие метода группировок огромный вклад внесли российские статистики. Им принадлежит первенство в применении комбинационных таблиц, в разработке классификации таблиц и в проведении многочисленных группировок материалов аграрных переписей и обследований, которые оказали благотворное влияние на развитие других отраслевых статистик и общей методологии. Исключительное значение метода группировок в статистике было сформулировано выдающимся русским ученым Д.П. Журавским (1810-1856). Он определил статистику как науку категорического вычисления, т.е. как науку о счете по категориям, по группам. В этом определении подчеркивается одна из специфических черт статистической методологии.

Очень важную роль в развитии теории и практики группировок сыграли работы земских статистиков. Метод группировок начинает рассматриваться ими как специальный научный метод обработки данных, а не просто как подсчет численности групп, естественно выделенных в самом процессе статистического наблюдения. Земская статистика использовала систему показателей для изучения социально-экономической дифференциации и анализа взаимосвязей отдельных факторов крестьянских хозяйств. Большие достижения в области применения метода группировок в
статистике отраслей народного хозяйства России характерны для XX столетия.

Огромное значение и роль группировок в статистическом исследовании вытекает из характера объекта статистики, его специфики. Явления общественной жизни, изучаемые статистикой, отличаются многообразием форм и стадий развития, они состоят из существенно различающихся частей, обладающих многими специфическими свойствами.

Изучая количественную сторону массовых общественных явлений в неразрывной связи с их качественными особенностями, статистика стремится показать совокупность явлений в дифференциации, в многообразии их типов, рассмотреть взаимосвязи и соотношения между последними. С помощью метода группировок решаются сложные задачи статистического анализа. Учитывая, что необходимость группировки обусловливается прежде всего наличием качественных различий между изучаемыми явлениями, первую задачу группировок можно сформулировать как задачу выделения в составе массового явления тех его частей, которые однородны по качеству и условиям развития, в которых действуют одни и те же закономерности влияния факторов. В результате такой группировки выделяются социально-экономические типы (а отсюда и название группировки – типологическая) как выражение конкретного общественного процесса, его форм и разветвлений, как выражение существенных черт, общих для множества единичных явлений.

С задачами типологической группировки тесно связаны и две другие задачи группировок: характеристика структуры и структурных сдвигов в исследуемой совокупности и выявление взаимосвязи между отдельными признаками изучаемого явления.

Примерами типологических группировок могут служить группировки хозяйственных объектов по формам собственности; населения по общественным группам; работников на занятых преимущественно физическим и преимущественно умственным трудом и т.д.

Методология типологических группировок определяется тем, насколько ясно выступают качественные отличия в изучаемых явлениях. Например, при группировке отраслей промышленности по экономическому назначению продукции выделяются отрасли, производящие средства производства и отрасли, производящие предметы потребления, в макроструктуре розничного товарооборота выделяются продовольственные и непродовольственные товары. В большинстве случаев качественные отличия
между явлениями не выступают столь отчетливо. Например, выделение в отраслях промышленности крупных, средних и мелких предприятий является достаточно сложной в методологическом отношении проблемой. В подобных случаях после предварительной наметки возможных типов на основе четкой формулировки познавательной задачи необходимо определить те признаки, которые будут положены в основу выделения типов, так называемые группировочные признаки.

При построении рядов распределений важное значение имеет решение вопроса о выборе величины интервала, что связано с характеристикой формы распределения и точностью вычисляемых оценок. Так, Р. Фишер подчеркивает значение выбора интервала для характеристики формы распределения: «В тех весьма частых случаях, когда переменная изменяется непрерывно, так что возможны все промежуточные значения, выбор размера интервалов и их границ произволен, а это может привести к заметным различиям во внешнем виде диаграмм». При расчете эмпирических характеристик по сгруппированным данным в расчетные формулы вместо фактических значений подставляются центральные значения интервалов. И здесь естественно поставить вопрос, в какой мере оценки средней и среднего квадратического отклонения, полученные по сгруппированным данным, близки к таким же оценкам, вычисленным без группировки. Вычисления будут точными, если средняя арифметическая всех значений, попавших в соответствующий интервал, совпадает с его центральным значением. Если отклонения средних арифметических интервалов от центральных значений не имеют систематического характера, то будет достигнута достаточная точность. Таким образом, ширина интервала должна быть такой, чтобы центральное значение интервала давало достаточно близкое представление о средней величине всех тех индивидуальных значений, которые входят в соответствующий интервал. Кроме того, весьма важно, чтобы число наблюдений в интервале не было бы слишком малым, а соответственно число групп чрезмерно большим. В общем виде можно сказать, что расчет величины интервала должен основываться на учете степени вариации признака и численности единиц исследуемой совокупности.

В условиях машинной обработки информации речь должна идти о тех или иных стандартных процедурах группировки по количественным признакам. Один из вариантов такого стандарта – формула Стэрджесса.

Определение величины интервала h для построения вариационного ряда с равными интервалами производится здесь следующим образом:

1) вычисляется разность между максимальным и минимальным значениями признака первичного ряда (определяется размах вариации).

2) размах вариации делится на число групп.

Число групп приближенно определяется по формуле Стэрджесса:

к = 1+3,322 lg h,

где п - общее число изучаемых единиц совокупности.

Указанное выражение почти всегда оказывается дробной величиной, которую округляют до целого числа, поскольку количество групп не может быть дробным.

Величина интервала должна определяться в соответствии с точностью данных наблюдения: если исходные данные представлены целыми числами, то рассчитанная величина интервала округляется до ближайшего целого числа; если данные представлены с точностью до 0,1, то величина интервала округляется до целых с десятыми и т.д. (здесь округление производится в большую сторону).

Значение величины интервала позволяет определить границы всех интервалов ряда распределения. Нижнюю границу первого интервала целесообразно принимать равной минимальному значению признака. Имеются и предложения иного рода. Так, нижнюю границу первого интервала рекомендуют определять вычитанием из минимального значения признака половины величины интервала. В каждый интервал включаются варианты, числовые значения которых больше или равны нижней границе и меньше или равны верхней границе. При построении интервальных рядов для непрерывных признаков имеет место совпадение верхних границ предшествующих интервалов и нижних границ следующих за ними интервалов. Здесь должны даваться пояснения, в какой интервал относить единицы совокупности, числовые значения признака у которых совпадают с одной из этих границ.

В дополнение к уже рассмотренной процедуре при построении рядов распределения можно воспользоваться свойствами кривой нормального распределения. Учитывая, что в пределах х±3а должно находиться 99,7% всех вариантов значений признака, можно предложить следующие интервалы группировки:

1) до – 3σ; 2) – 3σ – 2σ; 3) – 2σ – σ; 4) – σ ; 5) + σ; 6) + σ + 2σ; 7) + 2σ + 3σ; 8) + 3σ и более.

Такой вариант группировки может использоваться в совокупностях достаточно большого объема.

Для асимметричных распределений может быть предложен вариант группировки с использованием средних величин. Общая средняя величина , рассчитанная по всей совокупности единиц, позволяет выделить две группы с уровнем признака ниже и выше средней. По этим группам рассчитываются средние х1 их2, на основе которых в свою очередь можно аналогичным образом сформировать подгруппы.

В совокупностях, достаточно больших по объему, может быть продолжено деление сформированных групп на подгруппы и получено большее число групп.

 

2. Показатели симметрии, асимметрии и эксцесса

Для получения приблизительного представления о форме распределения строят графики распределения (полигон и гистограмму). Число наблюдений, по которому строится эмпирическое распределение, обычно невелико и представляет собой выборку из исследуемой генеральной совокупности. Поэтому эмпирические данные в определенной степени связаны со случайными ошибками наблюдения, величина которых неизвестна. Влияние этих случайностей затемняет основную закономерность изменения величины признака. С увеличением числа наблюдений и одновременным уменьшением величины интервала зигзаги полигона начинают сглаживаться, и в пределе мы приходим к плавной кривой, которая называется кривой распределения.

Кривая распределения характеризует теоретическое распределение, т.е. то распределение, которое получилось бы при полном погашении всех случайных причин, затемняющих основную закономерность. Исследование закономерности (или формы) распределения включает решение трех последовательных задач: 1) выяснение общего характера распределения; 2) выравнивание эмпирического распределения, которое состоит в том, что на основании эмпирического распределения строится кривая у = f(x) с заданной формой; 3) проверку соответствия найденного теоретического распределения эмпирическому.

В практике статистического исследования приходится встречаться с самыми различными распределениями. Однородные совокупности характеризуются, как правило, одновершинными распределениями. Многовершинность свидетельствует о неоднородности изучаемой совокупности. Появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп. Выяснение общего характера распределения предполагает оценку степени его однородности, а также вычисление показателей асимметрии и эксцесса. Симметричным является распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой. Для симметричных распределений имеет место равенство средней арифметической, моды и медианы. В связи с этим простейший показатель асимметрии основан на соотношении показателей центра распределения: чем больше разница между средними (), тем больше асимметрия ряда.

Для сравнительного анализа степени асимметрии нескольких распределений рассчитывают относительный показатель Аs:

Величина показателя асимметрии As может быть положительной и отрицательной. Положительная величина показателя асимметрии указывает на наличие правосторонней асимметрии (правая ветвь относительно максимальной ординаты вытянута больше, чем левая, рис. 1). При правосторонней асимметрии между показателями центра распределения существует соотношение: Мо < Ме < .

Отрицательный знак показателя асимметрии свидетельствует о наличии левосторонней асимметрии (рис. 1). Между показателями центра распределения в  этом случае имеется такое соотношение: Мо > Ме > .

 

Рис. 1. Асимметричные ряды распределения:

1 – с правосторонней асимметрией;

2 – с левосторонней асимметрией.

Другой показатель асимметрии, предложенный шведским математиком Линдбергом, рассчитывается по формуле:

As = П – 50,

где П – процент тех значений признака, которые превосходят по величине среднюю арифметическую.

Информация о работе Показатели симметрии, асимметрии и эксцесса