Автор работы: Пользователь скрыл имя, 17 Декабря 2010 в 06:39, курсовая работа
Целью данного курсового проекта является освоение теоретического материала, приобретение умения правильно решить практические задачи выборочного метода, грамотно интерпретировать полученные результаты, что служит необходимым условием успешного изучения курса теории статистики в целом.
Курсовой проект состоит из 6 параграфов. В первом параграфе изложена суть выборочного метода, а также преимущества его использования.
Второй параграф содержит информацию о наиболее часто применяемых способах отбора единиц из генеральной совокупности. Здесь же приведены формулы для вычисления средней ошибки для некоторых способов отбора. Этот параграф тесно связан со следующим, в котором излагаются общие принципы нахождения средней и предельной ошибок выборки.
В четвертом параграфе приведены методы определения необходимого объёма выборки. В пятом описана так называемая малая выборка и её особенности.
Шестой параграф состоит из двух частей. В первой части показаны области применения выборочного метода при изучении социально-экономических явлений. Вторая часть этого параграфа представляет собой практический расчет, который иллюстрирует применение выборочного метода на конкретном примере.
Введение 2
§1. Сущность и преимущества выборочного метода 3
§2. Способы отбора единиц из генеральной совокупности 4
§3. Ошибка выборки. 10
§4. Определение необходимого объёма выборки 15
§5. Малая выборка 18
§ 6. Применение выборочного метода при изучение социально-экономических явлений. 20
Заключение 26
Список литературы 27
Равномерный
и оптимальный способы
Для типической выборки средняя ошибка рассчитывается по формуле:
− при пропорциональном размещении:
где - средняя из групповых дисперсий.
− при непропорциональном размещении:
где Ni и ni – объёмы типической группы и выборки из неё соответственно;
- групповые дисперсии.
Серийный отбор также иногда применяется в социально-экономических исследованиях. Его отличительной особенностью является следующее: случайно или механически отбирают не отдельные единицы генеральной совокупности, а серии, или группы. Внутри каждой отобранной серии обследуются все единицы. Отбор серий может осуществляться как случайным, тогда принципиальных различий между серийным и случайным отбором отдельных единиц нет, так и механическим путем, тогда он уже носит черты направленного отбора.
Серийная выборка дает более значительную ошибку репрезентативности, чем другие способы отбора. Это объясняется тем, что единицы, составляющие отобранную серию, обычно похожи друг на друга. Эта похожесть обусловлена тем, что они формируются в схожих условиях.
Вычисление средней ошибки серийной выборки основано на дисперсии серийных средних и она рассчитывается следующим образом:
при повторном отборе - ,
при бесповторном отборе - ,
где r – количество серий в выборки; R – количество серий в генеральной совокупности. Отсюда можно сделать следующий вывод: чем более разнородными будут единицы, входящие в состав отбираемых серий, тем репрезентативней будет выборка.
В практике статистических обследований помимо рассмотренных выше способов применяются и их комбинация. Так, например, можно комбинировать типическую и серийную выборки, когда серии отбираются в установленном порядке из нескольких типических групп. Возможна также комбинация серийного и собственно-случайного отборов, при которой отдельные единицы отбираются внутри серии в собственно случайном порядке. Ошибка этой выборки определяется ступенчатостью отбора.
Требования более удобной и гибкой организации отбора, приводят к пожертвованию репрезентативностью, однако, имеются и другие методы организации выборочного наблюдения, лучше отвечающие характеру изучаемого материала. При этом иногда даже может улучшиться баланс между точностью наблюдения и затратами времени, труда и средств.
Одним из таких путей является многоступенчатый отбор, предполагающий подвыборку, которая заключается в отборе более мелких единиц из уже отобранных крупных, т.е. из генеральной совокупности сначала извлекаются укрупненные группы, потом – более мелкие и так до тех пор, пока не будут отобраны те единицы, которые подвергаются обследованию. Наиболее часто используется двухступенчатая форма многоступенчатой выборки.
В отличие от многоступенчатой выборки многофазная выборка предполагает сохранение одной и той же единицы отбора на всех этапах его проведения, при этом отобранные на каждой стадии единицы подвергаются обследованию (на каждой последующей стадии программа обследования расширяется).
Для начала введем некоторые характеристики генеральной и выборочной совокупностей:
№
п/п |
Характеристика | Генеральная совокупность | Выборочная совокупность |
1. | Объём совокупности | N | n |
2. | Численность единиц, обладающих обследуемым признаком | M | m |
3. | Доля единиц, обладающих обследуемым признаком | ||
4. | Средний размер признака | ||
5. | Дисперсия количественного признака | ||
6. | Дисперсия доли |
Существует два вида ошибок: ошибка регистрации и репрезентативности. Ошибка регистрации носит случайный или систематический характер и избегается путем правильной организации и проведения наблюдения. Ошибка репрезентативности органически присуща выборочному методу, так как выборочная совокупность не полностью воспроизводит генеральную совокупность. Выборочный метод опирается на теорию вероятностей и пользуется её методами, которые основаны на использование предельной теоремы закона больших чисел, и пользуясь этими методами можно свести к минимуму ошибки репрезентативности.
Ошибка выборочного наблюдения – это разность между величиной параметра в генеральной совокупности и его величиной, вычисленной по результатам выборочного наблюдения. То есть, вычисляя ошибку выборки, исследователь определяет вероятные пределы, в которых может находиться искомая характеристика генеральной совокупности. Для среднего значения ошибка будет определяться следующим образом:
где , .
Величина называется предельной ошибкой выборки.
Предельная ошибка выборки величина случайная. Наиболее полно закономерности случайных ошибок выборки раскрыты в теоремах П.Л. Чебышева и А.М. Ляпунова.
Теорему Чебышева применительно к определению среднего значения можно сформулировать следующим образом: при достаточно большом числе независимых наблюдений можно с вероятностью, близкой к единице, утверждать, что отклонение выборочной средней от генеральной будет сколь угодно малым. В теореме доказано, что величина ошибки не должна превышать tμ.
где , (3.1)
μ также зависит от способа отбора из генеральной совокупности.
Величину называют средней ошибкой выборки и обозначают μ, σ² - генеральная дисперсия, n – объём выборочной совокупности.
Из формулы (3.1) видно, что существует обратная связь между средней ошибкой выборки и числом отобранных единиц. Причем это не только просто обратная математическая зависимость, а такая зависимость, которая показывает. Что квадрат расхождения между средними обратно пропорционален числу отобранных единиц.
Далее посмотрим, как влияет колеблемость признака в генеральной совокупности на величину ошибки. Увеличение колеблемости признака повлечет за собой увеличение среднего квадратического отклонения, а значит и ошибки. Но чаще всего величина колеблемости признака в генеральной совокупности бывает неизвестна, поскольку неизвестны размеры единиц совокупности. то есть можно рассчитать лишь величину колеблемости признака в выборочной совокупности. соотношение между дисперсиями генеральной и выборочной совокупности выражается формулой
Так как величина при достаточно больших n близка к 1, то можно приближенно считать, что .
Следовательно, средняя ошибка выборки показывает, какие возможны отклонения характеристик выборочной совокупности от соответствующих характеристик генеральной совокупности. Но о величине этой ошибки можно судить с определенной вероятностью. На величину вероятности указывает множитель t.
А.М. Ляпунов доказал, что распределение выборочных средних (а значит, и их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально при условии, что генеральная совокупность обладает конечной средней и ограниченной дисперсией.
Математически теорему Ляпунова можно записать так:
где - предельная ошибка выборки, которая дает возможность судить, в каких пределах находится величина генеральной средней.
Значения этого интеграла для различных значений коэффициента доверия t вычислены и приводятся в специальных математических таблицах. Например, при t=1, F(t)=0.6827, т.е. с вероятностью 0,6827 можно утверждать, что разность между генеральной и выборочной средними не превышает одной величины средней ошибки. Логически связь здесь выглядит довольно ясно: чем больше пределы, в которых допускается возможная ошибка, тем с большей вероятностью судят о ее величине.
Зная выборочную среднюю величину признака ( ) и предельную ошибку выборки ( ), можно определить пределы, в которых заключена генеральная средняя:
Теорема Бернулли была доказана раньше теоремы Чебышева – Ляпунова, но является лишь её частным случаем, рассматривая ошибку выборки для альтернативного признака.
В ней утверждается, что при достаточно большом объёме выборки вероятность расхождения между долей признака в выборочной совокупности (w) и долей признака в генеральной совокупности (p) будет стремиться к единице.
Математически это выглядит так
Ввиду того, что вероятность расхождения между частостью и долей следует закону нормального распределения, эту вероятность можно найти по функции F(t) в зависимости от задаваемой величины t.
Следовательно, также как и в расхождениях средних, величина расхождения между долей признака в выборочной совокупности и долей признака в генеральной совокупности зависит от средней ошибки выборки. Эта зависимость выражается следующей формулой:
где (q = 1-p) - среднее квадратическое отклонение в генеральной совокупности для альтернативного признака. Но, так как доля признака в выборочной совокупности неизвестна, приходиться выразить её через долю того же признака в генеральной совокупности, т.е. принять , а дисперсию альтернативного признака принять за w(1 – w), тогда средняя ошибка выборки выразится формулой
Предельная величина разности между частостью и долей называется предельной ошибкой выборки. О величине предельной ошибки можно судить с некоторой вероятностью, зависящей от множителя t, так как .
Если известна доля признака (w) и предельная ошибка выборки ( ), то можно определить границы, в которых заключена генеральная доля (р):
Если отбор единиц из генеральной совокупности производился бесповторным способом, то речь уже идет о зависимых событиях, осуществляющихся с условными вероятностями, т.е. здесь уже нельзя использовать формулу средней ошибки при случайной повторной выборки. Существует более общая формула средней ошибки выборки, которая имеет следующий вид:
где - средний коэффициент корреляции, выражающий взаимосвязь между единицами возможных при данных условиях отбора выборочных совокупностей. Его называют внутригрупповым (или внутриклассовым) коэффициентом корреляции. При повторном случайном отборе он равен 0, так как связь между единицами совокупности отсутствует. При бесповторном отборе предполагается наличие взаимосвязи между единицами выборочной совокупности, и коэффициент корреляции нужно учитывать. Этот коэффициент в случайном бесповторном отборе имеет вид: . Подстановка в общую формулу средней ошибки коэффициента внутригрупповой корреляции даёт следующий результат:
Информация о работе Выборочный метод и его применение в социально-экономической статистике