Автор работы: Пользователь скрыл имя, 21 Февраля 2012 в 21:24, лекция
Статистические совокупности – это не только реально существующие множества, но и очень большие множества (примеры: 47 млн. жителей Украины).
Из этого следует, что если при изучении статистических совокупностей пользоваться сплошным наблюдением, то нужны огромные затраты времени.
Статистические совокупности – это не только реально существующие множества, но и очень большие множества (примеры: 47 млн. жителей Украины).
Из этого следует, что если при изучении статистических совокупностей пользоваться сплошным наблюдением, то нужны огромные затраты времени.
Затраты большие, материальные. Поэтому прибегают к не сплошному наблюдению или выборке.
Часть при обследовании (наблюдении) в единице совокупности приходится уничтожать единицы. Нужно прибегать к выборке.
Очень часто единицы недоступны по каким-то причинам для не постоянной регистрации, поэтому прибегают к выборочному анкетированию (выборка). В свете всего вышеизложенного практически любое наблюдение – выборочное.
Таким образом выборочное наблюдение (выборка) имеет массу преимуществ:
- экономит время, материальные расходы;
- сохраняет продукцию, позволяет изучать слишком большие и удаленные совокупности.
- Однако, там, где есть хорошо, там всегда присутствует плохо! Так и в выборке есть недостатки – ошибка – самый главный недостаток (она определяется законом соотношения части целого).
Эту ошибку очень сложно (невозможно) рассчитать.
Существует большое разнообразие выборочного наблюдения (выборки). Любое наблюдение, при котором из всей совокупности случайно отбирается какая-то часть единиц, обследуется, и полученный результат распространяется на всю совокупность.
Все показатели, рассчитанные для отобранной части называются выборочными, а для всей совокупности генеральными. Расхождение между ними ошибка.
Существует большое разнообразие выборки. При чем как по способу отбора, так и по другим показателям:
- по способу отбора единиц для обследования:
1) собственно случайная выборка (см. выше);
2) если перед отбором единиц для наблюдения совокупность механически разбивается на части, а затем производится отбор. Она называется механической;
3) когда перед отбором единиц совокупность разбивается на типы, а затем производится случайный отбор (типическая выборка).
Иногда единицы совокупности уже сами разбиты на серии - серийная выборка.
Очень важно различать выборку по объему отобранных единиц, ибо от того сколько единиц взято для обследования зависит предельная ошибка выборки () – чем больше, тем меньше ошибка.
В связи с этим выделяют малую выборку (до 1%).
Предел в выборке определяет экономию. Большая выборка: 1,5, 2,3,5%. Пределом является до 10%.
n бывает: 0,5; 1,5% - пишут однопроцентная выборка.
Если после обследования (наблюдения) единица возвращается в совокупность генеральную, а затем снова производится отбор, то выборка называется повторной, а если нет, то бесповторной.
Преимуществ у выборки очень много, но недостатков еще больше. Всегда есть ошибка и ее практически нельзя рассчитать. Правда в безвыходной ситуации этот метод незаменим.
Ошибка выборки рассчитывается как вероятностная на основе теории вероятности с использованием определенного задаваемого изначально исследователем доверительного интервала (t). Причем предельная ошибка выборки (t) в абсолютном значении неисчислима, ее рассчитывают через среднюю ошибку (). В этой ситуации математики доказали, что предельная ошибка выборки будет равна: .
Наступление той или иной ошибки выборки (р) при этом или ином доверительном интервале рассчитана по интегралу Лапласа на основе теоремы Чебышева и Лапунова. Эта теорема гласит, что при максимально взятом количестве наблюдений рассчитываемая средняя (выборочная средняя) будет сколь угодно мало отличаться от генеральной средней и не превзойдет заданного предела более чем на 1, 2 и т.д. Пределом ошибки выборки является 1 (больше 1 никогда не будет).
Соотношения между t и р (вероятностью той или иной ошибки выборки) рассчитаны и табулированы (занесены в таблицы).
t | p |
1,0 | 0,683 |
1,5 | 0,867 |
2 | 0,954 |
2,5 | 0,987 |
3 | 0,997 |
3,5 | 0,999 |
4 | 99999,6 |
Читается это так: 1) (по теореме Чебышева): если взято не 1 наблюдение, а тысяча, то в 683 случаях расхождение между выборочной и генеральной средней будет не больше, чем 1 и т.д.
2) вероятность (0,867) – это гарантия расхождения между той величиной, которую мы знаем и которую не знаем.
Из этих рассуждений средняя ошибка выборки является:
Средняя ошибка выборки прямопропорциональна на корню показателей вариации и обратнопропорциональна на объему выборки.
Исходя из этих формул: предельная ошибка выборки будет равна:
.
Эта формула справедлива, а для совокупностей с альтернативным признаком она не работает, потому что дисперсия такой совокупности рассчитывается с учетом соотношения показателя.
В таких совокупностях альтернативный признак обозначается , 1- - нет признака.
Тогда дисперсия альтернативного признака будет равна: .
Формула определения альтернативной ошибки:
.
Обозначенные формулы применимы для случаев повторной выборки. Для бесповторной выборки под знаком радикала появляется дополнительный множитель:
N –объем всей генеральной совокупности;
n – объем выборочной совокупности.
В выборочном наблюдении встает вопрос: а сколько нужно взять единиц для обследования, чтобы получить ту или иную ошибку выборки.
Из формулы следует:
.
Корреляция – это взаимозависимость, взаимосвязь, взаимодействие между признаками совокупности между различными структурными элементами туризма.
Чем больше доходы, тем выше спрос! Между качеством услуг и спросом, между имиджем курорта и спроса.
Все в мире взаимосвязано и взаимозависимо. Именно это обстоятельство порождает еще одну единственную категорию, которая называется процессы.
Не изучать процессы – корреляцию, значит, ничего не изучать!
Все зависимости можно условно разделить на 2 категории:
1) функциональные зависимости:
- эти зависимости постоянны;
- проявляются предсказуемо с одинаковым результатом.
2) корреляционные зависимости (статистические, географические)
взаимосвязи, проявляющиеся спонтанно (непредсказуемо).
Таким образом, взаимосвязи которых присутствуют факторный признак (х) и результативные признаки, являющиеся воздействием х (или фактора), проявляющиеся спонтанно называются корреляционными зависимостями. Любой у является функцией х y=fx,z.
Корреляция – причинно-следственные отношения (у) – результатный признак.
результат y=f(x) фактор (причина)
Изучение корреляционных зависимостей осуществляется в 3 этапа:
1. Посвящается обнаружению присутствия корреляции. Если есть, то какая? – тесная или не очень.
2. Обнаружить наличие корреляцией связи между изучаемыми совокупностями признаков можно:
а) построить корреляционную таблицу или график, или кривую. Для этого в таблице в строке пишется факторный признак, а в графах – результативный признак.
Выпуск продукции Произв-сть труда | 107 | 109 | 115 | 121 | 123 | 138 |
103 | 2 | 1 |
|
|
|
|
106 | 1 | 4 |
| 1 |
|
|
109 |
| 2 | 9 | 1 |
|
|
112 |
| 2 |
| 15 |
| 1 |
118 | 1 |
| 1 |
| 17 | 1 |
120 |
| 3 | 2 | 1 |
| 22 |
87 предприятий
69 предприятий – в центре
2.
б) структуризация или группировка текста. Корреляция устанавливается на основе коэффициентов корреляции.
Фехнер предложил очень простой, но довольно надежный коэффициент.
х | у | ||
- | - | ||
- | - | + | + |
+ | - | х | у и т.д. |
+ | + | = | |
+ | + |
| С – совпадения |
+ | + |
| Н – несовпадения |
Информация о работе Понятие о выборке и выборочном «методе в статистике»