Автор работы: Пользователь скрыл имя, 05 Декабря 2011 в 21:22, реферат
Статистика как наука представляет собой целостную систему научных дисциплин: теория статистики, экономическая статистика и ее отрасли, социальная статистика, отраслевые и специальные статистики.
Общая теория статистики является наукой о наиболее общих принципах и методах статистического исследования социально-экономических явлений и решает другие общественные вопросы.
Она разрабатывает понятийный аппарат и систему категорий статистической науки, ра
Свойства
совокупности, исследуемые В. м.,
могут быть качественными и
количественными. В первом
В математической
теории В. м. оценка средних
значений занимает центральное
место потому, что к ней в
известной степени сводится
представляющую собой среднее значение квадратов отклонений xi от их среднего значения 2 = М (N — M)/N2.
О точности оценок μ/n и ξ̅ судят по их дисперсиям
которые в терминах дисперсии конечной совокупности σ2 выражаются в виде отношений σ2/n (в случае выборок с повторением) и σ2(N — n)/n (N — 1) (в случае бесповторных выборок). Так как во многих практически интересных задачах случайные величины μ/n и ξ̅ при n ≥ 30 приближённо подчиняются нормальному распределению (См. Нормальное распределение), то отклонения μ/n от M/N и ξ̅ от x̅, превышающие по абсолютной величине 2σμ/n и n ≥ 30 осуществиться в среднем приблизительно в одном случае из двадцати. Более полную информацию о распределении количественного признака в данной совокупности можно получить с помощью эмпирического Распределения этого признака в выборке.
Выбор из
бесконечной совокупности. В математической
статистике результаты каких-
Понятие
генеральной совокупности не
является логически
По этой
причине, например, в вероятностной
теории обработки наблюдений
понятие бесконечной
11. Определение ошибок и объёмов большой выборк
Определение ошибки выборки
При выборочном наблюдении регистрируется только часть единиц генеральной совокупности. Но эта часть по объему должна быть такова, чтобы получаемые сведения оказались репрезентативными, т. е. достаточно верно отражали содержание и закономерности изучаемого явления в целом. Под репрезентативностью понимается свойство выборочной совокупности воспроизводить характеристики генеральной совокупности.
Разность между данными генеральной и выборочной совокупностей называют ошибкой репрезентативности, или ошибкой выборки. Например, генеральная совокупность правонарушителей составляет 500 человек. Удельный вес лиц, воспитанных в неполной семье, среди них равен 30%. При выборочном наблюдении было изучено 50 человек, среди которых удельный вес таких лиц оказался 25%. Ошибка выборки равна: 30% — 25% = 5% (0,5). Аналогичным образом выводится ошибка репрезентативности и для количественного признака. Предположим, что средняя арифметическая величина возраста преступников в генеральной совокупности была равна 28,3 года. В выборочной совокупности она составила 26,5 года. Ошибка равна: 28,3 — 26,5 = 1,8 года.
Ошибки
бывают тенденциозными, или систематическими,
и случайными. Первые — результат
неправильного или
Тенденциозные
ошибки возникают тогда, когда исследователь
неправильно сформировал
Истории известны многие курьезы, связанные с пренебрежением правилами выборочного наблюдения. Один из них произошел в США в 1936 г. при прогнозировании исхода президентских выборов. Журнал «Литерари Дайджест», используя телефонные книги, опросил свыше 2 млн человек. По итогам опроса президентом должен быть избран Ландон. Социологи Геллап и другие опросили только 4 тыс. жителей и пришли к однозначному выводу: победит Рузвельт. Их прогноз оправдался. В чем причина таких расхождений? Первая выборка отражала мнение лишь состоятельных консервативных слоев населения, которые имели телефоны, вторая — всех слоев населения. Она оказалась более представительной, хотя была в 500 раз меньше первой. Роковую роль сыграли тенденциозные ошибки.
Научно-практическая задача выборочного наблюдения сводится не только к тому, чтобы при малых затратах сил и средств максимально приблизить данные выборки к данным всей генеральной совокупности, но и к тому, чтобы точно измерить, в каких пределах результаты выборки отличаются от данных генеральной совокупности. Здесь и встает вопрос о характере ошибок.
Тенденциозные (систематические) ошибки нельзя измерить. Они могут быть самыми разными по величине и содержанию. Тенденциозные ошибки тем меньше, чем выше квалификация исследователя, чем лучше он знаком с объектом изучения и возможными источниками систематических ошибок.
Измерить можно лишь случайные ошибки, т. е. ошибки, обусловленные неполнотой изучения реально существующей совокупности. Случайные ошибки — непреднамеренные неточности статистического наблюдения, которые могут быть направлены как в сторону преувеличения показателей признака, так и в сторону их преуменьшения. При относительно большом изучении случайные ошибки взаимопогашаются (вспомним третий этап эксперимента по извлечению пронумерованных карточек, когда было сделано 30 выборок по 40 извлечений каждая), в результате чего данные выборочной совокупности становятся близкими к данным генеральной. Оставшиеся различия можно относительно точно измерить на основе теории вероятностей, закона больших чисел и закономерностей распределения случайных величин.
Для того чтобы избежать тенденциозных ошибок, необходимо строго соблюдать правила случайного отбора единиц выборочной совокупности. Случайные ошибки в выборочном наблюдении объективны. Их нельзя избежать, но можно уменьшить путем увеличения объема выборки и точно вычислить.
Если изучаемая статистика является не средним, а долей, то маркетолог определяет объем выборки аналогичным образом. Предположим, что исследователя интересует установление доли семей, владеющих кредитной карточкой универмага. Порядок действий будет следующим.
Укажите уровень достоверности. Предположим, по желателен 95%-ный уровень достоверности.
Определите значение z, связанное с данным уровнем достоверности. Как объяснялось при расчете среднего, оно составит г = 1,96.
Определите генеральную долю к, Как мы указывали раньше, ее можно получить из вторичных источников, в ходе экспериментального исследования или на основе мнения исследователя. Предположим, что на основе вторичных данных исследователь делает предположение, что 64% семей из изучаемой генеральной совокупности обладают кредитной карточкой универмага. Следовательно, л = 0,64.
Определите объем выборки с помощью формулы стандартной ошибки доли:
354,04 = 355 (округленное в большую сторону до целого числа).
Если конечный объем выборки составляет 10% и больше от объема совокупности, приме няется окончательная коррекция совокупности (fpc). Затем необходимый объем выборки рассчитывается по формуле
где
п — объем выборки до применения окончательной коррекции;
пг — объем выборки после применения окончательной коррекции.
7. Если расчет л был неверным, то доверительный интервал будет более или менее точным, чем необходимо. Предположим, что по окончании выборки рассчитывается значение доли р, равное 0,55. Затем повторно вычисляется доверительный интервал, при этом л, использу ется для расчета неизвестного (Т., а именно
Доверительный интервал тогда равен 0,55 ± 1,96 (0,0264) = 0,55 ± 0,052, что означает, что он шире, чем было задано. Это объясняется тем, что среднеквадратичное отклонение выборки при/) = 0,55 оказалось большим, чем предположительное значение среднеквадратичного отклонения совокупности, при л = 0,64.
Если интервал, превышающий указанный, недопустим, объем выборки можно скорректировать так, чтобы отразить максимально возможное отклонение в совокупности. Такое отклонение происходит, когда произведение ;;(I — я) достигает максимального значения, для чего л должно равняться 0,5. К этому выводу можно прийти и без расчетов. Поскольку у одной половины совокупности одно значение характеристики, а у другой — другое, потребуется больше данных, чтобы сделать правильный вывод, нежели когда ситуация более четко определена, и у большинства элементов одно значение характеристики. В нашем примере это приведет к получению объема выборки, равного
(округлено в большую сторону до целого числа).
В этом случае объем выборки можно определить как
12. кривая концентрации и кривая лоренца
Кривая Лоренца — это графическое изображение функции кумулятивного распределения. Она была предложена американским экономистом Максом Отто Лоренцом в 1905 году как показатель неравенства в доходах населения. В таком представлении она есть изображение функции кумулятивного распределения, в котором кумулируются доли численности и доходов населения. В прямоугольной системе координат кривая Лоренца является выпуклой вниз и проходит под диагональю единичного квадрата, расположенного в I координатной четверти.
Каждая точка на кривой Лоренца соответствует утверждению вроде «20 самых бедных процентов населения получают всего 7 % дохода». В случае равного распределения каждая группа населения имеет доход, пропорциональный своей численности. Такой случай описывается кривой равенства (line of perfect equality), являющейся прямой, соединяющей начало координат и точку (1;1). В случае полного неравенства (когда лишь один член общества имеет доход) кривая (line of perfect inequality) сначала «прилипает» к оси абсцисс, а потом из точки (1;0) «взмывает» к точке (1;1). Кривая Лоренца заключена между кривыми равенства и неравенства.
Кривые Лоренца применяют для распределений не только доходов, но и имущества домохозяйств, долей рынка для фирм в отрасли, природных ресурсов по государствам. Встретить кривую Лоренца можно и за пределами экономической науки.
13. темп прироста