Статистика, основные положения

Автор работы: Пользователь скрыл имя, 05 Декабря 2011 в 21:22, реферат

Описание

Статистика как наука представляет собой целостную систему научных дисциплин: теория статистики, экономическая статистика и ее отрасли, социальная статистика, отраслевые и специальные статистики.
Общая теория статистики является наукой о наиболее общих принципах и методах статистического исследования социально-экономических явлений и решает другие общественные вопросы.
Она разрабатывает понятийный аппарат и систему категорий статистической науки, ра

Работа состоит из  1 файл

СТАТИСТИКА.docx

— 195.80 Кб (Скачать документ)

     Свойства  совокупности, исследуемые В. м., могут быть качественными и  количественными. В первом случае  задача выборочного обследования  заключается в определении количества  М объектов совокупности, обладающих каким-либо признаком (например, при статистическом контроле часто интересуются количеством М дефектных изделий в партии объёма N). Оценкой для М служит отношение μN/n, где μ — число объектов с данным признаком в выборке объёма n. В случае количественного признака имеют дело с определением среднего значения совокупности является выборочное среднее 1,..., ξn — те значения из исследуемой совокупности x1, x2,..., xN, которые принадлежат выборке. С математической точки зрения 1-й случай — частная разновидность 2-го, которая имеет место, когда М величин xi равны 1, а остальные (N М) равны 0; в этой ситуации         

     В математической  теории В. м. оценка средних  значений занимает центральное  место потому, что к ней в  известной степени сводится изучение  изменчивости признака внутри  совокупности, так как за характеристику  изменчивости обычно принимают  дисперсию (См. Дисперсия)        

              

    представляющую  собой среднее значение квадратов  отклонений xi от их среднего значения 2 = М (NM)/N2.         

     О точности  оценок μ/n и ξ̅ судят по их дисперсиям         

              

    которые в  терминах дисперсии конечной совокупности σ2 выражаются в виде отношений σ2/n (в случае выборок с повторением) и σ2(Nn)/n (N — 1) (в случае бесповторных выборок). Так как во многих практически интересных задачах случайные величины μ/n и ξ̅ при n ≥ 30 приближённо подчиняются нормальному распределению (См. Нормальное распределение), то отклонения μ/n от M/N и ξ̅ от , превышающие по абсолютной величине 2σμ/n и n ≥ 30 осуществиться в среднем приблизительно в одном случае из двадцати. Более полную информацию о распределении количественного признака в данной совокупности можно получить с помощью эмпирического Распределения этого признака в выборке.         

     Выбор из  бесконечной совокупности. В математической  статистике результаты каких-либо  однородных наблюдений (чаще всего  независимых) принято называть  выборкой даже в том случае, когда эти результаты не соответствуют  понятию выборки с повторениями  или без повторений из конечной  совокупности. Например, результаты  измерений углов на местности,  подверженные независимым непрерывно  распределённым случайным ошибкам,  часто называют выборкой из  бесконечной совокупности. Предполагается, что принципиально можно осуществить  любое число таких наблюдений. Полученные фактически результаты  считают выборкой из бесконечного  множества возможных результатов,  называемых генеральной совокупностью.         

     Понятие  генеральной совокупности не  является логически безупречным  и необходимым. Для решения  практических задач нужна не  сама бесконечная генеральная  совокупность, а лишь те или  иные характеристики, которые ей  ставятся в соответствие. Эти  характеристики с точки зрения  теории вероятностей являются  числовыми или функциональными  характеристиками некоторого распределения  вероятностей, а элементы выборки  —случайными величинами, подчиняющимися  этому распределению. Такое истолкование  позволяет распространить на  выборочные оценки общую теорию  статистических оценок (См. Статистические оценки).        

     По этой  причине, например, в вероятностной  теории обработки наблюдений  понятие бесконечной генеральной  совокупности заменяется понятием  распределения вероятностей, содержащего  неизвестные параметры. Результаты  наблюдений истолковываются как  экспериментально наблюдаемые значения  случайных величин, подчиняющихся  этому распределению, Цель обработки  — вычисление по результатам  наблюдений в том или ином  смысле оптимальных статистических  оценок для неизвестных параметров  распределения. 
     

    11. Определение ошибок и объёмов большой выборк

Определение ошибки выборки

При выборочном наблюдении регистрируется только часть  единиц генеральной совокупности. Но эта часть по объему должна быть такова, чтобы получаемые сведения оказались репрезентативными, т. е. достаточно верно отражали содержание и закономерности изучаемого явления в целом. Под репрезентативностью понимается свойство выборочной совокупности воспроизводить характеристики генеральной совокупности.

Разность  между данными генеральной и  выборочной совокупностей называют ошибкой репрезентативности, или ошибкой выборки. Например, генеральная совокупность правонарушителей составляет 500 человек. Удельный вес лиц, воспитанных в неполной семье, среди них равен 30%. При выборочном наблюдении было изучено 50 человек, среди которых удельный вес таких лиц оказался 25%. Ошибка выборки равна: 30% — 25% = 5% (0,5). Аналогичным образом выводится ошибка репрезентативности и для количественного признака. Предположим, что средняя арифметическая величина возраста преступников в генеральной совокупности была равна 28,3 года. В выборочной совокупности она составила 26,5 года. Ошибка равна: 28,3 — 26,5 = 1,8 года.

Ошибки  бывают тенденциозными, или систематическими, и случайными. Первые — результат  неправильного или преднамеренного отбора исследователем тех или иных показателей, вторые — результат случайностей неполного отбора.

Тенденциозные ошибки возникают тогда, когда исследователь  неправильно сформировал выборку, не знал научных правил отбора единиц совокупности, сознательно отобрал  наиболее показательные единицы. Например, исследуя правосознание граждан, анкетер в целях экономии времени воспользовался аудиторией студентов-юристов и опросил их. Полученные данные, естественно, отражали правовые взгляды лишь этих респондентов и не соответствовали взглядам всех граждан. Выводы, сделанные на основе тенденциозных выборок, будут ошибочными. Они могут причинить вред делу.

Истории известны многие курьезы, связанные  с пренебрежением правилами выборочного наблюдения. Один из них произошел в США в 1936 г. при прогнозировании исхода президентских выборов. Журнал «Литерари Дайджест», используя телефонные книги, опросил свыше 2 млн человек. По итогам опроса президентом должен быть избран Ландон. Социологи Геллап и другие опросили только 4 тыс. жителей и пришли к однозначному выводу: победит Рузвельт. Их прогноз оправдался. В чем причина таких расхождений? Первая выборка отражала мнение лишь состоятельных консервативных слоев населения, которые имели телефоны, вторая — всех слоев населения. Она оказалась более представительной, хотя была в 500 раз меньше первой. Роковую роль сыграли тенденциозные ошибки.

Научно-практическая задача выборочного наблюдения сводится не только к тому, чтобы при малых  затратах сил и средств максимально приблизить данные выборки к данным всей генеральной совокупности, но и к тому, чтобы точно измерить, в каких пределах результаты выборки отличаются от данных генеральной совокупности. Здесь и встает вопрос о характере ошибок.

Тенденциозные (систематические) ошибки нельзя измерить. Они могут быть самыми разными  по величине и содержанию. Тенденциозные ошибки тем меньше, чем выше квалификация исследователя, чем лучше он знаком с объектом изучения и возможными источниками систематических ошибок.

Измерить  можно лишь случайные ошибки, т. е. ошибки, обусловленные неполнотой изучения реально существующей совокупности. Случайные ошибки — непреднамеренные неточности статистического наблюдения, которые могут быть направлены как в сторону преувеличения показателей признака, так и в сторону их преуменьшения. При относительно большом изучении случайные ошибки взаимопогашаются (вспомним третий этап эксперимента по извлечению пронумерованных карточек, когда было сделано 30 выборок по 40 извлечений каждая), в результате чего данные выборочной совокупности становятся близкими к данным генеральной. Оставшиеся различия можно относительно точно измерить на основе теории вероятностей, закона больших чисел и закономерностей распределения случайных величин.

Для того чтобы избежать тенденциозных ошибок, необходимо строго соблюдать правила случайного отбора единиц выборочной совокупности. Случайные ошибки в выборочном наблюдении объективны. Их нельзя избежать, но можно уменьшить путем увеличения объема выборки и точно вычислить.

 
 
пределение  объема выборки: доля

Если изучаемая  статистика является не средним, а долей, то маркетолог определяет объем выборки  аналогичным образом. Предположим, что исследователя интересует установление доли семей, владеющих кредитной  карточкой универмага. Порядок действий будет следующим.

Укажите уровень  достоверности. Предположим, по желателен 95%-ный уровень достоверности.

Определите значение z, связанное с данным уровнем  достоверности. Как объяснялось  при расчете среднего, оно составит г = 1,96.

Определите генеральную  долю к, Как мы указывали раньше, ее можно получить из вторичных источников, в ходе экспериментального исследования или на основе мнения исследователя. Предположим, что на основе вторичных  данных исследователь делает предположение, что 64% семей из изучаемой генеральной  совокупности обладают кредитной карточкой  универмага. Следовательно, л = 0,64.

Определите объем  выборки с помощью формулы  стандартной ошибки доли:

354,04 = 355 (округленное  в большую сторону до целого  числа).

Если конечный объем выборки составляет 10% и  больше от объема совокупности, приме  няется окончательная коррекция  совокупности (fpc). Затем необходимый  объем выборки рассчитывается по формуле

где

п — объем  выборки до применения окончательной  коррекции;

пг — объем  выборки после применения окончательной  коррекции.

7.             Если расчет л был неверным, то доверительный интервал будет более или менее точным, чем необходимо. Предположим, что по окончании выборки рассчитывается значение доли р, равное 0,55. Затем повторно вычисляется доверительный интервал, при этом л, использу ется для расчета неизвестного (Т., а именно

Доверительный интервал тогда равен 0,55 ± 1,96 (0,0264) = 0,55 ± 0,052, что означает, что он шире, чем было задано. Это объясняется  тем, что среднеквадратичное отклонение выборки при/) = 0,55 оказалось большим, чем предположительное значение среднеквадратичного отклонения совокупности, при л = 0,64.

Если  интервал, превышающий  указанный, недопустим, объем выборки  можно скорректировать  так, чтобы отразить максимально возможное  отклонение в совокупности. Такое отклонение происходит, когда  произведение ;;(I —  я) достигает максимального  значения, для чего л должно равняться 0,5. К этому выводу можно прийти и  без расчетов. Поскольку  у одной половины совокупности одно значение характеристики, а  у другой — другое, потребуется больше данных, чтобы сделать  правильный вывод, нежели когда ситуация более  четко определена, и у большинства  элементов одно значение характеристики. В  нашем примере  это приведет к  получению объема выборки, равного

  (округлено в большую  сторону до целого  числа).

В этом случае объем  выборки можно  определить как

    12. кривая концентрации  и кривая лоренца

Кривая  Лоренца — это графическое изображение функции кумулятивного распределения. Она была предложена американским экономистом Максом Отто Лоренцом в 1905 году как показатель неравенства в доходах населения. В таком представлении она есть изображение функции кумулятивного распределения, в котором кумулируются доли численности и доходов населения. В прямоугольной системе координат кривая Лоренца является выпуклой вниз и проходит под диагональю единичного квадрата, расположенного в I координатной четверти.

Каждая точка  на кривой Лоренца соответствует  утверждению вроде «20 самых бедных процентов населения получают всего 7 % дохода». В случае равного распределения каждая группа населения имеет доход, пропорциональный своей численности. Такой случай описывается кривой равенства (line of perfect equality), являющейся прямой, соединяющей начало координат и точку (1;1). В случае полного неравенства (когда лишь один член общества имеет доход) кривая (line of perfect inequality) сначала «прилипает» к оси абсцисс, а потом из точки (1;0) «взмывает» к точке (1;1). Кривая Лоренца заключена между кривыми равенства и неравенства.

Кривые Лоренца  применяют для распределений  не только доходов, но и имущества  домохозяйств, долей рынка для  фирм в отрасли, природных ресурсов по государствам. Встретить кривую Лоренца можно и за пределами  экономической науки.

    13. темп прироста

Информация о работе Статистика, основные положения