Шпаргалка по "Социологии"

Автор работы: Пользователь скрыл имя, 02 Марта 2013 в 16:54, шпаргалка

Описание

Количественные методы в социологическом исследовании ответы на экзамен (КУрганский гос.Университет)
Социальная реальность — пространственно-временная структура, представляющая собой связи между социальными позициями в определённый момент времени. Социальное пространство — самое широкое понятие, использующееся для описания социальной реальности. Большинство социологов определяют его как результирующую социальных связей.

Работа состоит из  1 файл

Вопросы-ответы по КМС к экзамену 10 января (Автосохраненный).doc

— 621.50 Кб (Скачать документ)

ется  вариацией.  Ряд  распределения  характеризуется  некоторыми  показате-

лями.

Частоты – указывают,  сколько раз  значение признака  встречается  в 

совокупности, их  сумма  равна  количеству исследуемых  единиц. В  случае,

когда  группировка  осуществляется  по  альтернативной  переменной,  иссле-

дуемая совокупность делится на непересекающиеся классы, то есть каждый

объект может входить  только в одну группу. Сумма частот в таком случае

равна количеству единиц в совокупности. Если группировка  осуществляет-

ся  по  поливариантной  переменной,  каждый  объект  может  входить  в  не-

сколько групп. Тогда  сумма частот представляет собой  количество данных

ответов и отличается от количества единиц совокупности. 

Помимо частот определяют следующие абсолютные величины:

Число ответивших – сколько  человек ответило на данный вопрос.

Число не ответивших –  сколько человек не ответило на данный вопрос.

Число  опрошенных –  сколько  всего  человек  приняло  участие  в  опросе =

число ответивших + число  не ответивших.

Число ответов – сколько  ответов было дано на данный вопрос. Кроме того,  используется  такой относительный показатель  как про-

центы, который показывает соотношения пропорций. Используют следую-

щие виды процентов:

% от числа ответивших: единицей анализа в данном  случае является чело-

век, ответивший на данный вопрос, то есть не ответившие будут игнориро-

ваться. За 100 % берется  число ответивших.

% от числа опрошенных: рассчитывается для того, чтобы  определить долю 

ответивших  и  не  ответивших  на  данный  вопрос.  За 100%  берется  число

опрошенных.

% от числа данных  ответов: единицей анализа   в данном случае выступа-

ет не человек, а его  ответ. Здесь за 100 % выступает общее  число данных

ответов.

Поскольку  в  социологии  мы  обычно  имеем  дело  с  выборочными 

данными,  то  перед  использованием  процентов необходимо  учесть  стати-

стическую погрешность, то есть ошибку репрезентативности. Таким  обра-

зом,  мы  можем  говорить  о  различии  между  двумя  вариантами  ответа

только  в  том  случае,  если  разница  между  ними  превышает  суммарную

ошибку репрезентативности.

Как для абсолютных, так  и для относительных частот можно  опреде-

лить  кумулятивные  показатели:  накопленная  частота (процент)  рассчиты-

вается путем суммирования всех частот (процентов), до выбранной  катего-

рии включительно.

Совокупность  в целом  характеризуют  такие  группы показателей  как 

показатели  центра  распределения  и  показатели  вариации.  Рассмотрим

первую из них.

Мода – это  наиболее  часто  встречающееся  значение  признака. В  ин-

тервальном ряду по определению можно установить только модальный ин-

тервал. Значение же моды определяется по формуле:

либо равным медиане, а вторая половина – меньшим либо равным. Лежит  в

середине ранжированного ряда.

Для  определения  медианы  нужно  сначала  рассчитать  накопленные

частоты по восходящей. Затем  – определить порядковый номер медианы  по

следующей формуле: 

После этого находим  накопленную частоту, равную номеру медианы,

или первую накопленную  частоту, начиная от минимальных  значений при-

знака, которая была бы больше номера медианы. Соответствующее ей зна-

чение  признака  и  есть медиана. Если  номер  дробный,  то  он  лежит между 

двумя единицами совокупности. Тогда медиана равна средней  арифметиче-

ской соседних значений признака.

Для интервального ряда так можно определить только медианный ин-

тервал. Медиану рассчитываем по формуле:

Средняя  арифметическая – это  такое  значение  признака,  которое 

имела бы каждая единица  совокупности, если бы общий итог значений был 

распределен равномерно между всеми единицами совокупности. Эта вели-

чина получается от деления  суммы всех значений признака на число  единиц

совокупности. Для сгруппированных  данных используется средняя арифме-

тическая взвешенная: 

Показатели вариации

 

Размах  вариации – разность  между  максимальным  и  минимальным

значениями признака в изучаемой совокупности

 

Этот показатель прост  в расчете, но зависит только от крайних  значе-

ний признака, поэтому  применяется только для однородных совокупностей.

Точнее вариацию признака характеризует показатель, основанный на учете

колеблемости всех значений признака. Т.к. обобщающей величиной  являет-

ся  средняя  арифметическая,  большинство  показателей  основано  на  рас-

смотрении  отклонений  от  нее  индивидуальных  значений  признака.  Таким

показателем  является  среднее  квадратическое (стандартное)  отклонение

(т.к. сумма всех  отклонений от средней равна  нулю, то возводим их в квад-

рат). Стандартное отклонение показывает, на сколько в среднем  индивиду-

альные значения признака отличаются от среднего. Помимо дисперсии  средней рассчитывается дисперсия доли. При на-

личии  двух  взаимоисключающих  вариантов  значений  признака  говорят  о 

наличии  альтернативной  изменчивости  качественного  признака.  Эквива-

лентом  такого признака будет переменная,  которая принимает  значение 1,

если обследуемая единица  обладает данным признаком, и значение 0, если

обследуемая  единица  не обладает им. К  такому  виду можно  привести лю-

бую переменную, выделив  группу единиц, обладающих данным значением

признака,  и  группу  единиц,  обладающих  всеми  остальными  значениями

признака. Тогда дисперсия  доли будет рассчитана по формуле:

Дисперсия применяется  как для оценки рассеяния признака, так и для 

определения ошибки репрезентативности.

Выбор показателей  зависит  от исследовательских  задач и  от уровня,

на  котором  замерен  группировочный  признак.  Для  шкал  более  высокого

уровня  можно  использовать  все  показатели,  которые  используются  для 

шкал более низкого  уровня, но не все показатели, используемые для шкал

более высокого уровня можно  использовать для шкал более низкого  уровня:

 

МНОГОМЕРНЫЙ АНАЛИЗ СОЦИОЛОГИЧЕСКИХ ДАННЫХ

Детерминационный анализ (ДА)

Основная идея ДА –  это идея правила, которое можно  найти по часто-

там совпадений или несовпадений событий. Такое правило называется "де-

терминацией", а математическая теория таких правил – носит название «де-

терминационный анализ»  или ДА. 

Люди  находят  правила (детерминации),  наблюдая  совпадения  либо

несовпадения  событий. Например,  если  замечено,  что  появление A  всегда

сопровождается  появлением B,  значит,  есть  правило "Если A,  то B",  или,

короче, A → B. Если A изобразить в виде одного кружка, а B – в виде дру-

гого, то кружок A полностью  входит в кружок B, как показано на рисунке 1.

Это и означает, что  имеет место точное правило A → B.

Рис. 6.1. Случай, когда  имеется точное правило A → B. Кружок A (крас-

ный) полностью входит в кружок B. Обрамляющий прямоугольник  симво-

лизирует весь массив наблюдений.

Идея правила как  детерминации тесно связана с  идеей предсказания,

объяснения.  Знание  правил  позволяет  успешно  действовать,  предвидя  ре-

зультат.  В  этом  причина  интереса  к  правилам.  Пример  правила,  которое 

может  заинтересовать  специалиста  по  предвыборным  технологиям: "Если

кандидат сделает в  таких-то условиях такое-то заявление, его рейтинг в та-

ких-то группах повысится, а в таких-то – станет ниже". Правила – это самая 

естественная форма  знаний, поэтому они нужны всем. Любое  правило  имеет  две  фундаментальные  характеристики –

 точность и полноту.  Точность правила A → B это,  по определению, доля 

случаев B среди случаев A. На рисунке 1 эта доля равна 1 (100%), что  и оз-

начает, что правило A → B предельно  точное. Помимо  точности  есть  еще

одна фундаментальная  характеристика – полнота. Из рисунка 1 видно, что с 

помощью правила A → B можно  предсказать лишь примерно одну четверть

всех случаев появления B. Чтобы применить правило A → B, нужно  снача-

ла  обнаружить A,  и только  после этого можно предсказать наличие B. А

площадь кружка A составляет примерно одну четверть от площади  кружка

B. Правило A → B точное, но не полное, его полнота равна  примерно одной 

четверти (25%).

В общем случае полнота  правила A → B есть, по определению, доля

случаев A среди случаев B. Полнота правила A → B равна точности обрат-

ного правила B → A, а  точность правила A → B равна полноте  обратного 

правила. При  перемене  направления  стрелки  в  любом  правиле  точность  и 

полнота меняются местами.

Неточное правило можно  сделать точным. Точных правил не так  мно-

го. Большинство правил – неточные. Если правило A → B неточное, кружок

A не полностью входит  в кружок B, как показано на  рисунке 2.

Если в неточное правило A → B добавить некоторый фактор C, может

случиться,  что  правило AC → B,  которое  получится  в  результате,  будет 

точным. Пример такой  ситуации показан на рисунке 3.

  73

Конечно, может случиться, что точность правила AC → B будет  еще 

менее точным, чем первоначальное правило A → B. На рисунке 4 правило

AC → B имеет точность, равную нулю.

Рис. 6.4. В неточное правило A → B добавлен фактор C. В результате полу-

чилось правило AC → B, которое имеет точность, равную нулю. Все случаи,

когда имеется сочетание A и C (окрашены серым) оказались вне кружка B.

Чесноков для обозначения  того объекта, который является носителем 

локальной  связи,  вводится понятие детерминации, обозначаемой  а→b. Де-

терминация определяется как носитель локальной связи  или как нечто, за-

даваемое двумя величинами: 

точностью I (а→b) = Р(b/а) и 

полнотой С (а→b) = Р (а /b) (справа стоят относительные частоты).

Факторный анализ

1

 

Одна из важных задач  статистики – сделать эмпирическую информа-

цию компактной, удобной  для анализа. Одним из направлений конденсации

информации является факторный анализ признаков. 

Основная  идея. Индивиды  обладают  самыми  разнообразными  при-

знаками, которые не являются независимыми. Связи между ними изучаются 

с  помощью методов  корреляционного  анализа. Можно  предположить,  что

некоторые  признаки  образуют  группы,  каждая  из  которых  отражает  опре-

деленный  аспект  сложного  явления.  При  анализе  системы  признаков  мы

сталкиваемся  с  классификацией  признаков,  т.  е.  с  выявлением  групп  при-

знаков, имеющих сходный  характер изменения при переходе от одного объ-

екта к другому. В  частности, ставится задача найти максимально  взаимосвя-

занные  группы  признаков. Выделяемые  группы – это  новые,  комплексные 

переменные, называемые факторами.

Обоснованная замена большого числа признаков, описывающих  объ-

екты наблюдения, меньшим  числом комплексных характеристик (факторов)

составляет сущность факторного анализа.

Подчеркнем,  что факторы  не  сводятся  к  некоторым,  пусть  главным,

основным признакам  исходного набора. Каждый фактор –  это группа взаи-мосвязанных признаков  из упомянутого набора, и вся совокупность входя-щих  в  него  признаков  определяет  содержательную  интерпретацию  этого 

фактора.

Факторный  анализ  позволяет  не  только  выделить  группы  наиболее

взаимосвязанных  признаков,  но  и  отделить  несущественные  признаки  от

существенных, оценить  их информативность.

В ходе факторного анализа  выделяется латентная переменная-фактор,

с которой коррелируют  первичные переменные. Эти корреляции называют-

ся факторными  нагрузками. Кроме  того,  рассматривают  корреляцию фак-

торов между собой.

Кластерный анализ

1

 

Еще одним направлением конденсации информации является класси-

фикация объектов. В качестве синонимов для обозначения этой группы ме-

тодов используют такие  термины как  «кластерный анализ», «таксономия»,

«автоклассификация» или (более широко)  говорят об использовании  мето-

дов «распознавания образов». Пусть, матрица данных включает характери-

стики N объектов по двум количественным признакам (например, стаж ра-

боты и зарплата). Откладывая признаки по осям координат, мы можем  изо-

бразить все объекты  на плоскости в виде N точек: абсцисса – значение ста-

жа, ордината – значение зарплаты данного объекта. В этом случае говорят,

что N объектов расположены  в двухмерном признаковом пространстве; (по

сути,  это  один  из  способов  изображения  двухмерного  распределения  при-

знаков). Как видно  из рисунка, все объекты можно  разбить на  три  группы

таким образом, что объекты внутри групп близки между собой (это означа-

ет, что они имеют  близкие характеристики и по X и  по Y), а объекты из раз-

ных групп – далеки.

Множество близких между  собой точек называется кластером  и при 

интерпретации  результатов  рассматривается  как  некоторый  социальный

тип. Если имеется k признаков, то говорят, что объекты расположены  в k-

мерном признаковом  пространстве. Если признаков более  чем два, то точки 

уже невозможно изобразить на плоскости. В этом случае группировку  мож-

но осуществить с помощью формальных методов.

Информация о работе Шпаргалка по "Социологии"