Автор работы: Пользователь скрыл имя, 15 Марта 2012 в 20:46, курс лекций
1. Экспериментальная психология. Работы В. Вундта, Ф. Гальтона, Г. Эббингауза, Д. Кеттелла
· 2. Дифференциальная психология. Возникновение тестирования как результат практических запросов медицины, педагогики и индустриализации производства
· 3. Бихевиоризм как теоретическая основа тестирования. Поведение как совокупность реакций организма на стимулы. Работы Дж. М. Кеттела, А. Бине
· 4. Шкала Бине-Симона. Понятие «умственного возраста». Шкала Стэнфорд-Бине. Понятие об «интеллектуальном коэффициенте» (IQ). Работы В. Штерна
· 5. Массовое обследование больших групп испытуемых. Работы А. С. Отиса. Появление армейских тестов «Альфа» и «Бета»
· 6. Факторный анализ. Двухфакторная теория способностей Ч. Спирмена. Многофакторная теория способностей Т. Л. Килли и Л. Терстона
· 7. Тесты достижений. Опросники. Интроспекционизм как теоретическая основа метода. Работы Ф. Гальтона, А. Бине, Р. Вудвортса
· 8. Проективные техники. Ассоцианизм. Метод свободных словесных ассоциаций Ф. Гальтона. Психоанализ как теоретическая основа развития проективных методик
Своеобразным показателем текущей валидности является комплекс сведений о том, насколько удобен, экономичен тест по сравнению с получением информации об исследуемом качестве из других источников (наблюдение, анализ объективных данных, экспертная оценка). Критерий текущей валидности является одним из ведущих при характеристике валидности любой психодиагностической методики. Однако наиболее высоким требованиям текущей валидности должны отвечать клинические тесты, служащие для уточнения дифференциального диагноза, скрининговые методики, тесты достижений, психометрические тесты интеллекта и ряд других.
Валидность эмпирическая – совокупность характеристик валидности теста, полученных сравнительным статистическим способом оценивания. Имеет отношение главным образом к области критериальной валидности и двум ее видам: валидности текущей и валидности прогностической.
Если при определении содержательной валидности оценка теста проводится с помощью различных качественных процедур получения информации описательными методами с использованием экспертных оценок и других источников информации, то эмпирическая валидность измеряется всегда с помощью статистического коррелирования. Проводится корреляционный анализ связи двух рядов значений – оценок теста и показателей по внешнему параметру изучаемого свойства. Конкретные процедуры определения эмпирической валидности связаны с комплексом коэффициентов валидности.
29. Прогностическая валидность
Прогностическая валидность – информация о том, с какой степенью точности и обоснованности методика (тест) позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Прогностическая валидность отражает временной интервал, на который распространяется обоснование такого суждения.
В стандартных требованиях к педагогическим и психологическим тестам различают прогностическую валидность и валидность текущую, в зависимости от временной связи между критерием и тестом. Оба вида относятся к критериальной валидности теста. Иногда говорят о предсказательной валидности. Термин «предсказание», по мнению А. Анастази (1982), может использоваться как в широком смысле, означая прогноз на основе данных тестирования поведения испытуемого в реальной (критериальной) ситуации, так, в более узком смысле, указывая лишь на временной интервал. В последнем смысле он и используется в прогностической валидности. Характеристика прогностической валидности определяет отрезок времени, для которого задается или проверяется связь с критерием исследуемых качеств.
Иногда текущая валидность заменяет прогностическую валидность. Часто невыгодно затягивать валидизацию, изучая отдаленные критериальные меры тестируемого свойства в обследуемой выборке валидизации. В качестве компромиссного решения для ускорения процедуры валидизации тест может быть проведен в группе, для которой уже имеются критериальные данные.
Для быстрого получения
сведений о предсказательных возможностях
можно воспользоваться ретроспе
Одним из наиболее надежных способов получения сведений о прогностических возможностях результата теста является метод «когорт». Следует проверить, насколько результат теста, предназначенного для изучения некоторых аспектов эмоциональных состояний у больных, предсказателен в отношении вероятности возникновения психосоматических заболеваний, позволяет ли определенный результат по этому тесту судить о повышенном риске подвергнуться таким расстройствам. Учитывая вероятный объем экстремальных (контрастных) групп, выборка должна быть достаточно большой.
30. Содержательная валидность. Этапы валидизации
Содержательная валидность – один из основных типов валидности методики, характеризующий степень репрезентативности содержания заданий теста измеряемой области психических свойств.
Комплекс сведений содержательной валидности традиционно имеет наибольшее значение для тестов, исследующих деятельность, близкую или совпадающую с реальной (чаще всего учебной или профессиональной). Валидность по содержанию закладывается в тест уже при подборе заданий будущей методики. Первым этапом валидизации является определение круга исследуемых свойств, видов деятельности, расчленение сложной способности или деятельности на элементы. На втором этапе разрабатывают собственно модель тестовой деятельности на основе наиболее важных элементов реальной деятельности. Наконец, на последнем этапе проводят анализ степени соответствия разработанной модели реальной деятельности, проверку соответствия пропорций представленности элементов в заданиях теста и в реальной деятельности.
Экспертная оценка адекватности содержания заданий теста может быть дополнена при характеристике содержательной валидности рядом эмпирических процедур. Роль этого критерия при оценке содержательной валидности заключается не в верификации конструкта, лежащего в основе теста, а лишь в анализе гипотез, приведших к выбору того или иного материала для теста.
Наряду с тестами достижений содержательная валидность является одной из важнейших форм валидизации критериально-ориентированных тестов, а также методик, предназначенных для профотбора, анализа успешности овладения профессией. Для валидизации личностных опросников и тестов интеллекта критерии содержательной валидности имеют ограниченное применение и используются лишь на начальных стадиях составления теста. Личностные опросники не имеют того сходства с исследуемой областью поведения, как это имеет место в случае тестов достижений. Ответы на вопросы анкеты, опросника, данные проективных исследований позволяют лишь косвенно судить о реальной деятельности испытуемого. Проявление личностных свойств и реализация способностей в деятельности могут носить индивидуальный характер.
При проведении теста интеллекта эффективное решение заданий может достигаться за счет логического мышления, механической памяти, психомоторной подвижности. Опросники личностные и тесты интеллекта прямо не связаны с конкретным курсом обучения или общностью предшествовавшего жизненного опыта, на которых строится содержание тестов достижений.
31. Очевидная, экологическая, иллюзорная (ложная) валидности
Очевидная валидность – представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого или другого лица, не располагающего специальными сведениями о характере использования и целях методики. Высокая очевидная валидность является весьма желательной. Она выступает в качестве фактора, побуждающего испытуемых к обследованию, способствует более серьезному и ответственному отношению к работе по выполнению заданий теста и к заключениям, формулируемым психологом.
Очевидная валидность улучшает применение понятных формулировок и терминов, также заданий, по содержанию являющихся наиболее естественными с учетом возрастной, половой, профессиональной специфики испытуемых. Очевидная валидность иногда носит название внешней (face validity), «доверительной» (faith validity), валидности.
Экологическая валидность – валидность теста по отношению к измеряемому свойству в контексте определенной ситуации. Экологическая валидность является свойством теста, проявляющимся в том, что его применение при решении различных практических задач ведет к качественно различной интерпретации результатов тестирования (Дружинин В. Н., 1990).
Введение понятия экологической валидности связано с проблемой влияния ситуации на результаты тестирования. Споры между «чертистами» (сторонниками теории черт личности, постулирующими устойчивость в разных ситуациях форм поведения, соответствующих определенным психическим свойствам) и «ситуационалистами» (утверждающими полное отсутствие влияния свойств личности на поведение в конкретной ситуации), хотя и продолжаются по сей день, привели к возникновению и развитию теорий личностно-ситуационного взаимодействия.
Иллюзорная (ложная) валидность – иллюзия соответствия заключения по результатам тестирования личностным характеристикам обследуемого. Возникает как следствие использования предельно общих, а поэтому применимых практически ко всем обследуемым формулировок, таких, например, как «разумный в выборе цели», «стремящийся к лучшей жизни» и т. п. Такого рода утверждения принимаются почти всеми людьми в качестве точного описания их личности, что создает почву для деятельности различного рода прорицателей и предсказателей. Иллюзорная валидность названа эффектом Барнума (по имени Финиса Барнума, популярного организатора публичных зрелищ, говорившего, что «глупец рождается ежеминутно»).
32. Критерий валидности. Основное психометрическое неравенство. Типы критериев валидности
Соответствие теста измеряемому психическому свойству называется валидностью теста. На валидность теста негативно влияют случайные факторы, поэтому в психометрике принято следующее основное психометрическое неравенство:
Валидность ≤ Надежность,
что означает, что валидность не может превышать надежность теста.
Помимо случайных факторов, на валидность теста влияют систематические факторы. Они привносят систематические искажения в результаты.
В современной психометрике разработаны десятки разнообразных теоретических и экспериментальных методов проверки валидности тестов. Основным элементом этих методов является так называемый «критерий».
Критерий валидности – это независимый от теста, внешний по отношению к тесту источник информации об измеряемом свойстве. Мы не можем судить о валидности теста до тех пор, пока не сравним его результаты с источником истинной (или заведомо более валидной) информации об измеряемом свойстве – с критерием.
Типы критериев валидности
В научных исследованиях
преобладают специальные
На практике в качестве критерия валидности используются прагматические критерии – показатели эффективности той деятельности, ради прогнозирования которой предпринимается тестирование.
В качестве критерия валидности используется экспертная оценка. Мы хотим убедиться, что короткий тест на измерение уровня дисциплинированности валиден. Для этого проводится опрос учителей об уровне дисциплинированности хорошо известных им учеников. После этого сравниваются результаты теста и экспертный рейтинг учеников по дисциплинированности. Это один из самых простых, популярных методов эмпирического измерения валидности. Это метод «известных групп». В психометрическом эксперименте по проверке валидности теста приглашаются испытуемые, при этом известно, к какой группе по критерию они относятся. В случае с тестом дисциплинированности подбираются ученики, дисциплинированные по данным экспертной оценки учителей («высокая» группа по критерию) и заведомо недисциплинированные («низкая» группа по критерию). Ученики со средними показателями по критерию в тестировании не участвуют.
33. Математическое выражение критерия валидности (коэффициент Гилфорда). Основные схемы валидизации психодиагностических
Меру совпадения (корреляции) между крайними группами по тесту и по критерию оценивают с помощью самого простого Фи-коэффициента Гилфорда:
При численности
протестированной группы в 30 человек (это
минимальная выборка для
Но метод «известных групп» обладает серьезным недостатком. Он не всегда позволяет использовать тест для прогноза. При формировании «известных групп» оценивается поведение, которое происходило в прошлом, а мы хотим сделать тест для прогноза поведения, которое будет происходить в будущем. Многие тесты, используемые в образовательной психодиагностике, обладают указанным недостатком. Они проходят в лучшем случае проверку по методике «известных групп» и не обладают прогностической валидностью (или валидность экспериментально не доказана).
Решение проблемы прогностической валидности под силу крупным научно-методическим центрам. Ведь к психометрическому исследованию по проверке прогностической валидности надо привлекать на порядок больше испытуемых – не 30, минимум – 300, так как не известно, кто из этих 300 попадет в крайние группы.
Мы хотим использовать
тест для прогноза готовности школьников
для обучения в вузе. Это типичная
прогностическая
Различение обычной дешевой схемы валидизации теста (по «известным группам») и дорогой прогностической схемы валидизации теста – важнейший элемент психодиагностической грамотности не только для психологов, но и для педагогов, как, впрочем, и для любых заказчиков психодиагностической информации.