Современные средства оценивания результатов обучения

Автор работы: Пользователь скрыл имя, 20 Апреля 2013 в 18:10, курс лекций

Описание

- соответствие целей и результатов общего образования современным социальным требованиям, связанным с переходом к открытому демократическому обществу с рыночной экономикой, что требует от людей принятия самостоятельных и сознательных решений на основе освоения социального опыта, умения жить в условиях трудовой и социальной мобильности, повышения уровня толерантности;

Работа состоит из  1 файл

Совр ср оцен..docx

— 108.43 Кб (Скачать документ)

 

– осознание необходимости  и важности овладения основами теории и практики компьютерного тестирования;

 

– интерес к компьютерному  тестированию, его освоению.

 

 

 

Когнитивный компонент представляет собой знание:

 

– значений понятий: «компьютерное  тестирование», «педагогический тест», «компьютерный тест», «тестовое  задание»;

 

– возможностей и ограничений  компьютерного тестирования;

 

– форм тестовых заданий;

 

– этапов и форм компьютерного  тестирования.

 

 

 

Процессуальный компонент  включает следующие умения:

 

– адекватно воспринимать интерфейс компьютерного теста;

 

– адекватно относиться к  ситуации компьютерного тестирования;

 

– отвечать на тестовые задания  различных форм [15].

 

 

 

Технология проектирования компьютерных тестов предметной области

 

 

 

Проектирование модульной  модели знаний

 

 

 

Метод нисходящего проектирования модели знаний состоит в следующем:  вначале строится генеральное содержание предметной области с разбивкой  на укрупненные модули (разделы). Затем  проводится детализация модулей  на элементарные подмодули, которые, в  свою очередь, наполняются педагогическим содержанием .

 

Каждый модуль предполагает входящую информацию, состоящую из набора необходимых понятий из других модулей и предметных областей, а  на выходе создает совокупность новых  понятий, знаний, описанных в данном модуле, рис. 1.

 

 

Рисунок 1.

 

 

 

Модуль может содержать  подмодули. Элементарный подмодуль - неделимый  элемент знания - может быть представлен  в виде базы данных, базы знаний, информационной модели. Понятия и отношения между  ними представляют семантический граф (рис. 2).

 

 

 

 

Рисунок 2.

 

 

 

Пример элемента модуля знаний по теме «Исследование графиков функций», рис. 3.

 

 

 

 

Рисунок 3.

 

 

 

Модульное представление  знаний помогает:

 

 

 

• организовывать четкую систему  контроля с помощью компьютерного  тестирования, поскольку допускает  промежуточный контроль (тестирование) каждого модуля, итоговый контроль по всем модулям и их взаимосвязям;

 

• осуществлять наполнение каждого модуля педагогическим содержанием;

 

• выявлять и учитывать  семантические связи модулей  и их отношения с другими предметными  областями [9].

 

 

 

Основные понятия компьютерного  тестирования

 

 

 

Тестирование - процесс оценки соответствия личностной модели знаний ученика экспертной модели знаний. Главная цель тестирования - обнаружение  несоответствия этих моделей (а не измерение  уровня знаний), оценка уровня их несоответствия. Тестирование проводится с помощью  специальных тестов, состоящих из заданного набора тестовых заданий.

 

 

 

Тестовое задание - это  четкое и ясное задание по предметной области, требующее однозначного ответа или выполнения определенного алгоритма  действий.

 

 

 

Тест - набор взаимосвязанных  тестовых заданий, позволяющих оценить  соответствие знаний ученика экспертной модели знаний предметной области.

 

 

 

Тестовое пространство - множество  тестовых заданий по всем модулям  экспертной модели знаний.

 

 

 

Класс эквивалентности - множество  тестовых заданий, таких, что выполнение учеником одного из них гарантирует  выполнение других.

 

 

 

Полный тест - подмножество тестового пространства, обеспечивающее объективную оценку соответствия между  личностной моделью и экспертной моделью знаний.

 

 

 

Эффективный тест - оптимальный  по объему полный тест.

 

Эффективный компьютерный тест оценивает уровень соответствия или несоответствия личностной модели знаний ученика и экспертной модели.

 

 

 

Множество тестовых заданий (тестовое пространство), согласно принципу исчерпывающего тестирования, может  быть бесконечным.  Однако в каждом реальном случае существует конечное подмножество тестовых заданий, использование  которых позволяет с большой  вероятностной точностью оценить  соответствие знаний ученика заданным критериям по экспертной модели знаний (полный тест).

 

Из полного теста можно  выделить эффективный тест (оптимальный  по объему набор тестовых заданий, гарантирующий  оценку личностной модели ученика заданным критериям). Выбор эффективного теста  зависит от удачного разбиения тестового  пространства на классы эквивалентности, пограничные условия, создание тестов на покрытие путей и логических связей между понятиями и модулями.

 

В дальнейшем необходим тестовый эксперимент на группе учащихся, который  позволит провести корректировку и  доводку теста до вида эксплуатации.

 

 

 

 

 

 

 

 

 

Способы составления тестовых заданий

 

(по степени сложности)

 

 

 

1) формирование вопросов  к понятиям, составляющим узлы  семантического графа (рис. 2), разработка  упражнений, требующих для их  выполнения знания свойств выбранного  понятия;

 

2) разработка тестовых  заданий, определяющих отношения  между понятиями; 

 

3) конструирование заданий,  выявляющих связь понятий между  отдельными модулями.

 

 

 

Этапы построения компьютерных тестов:

 

 

 

1) формализация экспертной  целевой модели знаний;

 

2) проектирование тестового  пространства;

 

3) формирование и наполнение  тестовых заданий;

 

4) формирование полного  компьютерного теста;

 

5) тестовый эксперимент;

 

6) выбор эффективного теста;

 

7) анализ, корректировка и  доводка теста до вида эксплуатации [9].

 

 

 

Тема 10

 

Сбор и статистическая обработка

 

результатов тестирования

 

 

 

Статистическая обработка  полученных данных тестирования (результатов  испытуемых) позволяет определить количественные характеристики тестовых заданий и  всего теста, что даёт возможность  использовать тест как научно обоснованный, объективный инструмент педагогических измерений. Статистическая обработка  результатов тестирования проводится с помощью программного обеспечения.

 

 

 

1. Матрица тестовых результатов

 

Для удобства обработки тестовых данных результаты  заносятся в  матрицу тестовых результатов. Ниже приведён пример такой матрицы (один балл за правильный ответ, ноль баллов - за неправильный ответ или пропуск  задания) [5].

 

Таблица 5

 

Матрица тестовых результатов 

№ испытуемого i 

№ задания j 

Индивидуальный балл Xi

 

5

 

0

 

3

 

3

 

2

 

4

 

Число правильных ответов Yj 

12

 

 

Для наглядности и удобства дальнейшего использования необходимо упорядочить матрицу тестовых результатов. Для этого строки таблицы располагают  таким образом, чтобы индивидуальные баллы располагались в порядке  возрастания. Затем столбцы матрицы  располагают в порядке убывания.

 

 

 

Таблица 6

 

Упорядоченная матрица тестовых результатов

№ испытуемого i 

№ задания j 

Индивидуальный балл Xi

 

5

 

0

 

2

 

3

 

3

 

4

 

Число правильных ответов Yj 

12

 

 

 

 

2. Трудность тестовых заданий

 

По результатам апробационного тестирования определяются характеристики тестовых заданий - трудность и дискриминативность.

 

Трудность задания  – соотношение  количества испытуемых, справившихся с данным заданием, и общего количества испытуемых. Трудность задания вычисляется  по формуле:

 

,

 

где pj - доля правильных ответов  на j-ое  задание; Yj - количество испытуемых, выполнивших j - ое задание верно, N  - число испытуемых в группе, j - номер  задания.

 

Чем выше показатель трудности, тем задание легче, чем меньше показатель трудности задания, тем  задание сложнее.

 

Показатель трудности  важен для определения характеристики тестового задания и помогает проранжировать задания, входящие в  тест по степени сложности. Благодаря  этому можно определить место  задания в тесте.

 

 

 

3. Дискриминативность тестового  задания

 

Дискриминативность (дифференцирующая способность, различающая способность) задания - это способность задания  дифференцировать испытуемых по уровню достижений, на сильных и слабых. Задание, которое одинаково выполняется  и слабыми, и сильными, имеет низкую дискриминативность. Задание с высокой  дискриминативностью выполняют  только сильные учащиеся.

 

Индекс дискриминативности определяется как разность долей  правильных ответов сильной и  слабой групп по формуле:

 

      (r дис)j = (p1)j - (p0)j,

 

где  r - индекс дискриминативности, p1 - доля правильных ответов в сильной  подгруппе (27 % от всего количества), p0 - доля правильных ответов в слабой группе (27 %).

 

Значение индекса дискриминативности находится в интервале [- 1; 1]. Если индекс дискриминативности выше 0,3,  это свидетельствует о том, что  задание обладает хорошим дифференцирующим эффектом. Если r = 0,  то это значит, что и слабые, и сильные испытуемые выполняют задание одинаково. Отрицательный  показатель дискриминативности появляется в том случае, когда слабые учащиеся выполняют задание правильно, а  сильные - неправильно, что свидетельствует  о некачественном (невалидном) задании. Тестовые задания с показателями rдис ? 0 и rдис< 0 необходимо удалять.

 

Высокая дискриминативность, которая свидетельствует о сильном  дифференцирующем эффекте тестового  задания, характерна для заданий  со средним показателем трудности (0,5). 

 

 

 

4. Дистракторный анализ

 

Одно из важнейших требований, которое предъявляется к заданиям закрытой формы, - это правдоподобность дистракторов (неправильных ответов). Дистракторный анализ (оценка качества дистрактора) предполагает подсчет  долей испытуемых, выбравших каждый дистрактор. В идеальном варианте каждый дистрактор должен выбираться в равной доле от всех неправильных ответов. Ниже представлены таблица 7, с качественными и таблица 8, с  некачественными дистракторами.

 

 

 

Таблица 7

 

Распределение ответов при  удачных дистракторах

  

Количество учащихся, выбравших  ответ

 

№ задания  

1 ответ 

2 ответ (правильный) 

3 ответ 

4 ответ

 

20% 

40% 

20% 

20%

 

 

 

 

Таблица 8

 

Распределение ответов при  неудачных дистракторах

  

Количество учащихся, выбравших  ответ

 

№ задания  

1 ответ 

2 ответ (правильный) 

3 ответ 

4 ответ

 

45% 

40% 

5% 

10%

 

 

 

 

В результате дистракторного анализа выявляются задания с  неработающими дистракторами (вариантами ответов в закрытом задании, которые  испытуемые выбирают мало или вообще не выбирают). Если в задании есть неработающие дистракторы, то вероятность  угадывания правильного ответа повышается, снижается его трудность.  Такие  задания требуют переработки (замены неработающих дистракторов) или удаления их из теста [3].

 

5. График (кривая частотного  распределения)

 

Для интерпретации распределения  результатов выполнения теста необходимо построить гистограмму или график (кривую частотного распределения), в  котором по оси Х откладывается  количество выполненных заданий, по оси У – количество учащихся, верно выполнивших эти задания (в абсолютном значении или в процентах).

 

 

 

Схема 2

 

 

 

 

6. Анализ кривой частотного  распределения

 

Асимметрия. Наличие асимметрии легко установить визуально, анализируя график или гистограмму.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Схема 3

 

Виды асимметрии

 

 

 

 

 

 

Положительная асимметрия распределения  характерна для излишне легких тестов, эффект отрицательной асимметрии встречается  в излишне трудных тестах. В  хорошо сбалансированном по трудности  тесте асимметрия нулевая.

 

 

 

Эксцесс.

 

С помощью эксцесса можно  получить представление о том, является ли гистограмма островершинной или  плоской. Островершинная кривая имеет  явно выраженный положительный эксцесс, средневершинная имеет нулевой  эксцесс, характерный для нормальной кривой, плосковершинная имеет эксцесс  меньше нуля.

 

Схема 4

 

Виды эксцессов

 

 

 

 

 

 

Понятие «эксцесс» применимо  лишь к унимодальным распределениям.

 

Для нормального распределения  характерна кривая с нулевой симметрией, нулевым эксцессом, одной вершиной [5].

 

 

 

7. Меры центральной тенденции

 

Меры центральной тенденции  предназначены для выявления  «центрального положения», вокруг которого в основном группируется множество  значений такого распределения данных.

 

Мода  (Мо) – это такое  значение, которое встречается наиболее часто среди результатов выполнения теста.

 

В том случае, если два  значения встречаются одинаково  часто, соответствующее распределение  называется бимодальным. Один из наиболее важных выводов в случае бимодального распределения – корректировка  трудности заданий теста.

Информация о работе Современные средства оценивания результатов обучения