Характеристика надежности теста: Определение надежности теста

Определение надежности теста

15.06.2020

Тест обычно считается надежным, если с его помощью получаются одни и те же показатели для каждого обследуемого при повторном тестировании.

В психометрике термин надежность имеет два значения. На одном из них — надежности по внутренней согласованности — мы не будем останавливаться подробно, отсылая читателя к соответствующим справочникам и руководствам, отметив только, что требование к внутренней согласованности теста не случайно. Вполне естественно считать, что если некоторая переменная измеряется частью теста, то другие его части, не будучи согласованными с первой, измеряют нечто другое. Для того чтобы быть валидным, тест должен быть согласованным. Существует несколько способов определения надежности.

Надежность ретестовая — предполагает повторное предъявление того же самого теста тем же испытуемым и примерно в тех же условиях, что первоначальное, а затем установление корреляции между двумя рядами данных.

При использовании этого способа определения надежности нужно отдавать себе отчет в том, что испытуемые могут запомнить свои ответы и воспроизвести их во второй раз, поэтому повторное тестирование должно быть отделено от первого более-менее значительным временным интервалом, обычно не менее месяца. Некоторые психологи настаивают на интервале между тестированиями не менее 6 месяцев (Клайн, 1994).

Мы не считаем требование П. Клайна об обязательном 6 месячном интервале между тестированиями безусловным. В подтверждение сошлемся на результаты исследования канадских психологов. С помощью личностного опросника были обследованы 302 студента с интервалом в 3 недели. Условия повторного тестирования варьировались. Стандартный коэффициент ретестовой надежности, равный 0,872, не отличался от коэффициентов надежности, полученных в трех группах испытуемых, получавших одну из трех специфических инструкций:

  1. продумывать ответы;
  2. использовать воспоминания о прошлых ответах;
  3. выполнять параллельную форму теста.

Было обнаружено, что стандартный коэффициент надежности выше коэффициента, полученного при инструкции воспроизводить прошлые ответы.

Наименьшим удовлетворительным значением для ретестовой надежности является коэффициент корреляции, равный 0,7. Правда, для некоторых тестов этот показатель может быть несколько ниже.

Надежность параллельных форм предусматривает создание эквивалентных форм опросника и предъявление их одним и тем же испытуемым для того, чтобы затем оценить корреляцию между полученными результатами. Основная проблема, препятствующая широкому распространению этого способа определения надежности, — необходимость подготовки двух наборов заданий, что чрезвычайно сложно, поскольку требуются убедительные доказательства их эквивалентности.

Надежность частей теста определяется путем деления опросника на две части (обычно на четные и нечетные задания), после чего и рассчитывается корреляция между этими частями. Обычно к этому способу определения надежности рекомендуется прибегать только в тех случаях, когда необходимо быстро получить результаты.

Для определения ретестовой надежности и надежности параллельных форм корреляции подсчитывается на основе коэффициента произведения моментов Пирсона. Эта процедура подсчета рассматривалась нами ранее, в разделе, посвященном анализу заданий. Для определения надежности частей теста ранее рассчитанный коэффициент произведения моментов Пирсона (между двумя половинами теста) используется в формуле Спирмена—Брауна. Формула Спирмена— Брауна имеет вид:


Подчеркнем, что наилучшей процедурой определения надежности является проведение повторных исследований через более или менее значительные временные интервалы.

Все исследования надежности должны выполняться на достаточно больших (рекомендуется 200 и более испытуемых) и репрезентативных выборках. Надежность — важная характеристика теста, но сама по себе ценности не представляет. Она необходима для достижения валидности.

Ключевые слова: Тесты

Источник: Бурлачук Л. Ф. Психодиагностика: Учебник для вузов. — СПб.: Питер, 2006. — 351 с: ил

Материалы по теме

Методы тестирования

Тесты способностей человека

Русланов Д.В. Психология: базовая теория и практика. -2-е изд., переработанное и дополненное…

Содержание психологического тестирования

Акимова М.К., Гуревич К.М., Психологическая диагностика 3-е издание. Спб.:Питер, 2008.

Личностные тесты

Русланов Д.В. Психология: базовая теория и практика. -2-е изд., переработанное и дополненное…

Формы психологического тестирования

Акимова М. К., Гуревич К.М., Психологическая диагностика 3-е издание. Спб.:Питер, 2008.

Тест творческого мышления П. Торренса

Е. П. Ильин. «Психология творчества, креативности, одаренности» Питер; СПб.; 2009

Тестирование в психологии

Анна Анастази, Дифференциальная психология

Понятие и виды тестов

Бурлачук Л. Ф. Психодиагностика: Учебник для вузов. — СПб.: Питер, 2006. — 351 с: ил

QualiTester

Содержание

  1. Интерфейс
  2. Теория
    1. Валидность
    2. Надежность
      1. Надежность как устойчивость
      2. Надежность как внутренняя согласованность
    3. Дискриминативность
  3. Интерпретация результата
  4. Рекомендации для тестолога

Пиктограммы

В крайнем левом столбце таблицы записаны номера тестируемых персон, в самой верхней строке записаны номера тестовых заданий

Знак суммы; в этом столбце суммируется и выводится количество правильных заданий выполненных тестируемым

Экспертная оценка — это оценка, которую выставляет сам преподаватель по десятибальной шкале, исходя из личного мнения о тестируемом, из опыта преподавания; преподавателем не должны овладеть злость, щедрость, обиды, радости, волнения, негодавания или иные проявления отношения к тому или иному тестируемому — иначе результаты анализа теста могут оказаться неудовлетворяующими действительности

Теория

Валидность

  1. Валидность — пригодность тестовых результатов для той цели, ради чего проводилось тестирование. {2}} $$

    Надежность

      Надежностью называется характеристика теста, отражающая точность тестовых измерений, а также устойчивость тестовых результатов к действию случайных факторов. Во-первых, тест считается надежным, если он обеспечивает высокую точность измерений. И во-вторых, тест считается надежным, если он дает при повторном выполнении близкие результаты при условии, что подготовка ученика не изменилась за время до повторного выполнения теста. Таким образом будем считать, что надежность теста показывает, на сколько точно тест измеряет знания студентов или другие явления. Надежность характеризует точность теста как измерительного инструмента, устойчивость его к действию помех. Различают два вида надежности:
    1. надежность как устойчивость
    2. надежность как внутреннюю согласованность.

    Однако большинство авторов предпочитают рассматривать только надежность как внутреннюю согласованность, так как этот вид измерений требует проведение тестирование только один раз. n (X_{i} — Y_{i}) $$

    Дискриминативность

    Дискриминативность задач определяется как способность отделять испытуемых с высоким общим баллом по тесту от тех, кто получил низкий балл, или испытуемых с высокой продуктивностью учебной деятельности от испытуемых с низкой продуктивностью.

    Другими словами, дискриминативность — способность заданий теста дифференцировать студентов относительно «максимального» или «минимального» результата теста. Определение дискриминативности тестового задания необходимо для того, чтобы поставить заслон некачественным заданиям.

    Для вычисления дискриминативности будет применяться метод крайних групп: при расчете дискриминативности тестового задания учитываются результаты наиболее и наименее успешных студентов — это самый простой и наглядный метод вычисления дискриминативности.

    Доля членов крайних групп может изменяться в широких пределах в зависимости от величины выборки. Чем больше выборка, тем меньшей долей испытуемых можно ограничиться при выделении групп с высоким и низким результатами. Нижняя граница «отсечения групп» составляет 10% от общего числа испытуемых в выборке, верхняя — 33%. В данном случае будет использоваться 27% группа, так как при таком процентном соотношении достигается максимальная точность определения дискриминативности. Индекс дискриминации вычисляется как разность между долей лиц, правильно решивших задачу, из «высокопродуктивной» и «низкопродуктивной» групп.

    Основная формула (Индекс дискриминации)

    $$ D = \frac{N_{n_{max}}}{N_{max}} — \frac{N_{n_{min}}}{N_{min}} $$

    общее количество испытуемых крайних группах27% от всего количества
    количество студентов в группе худших, верно выполнивших задание 
    количество студентов в группе лучших, верно выполнивших задание 
    номер тестового задания 
    коэффициент дискриминативоности тестового заданияпо основной формуле

    Интерпретация

    Валидность

    Значение коэффициентаИнтерпретация
    от 0. 6 до 1высокая вылидность теста
    от 0.3 до 0.6средняя вылидность теста
    меньше 0.3низкая вылидность теста

    Надежность

    Значение коэффициентаИнтерпретация
    от 0.9 до 1очень высокая надежность теста
    от 0.8 до 0.9высокая надежность теста
    Замечание : если тест разрабатывается профессионалами и его областью применения являются профессионально организованные службы тестирования и центры, то следует считать, что тест имеет низкую надежность.
    от 0.7 до 0.8хорошая надежность теста
    меньше 0.7низкая надежность теста
    Замечание 1 : если тест разрабатывается профессионалами и его областью применения являются профессионально организованные службы тестирования и центры, то следует считать, что тест имеет низкую надежность при значении коэффициента менее 0. 8.
    Замечание 2 : если вы только начали разрабатывать тест и полученное значение коэффициента находится в пределах от 0.46 до 0.7 (тест имеет низкую надежность), то полученный результат свидетельствует о том, что в разрабатываемой методике присутствует некоторое число заданий, которые в силу своей специфичности ведут к снижению значения данного коэффициента.

    Дискриминативность

    Значение коэффициентаИнтерпретация
    от 0.3 до 1задание эффективно
    от 0.1 до 0.3задание следует проанализировать на пригодность использования в тесте (низкая дифференцирующая способность)
    меньше 0.1задание некачественное — лучшая группа отвечает хуже, чем слабая

    Рекомендации для тестолога

    1. Если тест рассматривать как средство контроля качества знаний обучаемых, то, прежде всего, необходимо совершенствовать форму тестовых заданий с целью повышения качества педагогического измерения, включая в тест не только задания с выбором одного правильного ответа, но и выбором нескольких правильных ответов. Безусловно, задания с выбором одного правильного ответа удобно использовать при автоматизированном контроле знаний (так составлены педагогические тесты для централизованного тестирования по математике). Однако с помощью таких заданий далеко не всегда можно качественно проверить знания испытуемых в силу того, что слишком велика вероятность угадывания правильных ответов. Такого недостатка лишены задания с выбором нескольких правильных ответов и задания открытой формы, а интенсивное развитие информационных технологий позволяет включить их в педагогический тест и при автоматизированном контроле знаний.
    2. Если рассматривать тест как средство обучения, предназначенное для формирования системы знаний обучаемых, то в педагогической практике целесообразно использовать комплексы тематических тестов по изучаемой дисциплине. Эти комплексы должны состоять не только из тестов для проверки практических умений и навыков обучаемых, но и из тестов для проверки их теоретических знаний, которые являются ядром формируемой педагогом системы знаний обучаемых.
    3. Если Вы хотите составить тестовые задания, обладающие удовлетворительной дискриминативностью, то необходимо избегать следующего:
      1. излишней сложности и запутанности формулировок;
      2. неоднозначности условий;
      3. очевидности решения;
      4. зависимости результата от памяти или от других индивидуальных особенностей испытуемого, а не от уровня развития тех умений и навыков, для оценки которых разрабатывается тест;
      5. абсурдности, нереальности вариантов ответов;
      6. появления двух и более правильных ответов, не оговоренных в условии.
    4. Если Вы хотите повысить валидность теста, то:
      1. составляйте тестовые задания оптимальной трудности для обеспечения нормального закона распределения баллов по тесту;
      2. проводите экспертизу качества содержания теста;
      3. правильно рассчитывайте оптимальное время выполнения теста;
      4. включайте в тест задания с высокой дискриминативностью.
    5. Если Вы хотите повысить надежность теста, то по возможности устраните влияние на Ваш тест следующих факторов:
      1. субъективизма при оценке результатов выполнения заданий теста, используя для этого задания закрытого типа;
      2. угадывания, которое существенно снижает надежность теста, особенно в тех случаях, когда тестируется группа слабых учеников, которые обычно прибегают к догадке при выполнении наиболее трудных заданий теста;
      3. некорректно сформулированных заданий, поскольку такие задания пропускают сильные ученики, что в целом негативно отражается на надежности теста;
      4. неоправданного выбора весовых коэффициентов;
      5. неоправданной длины теста, так как его надежность растет по мере увеличения длины, и для удовлетворительной, но не хорошей надежности, обычно достаточно 30 тестовых заданий;
      6. отсутствия стандартной инструкции к тесту, так как любые неоднозначности, двусмысленности и отступления от требований стандартизации в инструкции ведут к снижению надежности теста;
      7. источников ненадежности, связанных с испытуемыми, а не с заданиями теста (плохого самочувствия испытуемого, его усталости и скуки, шума в аудитории и т. п.).
    6. Иногда при нахождении коэффициента надежности происходит деление на нуль. Это может произойти, если все испытуемые имеют одинаковое количество правильных и неправильных ответов. Такое редко бывает на практике, скорее всего, произошла утечка ответов. В данном случае следует провести тест повторно.
    7. При нахождении надежности как устойчивости, так же возможен случай, который дает в ответе неопределенность, т.е. происходит деление нуля на нуль. Такое может произойти, когда испытуемый дал одинаковое количество правильных и неправильных ответов на первом и повторном тестировании. Это означает, что тест составлен очень удачно или же наоборот, очень неудачно. Советуем вам проверить другие тестовые характеристиками и, исходя из них, сделать заключение.
    8. При расчете валидности также возможен случай, когда происходит деление на нуль. Это может произойти в том случае, если все испытуемые имеют одинаковое количество правильных и неправильных ответов или, если все экспертные оценки одинаковы. Такой случай редко может произойти на практике, скорее всего, произошла утечка ответов, и данный результат искажен.

    CHARACTERISTICS OF A GOOD TEST: RELIABILITY

    SUMMARY 5

    SHINTA AMALIA  100221404360

    WINARSIH              100221404945

    CHARACTERISTICS OF A GOOD TEST: RELIABILITY

     

    • Reliable = Stable = Consistent
    • Надежность означает согласованность, надежность или стабильность измерений в течение наблюдений или во времени. Надежность относится к постоянству меры. Тест считается надежным, если мы неоднократно получаем один и тот же результат. Например, если тест предназначен для измерения признака, то каждый раз, когда тест проводится субъекту, результаты должны быть примерно одинаковыми. К сожалению, точно рассчитать надежность невозможно, но ее можно оценить разными способами.

     

    Надежный тест — это тест, который может давать стабильные или непротиворечивые результаты.

    Надежный тест должен быть продемонстрирован согласованностью результатов среди оценщиков или внутри оценщиков, между оценщиками или посредниками, а также во времени и месте.

    Мы можем сказать, что тест имеет высокую надежность, если результаты демонстрируют постоянство независимо от того, кто проводит тест, когда проводится тест и где проводится тест.

    Как сформулировать надежность?

    X: полученная оценка/наблюдаемая оценка

    T: истинная оценка

    E: ошибка

    Таким образом, результат теста с высокой надежностью будет содержать 0 ошибок, или оценка с высокой надежностью не будет содержать ошибок. совпадать с истинным счетом.

    Тип надежности

    Как измерить

    Стабильность или повторное тестирование Дайте одну и ту же оценку дважды, разделенные днями, неделями или месяцами. Надежность определяется как корреляция между оценками во время 1 и во время 2.
    Альтернативная форма Создайте две формы одного и того же теста (слегка изменив элементы). Надежность определяется как корреляция между оценками Теста 1 и Теста 2.
    Внутренняя согласованность (альфа, а) Сравните одну половину теста с другой половиной. Или используйте такие методы, как Формула Кудера-Ричардсона 20 (KR20) или Альфа Кронбаха.

     

    Надежность можно оценить, используя несколько подходов:

    1. 1.    Повторное испытание
    • Повторное тестирование — один и тот же тест проводится дважды одной и той же группе испытуемых в разных случаях тестирования. Используется для оценки постоянства теста во времени
    • Этот тип надежности предполагает отсутствие изменений в измеряемом качестве или конструкции
    • Лучше всего использовать для вещей, стабильных во времени, таких как интеллект

     

    Прочность

    Слабость

    ü  Нужно построить только один набор тестов. ü  Требует много времени и энергии.

    ü Нелегко создать одинаковые условия в разное время.

    ü Точно неизвестно, в какой интервал времени лучше проводить второй тест. Он может быть слишком далеко или слишком близко.

     

     

     

    1. 2.    Эквивалентные формы/параллельные

    Требуется создание двух или более наборов тестов, которые равны во всех аспектах тестов. Оба теста следует проводить одновременно или, по крайней мере, через очень минимальный интервал времени.

    • Оценка путем сравнения двух разных тестов, созданных с использованием одного и того же содержимого
    • достигается путем создания большого пула тестовых заданий, измеряющих одинаковое качество, а затем случайным разделением элементов на два отдельных теста
    • .
    • Два теста следует проводить одновременно или, по крайней мере, через очень минимальный интервал времени
    • Корреляция между двумя параллельными формами является оценкой надежности

     

    Прочность

    Слабость

    ü Две формы можно использовать независимо друг от друга. ü  Требует много времени и энергии.

    ü Нелегко создать множество элементов, отражающих одну и ту же конструкцию.

    ü  Нелегко поддерживать одинаковое психическое состояние испытуемых.

    ü Определить интервал времени тестирования непросто. слишком коротко: немотивировано, запомните ответ

     

     

    1. 3.    Внутренняя согласованность

    Субъекты выполняют один инструмент один раз. Существует два типа внутренней согласованности:

    1. а. Разделенный пополам

    Надежность достигается путем сопоставления результатов половин теста. Общий балл за вопросы с нечетным числом коррелирует с общим баллом за четное число (хотя это может быть первая половина со второй половиной). Надежность разделения пополам — это просто корреляция между этими общими баллами. Однако очевидны разные результаты значений надежности из-за разного разбиения или группировки. Ключевые понятия метода «разделить пополам»: Способы разделения предметов на половины являются лишь произволом ради удобства. Различные способы приобретения могут привести к разным значениям надежности. Длина теста влияет на надежность теста (больше элементов в тесте = выше надежность)

     

     

    1. б. Межстатейная оценка
    2. Это своего рода оценка, при которой результаты теста коррелируют сами с собой в рамках теста. Средняя межэлементная корреляция использует все элементы нашего инструмента, предназначенные для измерения одной и той же конструкции. Сначала мы вычисляем корреляцию между каждой парой элементов. Средняя межэлементная корреляция — это просто среднее или среднее значение всех этих корреляций.

     

     

    Стандарты надежности

    • Ранние этапы исследований в области, более низкая надежность может быть приемлемой
    • Требуется более высокая надежность, когда меры используются для дифференциации между группами
    • Чрезвычайно высокая надежность, необходимая при принятии важных решений – пример: ООН
    • Эмпирическое правило = 0,7 минимальная надежность; предпочтительно 0,8+ (Nunnally & Bernstein, 1994), но 0,95+ может быть СЛИШКОМ высоким

     

    Факторы, влияющие на достоверность оценки

    • Тестируемый — возможно, у испытуемого плохой день
    • Сам тест — вопросы/направление на приборе могут быть непонятны
    • Условия тестирования — во время тестирования могут быть отвлекающие факторы, отвлекающие испытуемого — слишком жарко, слишком комфортно и т. д.
    • Подсчет баллов за тест — при оценке ответов испытуемых могут применяться разные стандарты — оценщик может быть болен, устал, с разбитым сердцем и т. д.

    Нравится:

    Нравится Загрузка…

    7 основных характеристик хорошего теста по образованию за 10 минут – правильно

    Придерживаться как можно большего количества характеристик хорошего теста по образованию — сложный процесс для учителей .

    Через 10 минут или меньше вы получите краткую информацию обо всех общепринятых характеристиках, практических способах их применения, чтобы сделать ваш тест надежным, и о лучших университетах мира, которые их используют!

    Одной из основных целей образования является подготовка учащихся к следующему шагу в их будущем. Они должны убедиться, что их учащиеся приобрели достаточно знаний в области обучения. Только хорошие тесты гарантируют это. Хороший тест — это не только результат, который учащиеся с трудом набирают.

    Это обратная связь, которую ученик получает, чтобы улучшить свои навыки и знания, и хороший учитель всегда любит возвращаться к ней, чтобы убедиться, что его стратегии обучения соответствуют действительности и нуждаются ли они в развитии или нет.

    Это также обратная связь для лиц, принимающих решения во всех учебных заведениях и на государственных должностях, которым нужны достоверные данные, чтобы перейти к следующему этапу учебного плана или образовательного плана штата.

    Это не что-то центральное, над чем студенты проводят дни в беспокойстве, задаваясь вопросом, насколько хорошо они справятся с данным тестом и насколько хорошо на самом деле написаны вопросы теста, и знают ли они ответы на эти вопросы или нет.

     

    Содержание

    Каковы характеристики хорошего теста в области образования?

    Что такое хороший тест в образовании? Это оценка, с помощью которой учителя измеряют способности учащихся, а также слабые и сильные стороны. Он оценивает их знания в области исследования и обеспечивает обе стороны реальной обратной связью.

    Хороший тест должен гарантировать, что учащиеся готовы перейти к следующему шагу, будь то средняя школа, колледж или даже армия.

     

    На нашем предыдущем мероприятии, первом бесплатном онлайн-вебинаре «Обеспечение эффективного электронного оценивания для высшего образования», команда Qorrect по электронному оцениванию подробно обсудила полный цикл хорошего теста, уделив особое внимание экзамену на высшее образование.

     

    Команда обсудила, как анализировать, проектировать, разрабатывать, внедрять и оценивать этапы, которые вместе составляют жизненный цикл электронного оценивания, прохождение жизненного цикла электронного оценивания и его важность для высшего образования, роль образовательных технологий в развитии процесса цифровой оценки.

     

    Это плюс, учитывая вклад образовательных технологий в повышение качества оценивания, анализ ответов экзаменуемых, оценку качества экзамена и эффективность задействованных вопросов в измерении того, для чего они предназначены.

    Прочтите нашу статью « Почему нельзя упускать из виду важность наводящих вопросов в обучении »

    Присоединяйтесь к Qorrect Now БЕСПЛАТНО

    Каковы качества хорошей оценки?

    Оценка — это процесс, посредством которого учащиеся могут поделиться своим образовательным опытом. Чтобы тест был хорошим инструментом для измерения знаний и навыков учащихся, он должен обладать следующими характеристиками экзамена, которые необходимы для успешной сдачи любого теста.

     

    Надежность или последовательность

    Надежность или последовательность теста означает, что учащиеся должны выполнять одинаковые задания или получать одинаковые баллы, если им задают разные вопросы в разное время и в разном месте. Тест считается надежным, когда один и тот же результат достигается в разных тестах.

    Как отмечает Джеймс Карлсон в своем исследовательском меморандуме: «Надежность результатов теста — это степень, в которой они постоянны в разных случаях тестирования, разных выпусках теста или разных оценщиках, оценивающих ответы испытуемого». Он также упоминает некоторые статистические данные, чтобы описать, насколько тест может быть надежным.

     

    Как убедиться, что ваш тест надежен?
    1. Распределение баллов: Процент тестируемых на каждом уровне баллов.
    2. Средний балл : Средний балл, рассчитанный путем суммирования баллов всех испытуемых и деления на количество испытуемых.
    3. Стандартное отклонение : Мера количества вариаций в наборе оценок. Его можно интерпретировать как среднее расстояние баллов от среднего. (На самом деле это особый вид среднего, называемый «среднеквадратичным», вычисляемый путем возведения в квадрат расстояния каждого результата от среднего балла, усреднения квадратов расстояний и извлечения квадратного корня. )
    4. Корреляция : Мера силы и направления взаимосвязи между оценками одних и тех же людей в двух тестах.

    Достоверность — это отношение истинной оценки к наблюдаемой дисперсии оценки. Чтобы измерить надежность теста, мы можем проводить тест для одной и той же группы более одного раза.

    Однако могут возникнуть ошибки, так как учащиеся могут забыть или иметь некоторые физические проблемы. Таким образом, крайне важно проводить один и тот же тест в одинаковых условиях, чтобы гарантировать получение одинаковых результатов.

    Читать « Как провести онлайн-экзамен для студентов всего за несколько минут »

     

    Валидность, когда тест действительно может быть достигнут измерять. Поэтому необходимо выбрать определенные критерии.

    Валидность очень важна для оценки качества данного теста, поскольку вопросы должны соответствовать выбранным критериям и показателям.

     

    Вот некоторые из самых популярных типов валидности:

    Валидность содержания: Тест должен точно отражать содержание курса или области обучения.

    Критерий Срок действия: Он используется для прогнозирования результатов кандидата на работу или студента.

      Конвергентная валидность : в основном используется в области социологии или психологии.

    Дискриминантная валидность: Дискриминантная валидность означает, что тест концепции не сильно коррелирует с другими тестами, предназначенными для измерения теоретически различных концепций.

    Узнайте, как можно проводить объективные и достоверные тесты в сфере образования с помощью системы электронной оценки Qorrect. Зарезервируйте бесплатную демо-версию прямо сейчас.

    Забронируйте БЕСПЛАТНУЮ демо-версию сегодня →

     

    Объективность

    По словам Гронлунда и Линна, «объективность теста относится к степени, в которой оценки одинаковой компетентности дают одинаковые результаты», тест должен быть удален. от любого личного или субъективного суждения. Она должна основываться только на оценке человеческого развития.

    Например, в тесте типа эссе учащиеся отвечают по-разному, поскольку у каждого свой стиль письма.

    Следовательно, когда несколько инструкторов проверяют тест, они могут ставить разные оценки в зависимости от того, нравится им стиль или нет. Так что здесь тест менее объективен.

    Во избежание такой предвзятости при оценке таких типов тестов должны быть установлены строгие правила. Должно быть единое руководство, которым учителя могли бы пользоваться при исправлении таких тестов.

    Личное суждение не используется в тестах на истинность или ложность или множественный выбор. Кроме того, учителя должны пройти обучение тому, как выставлять оценки на тестах, поскольку неподготовленные учителя могут выставлять неправильные оценки и не смогут обеспечить требуемую справедливость и точность.

    Читать « Стандартизированные тесты: история и реализация в университетах

    Область

    Тест должен полностью охватить всю область исследования, которую учащиеся подвергаются во время курса. Расплывчатые вопросы не следует включать, особенно во время онлайн-тестов, когда учащиеся растеряны и у них мало времени.

     

    Отсутствие двусмысленности

    Двусмысленности не должно быть места, особенно в онлайн-тестах, где экзаменаторы отсутствуют. Студенты не должны быть в замешательстве, и все вопросы должны быть кристально ясными.

    По словам Джейкобс, Люси С. из Университета Индианы, «неоднозначные вопросы представляют собой главный недостаток тестов колледжа.

    Неоднозначные вопросы часто возникают, когда инструкторы откладывают написание тестовых вопросов до последней минуты. Тщательное редактирование и независимая проверка тестовых заданий могут помочь свести к минимуму эту проблему».

    Прочтите « В чем разница между онлайн-экзаменом и офлайн-экзаменом

     

    Подготовка

    Чтобы гарантировать успех любого теста, инструкторы должны учитывать следующие факторы:

    •       Учащиеся должны быть хорошо подготовлены к тесту путем тщательного пересмотра и обсуждения.
    •       Между периодом проверки и экзаменом не должно быть промежутков.
    •       Экзаменаторы должны разъяснить учащимся, какие темы предполагается рассмотреть на экзамене.
    •       Учащиеся должны быть хорошо подготовлены к этому типу теста.

     

    Уместность времени

    Одной из главных характеристик хорошего теста является наличие у учащихся достаточного времени для ответа на все вопросы. Например, вопросы-эссе требуют больше времени, чем вопросы с несколькими вариантами ответов или вопросы «верно/неверно».

    Некоторые учителя сначала сами сдают тест, а затем удваивают или утраивают время для учеников. Хороший тест должен быть практичным и всеобъемлющим.

     

    Наш вывод о характеристиках хорошего теста    

    Однако существует сильное ощущение, что использование слов «характеристики» или «критерии» не является оптимальным. Это подразумевает разработку стандартов, по которым можно было бы судить об оценках.

    Вместо этого мы считаем, что должно быть достигнуто общее согласие в отношении того, что слово «структура» более точно отражает наше желание создать структуру, которая может быть полезна при разработке хорошего теста в образовании.

                               

    7 Выдающиеся характеристики хорошего онлайн-теста

    1.     Логистическая задержка отсутствует 
    2. Легкий доступ из любого места
    3.     Высокая скорость
    4.     Поддержка вопросов-эссе, вопросов с несколькими ответами, коротких ответов, уравнений и научных вопросов
    5.     Встроенный банк вопросов в системах онлайн-тестирования качества
    6.     Сразу создаются отчеты о результатах учащихся
    7.     Высокодетализированные, безошибочные аналитические отчеты об успеваемости учащихся, а также о качестве тестов и вопросов

     

    Характеристики хорошего теста с примерами

    Какова цель теста?

    Это процесс оценки, посредством которого экзаменаторы узнают, кто вы, что вы знаете и думаете. Они определяют, чем вы отличаетесь от других.

    Типы тестов

    Тесты можно разделить на два типа в зависимости от вопросов, которые они решают:

    Вопросы для эссе Тесты
    1.     Этот тип предназначен для оценки информации и знаний учащихся в области обучения. Он измеряет их навыки письма и то, насколько хорошо они могут показать свою индивидуальность в письменной форме.
    2.     Ничего не нужно запоминать, так как учащиеся отвечают в соответствии со своим пониманием материалов курса.
    3.     С помощью тестов этого типа преподаватели могут измерить логическое мышление учащихся и навыки решения задач.

    Прочтите « Экзамены с прокторингом: как успешно проводить дистанционный прокторинг »

     

    Объективные вопросы Тесты

    от любого личного мнения или субъективности. Например, вопросы «истина или ложь» и вопросы с несколькими вариантами ответов являются объективными тестами.

     В статье под названием «Гарвардские курсы превращаются в контролируемые экзамены, оценку открытых книг и веру в студентов по мере того, как классы переходят в онлайн» Джульет Э. Иссельбахер и Аманда Ю. Су, писатели The Crimson, рассказали об опыте разных профессоров во время пандемии COVID. -19пандемии и как они были вынуждены перейти на онлайн-обучение.

    Профессор Роберт Н. Ставинс решил сделать экзамен открытым, чтобы гарантировать равенство между студентами, особенно в отсутствие какого-либо контроля во время онлайн-тестов.

    Другие профессора предпочли сохранить тот же старый стиль закрытого экзамена, гарантируя, что он проверяется и контролируется, как сказал профессор Чаудойн: «Мы должны доверять студентам, а инструменты онлайн-экзаменов дают нам частичный способ контролировать вещи. ”

    Иаура Роуз Смит из Манчестерского университета поделилась своим опытом в статье «Мой опыт онлайн-экзамена и лучшие советы для студентов». Она дала понять, что онлайн-экзамены изменили ее способ обучения.

     Вместо того, чтобы просто думать о сдаче теста, она сосредоточилась на повторении, знании и реальном понимании материала курса. Она сказала: «Я бы порекомендовала использовать эту возможность, чтобы глубже понять свою предметную область и расширить свои знания дальше, чем учебная программа».

    Зарегистрируйтесь, чтобы начать БЕСПЛАТНУЮ пробную версию

    Глаголы, которые лучше всего используются в хороших тестах

    Преподаватели рекомендуют использовать набор ключевых глаголов, связанных с теорией Блума, классификацией образовательных целей, при написании любых типов тестовых вопросов/тестовых заданий.

    Этот список глаголов гарантирует, что учитель или создатель теста действительно задает правильные вопросы, соответствующие уровню знаний и понимания учащихся. Вот некоторые из этих глаголов, согласно веб-сайту Калифорнийского государственного университета.

     

    Знание                          Упорядочить — определить описать — дублировать идентификацию — метка — список совпадений — запомнить имя — порядок — очертить распознать — связать — отозвать — повторить воспроизвести — выбрать — состояние
    Понимание Объяснить – резюмировать перефразировать – описать проиллюстрировать – классифицировать преобразовать – защитить описать – обсудить различить – оценить объяснить выразить – расширить – обобщить привести пример(ы) – определить – указать – сделать вывод – найти перефразировать – предсказать распознать – переписать обзор – выбрать резюмировать – перевести
    Заявка Использование — вычисление — решение, демонстрация — применение, построение — применение — изменение — выбор, вычисление — демонстрация, обнаружение — инсценировка, использование — иллюстрация, интерпретация, манипулирование, изменение — работа, практика — прогнозирование, подготовка — создание связи — планирование — показ эскиза — решение — использование — запись
    Анализ Анализировать — категоризировать, сравнивать — сравнивать, разделять — применять — изменять — открывать, выбирать — вычислять, демонстрировать — инсценировать — использовать, иллюстрировать — интерпретировать, манипулировать — изменять, работать — практиковать, предсказывать — готовить, производить — соотносить, планировать — показывать — рисовать — решать — использовать — писать
    Синтез Создать – спроектировать гипотезу – изобрести разработать – упорядочить собрать – классифицировать собрать – скомбинировать соблюдать – составить построить – создать дизайн – разработать – разработать – объяснить сформулировать – создать план – подготовить – перестроить – реконструировать связать – реорганизовать – пересмотреть – переписать – настроить – обобщать – синтезировать – рассказывать – писать
    Оценка Судить – рекомендовать критиковать – обосновывать оценивать – аргументировать оценивать прикреплять – выбирать – сравнивать – делать выводы противопоставлять – защищать описывать – различать оценку – оценивать объяснять – судить – обосновывать интерпретировать – связывать – прогнозировать – оценивать – выбирать суммировать – поддерживать – значение

     

    Качество традиционного и онлайн-тестирования

    С появлением онлайн-обучения и использованием передовых программных систем в образовании большинству преподавателей пришлось изменить традиционный способ тестирования.

     

    Традиционное оценивание

    Раньше учителя оценивали знания учащихся только по их баллам на конкретном экзамене. Они дают студентам только один шанс показать свои компетенции без обсуждений или классных проектов.

     

    Онлайн-оценка

    Онлайн-оценка — это способ, с помощью которого учителя могут улучшить обучение, знания, убеждения и навыки учащихся. Онлайн-оценки могут быть поведенческими, когнитивными или коммуникативными.

    Учащиеся могут пройти онлайн-оценку в классе или дома, что снижает их стресс. Для инструкторов теперь представлены новые инструменты для установки различных типов оценок.

    Они могут использовать игровые оценки с помощью многих инструментов, таких как Kahoot, как упоминалось в нашей предыдущей статье «11 лучших экзаменационных и оценочных платформ 2021 года».

    Учителя также могут создавать опросы и мероприятия. Кроме того, Google Forms позволяет учителям создавать тесты и оценивать их. Они могут выбрать викторины с несколькими вариантами ответов или викторины с короткими ответами.

    Некоторые инструменты также предоставляют учителям отчеты об оценках учащихся в формате Excel, и отзывы могут быть легко отправлены учащимся сразу после экзамена. Многие передовые программные системы позволяют преподавателям проводить надежные экзамены без обмана и мгновенно оценивать их. Это значительно экономит время учителей.

    Qorrect (система электронных экзаменов) генерирует автоматические отчеты о результатах тестов. Чтобы проанализировать качество теста, он предоставляет обратную связь о том, что во время онлайн-экзамена не было мошенничества, и анализирует результаты студентов во время экзамена.

    Прочтите « Обзор итогового оценивания, цели и лучшее онлайн-программное обеспечение »

     

    Как написать хороший тест?
    •       Будьте конкретны
    •       Не используйте двусмысленные вопросы.
    •       Выберите подходящий формат для своего теста.
    •       Избегайте открытых вопросов, если вы не готовы принять какой-либо ответ.
    •       Тщательно выбирайте слова и избегайте двусмысленности.
    •       Учащиеся должны знать, сколько стоит каждый из вопросов.

    В заключение, учителя должны создавать свои экзамены без какой-либо субъективности, двусмысленности или недостатка полноты. Соответствующий формат должен быть выбран в соответствии с материалами курса и для измерения знаний и навыков учащихся.

     

    15 вещей, которые вам нужно знать о характеристиках хорошего теста в образовании

    Вот 15 советов, которые Американский совет завершил свой семинар «Способы оценивания в классе»:

    1. Теория образовательных целей Блума классификация, в которой когнитивные навыки существуют в иерархическом порядке, важна при любой оценке.
    2. Оценка работает лучше, когда она непрерывна и интегрирована в обучение, а не эпизодически и незначительно упоминается в обучении в классе.
    3. Многие преподаватели используют MCQ на своих занятиях, потому что они могут охватить гораздо больший объем материала и за очень короткий период времени; кроме того, они, как известно, очень просты по сравнению с другими вопросами и быстро набирают баллы.
    4. Многие преподаватели и тест-менеджеры предпочитают использовать другие типы тестов для оценки своих студентов/экзаменуемых: эссе, рефераты или электронные портфолио, проекты, тесты презентаций.
    5.  Оба представления неверны! Тем не менее, хороший учитель будет использовать все ранее упомянутые формы оценки в течение учебного года.
    6. Ценность тестов намного выше и более выражена, когда они выполняются как часть полностью комплексной программы, предназначенной для улучшения обучения, прогресса, производительности и успеха образовательного учреждения
    7. «Всеобъемлющая система обучения и оценки должна содержать множество методов оценки».
    8. Тест может проверять только то, для оценки чего он был создан. Таким образом, лица, принимающие решения, должны обрабатывать полученные данные.
    9. Суммативное оценивание называется «оценкой обучения», а формативное оценивание называется «оценкой обучения».
    10. Всегда должен быть баланс между оцениваемыми интеллектуальными навыками.
    11. Конкретная и описательная обратная связь с инструкциями, которая поможет учащимся улучшить свое обучение и подготовиться к овладению учебными темами, имеет решающее значение для эффективного формирующего оценивания.
    12. Частые короткие тесты более полезны для обучения и предоставляют более качественные данные для оценки, чем нечастые расширенные экзамены.
    13. Диагностические оценки измеряют текущие знания и навыки учащегося с целью определения индивидуальной программы обучения для этого учащегося.
    14. Оценки качества действительны, надежны и беспристрастны.
    15. Тест не лучше, чем качество содержащихся в нем предметов.

     

    Вы тестируете студентов или клиентов?

    В своей книге «Проблемы с высшим образованием» Патрик Смит и Тревор Хасси изложили уникальный взгляд на систему образования в целом.

    Книга связывает рост потребительства с образованием, обращаясь к тому влиянию, которое это теперь оказывает на все, что связано с обучением.

    Это включает в себя то, как сегодня работает система университетов, и высокие цены, с которыми мы сталкиваемся сегодня во многих ведущих мировых высших учебных заведениях и университетах… слишком высокие, некоторые студенты годами остаются в долгах (хотя книга посвящена образованию в Великобритании). , многие другие страны могут иметь отношение к поднятым вопросам).

    Важным следствием этих изменений стало то, что учащиеся стали считать себя клиентов . Все чаще их восприятие состоит в том, что они покупают продукт.

About the Author

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Related Posts