СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ

Благодаря готовым учебным материалам для работы в классе и дистанционно

Скидки до 50 % на комплекты
только до

Готовые ключевые этапы урока всегда будут у вас под рукой

Организационный момент

Проверка знаний

Объяснение материала

Закрепление изученного

Итоги урока

Презентация на тему:"Валидность, надёжность, гомогенность и гетерогенность тестов."

Нажмите, чтобы узнать подробности

Презентация о тестах, об их валидности, гомогенности и гетерогенности. Раскрываются данные понятия.

Просмотр содержимого документа
«Презентация на тему:"Валидность, надёжность, гомогенность и гетерогенность тестов."»

Тест  от слова  англ.   test  — «испытание», «проверка». Педагогическое тестирование  — это форма измерения знаний учащихся, основанная на применении педагогических тестов. Включает в себя подготовку качественных тестов, собственно проведение тестирования и последующую обработку результатов, которая даёт оценку обученности тестируемых .

Тест  от слова  англ.   test  — «испытание», «проверка».

Педагогическое тестирование  — это форма измерения знаний учащихся, основанная на применении педагогических тестов. Включает в себя подготовку качественных тестов, собственно проведение тестирования и последующую обработку результатов, которая даёт оценку обученности тестируемых .

Валидность  теста – понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает (А. Анастази) ВАЛИДНОСТЬ означает пригодность тестовых результатов для той цели, ради чего проводилось тестирование (В.Аванесов). ВАЛИДНОСТЬ - это характеристика способности теста служить поставленной цели измерения (М.Челышкова). ВАЛИДНОСТЬ - определяет, насколько тест отражает то, что он должен оценивать (А.Майоров) .

Валидность  теста – понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает (А. Анастази)

ВАЛИДНОСТЬ означает пригодность тестовых результатов для той цели, ради чего проводилось тестирование (В.Аванесов).

ВАЛИДНОСТЬ - это характеристика способности теста служить поставленной цели измерения (М.Челышкова).

ВАЛИДНОСТЬ - определяет, насколько тест отражает то, что он должен оценивать (А.Майоров) .

- содержательную; -критериальную; -конструктную.

- содержательную;

-критериальную;

-конструктную.

  определяется в случаях, когда представление об измеряемом свойстве  существует в форме абстрактного образа, модели. Для объяснения определенных качеств личности создается концептуальная модель, которая с помощью тестов подтверждается или опровергается.

  определяется в случаях, когда представление об измеряемом свойстве  существует в форме абстрактного образа, модели. Для объяснения определенных качеств личности создается концептуальная модель, которая с помощью тестов подтверждается или опровергается.

предполагает наличие внешнего критерия, корреляция с которым определяет валидность теста.  Имеется два вида критериальной валидности – текущая и прогностическая .

предполагает наличие внешнего критерия, корреляция с которым определяет валидность теста. Имеется два вида критериальной валидности – текущая и прогностическая .

ПРОГНОСТИЧЕСКАЯ  КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ ХАРАКТЕРИЗУЕТ СПОСОБНОСТЬ ТЕСТА ПРЕДСКАЗЫВАТЬ БУДУЩИЕ КАЧЕСТВА, ФОРМИРУЮЩИХСЯ В РЕЗУЛЬТАТЕ ВОЗДЕЙСТВИЯ ВНЕШНИХ ОБСТОЯТЕЛЬСТВ ИЛИ ЦЕЛЕНАПРАВЛЕННОЙ СОБСТВЕННОЙ ДЕЯТЕЛЬНОСТИ. ЭТОТ ТИП ВАЛИДНОСТИ ХАРАКТЕРИЗУЕТ КОРРЕЛЯЦИЮ РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ С ВНЕШНИМ КРИТЕРИЕМ, КОТОРЫЙ ПОЯВИТСЯ В БУДУЩЕМ. ТЕКУЩАЯ   КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ ХАРАКТЕРИЗУЕТ СПОСОБНОСТЬ ТЕСТА ИЗМЕРЯТЬ НЕКОТОРЫЕ КАЧЕСТВА ЛИЧНОСТИ. ВАЛИДНОСТЬ ТЕСТА ПОДТВЕРЖДАЕТСЯ КОРРЕЛЯЦИЕЙ С НЕКОТОРЫМ ВНЕШНИМ КРИТЕРИЕМ, СУЩЕСТВУЮЩИМ В ДАННОЕ ВРЕМЯ. ДОПУСТИМ, ТЕСТ ПОКАЗАЛ ДЛЯ НЕКОТОРОГО ИСПЫТУЕМОГО ОТЛИЧНЫЕ ЗНАНИЯ ПО ПРЕДМЕТУ, А ШКОЛЬНЫЕ ОТМЕТКИ, ВЫСТАВЛЕННЫЕ УЧИТЕЛЕМ – НЕУДОВЛЕТВОРИТЕЛЬНЫЕ. ЕСЛИ МЫ В КАЧЕСТВЕ ВНЕШНЕГО, НЕЗАВИСИМОГО И ДОСТОВЕРНОГО КРИТЕРИЯ ВЫБЕРЕМ ШКОЛЬНЫЕ ОТМЕТКИ, ТО КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ ТЕСТА  – НИЗКАЯ, ДАЖЕ ЕСЛИ ОН ИМЕЕТ ВЫСОКУЮ НАДЕЖНОСТЬ.

ПРОГНОСТИЧЕСКАЯ  КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ ХАРАКТЕРИЗУЕТ СПОСОБНОСТЬ ТЕСТА ПРЕДСКАЗЫВАТЬ БУДУЩИЕ КАЧЕСТВА, ФОРМИРУЮЩИХСЯ В РЕЗУЛЬТАТЕ ВОЗДЕЙСТВИЯ ВНЕШНИХ ОБСТОЯТЕЛЬСТВ ИЛИ ЦЕЛЕНАПРАВЛЕННОЙ СОБСТВЕННОЙ ДЕЯТЕЛЬНОСТИ. ЭТОТ ТИП ВАЛИДНОСТИ ХАРАКТЕРИЗУЕТ КОРРЕЛЯЦИЮ РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ С ВНЕШНИМ КРИТЕРИЕМ, КОТОРЫЙ ПОЯВИТСЯ В БУДУЩЕМ.

ТЕКУЩАЯ   КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ ХАРАКТЕРИЗУЕТ СПОСОБНОСТЬ ТЕСТА ИЗМЕРЯТЬ НЕКОТОРЫЕ КАЧЕСТВА ЛИЧНОСТИ. ВАЛИДНОСТЬ ТЕСТА ПОДТВЕРЖДАЕТСЯ КОРРЕЛЯЦИЕЙ С НЕКОТОРЫМ ВНЕШНИМ КРИТЕРИЕМ, СУЩЕСТВУЮЩИМ В ДАННОЕ ВРЕМЯ. ДОПУСТИМ, ТЕСТ ПОКАЗАЛ ДЛЯ НЕКОТОРОГО ИСПЫТУЕМОГО ОТЛИЧНЫЕ ЗНАНИЯ ПО ПРЕДМЕТУ, А ШКОЛЬНЫЕ ОТМЕТКИ, ВЫСТАВЛЕННЫЕ УЧИТЕЛЕМ – НЕУДОВЛЕТВОРИТЕЛЬНЫЕ. ЕСЛИ МЫ В КАЧЕСТВЕ ВНЕШНЕГО, НЕЗАВИСИМОГО И ДОСТОВЕРНОГО КРИТЕРИЯ ВЫБЕРЕМ ШКОЛЬНЫЕ ОТМЕТКИ, ТО КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ ТЕСТА  – НИЗКАЯ, ДАЖЕ ЕСЛИ ОН ИМЕЕТ ВЫСОКУЮ НАДЕЖНОСТЬ.

характеризует тест по степени его соответствия предметной области. Согласно А.Анастази, содержательная валидность означает систематическую проверку содержания теста, с тем чтобы установить, соответствует ли оно репрезентативной выборке измеряемой области поведения. Для обеспечения содержательной валидности необходим детальный анализ учебных программ, на основании чего составляется  спецификация  теста.  Спецификация содержит перечень учебных тем, их важность, количество и тип тестовых заданий.  Оценка содержательной валидности выполняется  экспертом  в данной предметной области

характеризует тест по степени его соответствия предметной области.

Согласно А.Анастази, содержательная валидность означает систематическую проверку содержания теста, с тем чтобы установить, соответствует ли оно репрезентативной выборке измеряемой области поведения.

Для обеспечения содержательной валидности необходим детальный анализ учебных программ, на основании чего составляется  спецификация  теста.  Спецификация содержит перечень учебных тем, их важность, количество и тип тестовых заданий.  Оценка содержательной валидности выполняется  экспертом  в данной предметной области

1) указать категорию лиц, для которой предназначен тест;  2) составить список знаний, умений, навыков, подлежащих тестированию;  3) выполнить внешнюю экспертизу полученного списка на предмет его полноты и обоснованности;  4) на основе списка составить перечень заданий;  5) выполнить внешнюю экспертизу полученных заданий;  6) после проверки  преобразовать их в задания в  тестовой форме . В дальнейшем,  на этой основе создать  тестовые задания ,  образующие тест, который  будет   содержательно  валидным

1) указать категорию лиц, для которой предназначен тест; 2) составить список знаний, умений, навыков, подлежащих тестированию; 3) выполнить внешнюю экспертизу полученного списка на предмет его полноты и обоснованности; 4) на основе списка составить перечень заданий; 5) выполнить внешнюю экспертизу полученных заданий; 6) после проверки  преобразовать их в задания в  тестовой форме . В дальнейшем,  на этой основе создать  тестовые задания ,  образующие тест, который  будет   содержательно  валидным

В традиционной тестологии термин  «надёжность»  означает относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Надёжность методики  – это критерий, который говорит о точности психологических измерений, то есть позволяет судить о том, насколько внушают доверие полученные результаты.

В традиционной тестологии термин  «надёжность»  означает относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых.

Надёжность методики  – это критерий, который говорит о точности психологических измерений, то есть позволяет судить о том, насколько внушают доверие полученные результаты.

   1) нестабильность диагностируемого свойства;       2) несовершенство диагностических методик (небрежно составлена инструкция, задания по своему характеру разнородны, нечетко сформулированы указания, как методику предъявлять испытуемым, и т. д.);       3) меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т. д.);       4) различия в манере поведения экспериментатора (от опыта к опыту по-разному предъявляет инструкции, по-разному стимулирует выполнение заданий и т. д.);       5) колебания в функциональном состоянии испытуемого (в одном эксперименте отмечается хорошее самочувствие, в другом — утомление и т. д.);       6) элементы субъективности в способах оценки и интерпретации результатов (когда ведется протоколирование ответов испытуемых, оцениваются ответы по степени полноты, оригинальности и т. п.).

   1) нестабильность диагностируемого свойства;      2) несовершенство диагностических методик (небрежно составлена инструкция, задания по своему характеру разнородны, нечетко сформулированы указания, как методику предъявлять испытуемым, и т. д.);      3) меняющаяся ситуация обследования (разное время дня, когда проводятся эксперименты, разная освещенность помещения, наличие или отсутствие посторонних шумов и т. д.);      4) различия в манере поведения экспериментатора (от опыта к опыту по-разному предъявляет инструкции, по-разному стимулирует выполнение заданий и т. д.);      5) колебания в функциональном состоянии испытуемого (в одном эксперименте отмечается хорошее самочувствие, в другом — утомление и т. д.);      6) элементы субъективности в способах оценки и интерпретации результатов (когда ведется протоколирование ответов испытуемых, оцениваются ответы по степени полноты, оригинальности и т. п.).

При описании видов надежности основной упор делается на работы К. М. Гуревича, который, проведя тщательный анализ зарубежной литературы по этой проблеме, предложил толковать надежность как комплексную характеристику, включающую:       - надежность самого измерительного инструмента;       - стабильность изучаемого признака;       - константность, т. е. относительную независимость результатов от личности экспериментатора.       Основные показатели он предложил обозначить следующим образом:       - показатель, характеризующий измерительный инструмент, предлагается называть коэффициентом надежности;       - показатель, характеризующий стабильность измеряемого свойства — коэффициентом стабильности;       - показатель оценки влияния личности экспериментатора — коэффициентом константности.

При описании видов надежности основной упор делается на работы К. М. Гуревича, который, проведя тщательный анализ зарубежной литературы по этой проблеме, предложил толковать надежность как комплексную характеристику, включающую:      - надежность самого измерительного инструмента;      - стабильность изучаемого признака;      - константность, т. е. относительную независимость результатов от личности экспериментатора.      Основные показатели он предложил обозначить следующим образом:      - показатель, характеризующий измерительный инструмент, предлагается называть коэффициентом надежности;      - показатель, характеризующий стабильность измеряемого свойства — коэффициентом стабильности;      - показатель оценки влияния личности экспериментатора — коэффициентом константности.

представляет собой  систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся  по одной учебной дисциплине .

представляет собой  систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся  по одной учебной дисциплине .

  Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика.  В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства . Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное .

  Гомогенные тесты распространены больше других. В педагогике они создаются для контроля знаний по одной учебной дисциплине или по одному разделу такой, например, объемной учебной дисциплины, как физика.  В гомогенном педагогическом тесте не допускается использование заданий, выявляющих другие свойства . Наличие последних нарушает требование дисциплинарной чистоты педагогического теста. Ведь каждый тест измеряет что-то заранее определенное .

Другой важный аспект- стремление некоторых авторов включать в тесты не столько проверку знаний, сколько умение решать физические задачи, вовлекая, тем самым, интеллектуальный компонент в измерение физической подготовленности. 

Другой важный аспект- стремление некоторых авторов включать в тесты не столько проверку знаний, сколько умение решать физические задачи, вовлекая, тем самым, интеллектуальный компонент в измерение физической подготовленности. 

представляет собой  систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся  по нескольким учебным дисциплинам .

представляет собой  систему заданий возрастающей трудности, специфической формы и определенного содержания - система, создаваемая с целью объективного, качественного, и эффективного метода оценки структуры и измерения уровня подготовленности учащихся  по нескольким учебным дисциплинам .

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

Обычно гетерогенные тесты используются для комплексной оценки выпускника школ, оценки личности при приеме на работу и для отбора наиболее подготовленных абитуриентов при приеме в вузы. Поскольку каждый гетерогенный тест состоит из гомогенных тестов, интерпретация результатов тестирования ведется по ответам на задания каждого теста (здесь они называются шкалами) и кроме того, посредством различных методов агрегирования баллов делаются попытки дать общую оценку подготовленности испытуемого.

  Напомним, что традиционный тест представляет собой  метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой .     При такой ориентации задачи определения точного объема и структуры освоенного учебного материала отступают, по необходимости, на задний план. В тест отбирается такое минимально достаточное количество заданий, которое позволяет сравнительно точно определить, образно говоря, не

  Напомним, что традиционный тест представляет собой  метод диагностики испытуемых, в котором они отвечают на одни задания, в одинаковое время, в одинаковых условиях и с одинаковой оценкой .

    При такой ориентации задачи определения точного объема и структуры освоенного учебного материала отступают, по необходимости, на задний план. В тест отбирается такое минимально достаточное количество заданий, которое позволяет сравнительно точно определить, образно говоря, не "кто что знает", а "кто знает больше".

https://ru.wikipedia.org/wiki/ Педагогическое_тестирование#. D0.9F.D1.80.D0.B5.D0.B8.D0.BC.D1.83.D1.89.D0.B5.D1.81.D1.82.D0.B2.D0.B0_.D0.B8_.D0.BD.D0.B5.D0.B4.D0.BE.D1.81.D1.82.D0.B0.D1.82.D0.BA.D0.B8 https://ru.wikipedia.org/wiki/ Тест http://www.psyworld.ru/students/bilety/texts/45.html http://zhkhacker.ru/wp-content/uploads/2012/10/Corbis-50320-15.jpg http://uss.dvfu.ru/struct/ui/kim/monograph/src/glava_3_9.html http://subscribe.ru/archive/job.education.testology/200112/16150236.html http://www.psy-expert.ru/index/0-723

https://ru.wikipedia.org/wiki/ Педагогическое_тестирование#. D0.9F.D1.80.D0.B5.D0.B8.D0.BC.D1.83.D1.89.D0.B5.D1.81.D1.82.D0.B2.D0.B0_.D0.B8_.D0.BD.D0.B5.D0.B4.D0.BE.D1.81.D1.82.D0.B0.D1.82.D0.BA.D0.B8

https://ru.wikipedia.org/wiki/ Тест

http://www.psyworld.ru/students/bilety/texts/45.html

http://zhkhacker.ru/wp-content/uploads/2012/10/Corbis-50320-15.jpg

http://uss.dvfu.ru/struct/ui/kim/monograph/src/glava_3_9.html

http://subscribe.ru/archive/job.education.testology/200112/16150236.html

http://www.psy-expert.ru/index/0-723


Скачать

Рекомендуем курсы ПК и ППК для учителей

Вебинар для учителей

Свидетельство об участии БЕСПЛАТНО!