В чем заключается принципиальное отличие методов теста. Тестовые (измерительные) методы в психодиагностике

Тестирование - это исследовательский метод, который позволяет выявить уровень знаний, умений и навыков, способностей и других качеств личности, а также их соответствие определенным нормам путем анализа способов выполнения испытуемым ряда специальных заданий. Такие задания принято называть тестами. Тест - это стандартизированное задание или особым образом связанные между собой задания, которые позволяют исследователю диагностировать меру выраженности исследуемого свойства у испытуемого, его психологические характеристики, а также отношение к тем или иным объектам. В результате тестирования обычно получают некоторую количественную характеристику, показывающую меру выраженности исследуемой особенности у личности. Она должна быть соотносима с установленными для данной категории испытуемых нормами. Значит, с помощью тестирования можно определить имеющийся уровень развития некоторого свойства в объекте исследования и сравнить его с эталоном или с развитием этого качества у испытуемого в более ранний период.

Тесты обычно содержат вопросы и задания, требующие очень краткого, иногда альтернативного ответа («да» или «нет», «больше» или «меньше» и т.д.), выбора одного из приводимых ответов или ответов по балльной системе. Тестовые задания обычно отличаются диагностичностью, их выполнение и обработка не отнимают много времени. В то же время, как показала мировая практика, очень важно видеть, что реально могут выявить тесты, для того чтобы не подменить предмет диагностирования. Так, многие тесты, претендующие на выявление уровня развития, реально выявляют лишь уровень подготовленности, информированности или умелости испытуемых.

При подготовке тестовых заданий следует соблюдать ряд условий. Во-первых, нужно определить и ориентироваться на некоторую норму, что позволит объективно сравнивать между собой результаты и достижения различных испытуемых. Это означает также, что исследователь должен принять некоторую научную концепцию изучаемого явления, ориентироваться на нее и с этих позиций обосновывать создание и интерпретировать результаты выполнения заданий. Например, тесты-задания на выявление уровня сформированности знаний, умений и навыков по тем или иным учебным предметам составляются и применяются на основе некоторых представлений о критериях оценки знаний, умений и навыков учащихся и соответствующих норм отметок или могут быть рассчитаны лишь на сравнение испытуемых между собой по успешности. выполнения ими заданий. Во-вторых, испытуемые должны находиться в одинаковых условиях выполнения задания (независимо от времени и места), что позволяет исследователю объективно оценить и сравнить полученные результаты.

Норма каждого теста определяется составителем-разработчиком путем нахождения среднего показателя, соответствующего результатам большой совокупности людей, принадлежащих некоторой культуре (выборка стандартизации). Этот показатель принимается за средний показатель развития выявляемого тестом свойства, статистически характерного для среднего человека. Это может быть, например, возрастной нормой интеллектуального развития или какой либо личностной характеристикой. Такой показатель определяется опытным путем и принимается за точку отсчета. Результаты каждого испытуемого сравниваются с нормой и соответствующим способом оцениваются: каждый тест сопровождается способом обработки данных и интерпретации результатов. Например, в тесте на определение акцентуации характера (К. Леон-гардт) испытуемый по каждому из типов акцентуации может набрать максимум 24 балла; признаком сильной выраженности (акцентуации) считается показатель, превышающий 12 баллов (исследователь может сам, на основании накопленного опыта, дополнительно уточнить характеристику меры выраженности свойства при показателях до 24 баллов).

Тесты, ориентированные на определение среднестатистических норм и принятие их в качестве критериев оценки и интеграции, позволяют осуществлять нормативно-ориентированное тестирование (НОРТ). Такие нормативные оценочные действия часто используются в педагогической практике. Например, существуют критерии оценки знаний, умений и навыков и нормы отметок по тем или иным учебным предметам, применяются учебные задания тестового характера по разным предметам с установленными нормами выставления отметок. НОРТ можно осуществить с применением многих тестов (тест Равена, тест Кэттелла, методика диагностики уровня субъективного контроля и др.).

Бывает много случаев, когда важно учитывать изменения в показателях одного и того же испытуемого на определенном промежутке времени, например до начала обучения и после завершения обучения некоторому учебному материалу. Это позволяет фиксировать возможности испытуемого, а периодическая диагностика и сравнение его показателей с предыдущими позволяет выявлять темп и направление развития изучаемого свойства. В таких случаях интерпретация результатов тестирования осуществляется с позиции выбранных критериев, показывающих особенности продвижения испытуемого в усвоении содержания учебного материала и развитии определенных психических качеств. Многие интеллектуальные тесты, тесты достижений и др. позволяют использовать их в указанном выше смысле. Норма теста в подобных случаях индивидуальная.

Возможен и случай, когда определение нормы теста осуществляется по содержательному признаку, на основе анализа логико-психологической структуры материала заданий, когда успешность выполнения теста интерпретируется в терминах - качественных характеристиках исследуемого свойства. Такие качественные характеристики выступают как критерии оценки достижений испытуемого, а само тестирование становится критериально-ориентированным. Критериально-ориентированное тестирование (КОРТ) позволяет достаточно успешно сочетать тестирование, интерпретацию результата и коррекцию хода обучения (формирования). Напомним еще раз, что результаты выполнения заданий в КОРТ соотносятся с качественными характеристиками содержания задания (теста), а не с некоторым среднестатистическим уровнем успешности его выполнения, как в НОРТ.

Примером может служить использование «Методики АРП» и соответствующего ей блока методик, предложенного одним из авторов данного пособия. Выполнение данного блока позволяет определить уровень развития мышления испытуемого - школьника, которое может быть эмпирическим, аналитическим, планирующим и рефлектирующим. Поскольку сформированность того или иного уровня развития мышления является предпосылкой возможного становления в будущем следующего уровня развития, поэтому имеется возможность: 1) принятия этих уровней в качестве критериев оценки исследуемого свойства; 2) принятия следующего за установленным уровня в качестве направления последующего развития мышления и определение ближайшей зоны развития мышления ученика; 3) составление адекватного набора упражнений по одному или ряду учебных предметов, выполнение которых должно привести к достижению школьником соответствующего уровня развития мышления1.

Существуют определенные правила проведения тестирования и интерпретации полученных результатов. Эти правила достаточно четко проработаны, и основные из них имеют следующий смысл: 1)

информирование испытуемого о целях проведения тестирования; 2)

ознакомление испытуемого с инструкцией по выполнению тестовых заданий и достижение уверенности исследователя в том, что инструкция понята правильно; 3)

обеспечение ситуации спокойного и самостоятельного выполнения заданий испытуемыми; сохранение нейтрального отношения к тестируемым, уход от подсказок и помощи; 4)

соблюдение исследователем методических указаний по обработке полученных данных и интерпретации результатов, которыми сопровождается каждый тест или соответствующее задание; 5)

предупреждение распространения полученной в результате тестирования психодиагностической информации, обеспечение ее конфиденциальности; 6)

ознакомление испытуемого с результатами тестирования, сообщение ему или ответственному лицу соответствующей информации с учетом принципа «Не навреди!»; в этом случае возникает необходимость решения серии этических и нравственных задач; 7)

накопление исследователем сведений, получаемых другими исследовательскими методами и методиками, их соотнесение друг с другом и определение согласованности между ними; обогащение своего опыта работы с тестом и знаний об особенностях его применения.

Как уже было отмечено, каждый тест сопровождается конкретной инструкцией и методическими указаниями по обработке и интерпретации получаемых данных.

Выделяют также несколько типов тестов, каждому из которых сопутствуют соответствующие процедуры тестирования.

Тесты способностей позволяют выявить и измерить уровень развития тех или иных психических функций, познавательных процессов.

Такие тесты чаще всего связаны с диагностикой познавательной сферы личности, особенностей мышления и обычно называются также интеллектуальными. К ним относятся, например, тест Равена, тест Амтхауэра, соответствующие субтесты теста Век-слера и т.д., а также тесты-задания на обобщение, классификацию и множество других тестов исследовательского характера.

Тесты достижений ориентированы на выявление уровня сфор-мированности конкретных знаний, умений и навыков и как меры

1 См.: Атаханов Р.А. Математическое мышление и методики определения уровня его развития // Науч. ред. В.В.Давыдова. - Рига, 2000.

успешности выполнения, и как меры готовности к выполнению некоторой деятельности. В качестве примеров могут служить все случаи тестовых экзаменационных испытаний. На практике обычно применяются «батареи» тестов достижений.

Личностные тесты предназначены для выявления свойств личности испытуемых. Они многочисленны и разнообразны: существуют опросники состояний и эмоционального склада личности (например, тесты тревожности), опросники мотивации деятельности и предпочтений, определения черт характера личности и отношений.

Имеется группа тестов, называемых проективными, которые позволяют выявить установки, неосознаваемые потребности и побуждения, тревоги и состояние страха. Испытуемому предлагаются различные стимульные материалы типа сюжетно неопределенных картинок, незавершенных предложений, сюжетные рисунки с конфликтными ситуациями и др. с просьбой интерпретировать их. Механизм выполнения таких заданий проявляется в том, что испытуемый некоторым образом упорядочивает элементы стимульного материала и придает им субъективный смысл, отражающий его личный опыт и переживания. Иначе говоря, проективные тесты построены на признании существования механизма «проектирования» человеком своего внутреннего мира на внешний, когда он невольно приписывает другим людям те свои влечения, потребности и желания, которые в обычном состоянии подавлены. Значит, проективные тесты позволяют с достаточной мерой объективности диагностировать бессознательные переживания человека. Такими тестами являются тематический апперцептивный тест, тест «чернильных пятен» Роршаха, широко применяемый фрустрационный тест Розенцвейга и др. Используются также графические проективные методики, где исследователь ставит испытуемого в ситуацию проектирования своего состояния, особенностей личности и отношений на реальность путем изображения дома, дерева, семьи, человека, несуществующего животного и его интерпретации. Например, тест «Конструктивный рисунок человека из геометрических фигур» выявляет индивидуально-типологические различия путем анализа рисунка человека, составленного из десяти фигур (треугольников, квадратов и кругов, причем их сочетание может быть любым): испытуемый может оказаться принадлежащим к типу «руководителей», «тревожно-мнительных личностей» и т. д.

Применение тестов всегда связано с измерением проявления того или иного психологического свойства и оценкой уровня его развития или сформированности. Поэтому важное значение имеет качество теста. Качество теста характеризуется критериями его точности, т. е. надежностью и валидностью.

Надежность теста определяется тем, насколько получаемые показатели являются стабильными и насколько они не зависят от случайных факторов. Разумеется, речь идет о сравнении показаний одних и тех же испытуемых. Это значит, что надежному тесту должна быть свойственна согласованность показателей тестирования, полученных при повторном тестировании, и можно быть уверенным в том, что тест выявляет одно и то же свойство. Применяются разные способы проверки надежности тестов. Один способ - это только что упомянутое повторное тестирование: если результаты первого и через определенное время проводимого повторного тестирования покажут наличие достаточного уровня корреляции, то это будет свидетельствовать о надежности теста. Второй способ связан с применением другой эквивалентной формы теста и наличием высокой корреляции между ними (некоторые тесты предлагаются пользователям в двух формах; например, тест-опросник Айзенка EPI - по определению темперамента - имеет равнозначные формы А и Б). Возможно и применение третьего способа оценки надежности, когда тест допускает его расщепление на две части и одна и та же группа испытуемых обследуется с применением обеих частей теста. Надежность теста показывает, насколько результаты тестирования могут быть устойчивы, насколько точно измеряются психологические параметры и насколько высокой может быть мера доверия исследователя к полученным результатам.

Валидность теста отвечает на вопрос о том, что именно выявляет тест, насколько он пригоден для выявления того, для чего он предназначен. Например, тесты способностей нередко выявляют несколько иное: натренированность, наличие соответствующего опыта или, наоборот, его отсутствие. В таком случае тест не отвечает требованиям валидности.

В психодиагностике выделяют разные виды валидности. В простейшем случае валидность теста обычно определяется путем сопоставления полученных в результате тестирования показателей с экспертными оценками о наличии данного свойства у исследуемых (текущая валидность или валидность «по одновременности»), а также путем анализа данных, полученных в результате наблюдения за обследуемыми в различных ситуациях их жизни и деятельности, и их достижений в соответствующей области. Вопрос о валидности теста может быть решен еще и сравнением его данных с показателями, полученными с помощью методики, связанной с данной методикой, валидность которой считается установленной.

Приступая к рассказу о тестировании, мы начнем с самого главного - с определения понятия «тест». В общенаучном смысле тест (от англ. test - опыт, проба) - это кратковременное стандартизованное испытание, направленное на получение в относительно сжатый отрезок времени наиболее существенной информации о признаках данного конкретного объекта с целью установления у него наличия или степени выраженности определенного психического свойства (черты, характеристики) или качества, а также совокупности психических свойств личности или психических состояний (отношений, взаимовосприятия) групп и коллективов. Тест позволяет с заранее установленной степенью вероятности определить существующий у человека в данное время уровень знаний, относительно устойчивые личностные свойства, черты поведения, а также получить качественные и количественные оценки измеряемых характеристик.

Концепция тестирования как метода оценки и измерения качеств личности базируется на следующих общих предпосылках:
1. Внутренние (психологические) свойства личности выявляются с помощью индикаторов - показателей или внешних поведенческих характеристик (ответов на вопросы, результатов решения разного рода задач и т.п.), посредством которых проявляются структуры и свойства личности.
2. Эти индикаторы имеют такое выражение, которое может быть объектом наблюдения и измерения с помощью специальных процедур.
3. Между внешней (поведенческой) чертой и внутренним свойством личности существует однозначная причинная зависимость:
наблюдаемое действие или реакция человека порождены определенным личностным свойством и только им.
4. Измеряемые тестами черты и соответственно получаемые результаты распределены среди большой совокупности людей достаточно равномерно. Это означает, что тест должен не только оценивать конкретно взятого человека, но и быть применимым к большой совокупности людей.

Последнее требование отражается в понятии «норма теста», под которой понимается «средний уровень развития большой совокупности людей, похожих на данного испытуемого по ряду социально-демографических характеристик»3. Иными словами, норма теста - это средний уровень распределения выявляемых с его помощью характеристик в большой группе людей, на применимость в которой он претендует. В большинстве случаев норма теста определяется с помощью усреднения результатов тестирования большой выборки людей одного пола, примерно одинакового возраста и дифференциации полученных результатов по важнейшим показателям. Норма теста отражает его репрезентативность или свойство выборочной совокупности людей (группы или ряда групп, на основе анализа качеств которых был разработан тест) представлять генеральную совокупность всех лиц, обладающих подобными типологическими характеристиками. Репрезентативность позволяет классифицировать результаты тестирования и выступает показателем качественности тестовой методики.

Еще одним критерием добротности теста, тесно связанным с репрезентативностью, является его адаптированность - способность учитывать национальные (в том числе и социальные) и региональные особенности. Авторы берут нужный для построения тестов материал из исторически сложившейся культуры близкой им социальной общности. Тесты, «свободные от культуры», а значит одинаково понятные по материалу индивидам из разных социальных общностей, создать нельзя - это неустранимое свойство тестовых программ. При использовании тестов, разработанных в иной социально-культурной среде, в проверке и переоценке нуждаются нормы, валидность, надежность тестов, а также их применимость в целом. Особенно остро проблема адаптированности заявила о себе в последние годы, когда в Россию широким потоком хлынули западные тестовые методики и российские специалисты в области кадрового менеджмента бросились применять их, подчас не задумываясь о необходимости внесения определенных корректив.

В силу фактического запрета на использование тестов, существовавшего в СССР (после известного постановления ЦК ВКПб 1936 г. «О педологических извращениях в системе Наркомпроса»), российский кадровый менеджмент является дилетантом в этой области. Многих буквально очаровывает магия «фирменных» латинских букв, аббревиатур, обозначающих «классические» методики, такие, например, как MMPI (личностный опросник, разработанный в Миннесотском университете), на основании которых» предлагается получение развернутых заключений о сотрудниках фирмы или кандидатах на имеющиеся вакансии. Несомненно, вышеупомянутый тест занимает в мировой психологии лидирующую (по популярности) позицию. Однако нельзя забывать тот факт, что он был разработан специально для пациентов психиатрических клиник (!) и широко используется в практике психоанализа. При приеме нормальных здоровых людей в американские фирмы этот тест в последние годы не применяется! Лица, подвергшиеся подобному тестированию, уже выиграли по суду немало исков, а компаниям пришлось уплатить солидные штрафы за нанесение морального ущерба.

Вообще западные личностные тесты, в том числе и более подходящие для ситуации приема на работу («16 личностных факторов» Кэттелла- 16PF, Калифорнийский личностный перечень - CPI, Опросник Айзенка - EPI, Тест Майерс-Бриггс, основанный на типологии Юнга), для корректного применения в России нуждаются в серьезной доработке («культурной и психометрической адаптации»). Неадаптированное, без внесения существенных поправок использование этих и подобных им тестов в современных, российских условиях явно неправомерно, хотя бы уже потому, что в нашей стране условия труда, его оплаты, традиции трудового сознания во многом отличны от западных. Далеко не для всех тестов проведена адаптация, что уж говорить о «пиратских» версиях западных тестов. Как правило, неадаптированные версии используют дилетанты в области психометрики, которые наивно полагают, что достаточно просто перевести на русский язык тестовые задания и тест будет работать. На самом же деле работа по адаптации тестовых методик должна включать пересчет не только так называемых тестовых норм, но и ключей к тест-заданиям (пунктам).

Для того чтобы тесты соответствовали своему назначению, адекватно выявляли и достаточно точно измеряли определенные качества, они должны также соответствовать таким критериям, как объективность, валидность, надежность и научность. Объективность означает, что результаты тестирования должны быть интерсубъективны, т.е. независимы от того, кто проводит тест. Валидность (от англ. valid- действительный, пригодный) - это пригодность теста для измерения именно того качества, на оценку которого он направлен. Так, например, если тест используется для оценки уровня знаний человека в области управления персоналом, он должен измерять именно эти знания, а не, например, общую эрудицию или знания в области экономики. Существуют, по меньшей мере, три условия обоснования валидности: валидность относительно критерия (требующая демонстрации корреляции или иного статистического взаимоотношения между результатами теста и требованиями работы); валидность относительно содержания (требующая демонстрации того, что содержание теста представляет важнейшие относительно работы черты поведения); валидность относительно конструктов (требующая демонстрации того, что тест определяет именно тот конструкт или характеристику, для определения которой он предназначен, и что эта характеристика важна для успешности в работе).

Надежность отражает степень точности и постоянства, с которой измеряется качество личности, и характеризует свободу процедуры тестирования от погрешностей. Точность проявляется в уровне совпадения результатов данного теста с показателями других тестов, используемых для этой же цели, постоянство - в устойчивости, стабильности результатов при повторной оценке той же группы тестируемых. Вместе с тем специалисты отмечают существование нескольких причин, по которым индивид, вновь проходящий тест, не получает сходные оценки. К ним относятся: временные психологические или физические изменения состояния тестируемого; факторы окружения (температура комнаты, освещение, уровень шума или даже личность проводящего тест); форма теста (многие тесты имеют разную форму или версию - на бумажном носителе, в электронном виде, в устном исполнении) и т.п. Указателем надежности теста является степень, в которой сфера оценок теста не подвержена влиянию указанных факторов.

Надежность теста определяется его коэффициентом, который может колебаться от 0 до 1. Обычно говорится, что если надежность теста 0,9 и более, то результаты его превосходны, тест с надежностью 0,8-0,89 дает хорошие результаты, тест с надежностью 0,7-0,79 дает адекватные результаты, тест с надежностью менее 0,7 имеет ограниченную применимость. Допустимый уровень надежности будет отличаться в зависимости от типа теста и используемой оценки его надежности. Ниже приводятся основные типы надежности тестовых процедур:
♦ надежность типа «тест - повторный тест» указывает на возможность получения таких же результатов по тесту по прошествии времени;
♦ надежность альтернативной, или параллельной, формы: речь идет о том, что результаты теста подобны, если индивид выбирает одну или несколько его альтернативных форм;
♦ надежность типа «интероценка» указывает, что результаты теста подобны при проведении его двумя или более оценщиками;
♦ надежность типа «внутренняя непротиворечивость» указывает границы, в которых тест измеряет одно и то же.

Надежность и валидность теста взаимосвязаны. Вместе с тем между ними следует проводить различия: надежность говорит о том, насколько истинные результаты дает тест, валидность - насколько хорош тест для отдельной ситуации. Таким образом, тест может быть надежным, но не быть валидным. Он может оказаться невалидным для различных целей: например, адекватно показывать технические навыки, но быть бесполезным при определении лидерских качеств. Сходным образом валидность теста обоснована относительно специфических групп индивидов (так называемых референтных групп); вполне реальна ситуация, когда целевая группа может не входить в число последних. В целом валидность теста может быть либо равна (идеальный случай), либо меньше его надежности.

Научность - это обоснованность теста фундаментальными исследованиями, его концептуальная осмысленность. Особенно необходимо научное обоснование при обращении к батарее тестов - серии испытаний, призванных оценить комплекс качеств человека, свидетельствующий о его профессиональной пригодноста и ожидаемых трудовых успехах, - широко применяемой при отборе персонала.

Масштабность использования процедуры тестирования в управлении персоналом объясняется, на наш взгляд, целым рядом ее достоинств:
♦ объективностью оценки (итоги тестирования практически не зависят от субъективного подхода тестирующего; к тому же они могут быть оценены не только качественно, но и количественно);
♦ оперативностью оценки (сама процедура тестирования занимает сравнительно немного времени, в то же время с ее помощью можно в короткий срок собрать требующуюся информацию о большом количестве людей);
♦ простотой и доступностью тестирования (в управлении персоналом используются стандартизированные тесты, которые содержат описание процедуры их проведения и оценки результатов; после профессиональной апробации ими может пользоваться широкий круг руководителей, а также сотрудников служб персонала);
♦ пригодностью результатов тестирования для компьютерной обработки и использования статистических методов оценки;
♦ большими эвристическими оценочными возможностями;
♦ конкретностью и непосредственной практической направленностью (тесты позволяют получить сведения об определенных свойствах личности и ее поведении, а не о человеке вообще).

В то же время, как и любые другие инструменты кадрового менеджмента, метод тестирования имеет свои ограничения и тонкости, которые необходимо знать в процессе его применения:
♦ существует серьезная проблема установления однозначной причинно-следственной связи между выявляемыми вопросами (заданиями) тестов и качествами личности, определяющими ее профессиональный успех: при разработке тестов далеко не всегда удается однозначно «перевести» тестовые задания (индикаторы черт) в конкретные качества личности, а последние - в факторы трудовых достижений;
♦ результаты тестов обычно оценивают лишь актуальные, т.е. существующие в данный момент, качества; в то же время большинство характеристик личности и ее поведения подвержены изменениям, порой достаточно динамичным;
♦ квалифицированное использование тестов требует соответствующей психодиагностической и этической подготовки тестирующего;
♦ применение тестов может вызывать у испытуемых страх, искажающий результаты тестирования;
♦ публичное объявление результатов тестирования может задевать чувство собственного достоинства аутсайдеров, компрометировать их в глазах окружающих и тем самым осложнять отношения в коллективе.

Существует строго математизированная, экспериментальная наука - тестология, мало известная в нашей стране, которая позволяет вполне однозначно установить, какой тест можно считать хорошим, а какой - плохим. В развитых странах все профессиональные и психологические тесты проходят сертификацию - неависимую экспертизу. В некоторых случаях проводящие специалисты объединены в национальную психологическую ассоциацию, в других - в специализированную тестологическую ассоциацию. К сожалению, в России подобная практика находится пока в зачаточном состоянии.

Тесты могут быть полезными только при условии их грамотного применения подготовленными к этому специалистами. Избегать проблем и получать объективные результаты помогают общие правила тестирования, к которым относятся следующие:
♦ любое сложное тестирование должно проводиться при участии специалиста по психодиагностике или при последующем его участии в качестве консультанта;
♦ человека нельзя подвергать психологическому обследованию обманным путем или против его воли, недопустимы никакие формы прямого или косвенного принуждения;
♦ перед проведением тестирования испытуемого необходимо предупредить о том, что в ходе исследования он невольно может сообщить такую информацию о себе, своих мыслях и чувствах, которую не осознает сам;
♦ любой человек (за исключением случаев, оговоренных за коном) имеет право знать результаты своего тестирования; итоговые данные в доступной для понимания форме предоставляет испытуемым тот, кто проводил обследование; ознакомление с результатами тестирования должно исключать их неправильное толкование или появление у испытуемых каких-либо опасений;
♦ результаты тестирования не должны травмировать исследуемого или снижать его самооценку, поэтому их следует сообщать в ободряющей форме, по возможности сопровождая конструктивными рекомендациями;
♦ испытуемый должен быть информирован о целях тестироввания и формах использования его результатов;
♦ тестирующий должен обеспечить беспристрастный подход к процедуре и результатам исследования;
♦ информация о результатах тестирования должна предоставляться только тем, кому она предназначается; тестирующий обязан обеспечить конфиденциальность психодиагностической информации, полученной от испытуемого на основе «личного доверия» или в социометрических тестах.

Помимо вышеперечисленных правил, обеспечивающих эффективность процедуры тестирования, особые требования предъявляются и к тестирующему. Общеизвестно, что эффективность тестирования во многом зависит не только от соответствующих знаний, но и от личностных качеств проводящего его человека. Важными для профессионального тестирования качествами являются: общительность и коммуникабельность; динамичность и гибкость поведения; эмоциональная сдержанность и терпимость; профессиональный такт (основой которого являются прежде всего соблюдение профессиональной тайны и деликатность); умение держать свою линию поведения; эмпатия (т.е. готовность и способность проникнуться чувствами и переживаниями других людей и тем самым эмоционально понять их); умение привлекать других людей к активному сотрудничеству, совместному анализу и решению проблем, а также конфликтологическая грамотность. В процессе подготовки и проведения тестирования можно выделить четыре основных этапа, учет особенностей которых во многом определяет успех использования этого метода:
♦ выбор тестовых методик (ознакомление с методиками и их проверка на предмет соответствия целям исследования и удобности применения);
♦ инструктирование испытуемых (разъяснение им целей и задач тестирования, порядка выполнения тестовых заданий и поведения во время их выполнения);
♦ контроль за выполнением заданий;
♦ интерпретация результатов и подведение итогов тестирования.

Еще одним непременным условием эффективности тестирования является учет особенностей различных типов тестов. По предмету исследования можно выделить три класса тестов: а) общеличностные, с помощью которых фиксируют некоторую целостность психических свойств личности (одно из направлений современной психологии личности - дифференциальная психология - целиком опирается на использование приемов психодиагностики); б) личностные - специальные тесты, предназначенные для диагностики той или иной особой черты, характеристики, свойства субъекта (например, творческих способностей, уровня общей ответственности, самоконтроля и т.п.); в) групповые, предназначенные для диагностики групповых психических процессов - уровня сплоченности групп и коллективов, особенностей группового психологического климата, межличностного восприятия, силы нормативного «давления» группы на ее членов и др.

Общие особенности психологических тестов определяются предметом изучения и спецификой применяемой техники. С точки зрения технических приемов обычно выделяют четыре разновидности тестов: а) так называемые объективные, преимущественно аппаратурные, часто психофизиологические испытания (на пример, измерение кожно-гальванического рефлекса, служащее индикатором эмоционального состояния); б) опросные методики или субъективные тесты, как, например, общеличностные тесты Г. Айзенка и Р. Кеттела (эти тесты состоят из серии взаимоконтролирующих суждений о различных проявлениях личностных черт с предложением испытуемому фиксировать наличие или отсутствие данного свойства, черты, особенности поведения); в) тес ты «с карандашом и бумагой», например, для диагностики внимания - вычеркивание определенных букв в тексте («корректорский тест» - см. приложение 1) или вычерчивание оптимального вы хода из лабиринта (оценка некоторых свойств интеллекта) и т.д.; г) тесты, основанные на экспертной оценке поведенческих проявлений испытуемых, например активно использовавшаяся советски ми психологами методика «ГОЛ» - групповой оценки личности.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

знание тестовый задание

Одним из способов быстрой проверки знаний является тестирование. Однако в настоящее время, в связи с развитием информационных технологий, дистанционного обучения и в частности адаптивных обучающих систем, тестирование может применяться как средство идентификации личности обучаемого для построения индивидуальной последовательности обучения, когда каждый обучаемый проходит учебные курсы в том порядке и в том объеме, которые наиболее соответствуют его уровню подготовленности. В технологии дистанционного обучения при отсутствии непосредственного контакта обучаемого с преподавателем тестирование становится одним из основных средств контроля знаний, поэтому особенно остро встает проблема создания качественных тестов, которые могли бы быстро, объективно и адекватно измерять уровень знаний обучаемых.

Можно различать три вида тестирования:

· предварительное;

· текущее;

· итоговое.

Предварительное тестирование применяется перед началом обучения и направлено на выявление предварительных знаний обучаемого по ряду дисциплин, которые ему предстоит изучать. Сюда же могут включаться психологические тесты для определения индивидуальных характеристик личности обучаемого, которые учитываются в ходе обучения для настройки на работу с конкретным обучаемым. По результатам предварительного тестирования строится предварительная последовательность изучения учебных курсов.

Текущее тестирование - это контроль или самоконтроль знаний по отдельному элементу учебного курса, например, разделу или теме. По его результатам строится последовательность изучения тем и разделов внутри курса, а также может осуществляться возврат к темам, которые были изучены недостаточно хорошо.

Итоговое тестирование - это контроль знаний по курсу в целом или по совокупности курсов. По его результатам корректируется последовательность изучения учебных курсов.

При работе с тестами всегда нужно учитывать надежность результатов тестирования. Под надежностью тестовых результатов понимается характеристика, показывающая точность измерения знаний заданиями теста. Нужно отметить, что речь идет не о надежности теста, а о надежности результатов тестирования, т.к. на нее сильно влияет степень однородности различных групп обучаемых, уровень их подготовленности и ряд других факторов, связанных не с самим тестом, а с условиями проведения процесса тестирования.

1. Классификация тестов, методы тестирования, достоинства и недостатки тестовой проверки знаний студентов

1.1 Тестирование как метод исследования

Тестирование (англ. test - испытание, проверка) - экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида .

Возникновение тестологических процедур было обусловлено потребностью сопоставления (сравнения, дифференциации и ранжирования) индивидов по уровню развития или степени выраженности различных психологических качеств.

Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку индивида в соответствии с поставленной целью исследования; обеспечивают возможность получения количественной оценки на основе квантификации качественных параметров личности и удобство математической обработки; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют объективности оценок, не зависящих от субъективных установок лица, проводящего исследование; обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

К тестам предъявляют следующие требования:

Строгая формализация всех этапов тестирования;

Стандартизация заданий и условий их выполнения;

Квантификация полученных результатов и их структурирование по заданной программе;

Интерпретации результатов на основе предварительно полученного распределения по изучаемому признаку.

Каждый тест, соответствующий критериям надежности, кроме набора заданий включает в себя следующие компоненты:

1) стандартная инструкция для испытуемого о цели и правилах выполнения заданий;

2) ключ шкалирования - соотнесение пунктов заданий со шкалами измеряемых качеств, указывающее, какой пункт заданий к какой шкале относится;

4) ключ интерпретации полученного индекса, представляющий собой данные нормы, с которыми соотносится полученный результат .

Традиционно нормой в тестологии являлись среднестатистические данные, полученные в результате предварительного тестирования на определенной группе лиц. Здесь необходимо учитывать, что переносить интерпретацию полученных результатов можно только на такие группы испытуемых, которые по своим основным социокультурным и демографическим признакам аналогичны базовой.

Для преодоления основного недостатка большинства тестов применяются различные приемы:

1) увеличение базовой выборки с целью повышения ее репрезентативности по большему числу параметров;

2) введение поправочных коэффициентов с учетом характеристик выборки;

3)введение в практику тестирования невербального способа предъявления материала.

Тест состоит из двух частей:

а) стимулирующего материала (задача, инструкция или вопрос);

б) указаний относительно регистрации или интеграции полученных ответов.

Тесты классифицируются по разным признакам.

По виду свойств личности они делятся на тесты достижений и личностные. К первым относятся тесты интеллекта, школьной успеваемости, тесты на творчество, тесты на способности, сенсорные и моторные тесты. Ко вторым - тесты на установки, на интересы, на темперамент, характерологические тесты, мотивационные тесты. Однако не все тесты (например, тесты развития, графические тесты) можно упорядочить по данному признаку. По виду инструкции и способу применения различаются индивидуальные и групповые тесты. При групповом тестировании одновременно обследуется группа испытуемых. Если в тестах уровня временных ограничений нет, то в тестах на скорость они обязательны. В зависимости от того, насколько в результате тестирования проявляется субъективность исследователя, различают тесты объективные и субъективные.

К объективным тестам относится большинство тестов достижений и психофизиологические тесты. К субъективным - проективные тесты. Это деление в определенной степени совпадает с делением на прямые и непрямые тесты, которые различаются в зависимости от того, знают или не знают испытуемые значение и цель теста.

По формальной структуре различаются тесты простые, т.е. элементарные, результатом которых может быть единственный ответ, и тесты сложные, состоящие из отдельных подтестов, по каждому из которых должна быть дана оценка. При этом могут высчитываться и общие оценки. Комплекс нескольких единичных тестов называют тестовой батареей, графическое изображение результатов по каждому подтесту - тестовым профилем. Нередко к тестам относят опросники, удовлетворяющие ряду требований, предъявляемых обычно к данному методу сбора психологической или социологической информации.

В последнее время все большее распространение получают критериально-ориентированные тесты, позволяющие оценивать испытуемого не в сопоставлении со среднестатистическими данными популяции, а по отношению к заранее заданной норме. Критерием оценки в таких тестах является степень приближения результата тестирования индивида к так называемой «идеальной норме» .

Разработка теста состоит из четырех этапов.

1) на первом этапе развивается исходная концепция с формулировкой основных пунктов испытания или основных вопросов, носящих предварительный характер;

2) на втором производится отбор предварительных пунктов испытания с последующей селекцией и приведением к окончательному виду, осуществляется одновременно оценка по качественным критериям надежности и валидности;

3) на третьем этапе тест проверяется повторно на той же самой популяции;

4) на четвертом калибруется по отношению к возрасту, уровню образования и другим признакам популяции.

На всех этапах разработки теста необходимо учитывать:

а) диагностируемое свойство личности (размер, положение, индикатор) или только наблюдаемые его проявления (способности, уровень знаний, темперамент, интересы, установки);

б) связанную с этим валидизацию метода, т.е. определение того, насколько он измеряет требуемое свойство;

в) величину выборки из популяции, на которой должна проводиться оценка метода;

г) стимулирующий материал (таблички, изображения, игрушки, фильмы);

д) влияние исследователя в процессе инструктирования, постановки задач, разъяснений, ответов на вопросы;

е) условия ситуации;

ж) такие формы поведения испытуемого, которые свидетельствуют об измеряемом свойстве;

з) шкалиpование релевантных форм поведения;

и) сведение результатов по отдельным измеряемым пунктам в общие значения (суммирование ответов типа «Да»);

к) формулировку результатов в нормированной шкале оценок.

Одним из вариантов теста может быть опросник, но при условии, что он отвечает требованиям, предъявляемым к тестам.

Опросник - это сборник вопросов, которые выбираются и располагаются по отношению друг к другу в соответствии с требуемым содержанием. Опросники используются, например, в целях психодиагностики, когда от испытуемого требуется самооценка его поведения, привычек, мнений и т.д. При этом испытуемый, отвечая на вопросы, выражает свои положительные и отрицательные предпочтения. С помощью опросников можно измерять у испытуемых и оценки ими других людей. Задание обычно выступает, как прямая реакция на вопросы, на которые надо ответить путем сожаления или опровержения. Возможности для ответа в большинстве случаев заданы и требуют лишь отметки в виде крестика, кружочка и т.п. Недостаток опросника состоит в том, что испытуемый может симулировать или диссимулировать те или иные свойства личности. Преодолеть указанный недостаток (хотя и не полностью) исследователь может посредством контрольных вопросов, контрольных шкал, шкал «лжи». Опросники применяются преимущественно для диагностики характера, диагностики личности (экстраверсии - интроверсии, интересов, установок, мотивов).

Диагностика личности - совокупность методов, позволяющих распознать ее внеинтеллектуальные свойства, носящие характер относительно устойчивых диспозиций.

На современном этапе в прикладной социологии чаще всего используются тестовые методики, заимствованные из социальной психологии, касающиеся изучения качеств личности. Появляются тесты, специально разработанные социологами. Эти тесты часто используются в социологических анкетах.

1.2 Достоинства и недостатки тес товой проверки знаний студентов

В системе высшего образования применение тестирования знаний студентов имеет свои предпосылки. Поэтому тестирование имеет как достоинства, так и недостатки которые будут рассмотрены ниже.

В качестве достоинств можно отметить следующее:

1. Тестирование является более качественным и объективным способом оценивания. Для заочного обучения в условиях предельного ограничения количества аудиторных часов тестирование часто является единственной возможностью формирования достаточно объективной оценки знаний студентов.

2. Тестирование - более справедливый метод, оно ставит всех студентов в равные условия, как в процессе контроля, так и в процессе оценки, исключая субъективизм преподавателя.

3. Тесты это более объёмный инструмент, поскольку позволяет установить уровень знаний студента по предмету в целом, чем при выполнении контрольной работы.

4. Тестирование существенно экономит время преподавателя, отводимое на контроль знаний студентов, по сравнению с проверкой и защитой контрольных работ студентами заочной форме обучения. Это связано с тем, что тестированию одновременно подвергается сразу группа студентов.

Однако тестирование имеет также некоторые недостатки:

1. Жесткие временные ограничения, применяемые при выполнении тестовых заданий, исключают возможности определить структуру и уровень подготовленности тех испытуемых, которые в силу своих психофизиологических особенностей думают и делают все медленно, но при этом качественно.

2. Данные, получаемые преподавателем в результате тестирования, хотя и включают в себя информацию о пробелах в знаниях по конкретным разделам, но не позволяют судить о причинах этих пробелов.

3. Обеспечение объективности и справедливости теста требует принятия специальных мер по обеспечению конфиденциальности тестовых заданий. При повторном применении теста желательно внесение в задания изменений.

4. В тестировании присутствует элемент случайности и интуиции. Причиной этого может быть угадывание ответа студентом, поэтому при разработке теста необходимо предвидеть такую ситуацию .

2 . Модели тестирования

Остановимся на основных моделях тестирования.

Классическая модель. Данная модель является самой первой и самой простой. Имеется n заданий по определенной области знаний, по нескольким областям знаний или части области знаний (разделу, теме и т.п.). Из этого множества заданий случайным образом выбирается k заданий (k

Достоинство:

Простота реализации.

Недостатки:

Из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных;

Оценка зависит только от количества правильных ответов и не учитывает сложность заданий.

Классическая модель из-за своих недостатков имеет самую низкую надежность, т.к. отсутствие учета параметров заданий часто не позволяет объективно оценить знания обучаемого.

В настоящее время происходит уход от использования данной модели к более совершенным и эффективным моделям, например, к адаптивному тестированию.

Классическая модель с учетом сложности заданий. Это тестирование проводится аналогично предыдущему, однако каждое задание имеет определенный уровень сложности Ti, i= и при подсчете результата тестирования учитывается сложность вопросов, на которые обучаемый дал правильный ответ. Чем выше сложность вопроса, тем выше будет результат тестирования. Для вопросов, на которые был дан неправильный ответ, сложность не учитывается.

Недостаток: из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных.

Модели с учетом сложности заданий позволяют более адекватно подойти к оценке знаний. Но случайность выбора заданий не позволяет добиться параллельности тестов по сложности, т.е. одинаковости суммарных характеристик сложности заданий, что снижает надежность тестирования.

Модель с возрастающей сложностью. Имеется m уровней сложности. В тесте должны присутствовать задания всех уровней сложности. Из этого множества заданий случайным образом выбирается k заданий (k

Результат тестирования определяется аналогично модели с учетом сложности.

Данная модель обеспечивает параллельность тестов по сложности, т.е. надежность результатов тестирования еще выше, чем в предыдущих моделях.

Модель с разделением заданий по уровням усвоения.

Различают пять уровней усвоения учебного материала.

Нулевой уровень (Понимание) - это такой уровень, при котором обучаемый способен понимать, т.е. осмысленно воспринимать новую для него информацию. Фактически речь идет о предшествующей подготовке обучаемого .

Первый уровень (Опознание) - это узнавание изучаемых объектов при повторном восприятии ранее усвоенной информации о них или действиях с ними, например, выделение изучаемого объекта из ряда предъявленных объектов.

Второй уровень (Воспроизведение) - это воспроизведение усвоенных ранее знаний от буквальной копии до применения в типовых ситуациях. Примеры: воспроизведение информации по памяти, решение типовых задач по образцу.

Третий уровень (Применение) - это такой уровень усвоения информации, при котором обучаемый способен самостоятельно воспроизводить и преобразовывать усвоенную информацию для обсуждения известных объектов и применения ее в нетиповых ситуациях. При этом обучаемый способен генерировать новую для него информацию об изучаемых объектах. Примеры: решение нетиповых задач, выбор подходящего алгоритма из набора ранее изученных алгоритмов для решения конкретной задачи.

Четвертый уровень (Творческая деятельность) - это такой уровень владения учебным материалом темы, при котором обучаемый способен создавать новую информацию, ранее неизвестную никому. Пример: разработка нового алгоритма решения задачи.

Уровень представления обозначается a и может меняться от 0 до 4.

Задания составляются для каждого из пяти уровней. Сначала проводится тестирование с использованием заданий по уровню 0, затем по уровню 1, 2 и т.д. Перед переходом с уровня на уровень вычисляется степень владения учебным материалом на данном уровне и определяется возможность перехода на следующий уровень.

Для измерения степени владения учебным материалом на каждом уровне используют коэффициент:

где P 1 - количество правильно выполненных существенных операций в процессе тестирования;

Р 2 - общее количество существенных операций в тесте.

Под существенными операциями понимают те операции, которые выполняются на проверяемом уровне a. Операции, принадлежащие к более низким уровням, в число существенных не входят.

Исходя из этого: 0 ? К б? 1.

Таким образом, уровень усвоения учебного материала может быть использован для оценивания качества знаний у обучаемого и выставления оценки. Рекомендуются следующие критерии для выставления оценки:

К б < 0,7 Неудовлетворительно

0,7 ? К б <0,8Удовлетворительно

0,8 ? К б <0,9Хорошо

К б? 0,9 Отлично

При К б < 0,7 следует продолжать процесс обучения на том же уровне.

Модель с учетом времени ответа на задание. В данной модели при определении результата тестирования учитывается время ответа на каждое задание. Это делается для того, чтобы учесть возможность несамостоятельного ответа на задания: обучаемый может долго искать ответ в учебнике или других источниках, но в итоге его оценка все равно будет низкой, даже если на все вопросы он ответил правильно. С другой стороны, если он не пользовался подсказками, а долго думал над ответами, это означает, что он недостаточно хорошо изучил теорию, а в результате даже при правильных ответах оценка будет снижена.

Учет времени ответа может производиться, например, по формулам.

Результат ответа на i-е задание теста:

знание тестовый задание

Если R i > 1, то R i =1.

Если R i < 0, то R i =0.

где: t отв - время ответа на задание,

t max - время, в течение которого уменьшение оценки не происходит.

t max установлено для того, чтобы обучаемый имел возможность прочитать вопрос и варианты ответов, осмыслить их и выбрать правильный, по его мнению, ответ. Параметр t max может задаваться как константа для всех заданий теста или вычисляться для каждого отдельно взятого задания в зависимости от его сложности, т.е. t 2 max =f(T i), т.к. логично предположить, что для ответа на сложное задание требуется больше времени, чем на простое задание. Другая возможная зависимость параметра t max - от индивидуальных способностей обучаемого, которые должны быть определены ранее.

Результат тестирования:

Модели с учетом времени ответа на задание также позволяют повысить надежность результатов тестирования, особенно в сочетании с моделью с учетом сложности заданий.

Модель с ограничением времени на тест. Для оценки результатов тестирования берутся только те задания, на которые успел ответить обучаемый за данное время.

В настоящее время данная модель используется достаточно широко.

В некоторых работах рекомендуется обязательно сортировать задания по возрастанию сложности и устанавливать такое время тестирования, за которое на все задания теста не сможет ответить ни один, даже самый сильный обучаемый. Такой подход предлагается применять при тестировании на бланках, когда обучаемых видит перед собой сразу все задания. Суть его в том, что когда обучаемый ответит на все задания, а время у него еще останется, он может начать проверять свои ответы, сомневаться, а в итоге может исправить правильные ответы на неправильные. Поэтому рекомендуется или ограничивать время на тест или забирать бланк сразу после ответа на все задания теста.

Адаптивная модель. Данная модель является продолжением классической модели с учетом сложности заданий.

Адаптивным называется тест, в котором сложность заданий меняется в зависимости от правильности ответов испытуемого. Если обучаемый правильно отвечает на тестовые задания, сложность последующих заданий повышается, если неправильно - понижается. Также есть возможность задания дополнительных вопросов по темам, которые обучаемый знает не очень хорошо для более тонкого выяснения уровня знаний в данных областях. Таким образом, можно сказать, что адаптивная модель напоминает преподавателя на экзамене - если обучаемый отвечает на задаваемые вопросы уверенно и правильно, преподаватель достаточно быстро ставит ему положительную оценку. Если обучаемый начинает «плавать», то преподаватель задает ему дополнительные или наводящие вопросы того же уровня сложности или по той же теме. И, наконец, если обучаемый с самого начала отвечает плохо, оценку преподаватель тоже ставит достаточно быстро, но отрицательную.

Данная модель применяется для тестирования обучаемых с помощью компьютера, т.к. на бумажном бланке невозможно заранее разместить столько вопросов и в том порядке, сколько и в котором они должны быть предъявлены обучаемому.

Тестирование обычно начинается с заданий средней сложности, но можно начинать и с легких заданий, т.е. идти по принципу повышения сложности.

Тестирование заканчивается, когда обучаемый выходит на некоторый постоянный уровень сложности, например, отвечает подряд на некоторое критическое количество вопросов одного уровня сложности.

Достоинства:

1) позволяет более гибко и точно измерять знания обучаемых;

2) позволяет измерять знания меньшим количеством заданий, чем в классической модели;

3) выявляет темы, которые обучаемый знает плохо и позволяет задать по ним ряд дополнительных вопросов.

Недостатки:

1) заранее неизвестно, сколько вопросов необходимо задать обучаемому, чтобы определить его уровень знаний. Если вопросов, заложенных в систему тестирования, оказывается недостаточно, можно прервать тестирование и оценивать результат по тому количеству вопросов, на которое ответил обучаемый;

2) возможно применение только на ЭВМ.

Надежность результатов тестирования в данном случае самая высокая, т.к. осуществляется приспособление под уровень знаний конкретного обучаемого, что обеспечивает более высокую точность измерений.

Возможный алгоритм адаптивной модели тестирования. Данный алгоритм является достаточно простым и позволяет варьировать только уровень сложности, не учитывая статистику ответов на предыдущие вопросы. На каждом шаге тестирования по каждому уровню сложности обучаемому дается два задания, и по результатам ответов на них определяется уровень сложности для следующих заданий. Данное количество заданий (два) позволяют более адекватно оценивать уровень знаний, чем одно задание, на которое обучаемый может отгадать или случайно забыть ответ, и в то же время не дает большого количества сочетаний вариантов ответов, как в случае трех и тем более большего количества заданий.

Пусть имеется m уровней сложности. Вводится коэффициент k r =100/m.

Обозначим t - текущий уровень знаний обучаемого, t н - нижний уровень знаний, t в - верхний уровень знаний. Все уровни знаний будем измерять от 0 до 100 (0 - нет знаний, 100 - абсолютное знание) .

1. Установить t = 50; t н = 0; t в = 100.

2. Вычислить текущий уровень сложности T=t/k r .

3. Выдать два задания сложности T. Пусть k пр - количество правильных ответов, k пр?.

4. Пересчет уровня знаний:

· если k пр = 2, то t н = t; t в = t в + 0.5t. Если t в > 100, то t в = 100;

· если k пр = 1, то t н = t н / 4; t в = t в + 0.1t. Если t в > 100, то t в = 100;

· если k пр = 0, то t н = t н / 2; t в = t.

5. Если |t-t 1 |<е, то уровень знаний равен t 1 , выход.

6. Перейти к шагу (2).

е устанавливается исходя из необходимой точности оценки знаний. Однако с уменьшением е возрастает число вопросов, необходимых для включения в тест.

Модель тестирования по сценарию. Данная модель также является продолжением классической модели. Данная модель реализуется в системе Дистанционного Асинхронного Обучения, разрабатываемой в Татарском Институте Содействия Бизнесу (ТИСБИ) .

Существенным недостатком классической модели является непараллельность тестов для различных обучаемых, т. к. нельзя заранее определить, какие задания по сложности и по каким темам достанутся обучаемому. Поэтому при сценарном тестировании преподаватель перед тестированием формирует сценарий тестирования, где может указывать:

· количество заданий по каждой теме, которые должны быть включено в тест;

· количество заданий каждого уровня сложности, которые должны быть включено в тест;

· количество заданий каждой формы, которые должны быть включено в тест»;

· время прохождения теста

· и другие параметры.

Сценарий может создаваться по любому объему учебного материала: разделу, предмету, специальности и т.д.

Существует четыре формы тестовых заданий:

1. Задания с выбором, которые делятся на 3 подгруппы: задания с выбором одного правильного ответа или одновариантные задания, задания с выбором нескольких правильных ответов или многовариантные задания, задания с выбором наиболее правильного ответа.

2. Открытые задания.

3. Задания на установление соответствия.

4. Задания на установление правильной последовательности.

Непосредственно при тестировании выборка заданий каждого уровня сложности, по каждой теме, каждой формы и т.д. производится случайным образом из общей базы заданий, поэтому каждый обучаемый получает свои задания. Получаемые тесты для всех обучаемых являются параллельными, т.е. имеют одинаковое число заданий и одинаковую суммарную сложность. Но в отличие от модели с возрастанием сложности, которая также обеспечивает параллельность, здесь разработчик теста решает сам, сколько и каких заданий должно быть предъявлено по каждой теме, следовательно, обеспечиваются абсолютно одинаковые условия тестирования для всех обучаемых.

По сравнению с адаптивной моделью данная модель является менее эффективной, т.к. не настраивается под индивидуальные особенности каждого обучаемого, однако имеет преимущество психологического характера: при тестировании по адаптивной модели обучаемые отвечают на разное количество вопросов и как будто бы находятся в разных условиях. В случае тестирования по сценарию все обучаемые получают одинаковое количество вопросов по каждой теме и по каждому уровню сложности.

Надежность результатов тестирования сопоставима с надежностью, получаемой при тестировании с возрастанием сложности.

Модель на нечеткой математике. Цель введения нечеткой математики - попытка математической формализации нечетких, качественных явлений и объектов с размытыми границами, встречающихся в реальном мире. Нечеткое управление оказывается особенно полезным, когда описываемые процессы являются слишком сложными для анализа с помощью общепринятых количественных методов или когда доступные источники информации интерпретируются качественно, неточно или неопределенно. Экспериментально показано, что нечеткое управление дает лучшие результаты по сравнению с получаемым при общепринятых алгоритмах управления. Нечеткая логика, на которой основано нечеткое управление, ближе по духу к человеческому мышлению и естественным языкам, чем традиционные логические системы. Нечеткая логика, в основном, обеспечивает эффективные средства отображения неопределенностей и неточностей реального мира. Наличие математических средств отражения нечеткости исходной информации позволяет построить модель, адекватную реальности .

Данная модель тестирования является развитием любой предыдущей модели, в которой вместо четких характеристик тестовых заданий и ответов используются их нечеткие аналоги. Примерами могут служить:

Сложность задания («легкое», «среднее», «выше среднего», «сложное» и т.п.);

Правильность ответа («правильно», «частично правильно», «скорее неправильно», «неправильно» и т.п.);

Время ответа («маленькое», «среднее», «большое», «очень большое» и т.п.);

Процент правильных ответов («маленький», «средний», «большой», «очень большой» и т.п.);

Итоговая оценка;

Введение нечетких характеристик может помочь преподавателям разрабатывать тесты. Например, преподаватель может достаточно быстро определить, является ли задание сложным или нет. Но сказать точно, насколько оно сложно, например, по 100-бальной шкале или точно оценить разницу сложностей двух заданий будет для него достаточно трудно. С точки зрения обучаемого нечеткая оценка его знаний в виде «хорошо», «отлично», «не очень хорошо» и т.п. более понятна ему, чем четкое количество баллов, которое он набрал в результате тестирования.

Модели могут быть комбинированными, например:

Классическая модель с учетом сложности заданий и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с ограничением времени на тест;

Модель с учетом времени ответа на задание и адаптивная модель;

Модель с учетом времени ответа на задание и модель на нечеткой математике;

Модель с разделением заданий по уровням усвоения и модель с учетом сложности заданий;

3 . Разработка тестовых заданий

3.1 Создание компьютерного тестирования

Компьютерный тест - инструмент, предназначенный для измерения обученности учащегося, состоящий из системы тестовых заданий в электронном виде, определённой процедуры проведения, обработки и анализа результатов. Компьютерный тест формируется программным способом из электронного банка тестовых заданий в соответствии со спецификацией (планом, паспортом теста).

Систематическая проверка знаний большого числа проверяемых приводит к необходимости автоматизации проведения тестирования знаний, использованию компьютерной техники и соответствующих программ проверки знаний.

Компьютерное тестирование как эффективный способ проверки знаний находит в образовании все большее применение. Одним из его достоинств является минимум временных затрат на получение надежных итогов контроля, и получение результатов практически сразу по завершении контролирующего теста. От традиционных оценок и контроля знаний - тесты отличаются объективностью измерения результатов обучения, поскольку они ориентируются не на субъективное мнение преподавателей, а на объективные критерии.

Главные требования к системе компьютерного контроля заключаются в том, что:

Тестовые вопросы и варианты ответов на них должны быть четкими и понятными по содержанию;

Компьютерный тест должен быть простым в использовании;

Тестовых вопросов должно быть настолько много, чтобы совокупность этих вопросов охватывала весь материал, который обучающийся должен усвоить;

Вопросы должны подаваться испытуемому в случайном порядке, чтобы исключить возможность механического запоминания их последовательности;

Варианты возможных ответов должны следовать так же в случайном порядке;

Необходимо проводить учет времени, затраченного на ответы, и ограничивать это время.

Был создан тест для проверки знаний студентов физического факультета по дисциплине специализации «Допуски, посадки и технические измерения». Опрос в форме тестирования проводится в течение 15 минут и включает в себя 15 вопросов, которые последовательно предъявляются студенту в автоматизированном режиме. Во время тестирования на экране монитора располагается только одно тестовое задание.

Каждый студент имеет право пройти тест только один раз. По истечении 15 минут компьютерная программа автоматически завершает процедуру тестирования и выдает на экран монитора итоговый результат.

Во время тестирования переговоры между студентами не разрешаются. С вопросами, не касающимися содержания учебного материала, следует обращаться к преподавателю или администратору компьютерного класса, предварительно подняв руку, чтобы не отвлекать других испытуемых во время тестирования.

Наличие учебных и справочных материалов во время сеанса тестирования не допускается. Выходить из компьютерного класса во время сеанса тестирования не разрешается.

Для компьютерного тестирования была использована программа «Краб 2», в которой случайным образом из 50 вопросов выбирается 15 и предлагаются студенту. На каждый вопрос дается по 4 варианта ответа. Правильными может быть от одного до трёх ответов.

Рисунок 1 - Пример вопроса с одним правильным ответом

Рисунок 2 - Пример вопроса с несколькими правильными ответами

При тестировании допускается пропускание вопроса, возвращение к предыдущему вопросу, а также своевременное завершение теста. Результат тестирования выводится на экран при завершении теста. Указывается количество правильных, неправильных и пропущенных ответов. По завершению теста можно посмотреть все задания, на который студент дал неверный ответ.

Рисунок 3 - Результат тестирования

3.2 Тестовые задания

1. Качество изделия следует рассматривать:

a. на протяжении всего «жизненного цикла»;

b. на этапе изготовления;

c. на этапе эксплуатации;

d. нет правильного ответа

2. Термин, условно применяемый для обозначения наружных элементов деталей, включая и нецилиндрические элементы:

a. отверстие;

b. вал;

d. шарнир.

3. Размер элемента, установленный измерением:

a. наименьший предельный размер;

b. номинальный;

c. предельный размер;

d. действительный размер.

Какая схема изображена на представленном рисунке

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

4. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

5. Какая схема изображена на представленном рисунке:

a. схемы посадок в системы основного отверстия;

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

c. поля допусков с разными основными отклонениями и уровнями относительной точности;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

6. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

a. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

c. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

7. Какие калибры обеспечивают контроль по наибольшему и наименьшему придельным значениям параметров:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

8. Калибры, предназначенные для контроля деталей в процессе их изготовления:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

9. Калибры, предназначенные для контроля рабочих калибров-скоб:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

10. Допуск формы - это:

a. нормативные ограничения отклонения формы назначенными полями допусков;

b. характеристики любой реальной поверхности;

c. прямолинейность осей поверхности вращения;

d. прямолинейность цилиндра и конуса.

11. Какие виды взаимозаменяемости различают:

a. функциональная;

b. алгебраическая;

c. геометрическая;

d. полная.

12. К суммарным отклонениям формы и расположения относятся:

a. торцовое биение;

b. заданное биение;

c. радиальное биение;

d. нормальное биение.

13. Условный знак допуска плоскости выглядит:

a. ;

14. Условный знак допуска формы заданной поверхности:

c. ;

15. По каким классам точности установлены общие допуски размеров:

a. последний, средний;

b. нормальный, точный;

c. точный, средний;

d. грубый, очень грубый.

16. Какое обозначение имеет шариковый радиальный подшипник:

a. 0;

17. Какое обозначение имеет шариковый радиальный сферический подшипник:

b. 1;

18. Какое обозначение имеет роликовый радиальный с витыми роликами подшипник:

d. 5.

19. Какое обозначение имеет шариковый радиально-упорный подшипник:

c. 6;

20. Основными достоинствами резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

21. Основными недостатками резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

22. Для метрических резьб стандартизированы:

a. профиль резьбы;

b. номинальные диаметры и шаги;

c. нормы точности;

d. нет правильного ответа.

23. В зависимости, от каких характеристик функционирования различают резьбовые соединения:

a. неподвижные;

b. подвижные;

c. стандартные;

d. нестандартные.

24. Качество измерений, отражающее близость к нулю систематических погрешностей и их результат:

a. правильность измерений;

b. сходимость измерений;

d. нормальность измерений.

25. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в одинаковых условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

26. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в различных условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

27. Какой взаимозаменяемости полная взаимозаменяемость предполагает наличие:

a. полная;

b. неполная;

c. начальная;

d. конечная.

28. Предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

29. Действительный размер это:

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

30. Номинальный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

31. Наибольший предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

32. Действительное отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

33. Предельное отклонение это:

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

34. Верхнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

35. Нижнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

36. Основное отклонение это:

a. одно из двух предельных отклонений определяющее положение поля допуска относительно нулевой линии;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

37. Квалитет - это:

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

38. Допуск - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

d. отверстие, нижнее отклонение которого равно нулю.

39. Поле допуска - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

d. отверстие, нижнее отклонение которого равно нулю.

40. Основное отверстие - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

d. отверстие, нижнее отклонение которого равно нулю.

41. Характер соединения двух деталей, определяемый разностью их размеров до сборки:

a. допуск;

b. посадка;

42. Разность между размерами отверстия и вала до сборки, если размер отверстия больше размера вала:

a. допуск;

b. посадка;

c. зазор;

43. Разность между размерами вала и отверстия до сборки, если размер вала больше размера отверстия:

a. допуск;

b. посадка;

d. натяг.

44. Разность между наибольшим и наименьшим предельными размерами или алгебраическая разность между верхним и нижним отклонениями:

a. допуск;

b. посадка;

45. Наименьший зазор - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

46. Наибольший зазор - это:

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

47. Посадка с натягом - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке.

48. Наименьший натяг - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наименьший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наименьшим предельным размером вала и наибольшим предельным размером отверстия до сборки в посадке с натягом.

49. Наибольший натяг - это:

a. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке;

b. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

c. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

d. разность между наименьшим предельным размером вала и наибольшим предельным размером отверстия до сборки в посадке с натягом.

Заключение

Тестирование является одним из основных видов проверки знаний, как во время вступительной комиссии в высшее учебное заведение, так и в процессе обучения. Этот метод проверки знаний позволяет давать оценку беспристрастно, системно, объективно и достаточно быстро, исключая субъективные особенности экзаменатора.

В курсовой работе были рассмотрены основные модели тестовых заданий (классический, адаптивный, с учетом времени, с учетом сложности), их достоинства и недостатки. Так же было разработано компьютерное тестирование для проверки знаний у студентов физического факультета по темам: «Допуски, посадки и технические измерения».

Тестовые задания познавательны для обучающихся, они способствуют развитию интереса к предмету и повышают качество знаний. Обучающиеся с разным уровнем подготовки чувствуют себя психологически комфортно при проведении теста. Тестовые задания способствуют развитию мышления, учат сопоставлять и сравнивать, анализировать и делать выводы, планировать дальнейшую деятельность.

На основе материала данной курсовой работы можно сказать, что использование тестов для проверки знаний студентов является надежным и перспективным методом и может широко использоваться и в дальнейшем.

Список использованных источников

знание тестовый задание

1. Социологический справочник / под ред. В.И. Воловича. - Киев, 1990. - 379 с.

2. Социологический словарь / сост.: А.Н. Елсуков, К.В. Шульга. - Мн., 1991. - 528 с.

3. Фонд времени и мероприятия в социальной сфере / под ред. В.Д. Патрушева. - М.: Наука, 1989. - 176 с.

4. Беспалько, В.П. Системно-методическое обеспечение учебно-воспитательного процесса подготовки специалистов / В.П. Беспалько, Ю.Г. Татур - М.: «Высшая школа», 1989. - 144 с.

6. Глова, В.И. Мягкие вычисления (soft computing) и их приложения / В.И. Глова, И.В. Аникин, М.А. Аджели. - Казань: 2000. - 98 с.

Подобные документы

    История возникновения тестирования. Понятие теста, тестовых заданий. Классификация тестов, основные формы тестирования. Закрытые и открытые тестовые задания. Задания на соответствие и установление правильной последовательности. Анализ систем тестирования.

    презентация , добавлен 07.04.2014

    Особенности организации тестирования знаний. Рекомендации по использованию тестовых заданий на разных этапах обучения и в различных видах занятий, оценка их результатов. Анализ роли и места тестовых заданий по истории в проверке знаний и умений учащихся.

    курсовая работа , добавлен 30.08.2010

    Значение проверки знаний учащихся по биологии. Классификация тестовых заданий. Основные формы и методы проверки знаний и умений учащихся. Использование тестовых заданий для текущей и итоговой проверки. Обучение учащихся работе с тестовыми заданиями.

    курсовая работа , добавлен 17.03.2010

    Педагогическое тестирование в России и за рубежом. Исторические предпосылки современного тестирования в отечественном образовании. Классификация видов педагогических тестов, предтестовых заданий и требования к ним. Инновационные формы тестовых заданий.

    курсовая работа , добавлен 28.10.2008

    Использование электронных систем управления обучением. Формирование банка тестовых заданий всех основных форм. Матрица результатов тестовых заданий. Индекс легкости заданий для тестируемой группы. Средства анализа результатов тестовых заданий системы.

    реферат , добавлен 31.03.2011

    Цель проведения и методы оценочной процедуры. Составление контрольно-измерительных материалов для итоговой аттестации по технической механике. Структуризация банка заданий. Оценка результатов тестирования. Экспертиза и апробация банка тестовых заданий.

    дипломная работа , добавлен 25.05.2014

    Качественные экспертно-ориентированные методы оценки знаний и умений учащихся. Цель и основные задачи тестирования. Основные виды тестовых заданий. Функции теста и основные этапы его разработки. Сквозное применение педагогами метода тестирования.

    курсовая работа , добавлен 27.12.2011

    История проверки знаний и способностей с помощью различных заданий. Опыт централизованного абитуриентского и репетиционного тестирования в России. Тесты в американской системе образования. Характерные черты тестовых методов, используемых в Америке.

    реферат , добавлен 05.02.2008

    Методологические основы создания тестовых заданий, их особенности, класификация, критерии качества, экспертиза. Проверка в тестовых заданиях законов сохранения энергии, сохранения импульса и сохранения момента импульса.

    дипломная работа , добавлен 29.07.2011

    Теоретико-методические основы тестовых заданий и его видов. Психолого-педагогические основы. Тесты на уроках математики. Анализ опыта учителей по применению тестовых заданий. Краткая характеристика преимуществ использования тестовой формы контроля.

Психологическое тестирование – это метод измерения и оценки психологических характеристик человека с помощью специальных техник. Предметом тестирования могут быть любые психологические характеристики человека: психические процессы, состояния, свойства, отношения и т. п. Основой психологического тестирования является психологический тест – стандартизированная система испытаний, позволяющая обнаружить и измерить качественные и количественные индивидуально-психологические различия.

Изначально тестирование рассматривалось как разновидность эксперимента. Однако к настоящему времени специфика и самостоятельное значение тестирования в психологии позволяют отграничить его от собственно эксперимента.

Теория и практика тестирования обобщены в самостоятельных научных дисциплинах – психологической диагностике и тестологии. Психологическая диагностика – это наука о способах выявления и измерения индивидуально-психологических и индивидуально-психофизиологических особенностей человека. Таким образом, психодиагностика является экспериментально-психологическим разделом дифференциальной психологии. Тестология – это наука о разработке, конструировании тестов.

Процесс тестирования, как правило, включает в себя три этапа:

1) выбор методики, адекватной целям и задачам тестирования;

2) собственно тестирование, т. е. сбор данных в соответствии с инструкцией;

3) сравнение полученных данных с «нормой» или между собой и вынесение оценки.

В связи с наличием двух способов вынесения оценки по тесту различают два типа психологического диагноза. Первый тип заключается в констатации наличия или отсутствия какого-либо признака. В этом случае полученные данные об индивидуальных особенностях психики тестируемого соотносятся с некоторым заданным критерием. Второй тип диагноза позволяет сравнивать нескольких тестируемых между собой и находить место каждого из них на определенной «оси» в зависимости от степени выраженности тех или иных качеств. Для этого проводится ранжирование всех обследуемых по степени представленности исследуемого показателя, вводятся высокий, средний, низкий и т. д. уровни изучаемых особенностей в данной выборке.

Строго говоря, психологический диагноз есть не только результат сравнения эмпирических данных с тестовой шкалой или между собой, но и итог квалифицированной интерпретации с учетом многих привходящих факторов (психического состояния тестируемого, его готовности к восприятию заданий и отчету о своих показателях, ситуации тестирования и пр.).

Психологические тесты особенно ярко демонстрируют связь способа исследования с методологическими воззрениями психолога. Например, в зависимости от предпочитаемой теории личности исследователь выбирает тип личностного опросника.

Использование тестов – неотъемлемая черта современной психодиагностики. Можно выделить несколько областей практического использования результатов психодиагностики: сфера обучения и воспитания, сфера профессионального отбора и профессиональной ориентации, консультативная и психотерапевтическая практика и, наконец, область экспертизы – медицинской, судебной и т. п.

6.2. Возникновение и развитие метода тестирования

Возникновение метода тестирования, как уже указывалось выше, произошло в конце XIX в. на основе развития экспериментальных методов для изучения психических явлений. Возможность количественной оценки психических явлений и сопоставления на этой основе результатов разных испытуемых между собой обусловила бурное развитие метода тестирования. Вместе с этим накапливались знания об индивидуально-психологических особенностях людей.

Дифференциально-психологическое изучение человека формировалось не только как следствие развития экспериментальной психологии. Дифференциальная психология «выросла» из задач, стоявших перед медицинской и педагогической практикой, где велика была потребность в дифференциации душевнобольных и умственно отсталых людей.

Разработка психологических тестов велась во многих странах Европы и в США. Первоначально в качестве тестов использовались обычные лабораторные эксперименты, однако смысл их применения был иным. В этих экспериментах изучались не различия в реакциях испытуемого на разные стимулы, а индивидуальные различия в реакциях испытуемого при соблюдении постоянных условий эксперимента.

В 1905 г. появился первый интеллектуальный тест, соответствующий современному пониманию тестов. По заказу министерства образования Франции французский психолог А. Бине разработал тест интеллекта для выявления умственно неполноценных детей, не способных обучаться в обычных школах. В 1907 г. этот тест был усовершенствован соотечественником А. Бине Т. Симоном и получил название шкалы умственного развития Бине – Симона. Разработанная шкала содержала 30 заданий, расположенных по степени возрастания трудности. Например, для ребенка трех лет требовалось: 1) показать свои глаза, нос, рот; 2) повторить предложение длиной до шести слов; 3) повторить по памяти два числа; 4) назвать нарисованные предметы; 5) назвать свою фамилию. Если ребенок решал все задания, ему предлагались задания более старшей возрастной ступени. Задания считались соответствующими определенной возрастной ступени, если их правильно выполняло большинство (80–90 %) детей данного возраста.

Шкала Бине – Симона в последующих редакциях (1908 и 1911 гг.) была переведена на английский и немецкий языки. В этих редакциях был расширен возрастной диапазон – до 13 лет, увеличено число задач и введено понятие умственного возраста. Умственный возраст определялся по успешности выполнения тестовых заданий следующим образом: сначала ребенку предлагались задания, соответствующие его хронологическому возрасту. Если он справлялся со всеми заданиями, ему предлагали задания следующей старшей возрастной группы. Если же он не выполнял задания своей возрастной группы, ему предлагались задания предшествующей младшей возрастной группы. Базовым умственным возрастом считался тот, все задания которого были выполнены ребенком. Если ребенок выполнял, кроме них, некоторые задания из последующего старшего возраста, то к его базовому умственному возрасту добавлялось несколько «умственных месяцев».

В 1912 г. немецким психологом В. Штерном было введено понятие коэффициента интеллекта (IQ), определяемого как отношение умственного возраста к хронологическому возрасту, выраженное в процентах.

Усовершенствование шкалы А. Бине было продолжено в Стэнфордском университете (США) под руководством американского психолога Л.М. Термена. В 1916 г. был предложен новый, стандартизированный вариант этой шкалы, которую стали называть шкалой Стэнфорд – Бине. Она имела два существенных отличия от предыдущих редакций. Во-первых, в ней использовался коэффициент интеллекта, а во-вторых, вводилось понятие статистической нормы. Для каждого возраста наиболее типичный, средний показатель выполнения теста равнялся 100, а статистическая мера разброса – стандартное отклонение – 16. Таким образом, все индивидуальные результаты в пределах от 84 до 116 считались нормальными. Если тестовый показатель был выше 116, ребенок считался одаренным, если ниже 84 – умственно отсталым. Шкала Стэнфорд – Бине имела впоследствии еще несколько редакций (1937, 1960, 1972, 1986 гг.). Вновь создаваемые интеллектуальные тесты до сих пор проверяются на валидность путем сопоставления с результатами этой шкалы.

В начале XX в. развитие тестирования определялось также запросами промышленности и армии. Создавались тесты для отбора в различных отраслях производства и сферы обслуживания (тесты Мюнстерберга для профотбора телефонисток, тесты Фридриха для отбора слесарей, тесты Гута для наборщиков и др.), а также для распределения новобранцев по родам войск (тесты «Армия Альфа» и «Армия Бета»). Это привело к появлению группового тестирования. Впоследствии армейские тесты были использованы в гражданских целях.

В первой половине XX в. появился целый ряд методик, направленных на дифференциальную диагностику различных типов патологии. Немецкий психиатр Э. Крепелин продолжил работу Ф. Гальтона над методикой свободных ассоциаций. Впоследствии ассоциативный эксперимент преобразовался в «метод незаконченных предложений», широко используемый до настоящего времени. В 1921 г. швейцарским психиатром Г. Роршахом был создан «тест чернильных пятен», являющийся одной из самых популярных проективных методик.

В 1935 г. американскими психологами Х. Морган и Г. Мюрреем был разработан тест тематической апперцепции (ТАТ), который в настоящее время имеет множество модификаций. Параллельно развивались теоретические основы конструирования тестов, совершенствовались методы математико-статистической обработки. Появились корреляционный и факторный анализ (Ч. Спирмен, Т.Л. Кили, Л.Л. Терстон и др.). Это позволяло разрабатывать принципы стандартизации тестов, что давало возможность создавать согласованные тестовые батареи. В итоге были предложены методики, построенные по факторному принципу (опросник Р. Кеттелла 16PF и др.), и новые тесты интеллекта (1936 г. – тест Дж. Равена, 1949 г. – тест Д. Векслера, 1953 г. – тест Амтхауэра). В это же время совершенствовались тесты профотбора (батарея GATB для армии США в 1957 г.) и клинические тесты (опросник MMPI в 1940-е гг.).

В 1950–1960 гг. произошли важные изменения в идеологии тестирования. Если раньше тесты были направлены на отсев, отбор, типизацию людей по различным категориям, то в 1950-1960-е гг. психодиагностика обратилась к нуждам и проблемам отдельной личности. Появилось огромное количество личностных опросников, цель которых – углубленное познание личности, выявление ее особенностей (опросники Г. Айзенка и др.).

Значительное количество тестов специальных способностей и достижений было создано по запросу со стороны промышленности и образования. В середине XX столетия появились критериально-ориентированные тесты.

В настоящее время в арсенале психологов насчитывается более десяти тысяч тестовых методик.

6.3. Классификация психологических тестов

Одна из наиболее удачных классификаций предложена американским психологом С. Розенцвейгом в 1950 г. Он разделил методы психодиагностики на три группы: субъективные, объективные и проективные.

Субъективные методы, к которым Розенцвейг отнес опросники и автобиографии, требуют от субъекта наблюдения за собой как за объектом. Объективные методы требуют исследования через наблюдение за внешним поведением. Проективные методы основываются на анализе реакций испытуемого на кажущийся личностно-нейтральным материал.

Американский психолог Г.У. Оллпорт предложил различать в психодиагностике прямые и непрямые методы. В прямых методах выводы о свойствах и отношениях испытуемого делаются исходя из его сознательного отчета, они соответствуют субъективным и объективным методам Розенцвейга. В непрямых методах выводы делаются на основании идентификаций испытуемого, они соответствуют проективным методам в классификации Розенцвейга.

В отечественной психологии принято подразделять все психодиагностические методики на два типа: методики высокого уровня формализации (формализованные) и малоформализованные методики (М.К. Акимова).

Для формализованных методик характерна жесткая регламентация процедуры обследования (точное соблюдение инструкций, строго определенные способы предъявления стимульного материала и т. д.); в них предусмотрены нормы или другие критерии оценки результатов. Эти методики позволяют собирать диагностическую информацию в относительно короткие сроки, количественно и качественно сравнивать результаты большого числа испытуемых.

Малоформализованные методики дают ценные сведения об испытуемом в тех случаях, когда изучаемые явления плохо поддаются объективизации (личностные смыслы, субъективные переживания) или чрезвычайно изменчивы (состояния, настроения). Малоформализованные методы требуют высокого профессионализма психолога, значительных затрат времени. Однако полностью противопоставлять эти типы методик не следует, так как в целом они дополняют друг друга.

Всю группу формализованных методик иногда называют тестами. Однако в данной классификации они включают в себя четыре класса методик: тесты, опросники, проективные техники и психофизиологические методики. К малоформализованным методикам относятся: наблюдение, беседа, анализ продуктов деятельности.

В контексте рассматриваемой темы обратимся к классификации С. Розенцвейга, представленной и детально рассмотренной в работе В.В. Никандрова и В.В. Новочадова.

Субъективные психодиагностические методики. При использовании субъективного диагностического подхода получение информации основано на самооценке исследуемым своего поведения и личностных особенностей. Соответственно, методики, основанные на использовании принципа самооценки, называют субъективными.

Субъективные методики в психодиагностике в основном представлены опросниками. В Словаре-справочнике по психодиагностике утверждается, что к опросникам относятся психодиагностические методики, задания которых представлены в виде вопросов. Однако такое представление заданий является лишь внешним признаком, объединяющим опросники, но вовсе не достаточным для отнесения методик к этой группе, поскольку в виде вопросов формулируются задания и интеллектуальных, и проективных тестов.

По процедуре использования опросники сближаются с анкетированием. И в том и в другом случае общение между исследователем и исследуемым опосредовано анкетой или опросником. Исследуемый сам читает предлагаемые ему вопросы и сам фиксирует свои ответы. Подобная опосредованность дает возможность проведения массового психодиагностического исследования с помощью опросников. Вместе с тем существует и ряд различий, не позволяющих рассматривать анкеты и опросники как синонимы. Определяющим является различие в направленности: в отличие от анкет, выполняющих функцию сбора информации любой направленности, опросники нацелены на выявление личностных особенностей, в силу чего в них на первый план выходит признак не технологический (получение ответов на вопросы), а целевой (измерение личностных качеств). Отсюда следуют различия в специфике исследовательских процедур анкетирования и тестирования с помощью опросника. Анкетирование обычно анонимно, тестирование с помощью опросника – персонифицировано. Анкетирование, как правило, формально, ответы респондента не приводят ни к каким непосредственным последствиям, тестирование – личностно. Анкетирование более свободно по процедуре сбора информации вплоть до рассылки анкет по почте, тестирование обычно подразумевает непосредственный контакт с тестируемым.

Таким образом, опросник – это тест для выявления индивидуально-психологических различий на основе самоописания их проявлений испытуемыми. А вопросник в строгом смысле слова – это совокупность последовательно задаваемых вопросов, закладываемая в анкету или опросник при их конструировании. Опросник, таким образом, включает инструкцию испытуемому, перечень вопросов (т. е. вопросник), ключи для обработки получаемых данных, сведения по интерпретации результатов.

По принципу построения различают опросники-анкеты и собственно опросники. К опросникам-анкетам относятся методики, несущие в себе элементы анкеты. Для них характерно включение вопросов не только закрытого, но и открытого типа. Обработка закрытых вопросов производится по соответствующим ключам и шкалам, результаты дополняются и уточняются информацией, получаемой с помощью открытых вопросов. Обычно в опросники-анкеты включаются вопросы на выявление социально-демографических показателей: сведений о поле, возрасте, образовании и т. п. Опросник-анкета может целиком состоять из открытых вопросов, причем иногда количество ответов на вопросы не ограничено. Кроме того, к опросникам-анкетам принято относить методики, предмет диагностики которых слабо связан с личностными характеристиками, даже в том случае, если такие методики имеют формальные признаки опросника (например, Мичиганский скрининг-тест алкоголизма).

По сфере преимущественного применения различают узкопрофильные опросники и опросники широкого применения (широкого профиля). Узкопрофильные опросники, в свою очередь, делятся по сфере преимущественного применения на клинические, профориентационные, сферы обучения, сферы менеджмента и работы с персоналом и др. Некоторые опросники созданы специально для вузовской и школьной психодиагностики (опросник диагностики уровня школьной тревожности Филлипса), психодиагностики в сфере менеджмента (опросники самооценки деловых и личностных качеств менеджеров различных уровней, выявления степени лояльности к фирме и т. п.). Иногда узкопрофильные опросники со временем становятся опросниками широкого профиля. Например, известный Миннесотский многопрофильный личностный опросник (MMPI) создавался как сугубо клинический, для выявления психических заболеваний. Затем благодаря созданию значительного количества дополнительных неклинических шкал он стал универсальным, одним из наиболее употребительных личностных опросников.

В зависимости от того, к какой категории относится исследуемое с помощью опросника явление, выделяют опросники состояний и опросники свойств (личностные опросники). Существуют также комплексные опросники.

Психические состояния ситуационно обусловлены и измеряются минутами, часами, сутками, очень редко – неделями или месяцами. Поэтому инструкции к опросникам состояний указывают на необходимость отвечать на вопросы (или оценивать утверждения) в соответствии с актуальными (а не типичными) переживаниями, отношениями, настроениями. Довольно часто опросники состояний используются для оценки эффективности коррекционных воздействий, когда диагностируются состояния до и после сеанса воздействия или до и после серии сеансов (например, опросник САН, позволяющий оценить состояние по трем параметрам: самочувствие, активность, настроение).

Психические свойства представляют собой более устойчивые явления, чем состояния. На их выявление направлены многочисленные личностные опросники. Комплексные опросники сочетают в себе признаки опросника состояний и опросника свойств. В подобном случае диагностическая информация является более полной, поскольку состояние диагностируется на определенном фоне личностных свойств, облегчающих или затрудняющих возникновение состояния. Например, опросник Спилбергера – Ханина содержит шкалу реактивной тревожности (с помощью которой диагностируется тревожность как состояние) и шкалу личностной тревожности (для диагностики тревожности как личностного свойства).

В зависимости от степени охвата свойств личностные опросники делятся на реализующие принцип черт и типологические.

Опросники, реализующие принцип черт, подразделяются на одномерные и многомерные. Одномерные личностные опросники направлены на выявление наличия либо степени выраженности одного свойства. Выраженность свойства подразумевается в каком-то диапазоне от минимально до максимально возможного уровня. Поэтому такие опросники часто называют шкалами (например, шкала тревожности Ж. Тейлор). Достаточно часто опросники-шкалы используются в целях скрининга, т. е. отсеивания испытуемых по определенному диагностируемому признаку.

Многомерные личностные опросники направлены на измерение более чем одного свойства. Перечень выявляемых свойств, как правило, зависит от специфики области применения опросника и концептуальных воззрений авторов. Так, опросник Э. Шострома, созданный в рамках гуманистической психологии, направлен на выявление таких свойств, как принятие себя, спонтанность, самоуважение, самоактуализация, способность к близким контактам и т. п. Иногда многомерные опросники служат основой для создания одномерных опросников. Например, шкала тревожности Ж. Тейлор была создана на основе одной из шкал опросника MMPI. При этом на создаваемые одномерные опросники не могут автоматически переноситься показатели надежности и валидности исходных многомерных опросников. В данном случае требуется дополнительная оценка этих характеристик производных методик.

Количество шкал в многомерных опросниках имеет определенные пределы. Так, тестирование опросником 16PF Р. Кеттелла, оценивающим свойства личности по 16 параметрам и содержащим 187 вопросов, занимает от 30 до 50 мин. Опросник MMPI содержит 10 основных шкал и три контрольные шкалы. Испытуемый должен ответить на 566 вопросов. Время работы над опросником составляет 1,5–2 ч и, пожалуй, имеет предельную продолжительность. Как показывает практика, дальнейшее увеличение количества вопросов непродуктивно, поскольку ведет к росту почти в геометрической прогрессии необходимого для ответов времени, развитию усталости и монотонии и к падению мотивации испытуемых.

Типологические опросники создаются на основе выделения личностных типов – целостных образований, не сводимых к набору отдельных свойств. Описание типа дается через характеристику усредненного или, наоборот, ярко выраженного представителя типа. Указанная характеристика может содержать значительное количество личностных свойств, которое при этом не обязательно жестко лимитировано. И тогда целью тестирования будет выявление не отдельных свойств, а близости обследуемого человека к тому или иному личностному типу, что можно сделать с помощью опросника с достаточно небольшим числом вопросов.

Ярким примером типологических опросников являются методики Г. Айзенка. Широко используется его опросник EPI, созданный в 1963 г. и направленный на выявление интроверсии-экстраверсии и нейротизма (аффективной стабильности-нестабильности). Эти две личностные характеристики представлены в виде ортогональных осей и круга, в секторах которого выделяются четыре типа личности: экстравертированный нестабильный, экстравертированный стабильный, интровертированный стабильный, интровертированный нестабильный. Для описания типов Айзенком использовано порядка 50 коррелирующих между собой разноуровневых черт: свойства нервной системы, свойства темперамента, черты характера. Впоследствии Айзенк предложил сопоставить эти типы с типами темперамента по Гиппократу и И.П. Павлову, что было реализовано при адаптации опросника в 1985 г. А.Г. Шмелевым. При создании методики экспресс-диагностики характерологических особенностей подростков Т.В. Матолиным исходные типы личности по Айзенку были разбиты на 32 более дробных типа с описанием путей психолого-педагогического воздействия, что позволяет использовать опросник в работе педагога, школьного психолога, работника службы занятости.

По оцениваемой подструктуре личности выделяют: опросники темперамента, опросники характера, опросники способностей, опросники направленности личности; смешанные опросники. Опросники каждой из групп могут быть как типологическими, так и нетипологическими. Например, опросник темперамента может быть направлен на диагностику как отдельных свойств темперамента (активности, реактивности, сензитивности, эмоциональной возбудимости и т. д.), так и на диагностику типа темперамента в целом по одной из существующих типологий.

Из опросников диагностики темперамента большую популярность получили методики В.М. Русалова, Я. Стреляу и ряд других. Опросники составлены с таким расчетом, чтобы о свойствах темперамента конкретного испытуемого можно было бы судить по его описанию своих эмоциональных и поведенческих реакций в различных жизненных ситуациях. Диагностика темперамента с помощью таких опросников не требует специального оборудования, занимает сравнительно немного времени и может быть массовой по процедуре. Основной недостаток этих тестов заключается в том, что относимые к темпераменту поведенческие проявления несут на себе отпечаток не только темперамента, но и характера. Характер сглаживает реальные проявления некоторых свойств темперамента, благодаря чему они выступают в замаскированном виде (феномен «маскировки темперамента»). Поэтому опросники темперамента дают информацию не столько о темпераменте, сколько о типичных формах реагирования испытуемого в тех или иных ситуациях.

Опросники для диагностики характера также могут быть как опросниками отдельных черт, так и опросниками типа характера в целом. Примерами типологического подхода к характеру являются опросник X. Шмишека, направленный на выявление типа акцентуации характера по типологии К. Леонгарда, и опросник ПДО (патохарактерологический диагностический опросник), выявляющий тип акцентуации характера по типологии российского психиатра А.Е. Личко. В работах немецкого психиатра К. Леонгарда можно встретить термины «акцентуация характера» и «акцентуация личности». А.Е. Личко полагает, что правильнее было бы говорить об акцентуациях только характера, потому что в действительности речь идет именно об особенностях и типах характера, а не личности.

Диагностика способностей с помощью субъективных опросников проводится редко. Считается, что дать достоверную оценку своим способностям большинство людей не в состоянии. Поэтому при оценке способностей предпочтение отдается объективным тестам, где уровень развития способностей определяется на основе результативности выполнения испытуемыми заданий тестов. Однако ряд способностей, самооценка развития которых не вызывает включения механизмов психологической защиты, можно успешно измерять и с помощью субъективных тестов, например коммуникативные способности.

Диагностика направленности личности может представлять собой определение типа направленности в целом или исследование ее компонентов, т. е. потребностей, мотивов, интересов, установок, идеалов, ценностей, мировоззрения. Из них достаточно крупные группы методик составляют опросники интересов, опросники мотивов и опросники ценностей.

Наконец, если выявляемые опросником свойства принадлежат не к одной, а к нескольким подструктурам личности, говорят о смешанном опроснике. Это могут быть адаптированные зарубежные опросники, где нет традиции проводить границы между темпераментом и характером, характером и личностью в целом. Существуют и отечественные опросники, созданные с целью комплексной диагностики, например опросник «Черты характера и темперамента» (ЧХТ).

Объективные тесты. В рамках объективного подхода диагноз выносится на основании информации об особенностях выполнения деятельности и ее результативности. Эти показатели в минимальной степени зависят от представлений испытуемого о себе (в отличие от субъективных тестов) и от мнения лица, проводящего тестирование и интерпретацию (в отличие от проективных тестов).

В зависимости от предмета тестирования существует следующая классификация объективных тестов:

Тесты личности;

Тесты интеллекта (вербальные, невербальные, комплексные);

Тесты способностей (общих и специальных;)

Тесты креативности;

Тесты достижений (тесты действия, письменные, устные).

Тесты личности, как и личностные опросники, направлены на выявление личностных особенностей, однако уже не на основе самоописания этих особенностей испытуемым, а через выполнение им ряда заданий с четко структурированной, фиксированной процедурой. Например, тест замаскированных фигур (EFT) подразумевает поиск испытуемым простых черно-белых фигур внутри сложных цветных фигур. Результаты дают информацию о перцептивном стиле личности, определяющим показателем которого авторы теста считают «поле-зависимость» или «поле-независимость».

Тесты интеллекта направлены на оценку уровня интеллектуального развития. При узкой трактовке понятия «интеллект» применяются методики, позволяющие оценить только умственные (мыслительные) особенности человека, его умственный потенциал. При широком понимании категории «интеллект» применяются методики, позволяющие характеризовать в дополнение к мышлению и другие познавательные функции (память, пространственную ориентировку, речь и др.), а также внимание, воображение, эмоционально-волевой и мотивационный компоненты интеллекта.

Измерению в тестах интеллекта подлежит как понятийное (словесно-логическое), так и образное и наглядно-действенное (предметное) мышление. В первом случае задания обычно носят вербальный (речевой) характер и предлагают испытуемому установить логические отношения, выявить аналогии, произвести классификацию или провести обобщение между различными словами, обозначающими какие-либо предметы, явления, понятия. Применяются также математические задачи. Во втором случае предлагается выполнить задания невербального (неречевого) характера: операции с геометрическими фигурами, складывание картинок из разрозненных изображений, группировка графического материала и т. п.

Конечно, диада «образное мышление – понятийное мышление» не то же самое, что диада «невербальное мышление – вербальное мышление», поскольку словом обозначаются не только понятия, но и образы и конкретные предметы, а мыслительная работа с предметами и образами требует обращения к понятиям, например при классификации или обобщении невербального материала. Тем не менее в диагностической практике вербальные методики часто соотносятся с изучением вербального интеллекта, основным компонентом которого считается понятийное мышление, а невербальные методики – с изучением невербального интеллекта, основой которого выступает образное или предметное мышление.

Учитывая сказанное, было бы корректнее говорить не об изучении видов мышления или интеллекта, а о видах применяемых методик по изучению интеллекта: вербальные – невербальные методы. К первой категории относятся такие тесты, как «Простые и сложные аналогии», «Логические связи», «Отыскание закономерностей», «Сравнение понятий», «Исключение лишнего» (в вербальном варианте), школьный тест умственного развития (ШТУР). Примеры методик второй категории: «Пиктограммы», «Классификация картинок», тест «Прогрессивные матрицы» Дж. Равена и т. п.

Как правило, в современных тестах интеллекта в одной методике совмещаются и вербальные, и невербальные задания, например в тестах А. Бине, Р. Амтхауэра, Д. Векслера. Такие тесты являются комплексными. Тест Д. Векслера (WAIS), один из самых популярных, состоит из 11 субтестов: шести вербальных и пяти невербальных. Задания вербальных субтестов направлены на выявление общей осведомленности, понятливости, легкости оперирования числовым материалом, способностей к абстрагированию и классификации, задания невербальных субтестов – на изучение сенсомоторной координации, особенностей зрительного восприятия, способностей к организации фрагментов в логическое целое и т. д. По результатам выполнения заданий вычисляются коэффициенты интеллекта: вербального, невербального и общего.

Тесты интеллекта подвергаются постоянной критике, поскольку в большинстве случаев неясно, что же они измеряют: то ли действительно умственный потенциал человека, то ли степень обученности, т. е. его знания и навыки, которые очень сильно зависят от условий развития и воспитания. Этот факт даже послужил основанием для обозначения результатов тестирования как тестовый, или психометрический, интеллект. Систематически наблюдаемые рассогласования между фактическими достижениями в умственной деятельности и тестовым интеллектом привели к введению в психодиагностическую практику понятия «несправедливых» тестов. Особенно резко эта «несправедливость» проявляется при использовании тестов, разработанных для одной общности (социальной группы, социального слоя, национальности и т. п.), в обследовании людей другой общности, с другими культурными традициями, иным уровнем образования. В психодиагностике постоянно предпринимаются попытки создать тесты интеллекта, свободные от влияния культуры (культурно-свободный тест Р. Кеттелла).

Принято считать, что классические тесты интеллекта позволяют измерять только уровень конвергентного мышления – нетворческого, «осторожного». Другой компонент интеллекта – дивергентное (творческое) мышление – подобному тестированию не поддается. Получаемые коэффициенты (IQ) не дают представления об этой стороне интеллекта, что привело к попыткам разработки специальных методов – тестов креативности (см. ниже).

Тесты способностей – это методы, направленные на оценку возможностей человека в овладении знаниями, умениями и навыками как общего, так и частного характера. В первом случае речь идет об оценке общих способностей (сенсорных, моторных, мнемических и т. д.), во втором – об оценке способностей специальных, обычно связанных с профессиональной деятельностью (математических, музыкальных, художественных, скорости чтения и т. д.).

В зависимости от задач исследования тесты способностей часто объединяются в те или иные батареи; иногда они включаются в батареи с тестами интеллекта, например для более полной оценки способностей человека при проведении профотбора и профориентации. Батарея тестов общих способностей GATB, разработанная американской Службой занятости в 1956 г., содержит 12 субтестов на вербальные и математические способности, пространственное восприятие, моторику пальцев, моторику рук и т. д. В настоящий момент батарея GATB за счет разработки ряда ее модификаций для отдельных групп профессий относится к числу наиболее широко применяемых в зарубежной профессиональной диагностике, в частности в США.

Отдельный вид способностей представляют собой творческие способности. Совокупность творческих способностей называют креативностью. В теоретическом плане не проведена четкая грань между креативностью как качеством интеллекта, как творческой способностью и как свойством личности. Поэтому в группу тестов креативности входят весьма разнообразные методики. Наиболее известны тесты Дж. Гилфорда и Е. Торренса, разработанные на рубеже 1950-1960-х гг. Тест Е. Торренса состоит из трех субтестов, позволяющих оценить уровни развития вербального, образного и звукового творческого мышления, получить представление о качественном своеобразии этих структур креативности у разных людей. Задания требуют от испытуемого продуцировать идеи в вербальной форме, в форме некоторого рисунка, изображения. В зависимости от количества и оригинальности идей судят об уровне развития креативности испытуемого.

Тесты достижений предназначены для оценки уровня овладения знаниями, умениями и навыками в какой-либо конкретной деятельности и используются преимущественно в сферах обучения и профотбора. По типу задания различают тесты действия, письменные и устные тесты.

Тесты действия выявляют степень умения выполнять действия с определенными инструментами, орудиями, материалами, механизмами и т. п., например при тестировании машинистки, сборщика деталей, водителя автомобиля и т. д. Письменные тесты представляют собой систему вопросов и возможных ответов на специальном бланке. Иногда вопросы иллюстрируются рисунками, сопровождающими вопрос. Задача испытуемого – либо выбрать правильный словесный ответ, либо отметить на графике отображение описанной в вопросе ситуации, либо найти в рисунке деталь, дающую правильное решение соответствующего вопроса. Устные тесты – это системы устных вопросов, предусматривающие обход трудностей, возникающих из-за отсутствия у испытуемого опыта в формулировании ответов. Тесты достижений используются в первую очередь в сферах обучения и профотбора. В последнее время они приобрели огромную популярность в виде разнообразных игр на радио и телевидении.

Проективные тесты. В рамках проективного диагностического подхода получение информации основано на анализе особенностей действий испытуемого с внешне нейтральным, как бы безличным материалом, становящимся в силу его слабой структурированности и неопределенности объектом проекции. Соответственно, методики, основанные на использовании принципа проекции, называются проективными (прожективными). Понятие проекции для обозначения этих методик впервые было использовано французским психологом Л.К. Франком в 1939 г. и, несмотря на неоднократные попытки изменить их название, закрепилось, став общепринятым.

Необходимость смены названия была продиктована постепенным отходом в интерпретации методик этой группы от идей психоанализа. На сегодняшний день термин «проекция» в психологии имеет два значения; 1) в психоаналитическом понимании – один из защитных механизмов, посредством которого внутренние импульсы и чувства, неприемлемые для «Я», приписываются внешнему объекту и только тогда проникают в сознание (в этом смысле термин был впервые введен в науку 3. Фрейдом в 1894 г.); 2) в непсихоаналитическом понимании – проявления личности вовне. Каждое проявление активности (эмоциональное, речевое, двигательное) несет на себе отпечаток личности в целом. Чем менее стереотипны стимулы, побуждающие к активности, тем ярче проявление личности.

Первое описание проекции как естественной тенденции людей действовать под влиянием своих потребностей, интересов и всей психической организации (причем защитные механизмы могут проявляться, а могут и не проявляться) принадлежит американскому психологу Г.А. Мюррею. Создание теоретической концепции проекции в применимом для исследования личности виде обусловило бурное развитие проективных методик, которые в настоящий момент занимают видное положение в зарубежной психодиагностической практике.

Тестирование с помощью проективных методов имеет следующие наиболее общие особенности. В методиках используется неоднозначный, слабоструктурированный стимульный материал, допускающий большое число вариантов восприятия и интерпретации. При этом предполагается, что чем слабее он структурирован, тем выше степень проекции: «Субъект, поглощенный попытками интерпретировать вроде бы ничего субъективно не значащий материал, не замечает, как раскрывает свои волнения, страхи, желания и тревоги. Таким образом значительно снижается сопротивление при раскрытии личных, иногда очень болезненных проблем». Для преодоления сопротивления испытуемого инструкция дается ему без раскрытия истинной цели, а сама процедура тестирования нередко проходит в игровой форме. Испытуемый, как правило, не ограничивается в выборе ответов, и ответы не оцениваются как «правильные» или «ошибочные». Благодаря этим особенностям проективные методики нередко используются на начальных этапах психологической работы с клиентом или в начале комплексного психологического тестирования личности, поскольку позволяют установить контакт и вызвать интерес к обследованию. Немаловажным достоинством многих проективных методик является то, что ответы испытуемых не обязательно должны даваться в вербальной форме (как в случае с опросниками), что позволяет использовать их в работе и со взрослыми, и с детьми.

Классификация проективных методов принадлежит Л.К. Франку. Он предложил различать проективные методы в зависимости от характера реакций испытуемого. В современной, дополненной классификации проективных методов различают конститутивные, конструктивные, интерпретативные, катартические, экспрессивные, импрессивные, аддитивные методики.

Конститутивные методики характеризуются ситуацией, в которой от испытуемого требуется создать некую структуру из слабоструктурированного, аморфного материала, оформить стимулы, придать им смысл. Примером методик этой группы является тест Г. Роршаха, стимульный материал которого состоит из 10 стандартных таблиц с черно-белыми и цветными симметричными «кляксами». Испытуемому предлагается ответить на вопрос, на что, по его мнению, похоже каждое пятно. В зависимости от ответов обследуемого судят о его переживаниях, особенностях взаимодействия с окружением, реалистичности восприятия действительности, тенденциях к беспокойству и тревожности и др. Тест Г. Роршаха в высокой степени удовлетворяет ориентацию проективной психологии на использование нестереотипных стимулов. Стимульный материал данного теста не навязывает испытуемому ответов, в связи с чем он является наиболее часто используемой в зарубежной психодиагностике проективной методикой. Попыткой дальнейшего развития принципа слабоструктурированности стимульного материала является методика «Картины облаков» В. Штерна и др., где используется напоминающий облака стимульный материал, не имеющий в отличие от «пятен Роршаха» симметрии и четкого контура. Испытуемому предлагается самостоятельно отметить контуры и рассказать о том, что изображено на картинках.

Конструктивные методики подразумевают конструирование, создание из оформленных деталей осмысленного целого. Например, стимульный материал методик «Деревня» и «Тест мира» состоит из небольших по величине предметов, количество которых в разных вариантах доходит до 300. Среди них школа, больница, мэрия, церковь, торговые лавки, деревья, автомобили, фигурки людей и животных и т. п. Испытуемому предлагается по своему усмотрению построить из этих предметов деревню, в которой он хотел бы жить, либо некоторое пространство своего существования (по терминологии авторов – «малый мир»). Определяется подход испытуемого к конструированию макета, реалистичность его построения, близость к характерным для разных контингентов построениям и т. д.

Интерпретативные методики подразумевают истолкование испытуемым какого-либо события, ситуации. Примерами являются тест тематической апперцепции (ТАТ), тесты словесных ассоциаций. Стимульный материал ТАТ представляет собой набор из 30 черно-белых изображений, на которых представлены относительно неопределенные сцены, допускающие неоднозначную интерпретацию. Испытуемому предлагается составить рассказ по каждому изображению: что там происходит, что переживают действующие лица, что этому предшествовало, чем ситуация закончится. На основе рассказа испытуемого создается представление о его переживаниях, осознаваемых и неосознаваемых потребностях, конфликтах и способах их разрешения. В тестах словесных ассоциаций стимульный материал состоит из списка не связанных между собой слов, на каждое из которых испытуемый должен как можно быстрее дать первое пришедшее на ум слово-ассоциацию. Характер и время реакции ответов дают возможность выделить наиболее «эмоционально заряженные» для данного испытуемого слова-стимулы, судить о наличии тех или иных проблемных тем.

Катартические методики представляют собой осуществление игровой деятельности в специально организованных условиях. К ним относят, в частности, психодраму Я. (Дж.) Морено, рассматриваемую как проективную методику исследования личности. В ходе мини-представления, в котором испытуемый (протагонист) играет роль самого себя или воображаемого лица в значимых для себя ситуациях, проявляются его личностные особенности, а путем аффективного отреагирования в драматических ситуациях, созвучных переживаниям испытуемого, достигается терапевтический эффект (катарсис – очищение и инсайт – озарение). Методика не имеет стандартной процедуры проведения, данных о валидности и надежности, вследствие чего применяется в качестве не столько психодиагностической, сколько психотерапевтической методики в групповой психотерапии.

В экспрессивных методиках получение информации основано на анализе рисунков испытуемого. Рисунки могут быть на свободную или заданную тему. Известны рисуночные методики «Несуществующее животное» М.З. Друкаревич, «Дом – дерево – человек» Дж. Бука, «Рисунок семьи» В. Халса, «Нарисуй человека» К. Маховер, «Мой жизненный путь» И.Л. Соломина, «Детская рука, которая беспокоит» Р. Давидо, «Лица и эмоции» А. Джахез и Н. Манши, многомерный рисуночный тест Р. Блоха, тест рисования пальцами Р. Шоу и др. По утверждению Д. Харриса, автора одной из модификаций теста «Рисунок человека» Ф. Гудинаф, «рисунки могут многое сказать об аффекте, темпераменте, отношении и личности человека, который их нарисовал».

Проведение рисуночных тестов не требует больших затрат времени, обычно допускает групповую форму. Основными подвергаемыми анализу элементами рисунка являются его размер, положение на листе (вверху, внизу, в центре, в углу), поворот рисунка влево или вправо, нажим (слабый, стандартный, сильный), характеристика линий (ровные, дрожащие, прерывистые, двойные), наклон фигуры, плотность и площадь штриховки, количество и характер деталей. Как правило, рисуночные методики подразумевают дополнение рисунка рассказом испытуемого об изображенном, составление истории по рисунку, опрос испытуемого по прилагаемому перечню вопросов. Анализируются и поведение испытуемого во время выполнения задания, его высказывания, вегетативные проявления, длительность работы над рисунком. Для увеличения достоверности интерпретации желательно проводить рисуночные методики в комплексе с другими тестами, дополнять их результатами беседы и наблюдения.

Импрессивные методики подразумевают предпочтение одних стимулов (как наиболее желательных) другим. Испытуемый оказывается в ситуации, когда необходимо либо выбрать наиболее предпочтительные стимулы, либо проранжировать стимулы по степени предпочтения. Например, в тесте Л. Сонди испытуемому предъявляются 48 портретов психически больных людей, разбитых на шесть серий, с инструкцией выбрать в каждой серии по два наиболее и наименее понравившихся портрета. В зависимости от предпочтений испытуемого судят о наиболее значимых для него «диагностических областях».

Отдельную подгруппу импрессивных тестов составляют тесты цветового выбора (цветовой тест отношений А.М. Эткинда, тест цветовых метафор И.Л. Соломина, тест цветных пирамид М. Пфистера и Р. Хайсса, «Попарные сравнения» Ю.И. Филимоненко и др.). Все эти тесты базируются на тесте швейцарского психолога М. Люшера, опубликованном в 1948 г. В основе теста Люшера лежит предположение о том, что выбор цвета отражает настроение, функциональное состояние и наиболее устойчивые черты личности. Каждый цвет спектра является пусковым сигналом, вызывающим у человека разнообразные, не осознаваемые в полной мере ассоциации. Например, с красным цветом человек сталкивается преимущественно в ситуациях опасности и напряженной борьбы (это цвет крови, огня), что приводит к ассоциированию этого цвета с соответствующим для таких ситуаций состоянием нервно-психического напряжения, мобилизованности, активного действия. Соответственно, предпочитать в ситуации тестирования красный цвет будет человек активный и хорошо отдохнувший, для которого ассоциативная специфика восприятия цвета будет соответствовать его энергетическим возможностям и мотивационным установкам, отвергать – человек утомленный и заторможенный, для которого возбуждение в данный момент неуместно, идет вразрез с наличным энергопотенциалом и установками.

Аддитивные методики подразумевают произвольное завершение испытуемым стимульного материала, например завершение предложения (методики А. Пейна, Д. Сакса и С. Леви, А. Тендлера, Дж. Роттера, Б. Форера, А. Роде и др.) или завершение истории (методики Л. Дюсса, М. Тома и др.). В зависимости от характера завершений судят о потребностях и мотивах испытуемого, его отношении к семье, сексу, вышестоящим по работе и т. д.

Классификация К. Франка неоднократно критиковалась за описательность, смешение критериев, нечеткое разделение групп методов. Непонятно, например, куда отнести тесты типа «Завершение рисунка» – к экспрессивным, конститутивным или аддитивным методам. При выделении группы катартических методов произошло смещение акцента с процесса на результат (катарсис). Вряд ли достаточно обоснован выбор характера реакций испытуемого в качестве критерия построения претендующей на полноту охвата классификации проективных методов, тем более что выделенные Франком категории оказались заданы не столько характером реакций испытуемого, сколько характером самого стимульного материала и целью исследования.

В связи с этим возникает необходимость в разведении проективных тестов по нескольким критериям. В.В. Никандров и В.В. Новочадов предлагают следующую классификационную систему проективных методик:

1) по задействованной модальности (методики с визуальной, тактильной, аудио– и иной стимуляцией);

2) по характеру стимульного материала (вербальные, невербальные);

3) по типу реакции испытуемого (ассоциативные, интерпретативные, манипулятивные, свободного выбора);

4) по наличию или отсутствию готовых вариантов ответа (проективные, полупроективные).

Большинство психодиагностических методик подразумевает задействование зрительной модальности. Это является отражением особой важности роли зрения в приеме информации у современного человека: допускается, что адресация стимульного материала глазам позволяет получать ответы, достаточно полно характеризующие личность. Тем не менее существуют методики, где стимуляция предъявляется испытуемому на слух, например в тесте словесных ассоциаций, где тестируемый должен как можно быстрее дать слово-ассоциацию на произносимое психодиагностом слово-стимул. Известны также попытки создания проективных методик, обращенных к тактильным ощущениям.

По характеру стимульного материала проективные методики могут быть вербальными, где в качестве стимула выступает слово, предложение или текст, и невербальными, с предметной, цветовой, рисуночной и прочей стимуляцией. В тестах словесных ассоциаций в качестве стимулов используются отдельные слова, в методиках типа «Завершение предложений» – незаконченные предложения, в методиках типа «Завершение истории» – неполные тексты.

Принято различать следующие типы ответов испытуемых: ассоциация, интерпретация, манипуляция (по шкале действий с предметами, материалами и др., имеющей полюсами творческую и репродуктивную манипуляцию), свободный выбор (т. е. некое распределение, ранжирование стимульного материала). В соответствии с этим проективные методики предложено делить на ассоциативные, интерпретативные, манипулятивные и методики свободного выбора.

В зависимости от наличия готовых вариантов ответа различают полупроективные методики, где испытуемому предлагается выбрать один из предложенных вариантов ответа на проективную стимуляцию (в некотором смысле – аналог закрытых опросников), и собственно проективные, где такие варианты отсутствуют. Примером полупроективной методики может быть тест Л. Сонди (обычно наиболее известные тесты называются только по фамилии, здесь именно такой случай), где испытуемому предлагается выбрать в каждой серии портретов по два понравившихся и два непонравившихся. Испытуемому может не понравиться ни один портрет, а ненравящихся может быть больше, чем два, однако принудительная инструкция ставит испытуемого в определенные условия, которым он должен следовать, что накладывает определенные ограничения на проявление его личностных свойств. Безусловными плюсами полупроективных методик являются простота количественной обработки результатов, доступность перевода методик в компьютерную форму, меньшая уязвимость относительно субъективизма интерпретатора.

Общепринятым является представление о том, что проективные тесты имеют преимущество над субъективными, поскольку позволяют выявить неосознаваемые компоненты психического. Однако необходимо заметить, что эти неосознаваемые компоненты вовсе не обязательно проявятся в результатах тестирования. По мнению Г.У. Оллпорта, нормальный, адекватно приспособленный субъект при проведении проективных тестов дает ответы, аналогичные сознательному отчету в субъективных тестах, либо благодаря достаточно развитому самоконтролю никак не проявляет свои доминирующие мотивы. Поэтому проективное тестирование приобретает особое значение только тогда, «когда в проективных реакциях обнаруживается эмоционально нагруженный материал, противоречащий сознательным отчетам. И только тогда можно с уверенностью говорить о наличии или отсутствии невротических тенденций».

Компьютерное тестирование. Это относительно молодое направление психодиагностики, связанное с использованием средств электронно-вычислительной техники. Появление компьютерной психодиагностики обусловлено развитием информационных технологий. Попытки автоматизировать предъявление испытуемому стимульного материала и последующую обработку результатов предпринимались начиная с 1930-х гг., но лишь с 1970-х гг. началось подлинное развитие компьютерной психодиагностики, обусловленное появлением персональных компьютеров. С 1980-х гг. компьютерные тесты стали разрабатываться в массовых масштабах: сначала – как компьютерные версии известных бланковых методик, а в 1990-е гг. – как специальные методики, учитывающие возможности современной техники и не употребимые в бланковом виде, поскольку рассчитаны на сложный, изменяющийся в пространстве и времени стимульный материал, специфическое звуковое сопровождение и т. п. Начало XXI в. отмечено тем, что управление тестированием все чаще передается компьютеру. Если в прошлые годы автоматизировались отдельные стадии исследования, например предъявление материала, обработка данных, интерпретация результатов, то на современном этапе все чаще можно встретить программы, которые берут на себя все обследование целиком вплоть до постановки диагноза, что сводит необходимость присутствия психолога к минимуму.

Безусловными достоинствами компьютерных тестов являются: быстрое проведение; высокая скорость и безошибочность обработки; возможность безотлагательного получения результатов; обеспечение стандартных условий тестирования для всех испытуемых; четкий контроль процедуры тестирования (невозможен пропуск вопросов, при необходимости может фиксироваться время каждого ответа, что особенно важно для тестов на интеллект); возможность исключения психолога как дополнительной переменной (что имеет особое значение при проведении экспертизы); наглядность и занимательность процесса (поддержка внимания с помощью цвета, звука, игровых элементов, что наиболее важно для обучающих программ); легкая архивация результатов; возможность объединения тестов в батареи (пакеты программ) с единой итоговой интерпретацией; мобильность экспериментатора (весь инструментарий на одной дискете); возможность проведения массовых исследований (например, через Интернет).

Недостатки компьютерных тестов: сложность, трудоемкость и дороговизна разработки программ; необходимость дорогостоящей компьютерной техники; сложность использования ЭВМ в полевых условиях; необходимость специального обучения испытуемого работе с компьютерными тестами; трудности работы с невербальным материалом, особая сложность перевода в компьютерную форму проективных тестов; отсутствие индивидуального подхода к тестируемому (потеря части психодиагностической информации, получаемой в беседе и наблюдении); латентность этапов обработки и интерпретации данных (качество этих процедур полностью зависит от разработчиков программ). У некоторых испытуемых при взаимодействии с компьютером могут возникать эффекты «психологического барьера» или «сверхдоверия». Поэтому данные о валидности, надежности и репрезентативности бланковых тестов не могут быть автоматически перенесены на их компьютерные аналоги, что ведет к необходимости новой стандартизации тестов.

Недостатки компьютерных тестов вызывают настороженное отношение к ним психологов. Мало используются такие тесты в клинической психологии, где цена ошибки слишком высока. Отечественный психолог Л.С. Выготский выделял три уровня психодиагностики: 1) симптоматический (выявление симптомов); 2) этиологический (выявление причин); 3) типологический (целостная, динамическая картина личности, на основе чего строится прогноз). Компьютерная психодиагностика на сегодняшний день находится на низшем уровне – уровне симптоматического диагноза, практически не давая материала для выявления причин и вынесения прогноза.

Тем не менее, по-видимому, компьютерные тесты имеют большое будущее. Многие из перечисленных недостатков компьютерной психодиагностики наверняка будут устранены благодаря дальнейшему развитию электронной техники и совершенствованию психодиагностических технологий. Залогом такого оптимизма является нарастающий интерес науки и практики к компьютерной диагностике, в арсенале которой уже сейчас имеется свыше 1000 компьютерных тестов.

Среди существующих компьютерных тестов можно выделить следующие их виды:

1) по структуре – аналоги бланковых тестов и собственно компьютерные тесты;

2) по количеству тестируемых – тесты индивидуального и группового тестирования;

3) по степени автоматизации тестирования – автоматизирующие один или несколько этапов обследования и автоматизирующие все обследование;

4) по задаче – диагностические и обучающие;

5) по адресату – профессиональные психологические, полупрофессиональные и непрофессиональные (развлекательные).

Пользователем профессиональных компьютерных тестов является психолог, поэтому они разрабатываются специализированными лабораториями или центрами компьютерной психодиагностики. Эти тесты имеют ряд специфических особенностей: а) наличие архива (базы данных); б) наличие пароля на вход в тест или базу данных для обеспечения конфиденциальности результатов; в) развернутая интерпретация результатов с использованием профессиональных терминов, коэффициентов, с построением графиков (профилей); г) наличие информации о разработчиках методики, сведений о валидности и надежности, справочных материалов о лежащих в основе методики теоретических положениях.

Полупрофессиональные компьютерные тесты ориентированы на специалистов смежных профессий, например на педагогов, менеджеров по персоналу. Такие тесты зачастую снабжены редуцированной интерпретацией без использования специальной лексики, просты в освоении и работе. Тесты подобного уровня могут быть предназначены и для неспециалиста, рядового пользователя персонального компьютера, интересующегося психологией. Наконец, существует также большое число непрофессиональных компьютерных тестов, направленных на популяризацию психологических идей или преследующих развлекательные цели.

Пользуясь профессиональными или полупрофессиональными компьютерными тестами, необходимо соблюдать те же этические принципы, что и при бланковом тестировании. Важно не распространять результаты тестирования и защищать свои файлы паролем, особенно если у компьютера несколько пользователей. И главное – «не сотворить себе кумира», т. е. помнить, что компьютерный тест является только средством, помощником и имеет свои границы применения.

6.4. Стандартизация, надежность и валидность теста

Рассмотрим понятия стандартизации, надежности и валидности теста с позиций классической эмпирико-статистической теории. В соответствии с этой теорией конструирование тестов для изменения психологических свойств и состояний основано на шкале интервалов. Измеряемое психическое свойство считается линейным и одномерным. Предполагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нормального распределения.

В основе психологического тестирования лежит классическая теория погрешности измерений. Считается, что тест – такой же измерительный прибор, как любой физический прибор, и результаты, которые он показывает, зависят от величины свойства у испытуемого, а также от самой процедуры измерения. Любое свойство психики имеет «истинный» показатель, а показания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» погрешность, но она сводится к прибавлению (вычитанию) константы к «истинной» величине параметра, что для интервальной шкалы значения не имеет.

Надежность теста. Если тест проводить много раз, то среднее значение будет характеристикой «истинной» величины параметра. Под надежностью теста принято понимать устойчивость результатов к воздействию случайных факторов, внешних и внутренних. Наиболее часто проводится оценка ретестовой надежности. Чем теснее коррелируют результаты начального и повторного (обычно отсроченного на несколько месяцев) проведения теста, тем он надежнее.

Предполагается, что существует неограниченное количество заданий, которые могут «работать» на измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокупности. В идеале можно создать сколько угодно эквивалентных форм теста, поэтому определение надежности теста можно провести путем корреляции параллельных форм или эквивалентных равных частей, полученных путем расщепления тестового задания на две части. Поскольку в реальном тесте число заданий ограничено (не более 100), то оценка надежности теста всегда приблизительна. Тест считается надежным, если коэффициент корреляции результатов составляет не менее 0,75.

Валидность теста. Проблеме валидности в классической теории теста уделяется много внимания, однако теоретически она никак не решается. Валидность означает пригодность теста измерять то свойство, для измерения которого он предназначен. Следовательно, чем больше на результат выполнения теста или отдельного задания влияет измеряемое свойство и чем меньше другие переменные (в том числе внешние), тем тест валиднее.

Тест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство. Тест невалиден (и ненадежен), если результаты тестирования определяются влиянием нерелевантных переменных.

Существуют следующие виды валидности теста.

Очевидная валидность. Тест считается валидным, если у испытуемого складывается впечатление, что он измеряет то, что должен измерять.

Конкретная валидность (конвергентная – дивергентная валидность). Тест должен хорошо коррелировать с тестами, измеряющими конкретное свойство либо близкое ему по содержанию, и иметь низкие корреляции с тестами, измеряющими заведомо иные свойства.

Прогностическая валидность. Тест должен коррелировать с отдаленными по времени внешними критериями.

Конструктная валидность. Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез.

С теоретической точки зрения единственным способом установления «внутренней» валидности теста и отдельных заданий является метод факторного анализа (и аналогичные), который позволяет: а) выявлять латентные (скрытые) свойства и вычислять значение «факторных нагрузок» – коэффициенты детерминации свойств тех или иных поведенческих признаков; б) определять меру влияния каждого латентного свойства на результаты тестирования.

Стандартизация теста заключается в приведении процедуры оценок к общепринятым нормативам. Стандартизация предполагает преобразование нормальной или искусственно нормализованной шкалы первичных оценок в шкальные оценки (подробнее об этом см. 5.2). Тестовые нормы, полученные в ходе стандартизации, представляют собой систему шкал с характеристиками распределения тестового балла для различных выборок. Они не являются «внутренними» свойствами теста, а лишь облегчают его практическое применение.

6.5. Требования к разработке, проверке и адаптации тестовых методик

Известны два пути создания психодиагностических методик: адаптация известных методик (зарубежных, устаревших, с иными целями) и разработка новых, оригинальных методик.

Адаптация теста – это комплекс мероприятий, обеспечивающих адекватность теста в новых условиях применения. Выделяют следующие этапы адаптации тестов:

1) анализ исходных теоретических положений автора теста;

2) для иностранных методик – перевод теста и инструкций к нему на язык пользователя (с обязательной экспертной оценкой соответствия оригиналу);

3) проверка надежности и валидности в соответствии с психометрическими требованиями;

4) стандартизация на соответствующих выборках.

Наиболее серьезные проблемы возникают при адаптации вербальных тестов (опросников, вербальных субтестов в составе тестов интеллекта). Эти проблемы связаны с языковыми и социокультурными различиями народов разных стран. Многовариантность перевода какого-либо термина, невозможность точной передачи идиоматических оборотов – обычное явление при переводах с языка на язык. Иногда бывает настолько сложно подобрать языковые и смысловые аналоги заданий теста, что полная его адаптация становится сопоставимой с разработкой оригинальной методики.

Понятие адаптации приложимо не только к зарубежным методикам, которые предполагается использовать в условиях нашей страны, но и к устаревшим отечественным методикам. Устаревают они достаточно быстро: в связи с развитием языка и изменчивостью социокультурных стереотипов методики должны корректироваться каждые 5–7 лет, что подразумевает уточнение формулировок вопросов, коррекцию нормативов, обновление стимульного материала, пересмотр интерпретационных критериев.

Самостоятельная разработка тестовой методики обычно состоит из следующих этапов.

1. Выбор предмета (явления) и объекта исследования (контингента).

2. Выбор вида теста (объективный, субъективный, проективный), типа заданий (с предписанными ответами, со свободными ответами) и шкал (числовые, вербальные, графические).

3. Подбор первичного банка заданий. Он может осуществляться двумя путями: вопросы формулируются исходя из теоретических представлений об измеряемом явлении (факторно-аналитический принцип) или же подбираются в соответствии с их дискриминативностью, т. е. способностью отделять испытуемых по наличию требуемого признака (критериально-ключевой принцип). Второй принцип эффективен при разработке тестов отбора (например, профессионального или клинического).

4. Оценка заданий первичного банка (содержательной валидности теста, т. е. соответствия каждого из заданий измеряемому явлению, и полноты охвата изучаемого явления тестом в целом). Проводится с помощью метода экспертной оценки.

5. Предварительное тестирование, формирование банка эмпирических данных.

6. Эмпирическая валидизация теста. Проводится с помощью корреляционного анализа оценок теста и показателей по внешнему параметру изучаемого свойства (например, школьной успеваемости при валидизации теста интеллекта, врачебного диагноза при валидизации клинических тестов, данных других тестов, валидность которых известна, и др.).

7. Оценка надежности теста (устойчивости результатов к действию случайных факторов, внешних и внутренних). Наиболее часто оцениваются ретестовая надежность (соответствие результатам повторного тестирования, обычно через несколько месяцев), надежность частей теста (устойчивость результатов отдельных задач или групп задач, например по методу «четное – нечетное») и надежность параллельных форм, если таковые существуют. Методика признается надежной, если коэффициент корреляции результатов (первичного и повторного тестирования, одной и другой частей теста, одной и другой параллельных форм) составляет не менее 0,75. При более низком показателе надежности производятся корректировка заданий теста, переформулирование вопросов, снижающих надежность.

8. Стандартизация теста, т. е. приведение процедуры и оценок к общепринятым нормативам. Стандартизация оценок подразумевает преобразование нормальной или искусственно нормализованной шкалы первичных оценок (эмпирических значений изучаемого показателя) в оценки шкальные (отражающие место в распределении результатов выборки испытуемых). Виды шкальных оценок: стены (1-10), станайны (1–9), 7-оценки (10-100) и др.

9. Определение прогностической валидности, т. е. информация о том, с какой степенью точности методика позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Прогностическая валидность также определяется по внешнему критерию, но данные по нему собираются спустя некоторое время после тестирования.

Таким образом, надежность и валидность – это собирательные понятия, включающие в себя несколько видов показателей, отражающих направленность методики на предмет исследования (валидность) и объект исследования (надежность). Степень надежности и валидности отражают соответствующие коэффициенты, указываемые в сертификате методики.

Создание методики – трудоемкая работа, требующая развитой системы заказа на методики с соответствующей оплатой труда разработчиков и гонорарами за использование авторских методик.

  • Tutorial

Доброго времени суток!

Хочу собрать всю самую необходимую теорию по тестирвоанию, которую спрашивают на собеседованиях у trainee, junior и немножко middle. Собственно, я собрал уже не мало. Цель сего поста в том, чтобы сообща добавить упущенное и исправить/перефразировать/добавить/сделатьЧтоТоЕщё с тем, что уже есть, чтобы стало хорошо и можно было взять всё это и повторить перед очередным собеседованием про всяк случай. Вообщем, коллеги, прошу под кат, кому почерпнуть что-то новое, кому систематизировать старое, а кому внести свою лепту.

В итоге должна получиться исчерпывающая шпаргалка, которую нужно перечитать по дороге на собеседование.

Всё ниже перечисленное не выдумано мной лично, а взято с разных источников, где мне лично формулировка и определение понравилось больше. В конце список источников.

В теме: определение тестирования, качество, верификация / валидация, цели, этапы, тест план, пункты тест плана, тест дизайн, техники тест дизайна, traceability matrix, tets case, чек-лист, дефект, error/deffect/failure, баг репорт, severity vs priority, уровни тестирования, виды / типы, подходы к интеграционному тестированию, принципы тестирования, статическое и динамическое тестирование, исследовательское / ad-hoc тестирование, требования, жизненный цикл бага, стадии разработки ПО, decision table, qa/qc/test engineer, диаграмма связей.

Поехали!

Тестирование программного обеспечения - проверка соответствия между реальным и ожидаемым поведением программы, осуществляемая на конечном наборе тестов, выбранном определенным образом. В более широком смысле, тестирование - это одна из техник контроля качества, включающая в себя активности по планированию работ (Test Management), проектированию тестов (Test Design), выполнению тестирования (Test Execution) и анализу полученных результатов (Test Analysis).

Качество программного обеспечения (Software Quality) - это совокупность характеристик программного обеспечения, относящихся к его способности удовлетворять установленные и предполагаемые потребности.

Верификация (verification) - это процесс оценки системы или её компонентов с целью определения удовлетворяют ли результаты текущего этапа разработки условиям, сформированным в начале этого этапа. Т.е. выполняются ли наши цели, сроки, задачи по разработке проекта, определенные в начале текущей фазы.
Валидация (validation) - это определение соответствия разрабатываемого ПО ожиданиям и потребностям пользователя, требованиям к системе .
Также можно встретить иную интерпритацию:
Процесс оценки соответствия продукта явным требованиям (спецификациям) и есть верификация (verification), в то же время оценка соответствия продукта ожиданиям и требованиям пользователей - есть валидация (validation). Также часто можно встретить следующее определение этих понятий:
Validation - ’is this the right specification?’.
Verification - ’is the system correct to specification?’.

Цели тестирвоания
Повысить вероятность того, что приложение, предназначенное для тестирования, будет работать правильно при любых обстоятельствах.
Повысить вероятность того, что приложение, предназначенное для тестирования, будет соответствовать всем описанным требованиям.
Предоставление актуальной информации о состоянии продукта на данный момент.

Этапы тестирования:
1. Анализ
2. Разработка стратегии тестирования
и планирование процедур контроля качества
3. Работа с требованиями
4. Создание тестовой документации
5. Тестирование прототипа
6. Основное тестирование
7. Стабилизация
8. Эксплуатация

Тест план (Test Plan) - это документ, описывающий весь объем работ по тестированию, начиная с описания объекта, стратегии, расписания, критериев начала и окончания тестирования, до необходимого в процессе работы оборудования, специальных знаний, а также оценки рисков с вариантами их разрешения.
Отвечает на вопросы:
Что надо тестировать?
Что будете тестировать?
Как будете тестировать?
Когда будете тестировать?
Критерии начала тестирования.
Критерии окончания тестирования.

Основные пункты тест плана
В стандарте IEEE 829 перечислены пункты, из которых должен (пусть - может) состоять тест-план:
a) Test plan identifier;
b) Introduction;
c) Test items;
d) Features to be tested;
e) Features not to be tested;
f) Approach;
g) Item pass/fail criteria;
h) Suspension criteria and resumption requirements;
i) Test deliverables;
j) Testing tasks;
k) Environmental needs;
l) Responsibilities;
m) StafÞng and training needs;
n) Schedule;
o) Risks and contingencies;
p) Approvals.

Тест дизайн - это этап процесса тестирования ПО, на котором проектируются и создаются тестовые случаи (тест кейсы), в соответствии с определёнными ранее критериями качества и целями тестирования.
Роли, ответственные за тест дизайн:
Тест аналитик - определяет «ЧТО тестировать?»
Тест дизайнер - определяет «КАК тестировать?»

Техники тест дизайна

Эквивалентное Разделение (Equivalence Partitioning - EP) . Как пример, у вас есть диапазон допустимых значений от 1 до 10, вы должны выбрать одно верное значение внутри интервала, скажем, 5, и одно неверное значение вне интервала - 0.

Анализ Граничных Значений (Boundary Value Analysis - BVA) . Если взять пример выше, в качестве значений для позитивного тестирования выберем минимальную и максимальную границы (1 и 10), и значения больше и меньше границ (0 и 11). Анализ Граничный значений может быть применен к полям, записям, файлам, или к любого рода сущностям имеющим ограничения.

Причина / Следствие (Cause/Effect - CE) . Это, как правило, ввод комбинаций условий (причин), для получения ответа от системы (Следствие). Например, вы проверяете возможность добавлять клиента, используя определенную экранную форму. Для этого вам необходимо будет ввести несколько полей, таких как «Имя», «Адрес», «Номер Телефона» а затем, нажать кнопку «Добавить» - эта «Причина». После нажатия кнопки «Добавить», система добавляет клиента в базу данных и показывает его номер на экране - это «Следствие».

Исчерпывающее тестирование (Exhaustive Testing - ET) - это крайний случай. В пределах этой техники вы должны проверить все возможные комбинации входных значений, и в принципе, это должно найти все проблемы. На практике применение этого метода не представляется возможным, из-за огромного количества входных значений.

Traceability matrix - Матрица соответствия требований - это двумерная таблица, содержащая соответсвие функциональных требований (functional requirements) продукта и подготовленных тестовых сценариев (test cases). В заголовках колонок таблицы расположены требования, а в заголовках строк - тестовые сценарии. На пересечении - отметка, означающая, что требование текущей колонки покрыто тестовым сценарием текущей строки.
Матрица соответсвия требований используется QA-инженерами для валидации покрытия продукта тестами. МСТ является неотъемлемой частью тест-плана.

Тестовый случай (Test Case) - это артефакт, описывающий совокупность шагов, конкретных условий и параметров, необходимых для проверки реализации тестируемой функции или её части.
Пример:
Action Expected Result Test Result
(passed/failed/blocked)
Open page «login» Login page is opened Passed

Каждый тест кейс должен иметь 3 части:
PreConditions Список действий, которые приводят систему к состоянию пригодному для проведения основной проверки. Либо список условий, выполнение которых говорит о том, что система находится в пригодном для проведения основного теста состояния.
Test Case Description Список действий, переводящих систему из одного состояния в другое, для получения результата, на основании которого можно сделать вывод о удовлетворении реализации, поставленным требованиям
PostConditions Список действий, переводящих систему в первоначальное состояние (состояние до проведения теста - initial state)
Виды Тестовых Случаев:
Тест кейсы разделяются по ожидаемому результату на позитивные и негативные:
Позитивный тест кейс использует только корректные данные и проверяет, что приложение правильно выполнило вызываемую функцию.
Негативный тест кейс оперирует как корректными так и некорректными данными (минимум 1 некорректный параметр) и ставит целью проверку исключительных ситуаций (срабатывание валидаторов), а также проверяет, что вызываемая приложением функция не выполняется при срабатывании валидатора.

Чек-лист (check list) - это документ, описывающий что должно быть протестировано. При этом чек-лист может быть абсолютно разного уровня детализации. На сколько детальным будет чек-лист зависит от требований к отчетности, уровня знания продукта сотрудниками и сложности продукта.
Как правило, чек-лист содержит только действия (шаги), без ожидаемого результата. Чек-лист менее формализован чем тестовый сценарий. Его уместно использовать тогда, когда тестовые сценарии будут избыточны. Также чек-лист ассоциируются с гибкими подходами в тестировании.

Дефект (он же баг) - это несоответствие фактического результата выполнения программы ожидаемому результату. Дефекты обнаруживаются на этапе тестирования программного обеспечения (ПО), когда тестировщик проводит сравнение полученных результатов работы программы (компонента или дизайна) с ожидаемым результатом, описанным в спецификации требований.

Error - ошибка пользователя, то есть он пытается использовать программу иным способом.
Пример - вводит буквы в поля, где требуется вводить цифры (возраст, количество товара и т.п.).
В качественной программе предусмотрены такие ситуации и выдаются сообщение об ошибке (error message), с красным крестиком которые.
Bug (defect) - ошибка программиста (или дизайнера или ещё кого, кто принимает участие в разработке), то есть когда в программе, что-то идёт не так как планировалось и программа выходит из-под контроля. Например, когда никак не контроллируется ввод пользователя, в результате неверные данные вызывают краши или иные «радости» в работе программы. Либо внутри программа построена так, что изначально не соответствует тому, что от неё ожидается.
Failure - сбой (причём не обязательно аппаратный) в работе компонента, всей программы или системы. То есть, существуют такие дефекты, которые приводят к сбоям (A defect caused the failure) и существуют такие, которые не приводят. UI-дефекты например. Но аппаратный сбой, никак не связанный с software, тоже является failure.

Баг Репорт (Bug Report) - это документ, описывающий ситуацию или последовательность действий приведшую к некорректной работе объекта тестирования, с указанием причин и ожидаемого результата.
Шапка
Короткое описание (Summary) Короткое описание проблемы, явно указывающее на причину и тип ошибочной ситуации.
Проект (Project) Название тестируемого проекта
Компонент приложения (Component) Название части или функции тестируемого продукта
Номер версии (Version) Версия на которой была найдена ошибка
Серьезность (Severity) Наиболее распространена пятиуровневая система градации серьезности дефекта:
S1 Блокирующий (Blocker)
S2 Критический (Critical)
S3 Значительный (Major)
S4 Незначительный (Minor)
S5 Тривиальный (Trivial)
Приоритет (Priority) Приоритет дефекта:
P1 Высокий (High)
P2 Средний (Medium)
P3 Низкий (Low)
Статус (Status) Статус бага. Зависит от используемой процедуры и жизненного цикла бага (bug workflow and life cycle)

Автор (Author) Создатель баг репорта
Назначен на (Assigned To) Имя сотрудника, назначенного на решение проблемы
Окружение
ОС / Сервис Пак и т.д. / Браузера + версия /… Информация об окружении, на котором был найден баг: операционная система, сервис пак, для WEB тестирования - имя и версия браузера и т.д.

Описание
Шаги воспроизведения (Steps to Reproduce) Шаги, по которым можно легко воспроизвести ситуацию, приведшую к ошибке.
Фактический Результат (Result) Результат, полученный после прохождения шагов к воспроизведению
Ожидаемый результат (Expected Result) Ожидаемый правильный результат
Дополнения
Прикрепленный файл (Attachment) Файл с логами, скриншот или любой другой документ, который может помочь прояснить причину ошибки или указать на способ решения проблемы.

Severity vs Priority
Серьезность (Severity) - это атрибут, характеризующий влияние дефекта на работоспособность приложения.
Приоритет (Priority) - это атрибут, указывающий на очередность выполнения задачи или устранения дефекта. Можно сказать, что это инструмент менеджера по планированию работ. Чем выше приоритет, тем быстрее нужно исправить дефект.
Severity выставляется тестировщиком
Priority - менеджером, тимлидом или заказчиком

Градация Серьезности дефекта (Severity)

S1 Блокирующая (Blocker)
Блокирующая ошибка, приводящая приложение в нерабочее состояние, в результате которого дальнейшая работа с тестируемой системой или ее ключевыми функциями становится невозможна. Решение проблемы необходимо для дальнейшего функционирования системы.

S2 Критическая (Critical)
Критическая ошибка, неправильно работающая ключевая бизнес логика, дыра в системе безопасности, проблема, приведшая к временному падению сервера или приводящая в нерабочее состояние некоторую часть системы, без возможности решения проблемы, используя другие входные точки. Решение проблемы необходимо для дальнейшей работы с ключевыми функциями тестируемой системой.

S3 Значительная (Major)
Значительная ошибка, часть основной бизнес логики работает некорректно. Ошибка не критична или есть возможность для работы с тестируемой функцией, используя другие входные точки.

S4 Незначительная (Minor)
Незначительная ошибка, не нарушающая бизнес логику тестируемой части приложения, очевидная проблема пользовательского интерфейса.

S5 Тривиальная (Trivial)
Тривиальная ошибка, не касающаяся бизнес логики приложения, плохо воспроизводимая проблема, малозаметная посредствам пользовательского интерфейса, проблема сторонних библиотек или сервисов, проблема, не оказывающая никакого влияния на общее качество продукта.

Градация Приоритета дефекта (Priority)
P1 Высокий (High)
Ошибка должна быть исправлена как можно быстрее, т.к. ее наличие является критической для проекта.
P2 Средний (Medium)
Ошибка должна быть исправлена, ее наличие не является критичной, но требует обязательного решения.
P3 Низкий (Low)
Ошибка должна быть исправлена, ее наличие не является критичной, и не требует срочного решения.

Уровни Тестирования

1. Модульное тестирование (Unit Testing)
Компонентное (модульное) тестирование проверяет функциональность и ищет дефекты в частях приложения, которые доступны и могут быть протестированы по-отдельности (модули программ, объекты, классы, функции и т.д.).

2. Интеграционное тестирование (Integration Testing)
Проверяется взаимодействие между компонентами системы после проведения компонентного тестирования.

3. Системное тестирование (System Testing)
Основной задачей системного тестирования является проверка как функциональных, так и не функциональных требований в системе в целом. При этом выявляются дефекты, такие как неверное использование ресурсов системы, непредусмотренные комбинации данных пользовательского уровня, несовместимость с окружением, непредусмотренные сценарии использования, отсутствующая или неверная функциональность, неудобство использования и т.д.

4. Операционное тестирование (Release Testing).
Даже если система удовлетворяет всем требованиям, важно убедиться в том, что она удовлетворяет нуждам пользователя и выполняет свою роль в среде своей эксплуатации, как это было определено в бизнес моделе системы. Следует учесть, что и бизнес модель может содержать ошибки. Поэтому так важно провести операционное тестирование как финальный шаг валидации. Кроме этого, тестирование в среде эксплуатации позволяет выявить и нефункциональные проблемы, такие как: конфликт с другими системами, смежными в области бизнеса или в программных и электронных окружениях; недостаточная производительность системы в среде эксплуатации и др. Очевидно, что нахождение подобных вещей на стадии внедрения - критичная и дорогостоящая проблема. Поэтому так важно проведение не только верификации, но и валидации, с самых ранних этапов разработки ПО.

5. Приемочное тестирование (Acceptance Testing)
Формальный процесс тестирования, который проверяет соответствие системы требованиям и проводится с целью:
определения удовлетворяет ли система приемочным критериям;
вынесения решения заказчиком или другим уполномоченным лицом принимается приложение или нет.

Виды / типы тестирования

Функциональные виды тестирования
Функциональное тестирование (Functional testing)
Тестирование безопасности (Security and Access Control Testing)
Тестирование взаимодействия (Interoperability Testing)

Нефункциональные виды тестирования
Все виды тестирования производительности:
o нагрузочное тестирование (Performance and Load Testing)
o стрессовое тестирование (Stress Testing)
o тестирование стабильности или надежности (Stability / Reliability Testing)
o объемное тестирование (Volume Testing)
Тестирование установки (Installation testing)
Тестирование удобства пользования (Usability Testing)
Тестирование на отказ и восстановление (Failover and Recovery Testing)
Конфигурационное тестирование (Configuration Testing)

Связанные с изменениями виды тестирования
Дымовое тестирование (Smoke Testing)
Регрессионное тестирование (Regression Testing)
Повторное тестирование (Re-testing)
Тестирование сборки (Build Verification Test)
Санитарное тестирование или проверка согласованности/исправности (Sanity Testing)

Функциональное тестирование рассматривает заранее указанное поведение и основывается на анализе спецификаций функциональности компонента или системы в целом.

Тестирование безопасности - это стратегия тестирования, используемая для проверки безопасности системы, а также для анализа рисков, связанных с обеспечением целостного подхода к защите приложения, атак хакеров, вирусов, несанкционированного доступа к конфиденциальным данным.

Тестирование взаимодействия (Interoperability Testing) - это функциональное тестирование, проверяющее способность приложения взаимодействовать с одним и более компонентами или системами и включающее в себя тестирование совместимости (compatibility testing) и интеграционное тестирование

Нагрузочное тестирование - это автоматизированное тестирование, имитирующее работу определенного количества бизнес пользователей на каком-либо общем (разделяемом ими) ресурсе.

Стрессовое тестирование (Stress Testing) позволяет проверить насколько приложение и система в целом работоспособны в условиях стресса и также оценить способность системы к регенерации, т.е. к возвращению к нормальному состоянию после прекращения воздействия стресса. Стрессом в данном контексте может быть повышение интенсивности выполнения операций до очень высоких значений или аварийное изменение конфигурации сервера. Также одной из задач при стрессовом тестировании может быть оценка деградации производительности, таким образом цели стрессового тестирования могут пересекаться с целями тестирования производительности.

Объемное тестирование (Volume Testing) . Задачей объемного тестирования является получение оценки производительности при увеличении объемов данных в базе данных приложения

Тестирование стабильности или надежности (Stability / Reliability Testing) . Задачей тестирования стабильности (надежности) является проверка работоспособности приложения при длительном (многочасовом) тестировании со средним уровнем нагрузки.

Тестирование установки направленно на проверку успешной инсталляции и настройки, а также обновления или удаления программного обеспечения.

Тестирование удобства пользования - это метод тестирования, направленный на установление степени удобства использования, обучаемости, понятности и привлекательности для пользователей разрабатываемого продукта в контексте заданных условий. Сюда также входит:
Тестирование пользовательского интерфейса (англ. UI Testing) - это вид тестирования исследования, выполняемого с целью определения, удобен ли некоторый искусственный объект (такой как веб-страница, пользовательский интерфейс или устройство) для его предполагаемого применения.
User eXperience (UX) - ощущение, испытываемое пользователем во время использования цифрового продукта, в то время как User interface - это инструмент, позволяющий осуществлять интеракцию «пользователь - веб-ресурс».

Тестирование на отказ и восстановление (Failover and Recovery Testing) проверяет тестируемый продукт с точки зрения способности противостоять и успешно восстанавливаться после возможных сбоев, возникших в связи с ошибками программного обеспечения, отказами оборудования или проблемами связи (например, отказ сети). Целью данного вида тестирования является проверка систем восстановления (или дублирующих основной функционал систем), которые, в случае возникновения сбоев, обеспечат сохранность и целостность данных тестируемого продукта.

Конфигурационное тестирование (Configuration Testing) - специальный вид тестирования, направленный на проверку работы программного обеспечения при различных конфигурациях системы (заявленных платформах, поддерживаемых драйверах, при различных конфигурациях компьютеров и т.д.)

Дымовое (Smoke) тестирование рассматривается как короткий цикл тестов, выполняемый для подтверждения того, что после сборки кода (нового или исправленного) устанавливаемое приложение, стартует и выполняет основные функции.

Регрессионное тестирование - это вид тестирования направленный на проверку изменений, сделанных в приложении или окружающей среде (починка дефекта, слияние кода, миграция на другую операционную систему, базу данных, веб сервер или сервер приложения), для подтверждения того факта, что существующая ранее функциональность работает как и прежде. Регрессионными могут быть как функциональные, так и нефункциональные тесты.

Повторное тестирование - тестирование, во время которого исполняются тестовые сценарии, выявившие ошибки во время последнего запуска, для подтверждения успешности исправления этих ошибок.
В чем разница между regression testing и re-testing?
Re-testing - проверяется исправление багов
Regression testing - проверяется то, что исправление багов не повлияло на другие модули ПО и не вызвало новых багов.

Тестирование сборки или Build Verification Test - тестирование направленное на определение соответствия, выпущенной версии, критериям качества для начала тестирования. По своим целям является аналогом Дымового Тестирования, направленного на приемку новой версии в дальнейшее тестирование или эксплуатацию. Вглубь оно может проникать дальше, в зависимости от требований к качеству выпущенной версии.

Санитарное тестирование - это узконаправленное тестирование достаточное для доказательства того, что конкретная функция работает согласно заявленным в спецификации требованиям. Является подмножеством регрессионного тестирования. Используется для определения работоспособности определенной части приложения после изменений произведенных в ней или окружающей среде. Обычно выполняется вручную.

Предугадывание ошибки (Error Guessing - EG) . Это когда тест аналитик использует свои знания системы и способность к интерпретации спецификации на предмет того, чтобы «предугадать» при каких входных условиях система может выдать ошибку. Например, спецификация говорит: «пользователь должен ввести код». Тест аналитик, будет думать: «Что, если я не введу код?», «Что, если я введу неправильный код? », и так далее. Это и есть предугадывание ошибки.

Подходы к интеграционному тестированию:

Снизу вверх (Bottom Up Integration)
Все низкоуровневые модули, процедуры или функции собираются воедино и затем тестируются. После чего собирается следующий уровень модулей для проведения интеграционного тестирования. Данный подход считается полезным, если все или практически все модули, разрабатываемого уровня, готовы. Также данный подход помогает определить по результатам тестирования уровень готовности приложения.

Сверху вниз (Top Down Integration)
Вначале тестируются все высокоуровневые модули, и постепенно один за другим добавляются низкоуровневые. Все модули более низкого уровня симулируются заглушками с аналогичной функциональностью, затем по мере готовности они заменяются реальными активными компонентами. Таким образом мы проводим тестирование сверху вниз.

Большой взрыв («Big Bang» Integration)
Все или практически все разработанные модули собираются вместе в виде законченной системы или ее основной части, и затем проводится интеграционное тестирование. Такой подход очень хорош для сохранения времени. Однако если тест кейсы и их результаты записаны не верно, то сам процесс интеграции сильно осложнится, что станет преградой для команды тестирования при достижении основной цели интеграционного тестирования.

Принципы тестирования

Принцип 1 - Тестирование демонстрирует наличие дефектов (Testing shows presence of defects)
Тестирование может показать, что дефекты присутствуют, но не может доказать, что их нет. Тестирование снижает вероятность наличия дефектов, находящихся в программном обеспечении, но, даже если дефекты не были обнаружены, это не доказывает его корректности.

Принцип 2 - Исчерпывающее тестирование недостижимо (Exhaustive testing is impossible)
Полное тестирование с использованием всех комбинаций вводов и предусловий физически невыполнимо, за исключением тривиальных случаев. Вместо исчерпывающего тестирования должны использоваться анализ рисков и расстановка приоритетов, чтобы более точно сфокусировать усилия по тестированию.

Принцип 3 - Раннее тестирование (Early testing)
Чтобы найти дефекты как можно раньше, активности по тестированию должны быть начаты как можно раньше в жизненном цикле разработки программного обеспечения или системы, и должны быть сфокусированы на определенных целях.

Принцип 4 - Скопление дефектов (Defects clustering)
Усилия тестирования должны быть сосредоточены пропорционально ожидаемой, а позже реальной плотности дефектов по модулям. Как правило, большая часть дефектов, обнаруженных при тестировании или повлекших за собой основное количество сбоев системы, содержится в небольшом количестве модулей.

Принцип 5 - Парадокс пестицида (Pesticide paradox)
Если одни и те же тесты будут прогоняться много раз, в конечном счете этот набор тестовых сценариев больше не будет находить новых дефектов. Чтобы преодолеть этот «парадокс пестицида», тестовые сценарии должны регулярно рецензироваться и корректироваться, новые тесты должны быть разносторонними, чтобы охватить все компоненты программного обеспечения, или системы, и найти как можно больше дефектов.

Принцип 6 - Тестирование зависит от контекста (Testing is concept depending)
Тестирование выполняется по-разному в зависимости от контекста. Например, программное обеспечение, в котором критически важна безопасность, тестируется иначе, чем сайт электронной коммерции.

Принцип 7 - Заблуждение об отсутствии ошибок (Absence-of-errors fallacy)
Обнаружение и исправление дефектов не помогут, если созданная система не подходит пользователю и не удовлетворяет его ожиданиям и потребностям.

Cтатическое и динамическое тестирование
Статическое тестирование отличается от динамического тем, что производится без запуска программного кода продукта. Тестирование осуществляется путем анализа программного кода (code review) или скомпилированного кода. Анализ может производиться как вручную, так и с помощью специальных инструментальных средств. Целью анализа является раннее выявление ошибок и потенциальных проблем в продукте. Также к статическому тестирвоанию относится тестирования спецификации и прочей документации.

Исследовательское / ad-hoc тестирование
Простейшее определение исследовательского тестирования - это разработка и выполнения тестов в одно и то же время. Что является противоположностью сценарного подхода (с его предопределенными процедурами тестирования, неважно ручными или автоматизированными). Исследовательские тесты, в отличие от сценарных тестов, не определены заранее и не выполняются в точном соответствии с планом.

Разница между ad hoc и exploratory testing в том, что теоретически, ad hoc может провести кто угодно, а для проведения exploratory необходимо мастерство и владение определенными техниками. Обратите внимание, что определенные техники это не только техники тестирования.

Требования - это спецификация (описание) того, что должно быть реализовано.
Требования описывают то, что необходимо реализовать, без детализации технической стороны решения. Что, а не как.

Требования к требованиям:
Корректность
Недвусмысленность
Полнота набора требований
Непротиворечивость набора требований
Проверяемость (тестопригодность)
Трассируемость
Понимаемость

Жизненный цикл бага

Стадии разработки ПО - это этапы, которые проходят команды разработчиков ПО, прежде чем программа станет доступной для широко круга пользователей. Разработка ПО начинается с первоначального этапа разработки (стадия «пре-альфа») и продолжается стадиями, на которых продукт дорабатывается и модернизируется. Финальным этапом этого процесса становится выпуск на рынок окончательной версии программного обеспечения («общедоступного релиза»).

Программный продукт проходит следующие стадии:
анализ требований к проекту;
проектирование;
реализация;
тестирование продукта;
внедрение и поддержка.

Каждой стадии разработки ПО присваивается определенный порядковый номер. Также каждый этап имеет свое собственное название, которое характеризует готовность продукта на этой стадии.

Жизненный цикл разработки ПО:
Пре-альфа
Альфа
Бета
Релиз-кандидат
Релиз
Пост-релиз

Таблица принятия решений (decision table) - великолепный инструмент для упорядочения сложных бизнес требований, которые должны быть реализованы в продукте. В таблицах решений представлен набор условий, одновременное выполнение которых должно привести к определенному действию.

QA/QC/Test Engineer


Таким образом, мы можем построить модель иерархии процессов обеспечения качества: Тестирование - часть QC. QC - часть QA.

Диаграмма связей - это инструмент управления качеством, основанный на определении логических взаимосвязей между различными данными. Применяется этот инструмент для сопоставления причин и следствий по исследуемой проблеме.



Понравилась статья? Поделитесь с друзьями!