Операциональная валидность. Операционализация переменных, операциональная и конструктная валидность

Пока отдельно были представлены некоторые типы психологических данных - как фиксируемых показателей и в контексте проблемы статистических решений. Теперь следует сделать следующий шаг - раскрыть проблему выбора психологических методик как средств операционализации переменных. По отношению к выборочным значениям ЗП принимаются статистические решения, по значения переменных выступают результатами использования определенных психологических методик.

Чтобы получить данные, психолог фиксирует как психофизиологические показатели, если гипотеза предполагает рассмотрение их связи с изучаемым процессом, так и самоотчеты испытуемых. Он может наблюдать за поведением, а может специально выделять лишь некоторые, методически специально выделенные аспекты активности испытуемого - время реакции, число предложенных решений, особенности ответа в неопределенной ситуации. Он применяет стандартизованные и не стандартизированные методики, с помощью которых фиксируются показатели когнитивной сферы человека (восприятия, внимания, памяти, мышления), а также его эмоционально-личностной сферы (мотивы, характерологические свойства и т.д.).

Из характеристик используемых методик не следует, каким методом проводилось исследование. Внешней характеристикой экспериментального исследования может служить указание на то, что в нем должны присутствовать как минимум две методики: для задания НП и измерения ЗП. И обе они оцениваются в аспектах репрезентативности - конструктов НП и ЗП или соответствия тем реальным условиям, аспекты которых моделируются.

Операциональная наличность - оценка эксперимента с точки зрения степени соответствия эмпирически нагруженным понятиям НП, ЗП и ДП тех методик задания и измерения переменных, которые используются в исследовании.

Наиболее простым путем было бы определение психологической переменной путем связывания ее с методикой получения тех или иных данных. Действительно, если определять различия между понятиями "метод" и "методика", то такой путь покажется логичным. Метод - это наиболее крупная единица анализа типа исследования. Методика - более мелкая единица. Методики могут кочевать из одного исследования в другое и использоваться при разных способах организации исследования.

Психологическая методика - это способы фиксации психологических данных, "техники" построения психологических показателей. С многообразием психологических методик студенты обычно знакомятся в предметном и исследовательском практикумах.

В то же время методика может не выглядеть психологической, но использоваться для задания, скажем, уровней независимой переменной или для измерения зависимой. Например, в оценке разного рода рекламы - как организуемого психологического воздействия - ее эффективность представлена в количестве единиц проданного продукта. Это экономический показатель. Он становится психологической переменной только в одном случае - когда связывается в психологической гипотезе с опосредствующим процессом психологического воздействия. Тогда разные виды рекламы одного и того же товара предстают разными уровнями НП (например, реклама постоянная или нет, в печатных или электронных СМИ и т.д.).

Выделение уровней НП также может осуществляться, казалось бы, безотносительно к арсеналу психологических методик. В приведенном в разделе 5.3.3 примере искусственной среды "Пятое измерение" ее можно трактовать в качестве единого (активного) уровня НП. Тогда контрольным (неактивным) уровнем будут обычные условия обучения и проведения ребенком своего досуга. В многочисленных исследованиях по инженерной психологии сравниваются разные условия выполнения человеком профессиональной деятельности, при том что разница условий задана особенностями используемых приборов, их расположением и т.д. Не продолжая примеров, можно сказать, что психологическими эти уровни экспериментальных факторов становятся именно благодаря тому, что в звене экспериментальной гипотезы они связываются с ожидаемыми изменениями изучаемого базисного процесса.

В самом общем виде под базисным процессом можно понимать центральное звено регуляции изменений, отражаемых в индексах, или показателях, 311. Показатель, фиксируемый методикой как отклик влияния НП, не сводится сам по себе к изучаемому базисному процессу.

В психологическом эксперименте это также входит в этап содержательного планирования исследования - обосновать, что подразумевается под изменениями индекса. Например, за показателем времени реакции можно предполагать совершенно разные процессы (обозначающие, что именно происходит в фиксируемые отрезки времени перед ответом испытуемого).

Если же речь пойдет о более сложных методиках, которые включают существенный пласт толкований психологом того или иного ее индекса, то интерпретационный процесс прямо будет задавать способ конструирования переменной. Например, применительно к проективной методике тематического апперцептивного теста (TAT) Е. Т. Соколовой прослежено изменение способов толкования того, как в рассказах по неопределенным картинкам (фотографиям) можно устанавливать проявление механизмов проекции, психологической защиты и т.д. От конца 30-х к концу 60-х гг. XX в. толкования существенно изменялись в зависимости от включения предположений о проявлении в рассказах испытуемых их рационального "Я" [Соколова, 1980].

Те же виды глубинной мотивации (социогенные потребности в классификации Г. Мюррея) могут диагностироваться с помощью опросника, который был предложен Л. Эдвардсом [Корнилова, 1997]. Проективный тест и вербальный, построенный в опроснике Эдвардса па основе приема вынужденного выбора предпочтений, могут давать разные местоположения испытуемого по отношению к конкретной мотивационной шкале, поскольку подразумевают проявление разных базисных процессов, стоящих за используемыми индексами двух процедурно разных методик.

Таким образом, одни и те же психологические конструкты (мотивация достижения, агрессия, аффилиация и т.д.) операционализируются по-разному. Их различие связано именно с подразумеваемыми механизмами осознанной оценки предпочтения или неосознаваемого проявления в рассказе субъекта той или иной глубинной мотивации (при инструкции "исследуется воображение").

Итак, наиболее простой путь связывания сути психологической переменной с той или иной методикой может вводить в заблуждение относительно того, что репрезентирует фиксируемый показатель. Более адекватным является иной путь - косвенной реконструкции того, что репрезентируется показателем. Два условия должны выполняться.

Первое . Представленные в гипотезе как эмпирически нагруженные понятия - независимой и зависимой переменных - должны быть операционализированы, т.е. должен быть конкретизирован путь их методического представления в исследовании.

Второе . Эта операционализация должна быть такой, чтобы управление экспериментальным фактором или изменения базисного процесса могли быть представлены в виде той или иной шкалы, т.е. измерены.

Совсем не все методики позволяют выделять переменные. Например, методики наблюдения, предполагающие фиксацию данных в единицах естественного языка или в условных обозначениях, еще не выступают способами выделения переменных. Наблюдать изменения - это еще не значит их измерять. Современные исследования, выполняемые методом наблюдения, включают огромный арсенал стандартизованных методик. По для перехода к процедурам измерения должны выполняться дополнительные условия, в результате чего и достигается возможность выделения правил приписывания чисел психологическим объектам.

Именно измерение переменных выступает условием проведения психологического эксперимента, а также реализации ряда других методов - корреляционного, квазиэксперимента, лонгитюда.

Перечисление событий, установление их частоты - еще не измерение, но процедура, позволяющая строить ЗП. Приведем пример того, как происходит конструирование такой ЗП, когда ее индекс является производным, а не отражает фиксацию какого-либо методически заданного показателя.

В примере с искусственным экспериментальным условием "Пятое измерение" М. Коула, который будет представлен в главе 5 (экскурс 5.8), можно выделять множество переменных. В реальных условиях на пляже психологами была создана особая ситуация отдыха для детей, которые при этом - в игровой ситуации - овладевали рядом средств (в частности, компьютером) своей деятельности. 311 было несколько. Одна из них - упоминания в дневниковых записях студентов, которые работали с детьми, тех или иных "артефактов" в их инструментальном значении или в виде упоминания как ориентиров для опосредствования действий ребенка. Число упоминаний одних и тех же объектов среды в двух контекстах -ориентация на возможность их использования или опосредствование действий их использованием - дало автору возможность проследить временную динамику процесса "культурации" в косвенном (отражаемом помощником психолога) виде.

Рис. 3.1. Динамика переменных, отражающих инструментальное и ориентационное отношение к "артефактам" в созданном игровом контексте

На диаграмме, представленной на рис. 3.1, видно, как растет со временем пребывания в искусственной среде "Пятого измерения" количественный показатель инструментального отношения к ее элементам по сравнению с иной тенденцией - снижением индексов общей ориентировки на элементы среды. Таким образом, в естественных условиях проведения этого исследования выделялись те показатели, динамика которых служила верификации (эмпирической проверке) теоретической гипотезы о роли "артефактов" как задаваемых ребенку средств преобразования его игровой деятельности и тем самым - его развития.

Понятие валидности эксперимента включает в себя по меньшей мере три основных понятия: операциональной валидности, внешней валидности и внутренней валидности. Рассмотрим эти понятия и реальности, обозначаемые ими, более подробно.

Операциональная валидность

Понятие операциональной валидности тесно связано с определенной проблемой, которая объективно существует не только в экспериментальном, но и в любом другом эмпирическом исследовании. В частности, в экспериментальном исследовании эта проблема состоит в том, что исследуемая реальность представлена в нем двояким образом. Во-первых, в гипотезе исследования она представлена в форме ее словесного описания, а во-вторых, в методике исследования она представлена в форме конкретных явлений, которым свойственны определенные характеристики. Очевидно, что с точки зрения идеальных требований к проведению экспериментального исследования оно должно быть организовано так, чтобы между этими двумя формами представления исследуемой реальности было полное соответствие . Если же это соответствие не достигнуто, то экспериментальное исследование является неадекватным в том смысле, что его результаты нельзя использовать ни для подтверждения, ни для опровержения гипотезы.

В связи с указанной проблемой, понятие операциональная валидность можно определить как правомерность вывода о полноте соответствия исследуемой реальности, представленной в гипотезе исследования в словесной форме, той реальности, которая представлена в методике исследования в форме конкретных явлений.

В зависимости от степени полноты этого соответствия экспериментальное исследование может обладать операциональной валидностью в разной степени, т.е. быть более или менее операционально валидным.

На практике для того, чтобы оценить операциональную валидность экспериментального исследования, необходимо решить вопрос о правомерности соответствия между содержаниями основных терминов, которые используются для описания исследуемой реальности в гипотезе исследования, и тем, как эти содержания представлены в методике исследования.

Для иллюстрации проблемы операциональной валидности можно воспользоваться следующим примером. Допустим, в гипотезе исследования фигурирует термин «объем внимания», означающий количество элементов, которые человек может воспринять одновременно ясно и отчетливо, а в методике исследования для измерения объема внимания используется тахистоскоп, позволяющий зрительно предъявлять одновременно на короткое время набор элементов, и в качестве конкретного явления, характеризующего объем внимания, выступает количество элементов, которые испытуемые могут воспроизвести. В этом случае перед экспериментатором, проводящим это исследование, неизбежнодолжен возникнуть следующий вопрос, непосредственно имеющий отношение к проблеме операциональной валидности, а именно: соответствует ли количество воспроизводимых испытуемыми элементов количеству элементов, воспринимаемых ими ясно и отчетливо. Как известно из истории экспериментальной психологии, В. Вундт допускал существование такого соответствия. Однако в экспериментах Дж. Сперлинга с использованием методики частичного отчета было показано, что количество воспроизводимых испытуемыми элементов может быть меньше количества элементов, воспринимаемых ими ясно и отчетливо. Из приведенного примера следует, что автору этого гипотетического исследования необходимо более тщательно обосновать, почему он считает возможным использовать для измерения объема внимания показатель продуктивности воспроизведения, иначе его исследование может оказаться операционально невалидным.

Валидность методики – это мера соответствия методики диагностики предмету диагностики. Валидность методики экспериментального исследования является необходимой в исследовании. Надежность - характеристика повторяемости результатов через определенное время.

Валидность психологического эксперимента – это качественная характеристика психологического исследования с точки зрения правильности его организации. На валидность влияет выборка (т.е., то, насколько она является репрезентативной). Понятие естественного эксперимента ввел А.Ф. Лазурский. Виды валидности в психологическом экспериментальном исследовании Выделяют следующие виды валидности психологического экспериментального исследования: 1Внутренняя валидность – представляет специфический вариант идеального эксперимента без недостатков, присущих истинному экспериментальному исследованию; 2.Внешняя валидность (экологическая); 3. Операциональная валидность; 4. Конструктная валидность.

Идеальный эксперимент – это такой эксперимент, в котором исключено влияние побочных переменных. Это умозрительная конструкция, возможность которой, однако, исключить нельзя (например, фактор развития). Независимая переменная влияет на зависимую переменную. Но существуют также и побочные переменные. Если влияние побочных переменных будет очень существенным, то можно получить смещение графиков. Таким образом, видно, что следует стремиться исключить Внутренняя валидность – Мера соответствия реального эксперимента идеальному. Соотношение влияния НП и побочных переменных на ЗП. Чем больше приходится на НП, тем выше Валидность. Чтобы ее повысить, нужно выявить сторонние переменные и устранить или усреднить. Высокая внутренняя валидность позволят считать выводы о зависимости достоверными. Внешняя валидность – переносимость полученных результатов в реальный мир. «Эксперимент полного соответствия» - абсолютная переносимость. Операциональная валидность – соответствие методики и плана эксперимента проверяемой гипотезе (соответствие того, что мы ищем, тому, что проверяем) Конструктивная валидность – мера соответствия интерпритации экспериментальных данных теории. Характеризует правильность обозначения причины и эффекта с помощью терминов.

Вы также можете найти интересующую информацию в научном поисковике Otvety.Online. Воспользуйтесь формой поиска:

Понятие «валидность» ввел в употребление Д. Кэмпбелл. Различают внутреннюю и внешнюю валидность эксперимента. Существуют также конструктная и операциональная валидности.

Внутренняя валидность характеризует меру влияния на изменение зависимой переменной тех условий (независимой переменной), которые варьирует экспериментатор. Чем больше влияют на изменение зависимой переменной неконтролируемые исследователем условия, тем ниже внутренняя валидность эксперимента. Высокая внутренняя валидность - главный признак хорошего эксперимента. Внутренняя валидность тем выше, чем больше вероятность того, что экспериментальный эффект (изменение зависимой переменной) вызван изменением независимой переменной.

Кэмпбелл выделил несколько основных факторов, нарушающих внутреннюю валидность эксперимента.
1. Селекция - неэквивалентность групп по составу, которая вызывает систематическую ошибку в результатах (например, исследуются группы младших школьников, но одни из обычных классов, а другие - из класса коррекции)
2. Статистическая регрессия - частный случай ошибки селекции, когда группы отбирались на основе «крайних» показателей (допустим, исследовали очень глупых и очень умных детей, а считалось, что взяли «середнячков»).
3. Экспериментальный отсев - неравномерное выбывание испытуемых из сравниваемых групп, приводящее к неэквивалентности групп по составу.
4. Естественное развитие - изменение испытуемых, являющееся следствием течения времени, без связи с конкретными событиями изменение состояния (голод, усталость, болезнь и др.), свойств индивида (возрастные перемены, накопление опыта и т.п.). Также на нарушение внутренней валидности влияет большое количество побочных переменных.

Внешняя валидность определяет, в какой мере результаты, полученные в эксперименте, будут соответствовать жизненной ситуации, послужившей «первообразом» для эксперимента.

Кроме того, внешняя валидность характеризует возможность обобщения, переноса результатов, полученных в эксперименте, на весь класс жизненных ситуаций, к которым принадлежит «первообразная», и на любые другие.

В принципе возможны такие эксперименты, которые не соответствуют никаким реальным жизненным ситуациям, а служат лишь для проверки гипотез, источником которых является развитая теория. Например, эксперименты по сенсорной депривации или выработке классических условных рефлексов у собак не соответствуют никакой жизненной реальности.

Внешняя валидность иногда трактуется как характеристика эксперимента, определяющая возможность переноса (обобщения) полученных результатов на различные времена, места, условия и группы людей (или животных). Однако возможность переноса является следствием двух причин:
- соответствия условий эксперимента его «первообразной» жизненной ситуации («репрезентативность» эксперимента) (например, исследование мотивации учащихся - репрезентативный эксперимент, т.к. все учащиеся находятся в ситуации учебной деятельности и так или иначе мотивированы на учебу);
- типичности самой «первообразной» ситуации для реальности («репрезентативность» ситуации). Выбранная для моделирования в эксперименте ситуация может быть совершенно нерепрезентативной с точки зрения жизни той группы испытуемых, которая участвует в эксперименте, или являться редкой и нетипичной (например, исследование поведения в экстремальных ситуациях пенсионеров села Банниково).

Кэмпбелл называет главные причины нарушения внешней валидности:
1. Эффект тестирования - уменьшение или увеличение восприимчивости испытуемых к экспериментальному воздействию под влиянием тестирования.
2. Условия проведения исследования. Они вызывают реакцию испытуемого на эксперимент. Следовательно, его данные нельзя переносить на лица, не принимавшие участия в эксперименте, этими лицами является вся генеральная совокупность, кроме экспериментальной выборки.
3. Интерференция экспериментальных воздействий. Испытуемые обладают памятью и обучаемостью. Если эксперимент состоит из нескольких серий, то первые воздействия не проходят для них бесследно и сказываются на появлении эффектов от последующих воздействий.

В реальной практике редко возникает возможность провести «правильное» исследование по всем законам и с учетом всех условий и требований. В действительности чаще оказывается невозможным подобрать репрезентативные выборки, исключить эффекты селекции, выбывания, да и возможность переноса результатов на всю популяцию зачастую оказывается нереальной. Поэтому в психологии разработаны так называемые планы квазиэкспериментов.

Квазиэкспериментом является любое исследование, направленное на установление причинной зависимости между двумя переменными («если А, то В»), в котором отсутствует предварительная процедура уравнивания групп или «параллельный контроль» с участием контрольной группы заменен сравнением результатов неоднократного тестирования группы (или групп) до и после воздействия. Выбираются две естественные группы, например два параллельных школьных класса. Обе группы тестируются. Затем одна группа подвергается воздействию (ставится в особые условия деятельности), а другая - нет. Через определенное время обе группы проходят тестирование повторно. В педагогической практике большинство исследований проведено по типу квазиэкспериментальных.

Кэмпбелл ввел еще одно важное понятие, а именно - конструктную валидность. Она характеризует правильность обозначения (интерпретации) причины и экспериментального эффекта с помощью абстрактных терминов из обыденного языка или формальной теории. Кэмпбелл отмечает, что установление внутренней валидности требует отбраковывания альтернативных объяснений связи между зависимой и независимой переменными. Установление конструктивной валидности требует отказа от альтернативных интерпретаций соотношения причины и следствия с понятиями, взятыми из той или иной теории. Таким образом, конструктная валидность определяется правильностью употребления терминов той или иной теории при интерпретации данных эксперимента.

На основе теории выдвигается гипотеза, которая в конечном счете и проверяется в эксперименте. Методики и план эксперимента должны соответствовать проверяемой гипотезе - степень этого соответствия и характеризует операциональную валидность.

Например, исследовать степень притязаний с помощью анализа степени привлекательности спутника (спутницы) испытуемого нельзя.

Исследовательская гипотеза, которую мы хотим проверить, формулируется, как правило, в довольно общих и абстрактных понятиях, которые должны репрезентироваться в конкретном эксперименте.

В предисловии к этой главе обсуждался вопрос о том, насколько громкий звук зуммера может репрезентировать абстрактное понятие наказания. На самом деле он очень мало похож на наказание. Обычно наказание связывается с представлением о боли, лишении собственности или свободы, общественном осуждении. Именно в вопросе перевода абстрактных или теоретических понятий на язык конкретного эксперимента даже лучшие психологи подчас демонстрируют сомнительную логику. Если такой перевод вызывает сомнения, то говорят, что эксперимент лишен операциональной валидности.

Эксперимент в социальной психологии

Хорошим примером такого сомнительного перевода, который сразу же приходит на память, может служить классическое исследование Левина, Липпита и Уайта (1939). В нем сравнивалось влияние авторитарной, демократической и анархической обстановки на групповое поведение 10-летних мальчиков. Посмотрим, как эти понятия переводились на язык конкретных экспериментальных операций. Авторитарная обстановка была представлена взрослым лидером, который сам принимал все решения и делал много персональных замечаний. Демократические условия также обеспечивались взрослым лидером, который, однако, способствовал коллективному решению вопросов и всячески стремился поддерживать ребят. Для создания анархической обстановки предусматривалось полное невмешательство взрослого как в деятельность группы, так и в межличностные отношения. В результате оказалось, что в условиях «демократической» обстановки было меньшее число драк, дети были более счастливы и более деятельны, чем при Других режимах. Автор этих строк предпочел бы назвать описанные ситуации соответственно как деспотию, либеральную монархию и демократию. Эти действительные режимы не смогли реализоваться полностью (кроме взрослого лидера) из-за недостатка времени. Другой вопрос, связанный с операциональной валидностью, - насколько эти кратковременные эксперименты с детьми, живущими в очень разной домашней обстановке, могут вообще что-либо говорить о поведении индивидов, которые постоянно находятся в соответствующих социальных условиях.

Эксперимент по научению

Один из самых выдающихся психологов Е. Л. Торндайк проверил гипотезу о том, что частота упражнения сама по себе (т. е. без знания результата) ведет к научению (1931, 1932). В опытах на самом себе Торндайк чертил линии заданной длины (например 4 дюйма) с закрытыми глазами, доведя число проб до нескольких сотен. К сожалению, он использовал два противоречащих друг другу критерия для оценки факта научения.

Первым критерием было увеличение точности действия; вторым - тем большее закрепление движений, чем чаще они осуществлялись в ранних пробах. Когда оказалось, что точность движении не увеличивается (работа 1931 г.), был сделан вывод, что экспериментальная гипотеза неверна. Когда же точность увеличилась (работа 1932 г.), но при этом неизбежно уменьшилась частота движений, осуществлявшихся в ранних пробах, то это также было использовано для опровержения экспериментальной гипотезы!

Снова об эксперименте полного соответствия

Были ли эти эксперименты правильны в том смысле, что они действительно проверяли экспериментальную гипотезу? Обладают ли они внешней валидностью? Ранее внешняя валидность определялась тем, насколько хорошо эксперимент репрезентирует безупречный эксперимент полного соответствия. Так, в отношении экспериментов, которые «улучшают» реальный мир (глава 3), ставился вопрос, насколько независимая, зависимая и побочные переменные репрезентировали реальную ситуацию, рассматриваемую в экспериментальной гипотезе. Точно так же в случае эксперимента на выборках (глава 4) обсуждался вопрос, насколько была представлена интересующая популяция. Таким образом, обсуждался тот же вопрос, хотя и в более утонченном виде.

Спорный момент исследования социальной обстановки (Левин, Липпит и Уайт, 1939) в том, насколько адекватно три экспериментальных условия репрезентируют соответствующие социальные системы. Было выдвинуто возражение, что никакая группа с самозваным лидером не может считаться демократической. Однако выполнение настоятельного требования, чтобы руководитель выдвигался самой группой, сделало бы эксперимент вообще невозможным. Поэтому предполагается, что при достаточном времени анархическая обстановка может перейти в демократическую. Правда, надо признать, что со временем в той же группе вполне могла сложиться и авторитарная обстановка, как это описано в «Повелителе Мух» (Голдинг, 1954). Итак, можно сделать вывод, что хотя в эксперименте не достигнуто полное соответствие, он все-таки был, насколько возможно, близок к этому. Таким образом, внешняя валидность оказалась настолько высокой, насколько это было практически возможно.

Вопрос о репрезентативности в этом эксперименте связан с независимой переменной. В эксперименте по научению, проведенном Торндайком, этот вопрос относится к зависимой переменной. Торндайк был талантливым исследователем; и только веская причина могла затруднить ему определение зависимой переменной. По его мнению, единственно, что можно достичь простым упражнением, без знания результатов, - это закрепить первоначальные реакции. Это должны быть те реакции, которые повторялись наиболее часто. Таким образом, когда точность движений действительно увеличилась, он решил, что это изменение не является свидетельством научения, так как он никак не мог этого объяснить. Тем не менее реально научение может происходить и без знания внешних результатов. Например, будучи испытуемым, Торндайк мог все более внимательно относиться к своим движениям и тем самым достигать лучшего соответствия воспроизводимых линий «внутреннему стандарту» в 4 дюйма. Теоретические представления экспериментатора не должны влиять на выбор зависимой переменной. Ведь экспериментальная гипотеза была достаточно ясной: научение означает более точное действие. Поэтому степень точности воспроизводимой линии и была наиболее адекватной зависимой переменной.

Итак, операциональная валидность означает, что конкретные экспериментальные операции (создание условий и получение зависимой переменной) репрезентируют независимую и зависимую переменные в недостижимом эксперименте полного соответствия. В данном случае эксперимент полного соответствия невозможен, потому что он существует в мире теорий, а не в сфере конкретных операций.