Добавлено в закладки: 0
Что такое валидность? Описание и определение понятия.
Валидность – это
1) мера соответствия, которая показывает насколько соответствуют поставленным задачам полученные результаты и разработанная методика исследования;
2) фундаментальное понятие в экспериментальной психологии и психодиагностике. Различают такие типы валидности: валидность по содержанию, конструктивная валидность, прогностическая валидность, валидность по критерию. Безупречную валидность имеет только теоретический безупречный эксперимент: эксперимент, при котором получаемый эффект вызывает независимую переменную, соответствует полностью реальности, а его итоги поддаются без дополнительных ограничений обобщению.
Вали́дность (англ. validity, от лат. validus — «сильный, здоровый, достойный») — пригодность и обоснованность использования результатов и методик исследования в конкретных условиях. Более прикладное определение понятия “валидность” – мера соответствия результатов и методик исследования поставленным задачам. Валидность является фундаментальным понятием психодиагностики, организационной психологии, экспериментальной психологии.
Как в статистике, так и в психологии, валидное измерение — такое измерение, которое измеряет то, что оно обязано измерять (эта узкая трактовка “валидности” – наиболее популярная, она по факту соответствует понятию “конструктная валидность”). То есть, например, при валидном измерении интеллекта измеряют именно интеллект, а не что-то другое. Безупречный эксперимент (возможный только в теории) будет иметь безупречную валидность: он точно будет показывать, что экспериментальный эффект вызван изменением независимой переменной, он будет соответствовать полностью реальности, его итоги можно без ограничений обобщить.
Когда говорят о степени валидности, рассматривают то, насколько итоги исследования соответствуют поставленным задачам (но при этом валидность не измеряется в каких-нибудь условных единицах).
Важная особенность валидности – её невозможно единожды установить и использовать это доказательство в качестве финального аргумента “за” качество определенной методики или эксперимента. Валидность нужно постоянно обосновывать новыми данными, в независимых исследованиях перепроверять.
Разница между валидацией и верификацией [ править | править код ]
Верификация — обычно внутренний
процесс управления качеством, обеспечивающий согласие с правилами, стандартами или спецификацией. Простой способ запомнить разницу между валидацией и верификацией заключается в том, что валидация подтверждает, что «вы создали правильный продукт», а верификация подтверждает, что «вы создали продукт таким, каким и намеревались его сделать» [2] . Ещё один пример типичной верификации: проведение испытания оборудования. Имея определенные требования на руках, мы проводим испытание продукта и фиксируем, соблюдены ли требования. Результат верификации — ответ на вопрос «Соответствует ли продукт требованиям?».
Но далеко не всегда продукт, соответствующий установленным требованиям, можно применять в конкретной ситуации. Например, лекарство прошло все положенные испытания и поступило в продажу. Значит ли это, что оно может быть применено каким-то конкретным больным? Нет, так как каждый организм имеет свои особенности и конкретно для него, это лекарство может быть губительным, то есть кто-то (врач) должен подтвердить: да, этому больному можно принимать это лекарство. То есть врач должен выполнить валидацию: придать законную силу конкретному применению.
Другой пример: предприятие выпускает трубы, предназначенные для закладки в землю, в соответствии с некоторыми ТУ (Техническими условиями). Продукция этим ТУ соответствует, но поступил заказ, предполагающий укладку труб по дну моря. Могут ли трубы, соответствующие имеющимся ТУ, быть применены в данном случае? Именно валидация и дает ответ на этот вопрос.
Можно видеть, что еще одно отличие состоит в том, что верификация производится всегда, а вот необходимость в валидации может и отсутствовать. Она появляется только тогда, когда возникают требования, связанные с конкретным применением продукции. Если фармацевтический завод выпускает лекарства, то он будет проверять лишь их соответствие требованиям, а проблемами применения конкретных лекарств конкретными пациентами заниматься не будет.
Таким образом, можно констатировать следующее:
- верификация — проводится практически всегда, выполняется методом проверки (сличения) характеристик продукции с заданными требованиями, результатом является вывод о соответствии (или несоответствии) продукции,
- валидация — проводится при необходимости, выполняется методом анализа заданных условий применения и оценки соответствия характеристик продукции этим требованиям, результатом является вывод о возможности применения продукции для конкретных условий [3] .
Исходя из вышеописанного, валидация должна быть определена как подтверждение на основе представления объективных свидетельств того, что требования, предназначенные для конкретного использования или применения, точно и в полном объёме предопределены, а цель достигнута.
Такие слова, как «верификация» и «валидация», довольно часто можно услышать в различных телепередачах, но мало кто из людей знает, что они означают. Их звучание довольно сходное, и те, кто произносят эти слова, часто сами путаются в них. Из контекста слушатель догадывается, что дело и там, и там связано с проверкой чего-то. Что же в действительности означают эти слова, что у них общего и чем отличается валидация от верификации?
Валидность методики это
Валидность методики определяет соответствие того, что изучается данной методикой, тому для изучения чего именно она предназначена.
Например, если психологическая методика, которая основана на осведомленном самоотчете, назначена для исследования некого качества личности, такого качества, которое не может быть верно, оцененным самим человеком, то такая методика не будет валидной.
В большинстве случаев ответы, которые дает испытуемый на вопросы о наличии или отсутствии развитости в нем этого качества, может выражать то, как сам испытуемый воспринимает себя, или каким бы ему хотелось быть в глазах других людей.
Валидность также является основным требованием к психологической методике изучения психологических конструктов. Существует масса разных видов данного критерия, и нет пока единственного мнения о том, как правильно назвать эти виды и неизвестно каким именно видам методика обязана соответствовать. Если же методика оказывается невалидной внешне или внутренне, не рекомендуется ее использовать. Существуют два подхода к валидизации методики.
Теоретический подход выявляется в том, чтобы показать насколько действительно методика измеряет именно то качество, которое, как придумал исследователь, и обязана измерять. Это доказывается через составление с родственными показателями и теми, где связей не могло бы быть. Поэтому для подтверждения теоретического валидного критерия нужно определить степень связей с родственной методикой, имеется в виду конвергентный критерий и отсутствие такой связи с методиками, которые имеют иную теоретическую базу (дискриминантная валидность).
Оценивание валидности методики может быть количественной или качественной. За прагматическим подходом оценивается эффективность и практическая значимость методики, и для ее проведения используется независимый критерий извне, как показатель встречаемости данного качества в повседневной жизни. Таким критерием, например, может быть успеваемость (для методик на достижения, тестов на интеллект), субъективные оценки (для личностных методик), специфические способности, рисование, моделирование (для методик специальных особенностей).
Для доказательства валидности внешних критериев, выделяется четыре типа: критерии исполнения – это критерии такие, как количество выполненных заданий, время, потраченное на обучение; субъективные критерии получают вместе с опросниками, интервью или анкетами; физиологические – частота пульса, давление, физические симптомы; критерии случайности – используются, когда к цели имеет касательство или влияние определенного случая или обстоятельств.
При выборе методики исследования имеет теоретическое и практическое значение определение охвата изучаемых характеристик, как важной составляющей валидности. Информация, которая содержится в названии методики практически всегда не является достаточной для суждения об области ее применения
Это просто имя методики, но под ним всегда кроется еще много чего. Хорошим примером будет методика корректурной пробы. Здесь в сферу изучаемых свойств включаются концентрация внимания, устойчивость и психомоторная скорость процессов. Такая методика дает оценку выраженности этих качеств в личности, хорошо соотноситься со значениями, полученными из других методов и обладает хорошей валидностью. Вместе с тем полученные в результате проведения корректурной пробы значения подвержены большему влиянию других факторов, относительно которых методика будет неспецифичной. Если применить корректурную пробу, чтобы измерить их, то валидность будет невысокая. Выходит,что определяя область применения методики, валидный критерий отображает уровень обоснованности результатов исследования. При небольшом количестве сопровождающих факторов, которые имеют влияние на результаты, достоверность оценок, полученных в методике будет выше. Еще достоверность результатов определяется с помощью набора измеряемых свойств, их важностью при осуществлении диагностики сложной деятельности, существенностью отображения в материале методики предмета измерения. Например, для удовлетворения требований достоверности и надежности, методика, назначенная на профотбор, должна иметь анализ большого круга различных показателей, которые наиболее важные при достижении успеха в профессии.
Верификация в науке
В науке верификация – это проверка научной гипотезы (предположения) на соответствие объективным критериям, признанным на данный момент истинными. Метод научного познания состоит в выдвижении гипотез, объясняющих какое-либо явление окружающего нас мира. Далее автор гипотезы собирает доказательства того, что ее положения не противоречат уже известным научным фактам и опытным данным.
Для этого проводятся серии натурных или мысленных экспериментов, и если их результаты подтверждают гипотезу, она считается верифицированной и становится научной концепцией или даже теорией.
Официальные этапы валидации
Валидация — сложный процесс, который требует четкой методологии. Официально выделяют 6 этапов валидации, которые соответствуют мировым стандартам:
- Спецификация требований пользователей. На этом этапе нужно собрать все данные о том, чего ждут пользователи или покупатели от системы, процесса или продукта. Данные собираются различными способами, от прямых вопросов и анкетирования, до масштабного анализа рынка с привлечением специалистов по статистическим данным.
- Специализация функций. На этом этапе, на основе предыдущих данных, нужно собрать свое понимание того, каким требованиям и стандартам будет соответствовать продукт, чтобы удовлетворить потребителя.
- Спецификация. На этом этапе на основе предыдущих выводов составляется полное описание того, как будет добиваться это соответствие ожиданиям. Все задокументировано, все технические процессы описаны.
- Оценка монтажа. Это проверка документов. Насколько все требования и соответствия были выполнены. Показатели сверяются со стандартами, которые были заданы на этапе сертификации.
- Проверка функционирования. Здесь уже этап тестов в конкретных условиях. Нужно посмотреть, как будет себя вести конкретный продукт в абстрактных условиях. Не приближенных к реальным, а в целом. И на основе этого сделать выводы о соответствии ожиданий клиентов с реальными показателями.
- Проверка эксплуатации. Если предыдущий этап пройден, нужно смотреть, как будет вести себя продукт в условиях эксплуатации. В каком случае он будет соответствовать ожиданиям пользователей, а в каких случаях нет.
По каждому из официальных этапов валидации составляются специальные протоколы, а из них потом собирается один общий документ с итогами. Его подписывают все специалисты, которые проводили валидацию, а также руководитель компании. Если это делала специальная компания на аутсорсе, она передает данные в компанию, последняя сравнивает показатели со своими данными, а представители ставят подписи.
Результатом такой проверки может быть список рекомендаций, который позволит улучшить производственный процесс и конечный продукт. И если их применить, продукт можно считать валидными. Потом в дело вступают финансовые аналитики, которые сравнивают риски ликвидации невалидного товара с потенциальными затратами на его доработку. И только после этого принимается решение о доработке или же выпуске на рынок.
Верификация на производстве товаров и в предоставлении услуг
В отличие от научной верификации, оставляющей большой простор для интерпретации результатов натурных, а в особенности – мысленных экспериментов, понятие верификации при производстве продуктов или предоставлении услуг четко формализовано и зафиксировано в стандартах системы управления качеством.
Наиболее широко процесс начал использоваться при производстве программного обеспечения и разработке сложных технических систем. Из этих отраслей метод распространился и в другие отрасли.
Подтверждение на основе представления объективных свидетельств того, что установленные требования были выполнены. (ИСО 9000:2000)
Производственная верификация заключается в сборе документальных доказательств того, что проектируемый и производимый продукт (или услуга) соответствует всем требованиям технического задания, производственных спецификаций и стандартов отрасли на каждом этапе производственного цикла. В случае сложных и продолжительных производственных процессов важно не откладывать сбор таких свидетельств на ночь перед отгрузкой продукции.
В производстве сложных систем и программных продуктов применяют следующие методы верификации:
- проведение альтернативных расчетов;
- сопоставление документации по текущему проекту с документацией по принятому и апробированному проекту;
- осуществление тестирования по утвержденной программе;
- анализ документов проекта на разных стадиях готовности.
Тестирование и анализ документов представляют собой наиболее широко и часто используемые подходы. Сопоставление научно-технической и проектной документации также весьма популярно, однако для многих передовых разработок трудно подобрать аналогичный проект.
Проведение альтернативных расчетов по независимому алгоритму позволяет получить базу для оценки точности расчетов, выполненных по проверяемому алгоритму. Один из наиболее часто используемых способов альтернативных расчетов – это калькулятор.
Детали
Говорят, что выводы обладают внутренней достоверностью, если причинно-следственная связь между двумя переменными правильно продемонстрирована. Обоснованный причинно-следственный вывод может быть сделан при соблюдении трех критериев:
- «причина» предшествует «следствию» во времени (приоритет во времени),
- «причина» и «следствие» имеют тенденцию происходить вместе (ковариация), и
- нет никаких правдоподобных альтернативных объяснений наблюдаемой ковариации (непредсказуемости).
В условиях научных экспериментов исследователи часто изменяют состояние одной переменной ( независимой переменной ), чтобы увидеть, какое влияние она оказывает на вторую переменную ( зависимую переменную ). Например, исследователь может манипулировать дозировкой определенного лекарства между разными группами людей, чтобы увидеть, какое влияние он оказывает на здоровье. В этом примере исследователь хочет сделать причинно-следственный вывод, а именно, что различные дозы препарата могут быть ответственны
за наблюдаемые изменения или различия. Когда исследователь может уверенно отнести наблюдаемые изменения или различия в зависимой переменной к независимой переменной (то есть, когда исследователь наблюдает связь между этими переменными и может исключить другие объяснения или
конкурирующие гипотезы
), тогда говорят, что причинный вывод быть внутренне действительным.
Однако во многих случаях размер эффектов, обнаруженных в зависимой переменной, может зависеть не только от
- вариации независимой переменной,
- мощность инструментов и статистические процедуры , используемые для измерения и обнаружения эффектов, и
- выбор статистических методов (см .: Достоверность статистического заключения ).
Скорее, ряд неконтролируемых (или неконтролируемых) переменных или обстоятельств может привести к дополнительным или альтернативным объяснениям (а) обнаруженных эффектов и / или (b) величины обнаруженных эффектов. Следовательно, внутренняя валидность больше зависит от степени, чем от «либо-либо», и именно поэтому исследовательские планы, отличные от истинных экспериментов, также могут давать результаты с высокой степенью внутренней достоверности.
Чтобы сделать выводы с высокой степенью внутренней достоверности, при разработке исследования могут быть приняты меры предосторожности. Как показывает опыт, выводы, основанные на прямом манипулировании независимой переменной, допускают большую внутреннюю валидность, чем выводы, основанные на ассоциации, наблюдаемой без манипуляций
Если рассматривать только внутреннюю валидность, строго контролируемые истинные экспериментальные планы (то есть со случайным выбором, случайным распределением в контрольную или экспериментальную группы, надежные инструменты, надежные процессы манипуляции и гарантии против мешающих факторов) могут быть «золотым стандартом» научных исследований . Однако сами методы, используемые для повышения внутренней достоверности, могут также ограничивать обобщаемость или внешнюю достоверность результатов. Например, изучение поведения животных в зоопарке может облегчить получение достоверных причинно-следственных выводов в этом контексте, но эти выводы могут не распространяться на поведение животных в дикой природе. В общем, типичный эксперимент в лаборатории, изучающий конкретный процесс, может не учитывать многие переменные, которые обычно сильно влияют на этот процесс в природе.
Верификация субъекта услуги
В этом случае происходит идентификация личности пользователя, какого-либо сетевого сервиса, например Twitter. В данном случае это означает проверку подлинности пользователя и подтверждения его личности. Аналогичные идентификации проводят и другие социальные медиа, сетевые торговые площадки и платежные системы.
Верификация заемщика в банке заключается не только в установлении его личности, но и в проверке его соответствия требованиям банка к пользователю данного продукта, таких как:
- наличие положительной кредитной истории;
- подтвержденного дохода;
- недвижимости, используемой в качестве залога, и т. д.
В русскоязычных медиа термин иногда используется в значении «проверка публикуемых фактов». Это чисто русский новояз, весь мир пользуется простым термином “fact cheking”, или «проверка фактов».
Пример нарушения внутренней валидности
Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.
Валидация на транспорте
Валидатором (от англ. valid – «действительный, правомерный») называют также специальное приспособление, с помощью которого проводят проверку электронных проездных документов. Таким образом определяют правомочность посадки пассажира в салон общественного транспорта. Часто валидатор совмещают с турникетом. Это позволяет экономить значительные средства на организации и проведении контроля оплаты проезда пассажирами. Применяют такие устройства также и для контроля прохода сотрудников на территорию предприятия.
Соотношение надежности и валидности психологических тестов
Надежность теста отражает его качество как метода диагностики, с точки зрения формальных показателей. Без учета содержательного анализа результатов.
Валидность оценивает именно содержательные результаты теста. Насколько они соответствуют реальным психологическим феноменам.
Надежный тест может не быть валидным. Например, тест инициативности может показывать высокую ретестовую надежность и согласованность частей. Однако, с содержательной точки зрения, результаты теста отражают не столько инициативность, сколько силу воли. То есть, надежность данного теста высокая, а валидность низкая.
В практике психологического тестирования надежность тестов с помощью ретеста. Валидность психологических тестов, как правило, проверяется с помощью анализа взаимосвязей с показателями других тестов, измеряющих аналогичные или схожие психологические показатели.
Валидация в системе управления качеством
Формулировка в стандарте ИСО несколько невнятная и слишком похожа на определение «верификации».
«Валидация — подтверждение на основе представления объективных свидетельств того, что требования, предназначенные для конкретного использования или применения, выполнены».
Слишком академичные формулировки и не совсем удачный перевод запутывают читателя. Чтобы ответить на вопрос: «Валидация – что это?» простыми словами, снова обратимся к процессу производства товара или предоставления услуги. Валидация проводится по отношению к готовому продукту, уже прошедшему верификацию и соответствующему всем заранее сформулированным требованиям. Смысл же ее состоит в том, что в процессе валидации готового изделия или услуги получают от потребителя подтверждение того, что продукт или услуга соответствует его ожиданиям в конкретных условиях.
Другие типы валидности
Помимо основных, выделяют и иные виды, которые соответствуют другим стадиям экспериментального исследования. Выделяют более десятка видов валидности, которые во многом, в том числе и угрозами, сходны с основными. Меняется только характер их нарушения. Рассмотрим кратко некоторые из них.
Экологическая — показывает, насколько условия эксперимента соответствуют исследуемой реальности. Высокую степень экологической валидности достаточно трудно соблюсти в лабораторных исследованиях, да и не всегда это нужно. А в полевых экспериментах она естественным образом достигает максимума.
Диагностическая (конкурентная) – отражает соответствие показателей теста состоянию психологических особенностей испытуемого на момент исследования.
Прогностическая – характеризует степень статистической надежности и обоснованности развития психологической особенности, которая исследуется, в будущем.
Эмпирическая – это понятие объединяет в себе 2 предыдущих. Подчеркивается общий подход к их определению, осуществляемый путем статистического коррелирования баллов по тесту (оценок) и показателю по внешнему критерию.
Основное отличие
В чем основное отличие верификации и валидации?
Верификация – обязательный внутренний процесс проверки изделия или услуги на соответствие стандартам и спецификациям.
«-К пуговицам претензии есть?
-К лацканам претензии есть?
К рукавам претензии есть?
Валидация – процесс проверки применимости к конкретным условиям готового продукта, прошедшего верификацию на соответствие стандартам и спецификациям.
«-Костюм можно носить?
Примеры верификации и валидации
Завод по производству лекарственных препаратов всегда будет проверять, соответствуют ли они техническим условиям и стандартам (верификация), а вот проверку, подойдут ли эти препараты определенному пациенту с таким-то набором симптомов, не будет (валидация).
Компания выпускает ботинки, предназначенные для загородных прогулок. Эти ботинки полностью соответствуют техническим условиям, и это проверяется для каждой пары (верификация). А вот подойдет ли эта обувь для высокогорных восхождений, предстоит определять отдельно (валидация).
Еще один пример, относящийся практически к любому предприятию. Отдел технического контроля осуществляет верификацию, а аудиторы проводят валидацию.
Здравствуйте, дорогие читатели! Добро пожаловать на блог!
Валидация — что это простыми словами? Чем отличается валидация от верификации? Ответы на эти вопросы — в статье.
Многие слова «валидация» и «верификация» считают синонимами. Но это не так. Разница есть, но она очень тонкая. Давайте разбираться.
Валидация и верификация — что это простыми словами?
Справедливости ради надо сказать, что в разных областях деятельности (в банках, в платежных системах, в интернете), в разных отраслях производства эти термины используются по-разному. Я решила привести здесь определение валидации и верификации из стандарта ISO 9000.
Чем отличается валидация от верификации?
Итак, что такое верификация? Более детально можете узнать из этой статьи, но здесь скажем коротко, что слово «верификация» происходит от английского слова «verification» — проверка. А слово «валидация» происходит от английского «validation» — придание законной силы.
Практический совет
Вы спросите, для чего нужно разбираться в этих терминах? Скажу, что есть и практическая польза. Главная цель верификации и валидации — безопасность, чтобы Ваши банковские карты и аккаунты были защищены. Однако, пользуясь тем, что многие не разбираются в этих терминах, злоумышленники для похищения личных данных часто применяют такой способ, как сообщение с просьбой верифицировать или валидировать вашу банковскую карту, аккаунт и т.д..
Практический совет: При появлении окна с просьбой верификации или валидации Ваших данных проверьте в адресной строке данные сайта, нет ли пропущенных или лишних символов. Либо попробуйте зайти в эту программу с другого устройства и если такого сообщения не появляется, значит Ваш компьютер надо лечить от опасных вирусов.