Валі́дність те́сту (англ. test validity) — це ступінь, до якого тест (наприклад, хімічний, фізичний чи освітній) точно вимірює те, що він має вимірювати. У галузях психологічного та освітнього тестування «валідність стосується ступеня, до якого свідчення й теорія підтримують інтерпретації результатів тесту, передбачені запропонованим використанням тесту». Хоча класичні моделі розділяли це поняття на різні «валідності» (як-от , та ), нині переважним є погляд на валідність як на єдиний унітарний конструкт.
Валідність загалом вважають найважливішим питанням у психологічному та освітньому тестуванні, оскільки вона стосується значення, яке покладають на результати тесту. Хоча багато підручників подають валідність як статичний конструкт, з моменту перших опублікованих рекомендацій зі створення психологічних та освітніх тестів розвинулися різні моделі валідності. Ці моделі можливо поділити на дві основні групи: класичні моделі, що містять кілька типів валідності, та сучасні моделі, що розглядають валідність як єдиний конструкт. Сучасні моделі реорганізують класичні «валідності» в «аспекти» валідності або «типи» свідчень, що підтримують валідність.
Валідність тесту часто плутають із
, яка стосується узгодженості вимірювання. Адекватна надійність є необхідною передумовою валідності, але висока надійність жодним чином не гарантує, що вимірювання валідне.Історичне підґрунтя
Хоча психологи й педагоги усвідомлювали кілька аспектів валідності ще до Другої світової війни, їхні методи встановлення валідності зазвичай обмежувалися кореляцією результатів тесту з деяким відомим критерієм. Під керівництвом «Технічні рекомендації для психологічних тестів і діагностичних методик» 1954 року намагалися уточнити й розширити поняття валідності, розділивши його на чотири частини: (а) , (б) , (в) і (г) . Пізніша публікація Кронбаха та Міла об'єднала прогностичну й конкурентну валідності в «критеріальну орієнтацію», яка згодом стала .
Протягом наступних чотирьох десятиліть багато теоретиків, зокрема й сам Кронбах, висловлювали своє невдоволення цією трикомпонентною моделлю валідності. Їхні аргументи досягли кульмінації у статті
1995 року, де валідність описано як єдиний конструкт, складений із шести «аспектів». На його погляд, різні висновування з результатів тесту можуть вимагати різних типів свідчень, але не різних валідностей.«Стандарти освітнього та психологічного тестування» 1999 року переважно кодифікували модель Мессіка. Вони описують п'ять типів свідчень, що підтримують валідність і включають кожен із аспектів Мессіка, не згадуючи змістовної, критеріальної та конструктної валідностей класичної моделі.
Процес валідації
За «Стандартами» 1999 року, валідація — це процес збирання свідчень для забезпечення «науково обґрунтованої основи» для інтерпретування результатів, запропонованої розробником тесту та/або його користувачем. Отже, валідація починається з розробки рамок, які визначають охоплення та аспекти (у випадку багатовимірних шкал) запропонованої інтерпретації. Ці рамки також містять раціональне обґрунтування, яке пов'язує інтерпретацію з відповідним тестом.
Дослідники валідності далі складають список тверджень, які мають бути виконані, щоби запропонована інтерпретація була валідною. Або, навпаки, вони можуть скласти список питань, які можуть загрожувати валідності інтерпретацій. У будь-якому випадку дослідники збирають свідчення — чи то оригінальні емпіричні дослідження, метааналіз, чи огляд наявної літератури або логічний аналіз питань — для підтримки або спростування тверджень інтерпретації (або загроз валідності інтерпретації). Наголос роблять на якості, а не на кількості свідчень.
Одна інтерпретація будь-якого результату тесту може вимагати, щоби було виконано кілька тверджень (або її може бути поставлено під сумнів будь-якою із загроз її валідності). Потужні свідчення на підтримку одного твердження не зменшують потреби в підтримці інших тверджень.
Свідчення для підтримки (або спростування) валідності інтерпретації можливо класифікувати в одну з п'яти категорій:
- Свідчення на основі змісту тесту
- Свідчення на основі процесів відповіді
- Свідчення на основі внутрішньої структури
- Свідчення на основі відношень до інших змінних
- Свідчення на основі наслідків тестування
Методики збирання кожного типу свідчень слід застосовувати лише тоді, коли вони дають інформацію, яка могла би підтримати або поставити під сумнів твердження, необхідні для відповідної інтерпретації.
Кожен елемент свідчень зрештою інтегрується в аргументацію валідності. Ця аргументація може вимагати перегляду тесту, протоколу його проведення або теоретичних конструктів, які лежать в основі інтерпретацій. Якщо тест та/або інтерпретації його результатів будь-яким чином змінюються, для підтримки нової версії мусить зібрати свідчення новий процес валідації.
Див. також
Примітки
- American Educational Research Association; American Psychological Association; National Council on Measurement in Education (1999). Standards for educational and psychological testing (англ.). Washington, DC: American Educational Research Association. ISBN . Архів оригіналу за 15 січня 2025.
- Guion, R. M. (1980). On trinitarian doctrines of validity. Professional Psychology (англ.). 11: 385—398. doi:10.1037/0735-7028.11.3.385.
- Лябах, А.П.; Турчин, О.А.; Пятковський, В.М.; Кучер, І.В. (2021). Порівняльний аналіз систем оцінки функції стопи. Вісник ортопедії, травматології та протезування (укр.). 2: 4—9. doi:10.37647/0132-2486-2021-109-2-4-9.
- Messick, S. (1995). Validity of psychological assessment: Validation of inferences from persons’ responses and performances as scientific inquiry into score meaning (PDF). American Psychologist (англ.). 50: 741—749. doi:10.1037/0003-066X.50.9.741. Архів (PDF) оригіналу за 11 грудня 2024.
- Popham, W. J. (2008). All About Assessment / A Misunderstood Grail. Educational Leadership (англ.). 66 (1): 82—83. Архів оригіналу за 27 січня 2025.
- Nitko, J.J.; Brookhart, S. M. (2004). Educational assessment of students (англ.). Upper Saddle River, NJ: Merrill-Prentice Hall.
- American Psychological Association; American Educational Research Association; National Council on Measurement in Education (1954). Technical recommendations for psychological tests and diagnostic techniques (англ.). Washington, DC: The Association. doi:10.1037/h0053479.
- Angoff, W. H. (1988). Validity: An evolving concept. У ; Braun, H. (ред.). Test Validity (англ.). Hillsdale, NJ: Lawrence Erlbaum. с. 19—32. doi:10.4324/9780203056905.
- Cronbach, L. J.; Meehl, P. E. (1955). Construct validity in psychological tests. Psychological Bulletin (англ.). 52: 281—302. doi:10.1037/h0040957. Архів оригіналу за 10 вересня 2024.
- Cronbach, L. J. (1969). Validation of educational measures. Proceedings of the 1969 Invitational Conference on Testing Problems (англ.). Princeton, NJ: Educational Testing Service. с. 35—52.
- Loevinger, J. (1957). Objective tests as instruments of psychological theory (PDF). Psychological Reports (англ.). 3: 634—694. doi:10.2466/pr0.1957.3.3.635. Архів (PDF) оригіналу за 7 липня 2024.
- Tenopyr, M. L. (1977). Content-construct confusion. Personnel Psychology (англ.). 30: 47—54. doi:10.1111/j.1744-6570.1977.tb02320.x.
- Guion, R. M. (1977). Content validity–The source of my discontent. Applied Psychological Measurement (англ.). 1: 1—10. doi:10.1177/014662167700100103. Архів оригіналу за 27 січня 2025.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Pro verifikaciyu ta validaciyu v nauci j tehnici zagalom div inshi movi inshi movi Vali dnist te stu angl test validity ce stupin do yakogo test napriklad himichnij fizichnij chi osvitnij tochno vimiryuye te sho vin maye vimiryuvati U galuzyah psihologichnogo ta osvitnogo testuvannya validnist stosuyetsya stupenya do yakogo svidchennya j teoriya pidtrimuyut interpretaciyi rezultativ testu peredbacheni zaproponovanim vikoristannyam testu Hocha klasichni modeli rozdilyali ce ponyattya na rizni validnosti yak ot inshi movi inshi movi ta inshi movi nini perevazhnim ye poglyad na validnist yak na yedinij unitarnij konstrukt Validnist zagalom vvazhayut najvazhlivishim pitannyam u psihologichnomu ta osvitnomu testuvanni oskilki vona stosuyetsya znachennya yake pokladayut na rezultati testu Hocha bagato pidruchnikiv podayut validnist yak statichnij konstrukt z momentu pershih opublikovanih rekomendacij zi stvorennya psihologichnih ta osvitnih testiv rozvinulisya rizni modeli validnosti Ci modeli mozhlivo podiliti na dvi osnovni grupi klasichni modeli sho mistyat kilka tipiv validnosti ta suchasni modeli sho rozglyadayut validnist yak yedinij konstrukt Suchasni modeli reorganizuyut klasichni validnosti v aspekti validnosti abo tipi svidchen sho pidtrimuyut validnist Validnist testu chasto plutayut iz inshi movi yaka stosuyetsya uzgodzhenosti vimiryuvannya Adekvatna nadijnist ye neobhidnoyu peredumovoyu validnosti ale visoka nadijnist zhodnim chinom ne garantuye sho vimiryuvannya validne Istorichne pidgruntyaHocha psihologi j pedagogi usvidomlyuvali kilka aspektiv validnosti she do Drugoyi svitovoyi vijni yihni metodi vstanovlennya validnosti zazvichaj obmezhuvalisya korelyaciyeyu rezultativ testu z deyakim vidomim kriteriyem Pid kerivnictvom inshi movi Tehnichni rekomendaciyi dlya psihologichnih testiv i diagnostichnih metodik 1954 roku namagalisya utochniti j rozshiriti ponyattya validnosti rozdilivshi jogo na chotiri chastini a inshi movi b inshi movi v inshi movi i g inshi movi Piznisha publikaciya Kronbaha ta Mila ob yednala prognostichnu j konkurentnu validnosti v kriterialnu oriyentaciyu yaka zgodom stala inshi movi Protyagom nastupnih chotiroh desyatilit bagato teoretikiv zokrema j sam Kronbah vislovlyuvali svoye nevdovolennya ciyeyu trikomponentnoyu modellyu validnosti Yihni argumenti dosyagli kulminaciyi u statti inshi movi 1995 roku de validnist opisano yak yedinij konstrukt skladenij iz shesti aspektiv Na jogo poglyad rizni visnovuvannya z rezultativ testu mozhut vimagati riznih tipiv svidchen ale ne riznih validnostej Standarti osvitnogo ta psihologichnogo testuvannya 1999 roku perevazhno kodifikuvali model Messika Voni opisuyut p yat tipiv svidchen sho pidtrimuyut validnist i vklyuchayut kozhen iz aspektiv Messika ne zgaduyuchi zmistovnoyi kriterialnoyi ta konstruktnoyi validnostej klasichnoyi modeli Proces validaciyiZa Standartami 1999 roku validaciya ce proces zbirannya svidchen dlya zabezpechennya naukovo obgruntovanoyi osnovi dlya interpretuvannya rezultativ zaproponovanoyi rozrobnikom testu ta abo jogo koristuvachem Otzhe validaciya pochinayetsya z rozrobki ramok yaki viznachayut ohoplennya ta aspekti u vipadku bagatovimirnih shkal zaproponovanoyi interpretaciyi Ci ramki takozh mistyat racionalne obgruntuvannya yake pov yazuye interpretaciyu z vidpovidnim testom Doslidniki validnosti dali skladayut spisok tverdzhen yaki mayut buti vikonani shobi zaproponovana interpretaciya bula validnoyu Abo navpaki voni mozhut sklasti spisok pitan yaki mozhut zagrozhuvati validnosti interpretacij U bud yakomu vipadku doslidniki zbirayut svidchennya chi to originalni empirichni doslidzhennya metaanaliz chi oglyad nayavnoyi literaturi abo logichnij analiz pitan dlya pidtrimki abo sprostuvannya tverdzhen interpretaciyi abo zagroz validnosti interpretaciyi Nagolos roblyat na yakosti a ne na kilkosti svidchen Odna interpretaciya bud yakogo rezultatu testu mozhe vimagati shobi bulo vikonano kilka tverdzhen abo yiyi mozhe buti postavleno pid sumniv bud yakoyu iz zagroz yiyi validnosti Potuzhni svidchennya na pidtrimku odnogo tverdzhennya ne zmenshuyut potrebi v pidtrimci inshih tverdzhen Svidchennya dlya pidtrimki abo sprostuvannya validnosti interpretaciyi mozhlivo klasifikuvati v odnu z p yati kategorij Svidchennya na osnovi zmistu testu Svidchennya na osnovi procesiv vidpovidi Svidchennya na osnovi vnutrishnoyi strukturi Svidchennya na osnovi vidnoshen do inshih zminnih Svidchennya na osnovi naslidkiv testuvannya Metodiki zbirannya kozhnogo tipu svidchen slid zastosovuvati lishe todi koli voni dayut informaciyu yaka mogla bi pidtrimati abo postaviti pid sumniv tverdzhennya neobhidni dlya vidpovidnoyi interpretaciyi Kozhen element svidchen zreshtoyu integruyetsya v argumentaciyu validnosti Cya argumentaciya mozhe vimagati pereglyadu testu protokolu jogo provedennya abo teoretichnih konstruktiv yaki lezhat v osnovi interpretacij Yaksho test ta abo interpretaciyi jogo rezultativ bud yakim chinom zminyuyutsya dlya pidtrimki novoyi versiyi musit zibrati svidchennya novij proces validaciyi Div takozh inshi movi PrimitkiAmerican Educational Research Association American Psychological Association National Council on Measurement in Education 1999 Standards for educational and psychological testing angl Washington DC American Educational Research Association ISBN 978 0 935302 25 7 Arhiv originalu za 15 sichnya 2025 Guion R M 1980 On trinitarian doctrines of validity Professional Psychology angl 11 385 398 doi 10 1037 0735 7028 11 3 385 Lyabah A P Turchin O A Pyatkovskij V M Kucher I V 2021 Porivnyalnij analiz sistem ocinki funkciyi stopi Visnik ortopediyi travmatologiyi ta protezuvannya ukr 2 4 9 doi 10 37647 0132 2486 2021 109 2 4 9 Messick S 1995 Validity of psychological assessment Validation of inferences from persons responses and performances as scientific inquiry into score meaning PDF American Psychologist angl 50 741 749 doi 10 1037 0003 066X 50 9 741 Arhiv PDF originalu za 11 grudnya 2024 Popham W J 2008 All About Assessment A Misunderstood Grail Educational Leadership angl 66 1 82 83 Arhiv originalu za 27 sichnya 2025 Nitko J J Brookhart S M 2004 Educational assessment of students angl Upper Saddle River NJ Merrill Prentice Hall American Psychological Association American Educational Research Association National Council on Measurement in Education 1954 Technical recommendations for psychological tests and diagnostic techniques angl Washington DC The Association doi 10 1037 h0053479 Angoff W H 1988 Validity An evolving concept U Braun H red Test Validity angl Hillsdale NJ Lawrence Erlbaum s 19 32 doi 10 4324 9780203056905 Cronbach L J Meehl P E 1955 Construct validity in psychological tests Psychological Bulletin angl 52 281 302 doi 10 1037 h0040957 Arhiv originalu za 10 veresnya 2024 Cronbach L J 1969 Validation of educational measures Proceedings of the 1969 Invitational Conference on Testing Problems angl Princeton NJ Educational Testing Service s 35 52 Loevinger J 1957 Objective tests as instruments of psychological theory PDF Psychological Reports angl 3 634 694 doi 10 2466 pr0 1957 3 3 635 Arhiv PDF originalu za 7 lipnya 2024 Tenopyr M L 1977 Content construct confusion Personnel Psychology angl 30 47 54 doi 10 1111 j 1744 6570 1977 tb02320 x Guion R M 1977 Content validity The source of my discontent Applied Psychological Measurement angl 1 1 10 doi 10 1177 014662167700100103 Arhiv originalu za 27 sichnya 2025