Класи́чна тео́рія тестува́ння (КТТ, англ. classical test theory, CTT) — це сукупність пов'язаних психометричних теорій, що передбачують результати психологічного тестування, як-от складність завдань або здібності тестованих. Це теорія тестування на основі ідеї, що спостережувана чи отримана оцінка особи в тесті є сумою істинної оцінки (безпомилкової оцінки) та оцінки похибки. Загалом, метою класичної теорії тестування є розуміння та вдосконалення психологічних тестів.
Класичну теорію тестування можна вважати приблизно синонімом теорії істинної оцінки (англ. true score theory). Термін «класична» стосується не лише хронології цих моделей, але й контрастує з новішими психометричними теоріями, які зазвичай називають теорією відгуку завдання, а іноді й «сучасними», як у «сучасній теорії латентних рис».
Класична теорія тестування, якою ми її знаємо сьогодні, була кодифікована в Novick, (1966) і описана в класичних текстах, як-от Lord та Novick, (1968) і Allen та Yen, (2002). Опис класичної теорії тестування нижче ґрунтується на цих оригінальних публікаціях.
Історія
Класична теорія тестування народилася лише після концептуалізації наступних трьох досягнень або ідей:
- усвідомлення наявності похибок у вимірюваннях,
- уявлення про цю похибку як про випадкову змінну,
- розуміння кореляції та способів її індексації.
1904 року Чарльз Спірмен був відповідальним за розробку способу коригування коефіцієнта кореляції для згасання через похибку вимірювання, а також способу отримання індексу надійності, необхідного для такого коригування. Відкриття Спірмена деякі вважають початком класичної теорії тестування (Traub, 1997). До іншх, хто вплинули на формування класичної теорії тестування, належать Джордж Удні Юл, , та , які брали участь у розробці , , а також, найнещодавніше, , не кажучи вже про інших, протягом чверті століття після початкових знахідок Спірмена.
Визначення
Класична теорія тестування виходить з того, що кожна особа має істинну оцінку (англ. true score) T, яка була б отримана за відсутності похибок вимірювання. Істинну оцінку особи визначають як математичне сподівання оцінки за кількістю правильних відповідей за нескінченну кількість незалежних проведень тесту. На жаль, користувачі тестів ніколи не спостерігають істинну оцінку особи, а лише спостережувану оцінку (англ. observed score) X. Виходять з того, що спостережувана оцінка дорівнює істинній оцінці плюс певна похибка (англ. error):
X = T + E спостережувана істинна похибка оцінка оцінка
Класична теорія тестування стосується взаємозв'язків між трьома змінними , і у сукупності. Ці взаємозв'язки використовують, щоби сказати щось про якість тестових оцінок. У цьому контексті найважливішим поняттям є надійність (англ. reliability). Надійність спостережуваних тестових оцінок , позначувану через , визначають як відношення дисперсії істинної оцінки до дисперсії спостережуваної оцінки :
Оскільки можливо показати, що дисперсія спостережуваних оцінок дорівнює сумі дисперсії істинних оцінок і дисперсії похибок, це рівняння еквівалентне
Це рівняння, яке формулює співвідношення сигнал/шум, має інтуїтивну привабливість: надійність тестових оцінок зростає пропорційно зменшенню частки дисперсії похибок у тестових оцінках і навпаки. Надійність дорівнює частці дисперсії тестових оцінок, яку можливо було би пояснити, якби ми знали істинні оцінки. Квадратний корінь із надійності є абсолютним значенням кореляції між істинними та спостережуваними оцінками.
Оцінювання тестів та оцінок: надійність
Надійність неможливо оцінити безпосередньо, оскільки це потребувало би знання істинних оцінок, що за класичною теорією тестування неможливо. Проте можливо отримувати різними способами оцінки надійності. Один із методів оцінювання надійності — побудова так званого (англ. parallel test). Основна властивість паралельного тесту полягає в тому, що він видає ту саму істинну оцінку й ту саму дисперсію спостережуваних оцінок, що й первинний тест, для кожної особи. Якщо ми маємо паралельні тести x і x', то це означає, що
та
Із цих припущень випливає, що кореляція між оцінками паралельних тестів дорівнює надійності (доведення див. у Lord та Novick, 1968, гл. 2).
Використання паралельних тестів для оцінювання надійності є громіздким, оскільки створювати паралельні тести дуже важко. На практиці цей метод використовують нечасто. Натомість дослідники використовують міру внутрішньої узгодженості, відому як альфа Кронбаха (). Розгляньмо тест, складений з завдань , . Загальна оцінка за тестом визначається як сума оцінок в окремих завданнях, тож для особи :
Тоді альфа Кронбаха дорівнює
Можливо показати, що Кронбаха забезпечує нижню межу надійності за доволі м'яких припущень.[] Отже, надійність тестових оцінок у сукупності завжди вища за значення Кронбаха в цій сукупності. Тож цей метод емпірично зручний, а тому дуже популярний серед дослідників. Обчислення Кронбаха включено до багатьох стандартних статистичних пакетів, як-от SPSS та .
Як було зазначено вище, вся діяльність у межах класичної теорії тестування спрямована на отримання прийнятного визначення надійності. Надійність повинна дати уявлення про загальну якість обговорюваних тестових оцінок. Основна ідея полягає в тому, що чим вища надійність, тим краще. Класична теорія тестування не встановлює, наскільки високою має бути надійність. Надто високе значення , скажімо понад 0,9, вказує на надлишковість завдань. Для досліджень особистості радять значення близько 0,8, тоді як для індивідуального тестування з високими ставками бажано понад 0,9. Ці «критерії» не ґрунтуються на формальних аргументах, а радше є результатом звичаю та професійної практики. Міра їхньої відповідності формальним принципам статистичного висновування залишається незрозумілою.
Оцінювання завдань: P-значення та кореляція завдання з тестом
Надійність забезпечує зручний індекс якості тесту у вигляді єдиного числа — надійності. Проте вона не надає жодної інформації для оцінювання окремих завдань. Аналіз завдань у межах класичного підходу часто спирається на дві статистики: P-значення (англ. P-value, пропорцію) та кореляцію завдання з тестом ( ). P-значення подає частку іспитників, які відповіли у правильному напрямку, його зазвичай називають складністю завдання (англ. item difficulty). Кореляція завдання з тестом надає індекс розрізнювальності або розрізнювальної спроможності завдання, її зазвичай називають розрізнювальністю завдання (англ. item discrimination). Крім того, ці статистики обчислюють для кожної відповіді у часто використовуваних завданнях множинного вибору, використовуючи їх для оцінювання завдань і діагностування можливих проблем, як-от заплутувального відволікання (англ. confusing distractor). Такий цінний аналіз забезпечує спеціально розроблене .
Альтернативи
Класична теорія тестування є впливовою теорією тестових оцінок у суспільних науках. У психометрії цю теорію витіснили складніші моделі, як-от теорія відгуку завдання (ТВЗ, англ. item response theory, IRT) та теорія узагальнюваності (англ. generalizability theory, G-theory). Проте ТВЗ не включено до стандартних статистичних пакетів, як-от SPSS, але може оцінювати моделі ТВЗ за допомогою PROC IRT і PROC MCMC, а також існують пакети ТВЗ для відкритої статистичної мови програмування R (наприклад, CTT). Хоча комерційні пакети зазвичай надають оцінки Кронбаха, перевагу можуть віддавати використанню спеціалізованого для ТВЗ чи теорії узагальнюваності. Проте загальні статистичні пакети часто не забезпечують повного класичного аналізу ( Кронбаха є лише однією з багатьох важливих статистик), і в багатьох випадках також необхідне спеціалізоване програмне забезпечення і для класичного аналізу.
Вади
Однією з найважливіших чи найвідоміших вад класичної теорії тестування є те, що характеристики іспитника та характеристики тесту неможливо розділити: кожну з них можливо інтерпретувати лише в контексті іншої. Іншою вадою є визначення надійності, яке існує у класичній теорії тестування, що стверджує, що надійність є «кореляцією між оцінками тесту на паралельних формах тесту». Проблема тут полягає в тому, що існують різні думки щодо того, що таке паралельні тести. Різні коефіцієнти надійності надають або нижню межу оцінки надійності, або оцінки надійності з невідомими зміщеннями. Третя вада стосується стандартної похибки вимірювання. Проблема полягає в тому, що, за класичною теорією тестування, стандартну похибку вимірювання вважають однаковою для всіх іспитників. Проте, як пояснює Гемблтон у своїй книзі, оцінки в будь-якому тесті є нерівноточними мірами для іспитників із різними здібностями, що робить припущення про рівність похибок вимірювання для всіх іспитників неправдоподібним (Hambleton, Swaminathan та Rogers, 1991, с. 4). Четверта й остання вада класичної теорії тестування полягає в тому, що вона спрямована на тест, а не на завдання. Іншими словами, класична теорія тестування не може допомогти нам передбачувати, наскільки добре окремий іспитник чи навіть група іспитників могли би впоратися з якимось тестовим завданням.
Див. також
Примітки
- National Council on Measurement in Education (англ.). Архів оригіналу за 22 липня 2017.
- Traub, R. (1997). Classical Test Theory in Historical Perspective. (англ.). 16 (4): 8—14. doi:10.1111/j.1745-3992.1997.tb00603.x.
- Pui-Wa Lei and Qiong Wu (2007). CTTITEM: SAS macro and SPSS syntax for classical item analysis. Behavior Research Methods (англ.). 39 (3): 527—530. doi:10.3758/BF03193021. PMID 17958163.
- Streiner, D. L. (2003). Starting at the Beginning: An Introduction to Coefficient Alpha and Internal Consistency. Journal of Personality Assessment. 80 (1): 99—103. doi:10.1207/S15327752JPA8001_18. hdl:11655/5356. PMID 12584072. S2CID 3679277.
- Hambleton, R.; Swaminathan, H.; Rogers, H. (1991). Fundamentals of Item Response Theory (англ.). Newbury Park, California: Sage Publications, Inc. Архів оригіналу за 2 серпня 2022.
Джерела
- Allen, M.J.; Yen, W. M. (2002) [1979]. Introduction to Measurement Theory (англ.). Long Grove, IL: Waveland Press. ISBN .
- Novick, M.R. (February 1966). The axioms and principal results of classical test theory. Journal of Mathematical Psychology (англ.). 3 (1): 1—18. doi:10.1016/0022-2496(66)90002-2.
- Lord, F. M.; Novick, M. R. (1968). Statistical theories of mental test scores (англ.). Reading MA: Addison-Welsley Publishing Company. ISBN .
Література
Посилання
- Стаття Міжнародної комісії з тестування про класичну теорію тестування (англ.)
- TAP: безкоштовне програмне забезпечення для класичної теорії тестування (англ.)
- Iteman: програмне забезпечення для візуальної звітності за класичною теорією тестування (англ.)
- Lertap: програмне забезпечення на основі Excel для класичної теорії тестування (англ.)
- CITAS: програмне забезпечення на основі Excel для класичної теорії тестування (англ.)
- jMetrik: програмне забезпечення для класичної теорії тестування (англ.)
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Klasi chna teo riya testuva nnya KTT angl classical test theory CTT ce sukupnist pov yazanih psihometrichnih teorij sho peredbachuyut rezultati psihologichnogo testuvannya yak ot skladnist zavdan abo zdibnosti testovanih Ce teoriya testuvannya na osnovi ideyi sho sposterezhuvana chi otrimana ocinka osobi v testi ye sumoyu istinnoyi ocinki bezpomilkovoyi ocinki ta ocinki pohibki Zagalom metoyu klasichnoyi teoriyi testuvannya ye rozuminnya ta vdoskonalennya inshi movi psihologichnih testiv Klasichnu teoriyu testuvannya mozhna vvazhati priblizno sinonimom teoriyi istinnoyi ocinki angl true score theory Termin klasichna stosuyetsya ne lishe hronologiyi cih modelej ale j kontrastuye z novishimi psihometrichnimi teoriyami yaki zazvichaj nazivayut teoriyeyu vidguku zavdannya a inodi j suchasnimi yak u suchasnij teoriyi latentnih ris Klasichna teoriya testuvannya yakoyu mi yiyi znayemo sogodni bula kodifikovana v Novick 1966 i opisana v klasichnih tekstah yak ot Lord ta Novick 1968 i Allen ta Yen 2002 Opis klasichnoyi teoriyi testuvannya nizhche gruntuyetsya na cih originalnih publikaciyah IstoriyaKlasichna teoriya testuvannya narodilasya lishe pislya konceptualizaciyi nastupnih troh dosyagnen abo idej usvidomlennya nayavnosti pohibok u vimiryuvannyah uyavlennya pro cyu pohibku yak pro vipadkovu zminnu rozuminnya korelyaciyi ta sposobiv yiyi indeksaciyi 1904 roku Charlz Spirmen buv vidpovidalnim za rozrobku sposobu koriguvannya koeficiyenta korelyaciyi dlya zgasannya cherez pohibku vimiryuvannya a takozh sposobu otrimannya indeksu nadijnosti neobhidnogo dlya takogo koriguvannya Vidkrittya Spirmena deyaki vvazhayut pochatkom klasichnoyi teoriyi testuvannya Traub 1997 Do inshh hto vplinuli na formuvannya klasichnoyi teoriyi testuvannya nalezhat Dzhordzh Udni Yul inshi movi inshi movi ta inshi movi yaki brali uchast u rozrobci inshi movi inshi movi a takozh najneshodavnishe inshi movi ne kazhuchi vzhe pro inshih protyagom chverti stolittya pislya pochatkovih znahidok Spirmena ViznachennyaKlasichna teoriya testuvannya vihodit z togo sho kozhna osoba maye istinnu ocinku angl true score T yaka bula b otrimana za vidsutnosti pohibok vimiryuvannya Istinnu ocinku osobi viznachayut yak matematichne spodivannya ocinki za kilkistyu pravilnih vidpovidej za neskinchennu kilkist nezalezhnih proveden testu Na zhal koristuvachi testiv nikoli ne sposterigayut istinnu ocinku osobi a lishe sposterezhuvanu ocinku angl observed score X Vihodyat z togo sho sposterezhuvana ocinka dorivnyuye istinnij ocinci plyus pevna pohibka angl error X T E sposterezhuvana istinna pohibka ocinka ocinka Klasichna teoriya testuvannya stosuyetsya vzayemozv yazkiv mizh troma zminnimi X displaystyle X T displaystyle T i E displaystyle E u sukupnosti Ci vzayemozv yazki vikoristovuyut shobi skazati shos pro yakist testovih ocinok U comu konteksti najvazhlivishim ponyattyam ye nadijnist angl reliability Nadijnist sposterezhuvanih testovih ocinok X displaystyle X poznachuvanu cherez r X T 2 displaystyle rho XT 2 viznachayut yak vidnoshennya dispersiyi istinnoyi ocinki s T 2 displaystyle sigma T 2 do dispersiyi sposterezhuvanoyi ocinki s X 2 displaystyle sigma X 2 r X T 2 s T 2 s X 2 displaystyle rho XT 2 frac sigma T 2 sigma X 2 Oskilki mozhlivo pokazati sho dispersiya sposterezhuvanih ocinok dorivnyuye sumi dispersiyi istinnih ocinok i dispersiyi pohibok ce rivnyannya ekvivalentne r X T 2 s T 2 s X 2 s T 2 s T 2 s E 2 displaystyle rho XT 2 frac sigma T 2 sigma X 2 frac sigma T 2 sigma T 2 sigma E 2 Ce rivnyannya yake formulyuye spivvidnoshennya signal shum maye intuyitivnu privablivist nadijnist testovih ocinok zrostaye proporcijno zmenshennyu chastki dispersiyi pohibok u testovih ocinkah i navpaki Nadijnist dorivnyuye chastci dispersiyi testovih ocinok yaku mozhlivo bulo bi poyasniti yakbi mi znali istinni ocinki Kvadratnij korin iz nadijnosti ye absolyutnim znachennyam korelyaciyi mizh istinnimi ta sposterezhuvanimi ocinkami Ocinyuvannya testiv ta ocinok nadijnistDokladnishe inshi movi Nadijnist nemozhlivo ociniti bezposeredno oskilki ce potrebuvalo bi znannya istinnih ocinok sho za klasichnoyu teoriyeyu testuvannya nemozhlivo Prote mozhlivo otrimuvati riznimi sposobami ocinki nadijnosti Odin iz metodiv ocinyuvannya nadijnosti pobudova tak zvanogo angl parallel test Osnovna vlastivist paralelnogo testu polyagaye v tomu sho vin vidaye tu samu istinnu ocinku j tu samu dispersiyu sposterezhuvanih ocinok sho j pervinnij test dlya kozhnoyi osobi Yaksho mi mayemo paralelni testi x i x to ce oznachaye sho E X i E X i displaystyle mathbb E X i mathbb E X i ta s E i 2 s E i 2 displaystyle sigma E i 2 sigma E i 2 Iz cih pripushen viplivaye sho korelyaciya mizh ocinkami paralelnih testiv dorivnyuye nadijnosti dovedennya div u Lord ta Novick 1968 gl 2 r X X s X X s X s X s T 2 s X 2 r X T 2 displaystyle rho XX frac sigma XX sigma X sigma X frac sigma T 2 sigma X 2 rho XT 2 Vikoristannya paralelnih testiv dlya ocinyuvannya nadijnosti ye gromizdkim oskilki stvoryuvati paralelni testi duzhe vazhko Na praktici cej metod vikoristovuyut nechasto Natomist doslidniki vikoristovuyut miru vnutrishnoyi uzgodzhenosti vidomu yak alfa Kronbaha a displaystyle alpha Rozglyanmo test skladenij z k displaystyle k zavdan u j displaystyle u j j 1 k displaystyle j 1 ldots k Zagalna ocinka za testom viznachayetsya yak suma ocinok v okremih zavdannyah tozh dlya osobi i displaystyle i X i j 1 k U i j displaystyle X i sum j 1 k U ij Todi alfa Kronbaha dorivnyuye a k k 1 1 j 1 k s U j 2 s X 2 displaystyle alpha frac k k 1 left 1 frac sum j 1 k sigma U j 2 sigma X 2 right Mozhlivo pokazati sho a displaystyle alpha Kronbaha zabezpechuye nizhnyu mezhu nadijnosti za dovoli m yakih pripushen dzherelo Otzhe nadijnist testovih ocinok u sukupnosti zavzhdi visha za znachennya a displaystyle alpha Kronbaha v cij sukupnosti Tozh cej metod empirichno zruchnij a tomu duzhe populyarnij sered doslidnikiv Obchislennya a displaystyle alpha Kronbaha vklyucheno do bagatoh standartnih statistichnih paketiv yak ot SPSS ta inshi movi Yak bulo zaznacheno vishe vsya diyalnist u mezhah klasichnoyi teoriyi testuvannya spryamovana na otrimannya prijnyatnogo viznachennya nadijnosti Nadijnist povinna dati uyavlennya pro zagalnu yakist obgovoryuvanih testovih ocinok Osnovna ideya polyagaye v tomu sho chim visha nadijnist tim krashe Klasichna teoriya testuvannya ne vstanovlyuye naskilki visokoyu maye buti nadijnist Nadto visoke znachennya a displaystyle alpha skazhimo ponad 0 9 vkazuye na nadlishkovist zavdan Dlya doslidzhen osobistosti radyat znachennya blizko 0 8 todi yak dlya individualnogo testuvannya z visokimi stavkami bazhano ponad 0 9 Ci kriteriyi ne gruntuyutsya na formalnih argumentah a radshe ye rezultatom zvichayu ta profesijnoyi praktiki Mira yihnoyi vidpovidnosti formalnim principam statistichnogo visnovuvannya zalishayetsya nezrozumiloyu Ocinyuvannya zavdan P znachennya ta korelyaciya zavdannya z testomNadijnist zabezpechuye zruchnij indeks yakosti testu u viglyadi yedinogo chisla nadijnosti Prote vona ne nadaye zhodnoyi informaciyi dlya ocinyuvannya okremih zavdan Analiz zavdan u mezhah klasichnogo pidhodu chasto spirayetsya na dvi statistiki P znachennya angl P value proporciyu ta korelyaciyu zavdannya z testom inshi movi P znachennya podaye chastku ispitnikiv yaki vidpovili u pravilnomu napryamku jogo zazvichaj nazivayut skladnistyu zavdannya angl item difficulty Korelyaciya zavdannya z testom nadaye indeks rozriznyuvalnosti abo rozriznyuvalnoyi spromozhnosti zavdannya yiyi zazvichaj nazivayut rozriznyuvalnistyu zavdannya angl item discrimination Krim togo ci statistiki obchislyuyut dlya kozhnoyi vidpovidi u chasto vikoristovuvanih zavdannyah mnozhinnogo viboru vikoristovuyuchi yih dlya ocinyuvannya zavdan i diagnostuvannya mozhlivih problem yak ot zaplutuvalnogo vidvolikannya angl confusing distractor Takij cinnij analiz zabezpechuye specialno rozroblene inshi movi AlternativiKlasichna teoriya testuvannya ye vplivovoyu teoriyeyu testovih ocinok u suspilnih naukah U psihometriyi cyu teoriyu vitisnili skladnishi modeli yak ot teoriya vidguku zavdannya TVZ angl item response theory IRT ta teoriya uzagalnyuvanosti angl generalizability theory G theory Prote TVZ ne vklyucheno do standartnih statistichnih paketiv yak ot SPSS ale inshi movi mozhe ocinyuvati modeli TVZ za dopomogoyu PROC IRT i PROC MCMC a takozh isnuyut paketi TVZ dlya vidkritoyi statistichnoyi movi programuvannya R napriklad CTT Hocha komercijni paketi zazvichaj nadayut ocinki a displaystyle alpha Kronbaha perevagu mozhut viddavati vikoristannyu specializovanogo inshi movi dlya TVZ chi teoriyi uzagalnyuvanosti Prote zagalni statistichni paketi chasto ne zabezpechuyut povnogo klasichnogo analizu a displaystyle alpha Kronbaha ye lishe odniyeyu z bagatoh vazhlivih statistik i v bagatoh vipadkah takozh neobhidne specializovane programne zabezpechennya i dlya klasichnogo analizu VadiOdniyeyu z najvazhlivishih chi najvidomishih vad klasichnoyi teoriyi testuvannya ye te sho harakteristiki ispitnika ta harakteristiki testu nemozhlivo rozdiliti kozhnu z nih mozhlivo interpretuvati lishe v konteksti inshoyi Inshoyu vadoyu ye viznachennya nadijnosti yake isnuye u klasichnij teoriyi testuvannya sho stverdzhuye sho nadijnist ye korelyaciyeyu mizh ocinkami testu na paralelnih formah testu Problema tut polyagaye v tomu sho isnuyut rizni dumki shodo togo sho take paralelni testi Rizni koeficiyenti nadijnosti nadayut abo nizhnyu mezhu ocinki nadijnosti abo ocinki nadijnosti z nevidomimi zmishennyami Tretya vada stosuyetsya standartnoyi pohibki vimiryuvannya Problema polyagaye v tomu sho za klasichnoyu teoriyeyu testuvannya standartnu pohibku vimiryuvannya vvazhayut odnakovoyu dlya vsih ispitnikiv Prote yak poyasnyuye Gemblton u svoyij knizi ocinki v bud yakomu testi ye nerivnotochnimi mirami dlya ispitnikiv iz riznimi zdibnostyami sho robit pripushennya pro rivnist pohibok vimiryuvannya dlya vsih ispitnikiv nepravdopodibnim Hambleton Swaminathan ta Rogers 1991 s 4 Chetverta j ostannya vada klasichnoyi teoriyi testuvannya polyagaye v tomu sho vona spryamovana na test a ne na zavdannya Inshimi slovami klasichna teoriya testuvannya ne mozhe dopomogti nam peredbachuvati naskilki dobre okremij ispitnik chi navit grupa ispitnikiv mogli bi vporatisya z yakimos testovim zavdannyam Div takozhPedagogichna psihologiya Standartizovane testuvannyaPrimitkiNational Council on Measurement in Education angl Arhiv originalu za 22 lipnya 2017 Traub R 1997 Classical Test Theory in Historical Perspective inshi movi angl 16 4 8 14 doi 10 1111 j 1745 3992 1997 tb00603 x Pui Wa Lei and Qiong Wu 2007 CTTITEM SAS macro and SPSS syntax for classical item analysis Behavior Research Methods angl 39 3 527 530 doi 10 3758 BF03193021 PMID 17958163 Streiner D L 2003 Starting at the Beginning An Introduction to Coefficient Alpha and Internal Consistency Journal of Personality Assessment 80 1 99 103 doi 10 1207 S15327752JPA8001 18 hdl 11655 5356 PMID 12584072 S2CID 3679277 Hambleton R Swaminathan H Rogers H 1991 Fundamentals of Item Response Theory angl Newbury Park California Sage Publications Inc Arhiv originalu za 2 serpnya 2022 DzherelaAllen M J Yen W M 2002 1979 Introduction to Measurement Theory angl Long Grove IL Waveland Press ISBN 0818502835 Novick M R February 1966 The axioms and principal results of classical test theory Journal of Mathematical Psychology angl 3 1 1 18 doi 10 1016 0022 2496 66 90002 2 Lord F M Novick M R 1968 Statistical theories of mental test scores angl Reading MA Addison Welsley Publishing Company ISBN 0201043106 LiteraturaGregory Robert J 2011 Psychological Testing History Principles and Applications angl vid Sixth Boston Allyn amp Bacon ISBN 978 0 205 78214 7 Hogan Thomas P Brooke Cannon 2007 Psychological Testing A Practical Introduction angl vid Second Hoboken NJ John Wiley amp Sons ISBN 978 0 471 73807 7 PosilannyaStattya Mizhnarodnoyi komisiyi z testuvannya pro klasichnu teoriyu testuvannya angl TAP bezkoshtovne programne zabezpechennya dlya klasichnoyi teoriyi testuvannya angl Iteman programne zabezpechennya dlya vizualnoyi zvitnosti za klasichnoyu teoriyeyu testuvannya angl Lertap programne zabezpechennya na osnovi Excel dlya klasichnoyi teoriyi testuvannya angl CITAS programne zabezpechennya na osnovi Excel dlya klasichnoyi teoriyi testuvannya angl jMetrik programne zabezpechennya dlya klasichnoyi teoriyi testuvannya angl