Вирі́внювання те́сту (англ. test equating) традиційно стосується статистичного процесу визначення порівнянних оцінок на різних формах іспиту. Його можливо здійснювати за допомогою класичної теорії тестування та теорії відгуку завдання.
У теорії відгуку завдання вирівнювання (англ. equating) — це процес перенесення оцінок із двох чи більше паралельних форм тесту на спільну шкалу оцінювання. Його результатом є можливість порівнювати оцінки з різних форм тесту напряму, або трактувати їх так, ніби вони походять з однієї форми тесту. Коли тести не паралельні, цей загальний процес називають «зв'язуванням» (англ. linking). Це процес вирівнювання одиниць і початку двох шкал, на яких оцінено здібності учнів за результатами різних тестів. Цей процес аналогічний вирівнюванню градусів за шкалами Фаренгейта та Цельсія шляхом перетворення вимірювань з однієї шкали до другої. Визначення порівнянних оцінок є побічним продуктом вирівнювання в результаті вирівнювання шкал, отриманих із результатів тестів.
Мета
Припустімо, що Рома і Леся складають тест для отримання ліцензії на певну професію. Оскільки високі ставки (отримання права займатися цією професією в разі успішного складання тесту) можуть створити спокусу списування, організація, відповідальна за тест, створює дві форми. Якщо відомо, що Рома набрав 60 % за формою А, а Леся — 70 % за формою Б, чи можемо ми точно сказати, хто краще опанував матеріал? А що, як форма А складається з дуже складних завдань, а форма Б відносно легка? Для розв'язання саме цієї проблеми й виконують аналізи вирівнювання, щоб оцінки були максимально справедливими.
Вирівнювання у теорії відгуку завдання
У теорії відгуку завдання «розташування» (англ. "location") осіб (міри деякої якості, яку оцінює тест) оцінюють на інтервальній шкалі, тобто розташування оцінюють відносно одиниці вимірювання та точки відліку. У галузі освітнього оцінювання часто використовують тести для оцінювання різних груп учнів із метою встановлення спільної шкали шляхом вирівнювання точок відліку, а коли це доцільно, також й одиниць вимірювання, шкал, отриманих з даних відгуку різних тестів. Цей процес називають вирівнюванням або вирівнюванням тестів.
У теорії відгуку завдання розрізняють два види вирівнювання: горизонтальне та вертикальне. Вертикальне вирівнювання стосується процесу вирівнювання тестів, які проводять для груп учнів із різними здібностями, як-от учнів різних класів (років навчання). Горизонтальне вирівнювання стосується вирівнювання тестів, які проводять для груп зі схожими здібностями; наприклад, двох тестів, проведених для учнів такого же класу в два послідовні календарні роки. Різні тести використовують для запобігання ефекту тренування.
У термінах теорії відгуку завдання вирівнювання є лише особливим випадком загальнішого процесу шкалювання (англ. scaling), який застосовують при використанні понад одного тесту. Проте на практиці шкалювання часто втілюють окремо для різних тестів, а потім уже здійснюють послідовне вирівнювання шкал.
Зазвичай розрізняють два методи вирівнювання: за спільними особами (англ. common person equating) та за спільними завданнями (англ. common item equating). Вирівнювання за спільними особами передбачає проведення двох тестів для спільної групи осіб. Середнє значення й стандартне відхилення шкального розташування цієї групи на цих двох тестах вирівнюють за допомогою лінійного перетворення. Вирівнювання за спільними завданнями передбачає використання набору спільних завдань, який називають (англ. anchor test), вкладеним у два різні тести. Вирівнюють середнє значення розташувань спільних завдань.
Класичні підходи до вирівнювання
У класичній теорії тестування вирівнювання за середнім значенням просто коригує розподіл оцінок так, щоб середнє значення однієї форми було порівнянним із середнім значенням іншої форми. Хоч вирівнювання за середнім значенням і привабливе своєю простотою, йому бракує гнучкості, зокрема врахування можливої відмінності стандартних відхилень цих форм.
Лінійне вирівнювання коригує так, щоби дві форми мали порівнянні середнє значення та стандартне відхилення. Існує декілька типів лінійного вирівнювання, які відрізняються припущеннями та математичними методами оцінювання параметрів. Методи спостережуваних оцінок (англ. Observed Score) Такера та Левіна оцінюють взаємозв'язок між спостережуваними оцінками двох форм, тоді як метод істинних оцінок (англ. True Score) Левіна оцінює взаємозв'язок між істинними оцінками двох форм.
Вирівнювання за еквіпроцентилями (англ. equipercentile) визначає взаємозв'язок вирівнювання як такий, за якого оцінка може мати еквівалентний процентиль на кожній з форм. Цей взаємозв'язок може бути нелінійним.
На відміну від теорії відгуку завдання, вирівнювання на основі класичної теорії тестування певною мірою відрізняється від шкалювання. Вирівнювання є перетворенням сирих даних до сирих даних у тому сенсі, що воно оцінює сиру оцінку за Формою Б, еквівалентну кожній сирій оцінці за базовою Формою А. Будь-яке перетворення шкалювання, що використовується, потім застосовується поверх або разом із вирівнюванням.
Див. також
Примітки
- Лісова, Т.В. (2014). До проблеми вирівнювання результатів тестування у рамках сучасної теорії IRT. Міжнародні Челпанівські психолого-педагогічні читання. 11: 368—375. Архів оригіналу за 28 січня 2025.
- Kolen, M.J.; Brennan, R.L. (1995). Test Equating (англ.). New York: Spring. doi:10.1007/978-1-4757-2412-7. ISBN .
- National Council on Measurement in Education (англ.). Архів оригіналу за 22 липня 2017.
- Baker, F. (1983). Comparison of ability metrics obtained under two latent trait theory procedures. Applied Psychological Measurement (англ.). 7: 97—110. Архів оригіналу за 28 січня 2025.
- Baker, F. (1984). Ability metric transformations involved in vertical equating under item response theory. Applied Psychological Measurement (англ.). 8 (3): 261—271.
- Копняк, Н.Б. (2004). Ще раз до питання вибору системи оцінювання рівня навчальних досягнень учнів в Україні та за її межами (PDF). Педагогічні науки. Збірник наукових праць НПУ імені М. П. Драгоманова (укр.). Київ: НПУ імені М. П. Драгоманова: 84—90. Архів (PDF) оригіналу за 29 січня 2025.
Посилання
- Вирівнювання та SAT (англ.)
- Вирівнювання та тести AP (англ.)
- IRTEQ: Windows Application that Implements IRT Scaling and Equating (англ.). Архів оригіналу за 4 липня 2017.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Pro matematichnij metod rozv yazuvannya funkcionalnogo rivnyannya div Pririvnyuvannya koeficiyentiv Viri vnyuvannya te stu angl test equating tradicijno stosuyetsya statistichnogo procesu viznachennya porivnyannih ocinok na riznih formah ispitu Jogo mozhlivo zdijsnyuvati za dopomogoyu klasichnoyi teoriyi testuvannya ta teoriyi vidguku zavdannya U teoriyi vidguku zavdannya virivnyuvannya angl equating ce proces perenesennya ocinok iz dvoh chi bilshe paralelnih form testu na spilnu shkalu ocinyuvannya Jogo rezultatom ye mozhlivist porivnyuvati ocinki z riznih form testu napryamu abo traktuvati yih tak nibi voni pohodyat z odniyeyi formi testu Koli testi ne paralelni cej zagalnij proces nazivayut zv yazuvannyam angl linking Ce proces virivnyuvannya odinic i pochatku dvoh shkal na yakih ocineno zdibnosti uchniv za rezultatami riznih testiv Cej proces analogichnij virivnyuvannyu gradusiv za shkalami Farengejta ta Celsiya shlyahom peretvorennya vimiryuvan z odniyeyi shkali do drugoyi Viznachennya porivnyannih ocinok ye pobichnim produktom virivnyuvannya v rezultati virivnyuvannya shkal otrimanih iz rezultativ testiv MetaPripustimo sho Roma i Lesya skladayut test dlya otrimannya licenziyi na pevnu profesiyu Oskilki visoki stavki otrimannya prava zajmatisya ciyeyu profesiyeyu v razi uspishnogo skladannya testu mozhut stvoriti spokusu spisuvannya organizaciya vidpovidalna za test stvoryuye dvi formi Yaksho vidomo sho Roma nabrav 60 za formoyu A a Lesya 70 za formoyu B chi mozhemo mi tochno skazati hto krashe opanuvav material A sho yak forma A skladayetsya z duzhe skladnih zavdan a forma B vidnosno legka Dlya rozv yazannya same ciyeyi problemi j vikonuyut analizi virivnyuvannya shob ocinki buli maksimalno spravedlivimi Virivnyuvannya u teoriyi vidguku zavdannyaRisunok 1 Krivi harakteristik testu sho pokazuyut vzayemozv yazok mizh zagalnoyu ocinkoyu ta roztashuvannyam osobi dlya dvoh riznih testiv vidnosno spilnoyi shkali U comu prikladi zagalna ocinka 37 za Ocinyuvannyam 1 vidpovidaye ocinci 34 9 za Ocinyuvannyam 2 yak pokazano vertikalnoyu liniyeyu U teoriyi vidguku zavdannya roztashuvannya angl location osib miri deyakoyi yakosti yaku ocinyuye test ocinyuyut na intervalnij shkali tobto roztashuvannya ocinyuyut vidnosno odinici vimiryuvannya ta tochki vidliku U galuzi osvitnogo ocinyuvannya chasto vikoristovuyut testi dlya ocinyuvannya riznih grup uchniv iz metoyu vstanovlennya spilnoyi shkali shlyahom virivnyuvannya tochok vidliku a koli ce docilno takozh j odinic vimiryuvannya shkal otrimanih z danih vidguku riznih testiv Cej proces nazivayut virivnyuvannyam abo virivnyuvannyam testiv U teoriyi vidguku zavdannya rozriznyayut dva vidi virivnyuvannya gorizontalne ta vertikalne Vertikalne virivnyuvannya stosuyetsya procesu virivnyuvannya testiv yaki provodyat dlya grup uchniv iz riznimi zdibnostyami yak ot uchniv riznih klasiv rokiv navchannya Gorizontalne virivnyuvannya stosuyetsya virivnyuvannya testiv yaki provodyat dlya grup zi shozhimi zdibnostyami napriklad dvoh testiv provedenih dlya uchniv takogo zhe klasu v dva poslidovni kalendarni roki Rizni testi vikoristovuyut dlya zapobigannya efektu trenuvannya U terminah teoriyi vidguku zavdannya virivnyuvannya ye lishe osoblivim vipadkom zagalnishogo procesu shkalyuvannya angl scaling yakij zastosovuyut pri vikoristanni ponad odnogo testu Prote na praktici shkalyuvannya chasto vtilyuyut okremo dlya riznih testiv a potim uzhe zdijsnyuyut poslidovne virivnyuvannya shkal Zazvichaj rozriznyayut dva metodi virivnyuvannya za spilnimi osobami angl common person equating ta za spilnimi zavdannyami angl common item equating Virivnyuvannya za spilnimi osobami peredbachaye provedennya dvoh testiv dlya spilnoyi grupi osib Serednye znachennya j standartne vidhilennya shkalnogo roztashuvannya ciyeyi grupi na cih dvoh testah virivnyuyut za dopomogoyu linijnogo peretvorennya Virivnyuvannya za spilnimi zavdannyami peredbachaye vikoristannya naboru spilnih zavdan yakij nazivayut inshi movi angl anchor test vkladenim u dva rizni testi Virivnyuyut serednye znachennya roztashuvan spilnih zavdan Klasichni pidhodi do virivnyuvannyaU klasichnij teoriyi testuvannya virivnyuvannya za serednim znachennyam prosto koriguye rozpodil ocinok tak shob serednye znachennya odniyeyi formi bulo porivnyannim iz serednim znachennyam inshoyi formi Hoch virivnyuvannya za serednim znachennyam i privablive svoyeyu prostotoyu jomu brakuye gnuchkosti zokrema vrahuvannya mozhlivoyi vidminnosti standartnih vidhilen cih form Linijne virivnyuvannya koriguye tak shobi dvi formi mali porivnyanni serednye znachennya ta standartne vidhilennya Isnuye dekilka tipiv linijnogo virivnyuvannya yaki vidriznyayutsya pripushennyami ta matematichnimi metodami ocinyuvannya parametriv Metodi sposterezhuvanih ocinok angl Observed Score Takera ta Levina ocinyuyut vzayemozv yazok mizh sposterezhuvanimi ocinkami dvoh form todi yak metod istinnih ocinok angl True Score Levina ocinyuye vzayemozv yazok mizh istinnimi ocinkami dvoh form Virivnyuvannya za ekviprocentilyami angl equipercentile viznachaye vzayemozv yazok virivnyuvannya yak takij za yakogo ocinka mozhe mati ekvivalentnij procentil na kozhnij z form Cej vzayemozv yazok mozhe buti nelinijnim Na vidminu vid teoriyi vidguku zavdannya virivnyuvannya na osnovi klasichnoyi teoriyi testuvannya pevnoyu miroyu vidriznyayetsya vid shkalyuvannya Virivnyuvannya ye peretvorennyam sirih danih do sirih danih u tomu sensi sho vono ocinyuye siru ocinku za Formoyu B ekvivalentnu kozhnij sirij ocinci za bazovoyu Formoyu A Bud yake peretvorennya shkalyuvannya sho vikoristovuyetsya potim zastosovuyetsya poverh abo razom iz virivnyuvannyam Div takozh inshi movi PrimitkiLisova T V 2014 Do problemi virivnyuvannya rezultativ testuvannya u ramkah suchasnoyi teoriyi IRT Mizhnarodni Chelpanivski psihologo pedagogichni chitannya 11 368 375 Arhiv originalu za 28 sichnya 2025 Kolen M J Brennan R L 1995 Test Equating angl New York Spring doi 10 1007 978 1 4757 2412 7 ISBN 978 0 387 94486 9 National Council on Measurement in Education angl Arhiv originalu za 22 lipnya 2017 Baker F 1983 Comparison of ability metrics obtained under two latent trait theory procedures Applied Psychological Measurement angl 7 97 110 Arhiv originalu za 28 sichnya 2025 Baker F 1984 Ability metric transformations involved in vertical equating under item response theory Applied Psychological Measurement angl 8 3 261 271 Kopnyak N B 2004 She raz do pitannya viboru sistemi ocinyuvannya rivnya navchalnih dosyagnen uchniv v Ukrayini ta za yiyi mezhami PDF Pedagogichni nauki Zbirnik naukovih prac NPU imeni M P Dragomanova ukr Kiyiv NPU imeni M P Dragomanova 84 90 Arhiv PDF originalu za 29 sichnya 2025 PosilannyaVirivnyuvannya ta SAT angl Virivnyuvannya ta testi AP angl IRTEQ Windows Application that Implements IRT Scaling and Equating angl Arhiv originalu za 4 lipnya 2017