ТЕСТУВАННЯ ЯК СКЛАДОВА МОНІТОРИНГОВОГО ДОСЛІДЖЕННЯ НАВЧАЛЬНИХ ДОСЯГНЕНЬ УЧНІВ
Наталія Мазур
(Київ, Україна)
У статті узагальнено способи класифікації тестів, що можуть бути використані у моніторингових дослідженнях. Представлено можливості застосування різних видів тестів в залежності від поставленої мети. Зазначено, які вимоги висуваються до дидактичних тестів та їх зміст.
Ключові слова: моніторинг, тест, тестування, класифікація тестів, надійність, валідність.
The article generalizes the ways of classifying tests which can be used in monitoring researches. Possibilities of applying different types of tests depending on a goal are presented. It is specified what requirements are imposed to didactic tests and their contents.
Keywords:monitoring, test, testing, classification of tests, reliability, validity.
Оцінка ефективності навчально-виховного процесу та подальше планування заходів щодо її підвищення можлива лише за умови проведення якісного моніторингу. Сам процес моніторингу є досить складним, має враховувати ряд важливих факторів та містити перелік необхідних процедур та операцій, зазначених у програмі моніторингового дослідження. Однією зі складових моніторингу є збір даних для визначення рівня знань, вмінь та навичок учнів/студентів з метою подальшого його аналізу та внесення необхідних змін для удосконалення навчально-виховного процесу. Зазвичай навчальні досягнення вимірюються за допомогою тестів, контрольних робіт, зрізів знань, які корелюються зі змістом освіти. Тому варто розглянути типологію тестів, що можуть бути використані у моніторинговому дослідженні, вимоги до їх розробки та застосування.
Проблему моніторингу вивчають у таких напрямках: теоретичні основи моніторингу – О. Локшина, Т. Лукіна, В. Лунячек, зокрема, науково обґрунтувала вітчизняну систему державного управління якістю загальної середньої освіти – Т. Лукіна; управління якістю освіти – С. Воровщиков, Д. Матрос, Н. Мельникова, Д. Полев, М. Поташник, Д. Татьянченко; удосконалення організації освітнього процесу – Л. Мойсеєва; педагогічний моніторинг освітнього процесу – А. Белкін, Н. Жукова; моніторинг якості освіти медичного спрямування – І.Є. Булах; регіональний аспект моніторингу якості освіти – Т.Б. Волобуєва; характеристика таких найголовніших порівняльних моніторингових досліджень, як TIMSS, PISA, PIRLS та ін. – І.І. Іванюк; рівень розвитку моніторингу в межах загальноосвітніх навчальних закладів – А. Вілохін, А. Ісаєва, Г. Сігеєва, В. Кальней, С. Шишов, Дж. Уілмс та ін. О. Ляшенко визначив концептуальні засади моніторингу якості освіти, рівні функціонування цієї системи та етапи проведення моніторингових досліджень.
Метою написання статтіє аналіз класифікацій тестів, що можуть бути використані у моніторингових дослідженнях навчальних досягнень учнів, вимоги до їх розробки та застосування у навчально-виховному процесі.
У великому тлумачному словнику сучасної української мови за ред. В. Бусела визначено, що «моніторинг – безперервне стеження за яким-небудь процесом з метою виявлення його відповідності бажаному результату, а також прогнозування та запобігання критичним ситуаціям» [3: 687].
Д. Матрос, Н. Мельников, Д. Полев розглядають моніторинг як механізм контролю й відстеження якості освіти, постійне спостереження за навчально-виховним процесом з метою виявлення його відповідності бажаному результату або першочерговим позиціям, що дозволяє виявити тенденції розвитку системи освіти [7].
В. Звонніков визначає моніторинг як стандартизоване спостереження за освітнім процесом і його результатами, що дозволяє створити історію стану об’єкту у часі, кількісно оцінювати зміну суб’єктів навчання і освітньої системи, визначати і прогнозувати напрямки їх розвитку [5: 203].
Під моніторингом навчальних досягнень учнів ми будемо розуміти систему контролюючих і діагностуючих заходів, обумовлених цілями і завданнями навчального процесу, які дозволяють спостерігати за процесом навчання, визначати його результати (в т.ч. рівні засвоєння знань) і корегувати їх по мірі необхідності у відповідності з встановленими еталонами на підставі проведеного аналізу.
Що стосується вимірювання рівня навчальних досягнень, то різні педагоги підходять до цього питання по-різному. Так, наприклад, Локшина О.І. [8] запропонувала виокремити два головні підходи, на яких вимірювання учнівських досягнень можуть ґрунтуватися. Перший – це коли тест конструюють з навчального матеріалу, який містить знання й навички, що мав засвоїти учень. На основі результатів тестування встановлюють так звані норми. Результати відповідей учнів, класів, шкіл або освітніх систем відображаються у показниках, які порівнюють з розподілом балів усієї кількості тих, хто складав тест.
В основі альтернативного підходу лежить визначення рівня знань, які має продемонструвати середній учень на певному рівні розвитку, наприклад у 8-му класі. Цей рівень можуть установлювати вчителі, шкільна рада, управлінські структури (наприклад, міністерство) тощо. При такому підході результати отримують як співвідношення або завдань, на які конкретний учень відповів правильно, до всіх одержаних завдань або учнів у конкретному класі чи системі, які досягли визначеного критерію, до всіх учнів, що брали участь у замірах навчальних досягнень.
Зазначені підходи дають різну по-суті інформацію. Перший – нормативне тестування (вимірювання) – відображає рівень знань конкретних учнів або груп учнів порівняно з контрольною групою; другий – критеріальне тестування – про рівень знань конкретних учнів або груп учнів порівняно з визначеним обсягом знань (вмінь, навичок). Досить часто, більшість тестів, що ґрунтуються на таких підходах, проводяться у паперовому вигляді з вибором відповіді.
Щодо самих тестів, то в літературі зустрічається досить багато різних класифікацій і зрозуміло, що їх можна класифікувати за різними ознаками.
Розглянемо деякі класифікації.
1. За процедурою створення можуть бути виділені стандартизовані й нестандартизовані тести.
Стандартизуються процедура й умови проведення тестування, способи обробки та інтерпретації результатів, які повинні призвести до створення рівних умов для випробуваних і мінімізувати випадкові помилки й похибки, як на етапі проведення, так і на етапі обробки результатів й інтерпретації даних.
Стандартизованим є тест, що пройшов апробацію на досить великій кількості учасників тестування, який має стабільні та допустимі показники якості, а також специфікацію – паспорт з нормами, умовами та інструкціями для його багаторазового використання у процесі контролю за якістю знань. Стандартизації передує пілотне тестування. Воно проводиться на репрезентативній вибірці з метою визначення параметрів тесту на уточнення процедури тестування і є обов’язковим етапом процесу стандартизації тесту.
Нестандартизовані тести створюються самими викладачами для своїх учнів. Вони не проходять мінімально необхідні методологічні процедури обґрунтування надійності та валідності, не мають нормативів стандартизації.
У навчальному процесі можна виділити ряд задач, які можуть бути вирішені нестандартизованими тестами. Наприклад, проведення початкового та проміжного контролю, проте для цілей підсумкової атестації учнів можна використовувати тільки стандартизований тестовий інструмент.
2. По засобах пред’явлення:
– бланкові (тести «папір й олівець»), які у свою чергу розділяються на два види:
1) з використанням тестових зошитів, у яких знаходяться тестові завдання й у яких фіксуються результати (відповіді перш за все);
2) з використанням бланків, у яких відзначають або вписують лише правильні відповіді. Бланки відповідей відокремлені від бланків завдань;
– предметні – у яких необхідно маніпулювати матеріальними об’єктами, результативність виконання цих тестів залежить від швидкості й правильності виконання завдань;
– апаратурні – тести з використанням пристроїв для вивчення особливостей уваги, сприйняття, пам’яті й мислення;
– практичні – тести, які схожі на відомі лабораторні роботи (по хімії, фізиці, біології тощо), однак забезпечені відповідними інструкціями й мають тестові умови завдань;
– комп’ютерні [6].
Комп’ютерне тестування по предметам як один з елементів внутрішньошкільного контролю відкриває широкі можливості для індивідуалізації процесу засвоєння знань. Таке тестування є реальною можливістю розв’язання цілого ряду задач, що сприяють підвищенню якості навчання не за рахунок збільшення навантаження викладача, а шляхом впровадження у навчальний процес навчаючих програм і тестів, які здатні змінити технологію навчання. При цьому наявна можливість створювати і застосовувати тести з широким використанням різноманітних видів наочності (зображення, графіки, діаграми, аудіо- та відеофрагменти).
B.C. Аванесов [1] пропонує в рамках комп’ютерного тестування виділити адаптивні тести – тести, у яких завдання подаються послідовно по одному, залежно від відповіді на попереднє запитання. У цьому є сенс, оскільки більшість тестів припускає пред’явлення кінцевого набору питань тому, хто проходив випробування, і не припускає залежності кожного наступного питання від відповіді на попередні запитання чи завдання.
3. По спрямованості, тобто по тому, що саме передбачається досліджувати за допомогою даного тесту:
–тести інтелекту використовуються для аналізу рівня розвитку пізнавальних процесів і функцій мислення;
– тести особистості застосовують для оцінки емоційно-вольових якостей особистості;
– тести здібностей використовуються для оцінки можливості в оволодінні різних видів діяльності;
–тести досягнень дозволяють оцінити розвиток знань, вмінь та навичок після навчання.
Найбільш активно застосовуються тести досягнень. Вони створюються для перевірки результатів навчання на різних рівнях здобуття освіти, визначення ефективності навчальних програм та процесу навчання вцілому. Тести досягнень прийнято протиставляти тестам здібностей, тому що тести здібностей визначають ефективність навчання у відносно неконтрольованих і невизначених умовах, в той час як тести досягнень визначають ефективність навчання при частково відомих і контрольованих умовах [2].
4. За характером дій:
– вербальні (пов’язані з необхідністю відтворення розумових дій – словесно-логічні тести, опитувальники щодо перевірки знань, встановлення закономірностей тощо);
– невербальні, пов’язані із практичним маніпулюванням предметами – картками, блоками, деталями.
5. По провідній орієнтації:
– тести швидкості, що містять прості задачі, час розв’язання яких обмежено настільки, що жоден з тих, хто виконує тестування, не встигає виконати всі завдання у відведений проміжок часу. Зазвичай це психодіагностичні тести або моторні тести для професійного відбору і виявлення специфічних особливостей, необхідних для виконання професійних дій (з урахуванням фактору швидкості).
У практичній психодіагностиці такі тести є одночасно імітаційними вправами або завданнями тренувального характеру і безпосередньо відтворюють всі або частину рухів (дій), які здійснюються професіоналом в ході роботи.
До моторних тестів можна віднести: спрямованість реакції, час реакції, швидкість руху рук, точність руху рук та пальців тощо.
– тести потужностіабо результативності, що включають складні задачі, час вирішення яких або зовсім не обмежено, або м’яко лімітовано. Оцінці підлягає успішність і спосіб розв’язання завдання. Близькими до тестових завдань такого роду є завдання для письмових підсумкових екзаменів за курс середньої школи;
– змішані тести, які поєднують у собі риси двох зазначених вище тестів. У таких тестах представлені завдання різного рівня складності – від найпростіших до дуже складних. Час випробування у такому випадку обмежено, але достатній для розв’язання більшості пропонованих завдань певною групою учнів. Оцінкою у такому випадку виступають і швидкість виконання завдань (кількість виконаних завдань), і правильність розв’язання.
Змішані тести найчастіше застосовуються на практиці, до них відноситься більшість тестів щодо навчальних досягнень школярів.
6. По ступеню однорідності завдань:
– гомогенні, що мають, як правило, одну шкалу та дозволяють оцінити одну властивість або якість особистості й включають завдання, схожі за характером, але різні за змістом;
– гетерогенні (багатовимірні), що мають декілька шкал, які дозволяють оцінити різноманітні характеристики особистості й включають завдання, що відрізняються як за характером, так і за змістом.
7. За цілями використання (тільки для тестів у системі освітиза Норманом Е. Гронлундом [6]):
–визначальний тест (знання або поведінка учня/студента на початку навчання);
–формуючий тест (тест прогресу, що досягнутий у процесі навчання);
– діагностичний тест (тест на виявлення ускладнень та джерел їх виникнення за під час навчання);
–підсумовуючий тест (тест досягнень наприкінці навчання).
Для всіх названих тестів принципи й механізми розробки однакові, але зміст матеріалу, включеного у тест, і ступінь складності питань різні і відповідають цілям тестування.
Усе більшої актуальності набувають так звані тести виконання, які вимагають від учнів щось зробити або написати для того, щоб продемонструвати здатність розв’язувати проблему або виконувати якусь діяльність. Незважаючи на значні складнощі щодо розроблення тестів виконання (пошук критеріїв вимірювання, неодмінних для валідного порівняння, значні капіталовкладення), вони надзвичайно перспективні [Локши].
Тести, що використовуються у дослідженнях, зазвичай, стандартизовані. Стандартизоване тестування, застосовуване на регіональному, загальнонаціональному й міждержавному рівнях, отримало назву зовнішнього оцінювання. На відміну від внутрішнього (його проводять вчителі на рівні групи, класу або школи, використовуючи свої розробки завдань) зовнішнє оцінювання навчальних досягнень учнів охоплює значно більшу кількість учнів, як правило, проводять на території незалежної інституції з залученням її працівників.
Ґрунтуючись на двох основних функціях, що виконує зовнішнє оцінювання, а саме: на діагностичній та сертифікаційній, – воно може мати форму оцінювання:
· на певних етапах навчання учня/студента в школі/ВНЗ у формі моніторингового тестування з метою діагностики і
· по закінченні окремого періоду навчання у формі державних (національних) випускних іспитів з метою сертифікації чи відбору [Локши].
Діагностичне зовнішнє оцінювання може бути організовано як вибіркове тестування (на основі репрезентативної вибірки учнів, коли результати оцінювання поширюють на ввесь учнівський контингент) або як обов’язкове для всіх учнів.
Враховуючи викладене, слід наголосити, що всі види тестів повинні бути (відносно до якості тесту): надійні; валідні; стандартизовані; коректні та прості; дискримінативні; предметно чисті; оптимальні за кількістю; стислі у часі. Охарактеризуємо кожну з ознак.
Надійність. Означає відносну постійність, стійкість, узгодженість отриманого результату. Повторне застосування тестів, що відповідають цій вимозі, призводить до подібних оцінок. Тобто, виконання тесту одним і тим самим учнем/студентом повинно давати практично однакові результати, за умови, що учень/студент не знає результатів попереднього оцінювання (правильно чи неправильно виконав кожне із запропонованих завдань).
Також надійним вважається тест, який дає однакові результати (зрозуміло, у межах похибки) в різних експериментальних групах, що вивчають теоретичний матеріал за однією і тією самою програмою.
У загальному випадку ступінь надійності може залежати від багатьох причин. Зокрема на точність вимірювання можуть впливати: недосконалість методики (інструкція до тесту складена невдало, вплив сторонніх шумів, якість освітлення тощо); різна поведінка експериментатора; самопочуття тих, кого тестують.
Валідність. Ця характеристика є одним із найважливіших критеріїв якості тесту. Найвдалішим на нашу думку означення валідності надано А. Анастазі. Валідність тесту – це поняття, яке вказує, що тест вимірює та наскільки добре він це робить [2]. Питання валідності постає в процесі розробки та практичного застосування тесту, коли ставиться завдання встановити відповідність між ступенем вираження певної властивості особистості та методом вимірювання цієї властивості. Чим краще в тесті відображена та властивість, заради вимірювання якої він створений, тим валіднішим є такий тест. Валідність тестових завдань поділяється на змістовну і функціональну.
Стандартизованість– передбачає певну уніфікованість в оформленні завдань та числовій обробці даних.
Коректність та простота. Означає, що тестові завдання повинні мати чіткі та зрозумілі формулювання, а в змісті завдань не повинно міститися суперечливих тверджень (випадок, коли при міркуванні про один і той самий об’єкт, висловлюються твердження, що виключають одне одного). Також не можна включати відповіді, правильність або неправильність яких студент не може обґрунтувати на момент тестування.
Дискримінативність– передбачає наявність обмеження щодо складності тестових завдань. Тест не повинен містити як занадто простих (елементарних) питань, так і питань, які вимагають суттєво поглибленого вивчення теоретичного матеріалу.
Предметна чистота. Для забезпечення цієї вимоги потрібно впорядкувати зміст теоретичного матеріалу, знання якого перевірятимуться в подальшому.
Стислість у часі. Для виконання тесту потрібно передбачити певний час, який обов’язково фіксуватиметься таймером. Після того, як відведений час буде вичерпано, фіксуються результати. Питання, відповіді на які не були надані, до цього результату не враховуються. Необхідно також надати учню/студенту можливість самостійно завершити роботу із тестом у разі, коли він дасть відповіді на запитання достроково. Вимога стислості в часі певним чином пов’язана з вимогою коректності та простоти: студент не повинен витрачати час на громіздкі обчислення, на осмислення некоректно сформульованого твердження або запитання тощо [4].
Висновки. При проведенні системного моніторингу його результати достовірні і надійні, а їх вдалий і грамотний аналіз дозволяє оптимізувати діяльність вчителя щодо формування та корекції знань і вмінь учнів. Одним із засобів збирання даних є проведення тестування. В залежності від мети дослідження можна підібрати доцільний вид тесту та засоби для його реалізації. Проте при розробці тесту слід враховувати ряд характеристик, такі як надійність, валідність, стандартизованість та ін. Варто зазначити, що для перевірки цих показників мають бути проведені спеціальні математичні розрахунки.
ЛІТЕРАТУРА
1. Аванесов B.C. Композиция тестовых заданий. М., Ассоциация инженеров-педагогов, 1996. – 191 с.
2. Анастази А., Урбина С. Психологическое тестирование. – 7-е изд. – СПб.: Питер, 2007. – 688 с.
3. Великий тлумачний словник сучасної української мови (з дод. І допов.) / Уклад. і гол. ред. В.Т. Бусел. – К.; Ірпінь: ВТФ «Перун», 2005. – 1728 с.
4. Зарицька О.Л. Комп’ютерні тести з інформатики в системі дистанційного навчання – Електронний режим доступу: http://eprints.zu.edu.ua/1317/1/8.pdf
5. Звонников В.И. Современные средства оценивания результатов обучения: учеб. пособие для студ. высш. учеб. заведений / В.И. Звонников, М.Б. Челышкова. – М. : Издательский центр «Академия», 2007. – 224 с.
6. Майоров А.Н. Теория и практика создания тестов для системы образования. (Как выбирать, создавать и использовать тесты для целей образования). – М., «Интеллект-центр», 2002. – 296 с.
7. Матрос Д. Ш., Полев Д. М., Мельникова Н.Н. Управление качеством образования на основе новых информационных технологий и образовательного мониторинга. Издание 2-е, исправленное и дополненное. - М.: Педагогическое общество России, 2001. – 128 с.
8. Моніторинг якості освіти: становлення та розвиток в Україні: Рекомендації з освітньої політики / під заг. ред. О.І. Локшиної. К.: «К.І.С.», 2004. – 160с.
ВІДОМОСТІ ПРО АВТОРА
Мазур Наталія Петрівна – викладач кафедри інформаційних технологій та математичних дисциплін Київського університету імені Бориса Грінченка.
Дякую, стаття в даний час є дуже необхідною. Дійсно, на сьогоднішній день аналіз класифікації тестів, які можуть бути використані у моніторингових дослідженнях навчальних досягнень учнів,а також вимоги до їх розробки та застосування у навчально-вихов ному процесі є досить актуальним та потрібним на сьогодні.
Дякую за коментар! Ми розуміємо, що визначення рівня навчальних досягнень учнів лише на основі тестів є неповним, але це дозволяє, як мінімум, провести діагностику і виявити "прогалини" та "проблемні зони" в певній темі або розділі. А за для більш ґрунтовної оцінки та аналізу варто використовувати комплекс практичних завдань.
Проблема визначення навчальних досягнень учнів за допомогою тестів досить важлива, оскільки існує безліч видів тестового контролю. Запропонована систематизація є досить цікавою і дозволяє зорієнтуватись у виборі необхідного виду тесту в залежності від мети тестування.
Стрічка RSS коментарів цього запису