Prof.Dr.Mustafa ERGÜN                *****        ÖĞRETİMDE PLANLAMA VE DEĞERLENDİRME

MADDE ANALİZİ VE TEST GELİŞTİRME

Madde güçlüğü

a) Test değerlendirilir. Cevap kağıtları puan sırasına konur.
b) Üstten ve alttan kağıtların %27'si alınır.
c) Güçlüğü hesaplanacak sorunun (madde) "doğru" cevapları sayılır.

Madde güçlüğü p=(Üst grupta doğru cevap sayısı+Alt grupta doğru cevap sayısı/2*Yüzde 27
Mesela Üst grupta doğru cevap 40, Alt grupta doğru cevap 30, Toplam kağıtların %27 ise 50 ise
(40+30)/2*50=0.70
Maddenin güçlüğü, doğru cevap yüzdeleri üzerinden de hesaplanır.
Mesela, üst grupta 24, alt grupta 16 doğru cevap olan ve %27'si 40 olan bir test maddesinde üst grup yüzdesi 24/40=0.60, alt grup yüzdesi 16/40=0.40 ve ikisinin ortalaması 0.50'dir.

Maddenin ayırıcılığı

Üst grupta doğru cevap verenler ile alt grup arasında doğru cevap verenler arasındaki fark, maddenin ayırt ediciliğidir.
d=(Üst grupta doğru cevap sayısı-Alt grupta doğru cevap sayısı/Yüzde 27
Yukarıdaki soru meddesinin ayırıcılığı d=(40-30)/50=0.20
Eğer alt grupta doğru cevap verenlerin sayısı daha fazla ise, negatif yönde bir ayırt edicilik vardır.

Testin geçerliği

Test, ölçmek istediği bilgi ve beceriyi doğru ve başka faktörler karıştırmadan ölçebiliyor mu? Geçerlikler:
* Kapsam geçerliği: Test işlenen tüm konuları kapsıyor mu?
* Mantıksal geçerlik: Test ölçülmek istenen konunun en önemli bileşenlerini kapsıyor mu, yoksa birçok şeyi dışarda mı bırakıyor?
* Ölçüt geçerliği: Bu, uyum ve yordama geçerliği olarak ikiye ayrılıyor. Uyum geçerliği, uzmanlar tarafından hazırlanmış, geçerliğinden emin olunan daha önce hazırlanmış standar bir test ile sizin yaptığınız testin korelasyonuna bakar. Burada iki test arasında 0.70 ve daha iyisi 0.80 korelasyon aranır. Kestirim geçerliği, ilerdeki başarıyı ne kadar kestşrebildiğiyle ölçülür. Üniversite giriş sınavları ile üniversitedeki başarı arasında ne kadar bir korelsyon var?

Geçerliğin hesaplanması
 
Test sonucu Başarılı Başarısız Toplam
Başarılı A (testte ve soruda başarılı) B (testte başarısız, soruda başarılı) A+B
Başarısız C (testte başarılı, soruda başarısız) D (testte ve soruda başarısız) C+D
Toplam A+C B+D A+B+C+D

Geçerlik katsayısı c=(A+D)/(A+B+C+D). c değerinin 1.0'a yakın olması gerekir.
Gene bu tablodan çıkarılabilecek sonuçlar vardır.
Başarılıları ayırtedebilme: A/(A+C)
Başarısızları ayırtedebilme: D/(B+D). Bu değerlerin de 1.0'a yakın olması gerekir.

Testin güvenirliği

Bir gruba farklı zamanlarda iki kere uygulanırsa, öğrencilerin aynı veya birbirine yakın puanlar alması gerekir. Eğer iki test puanları arasında yüksek bir korelasyon varsa, testin güvenirliği de yüksektir.  Ancak bir testi aynı gruba iki kez uygulamanın getireceği bazı sakıncalar vardır. Burada bir test ortadan ikiye (veya tek sayılı ve çift sayılı sorular olarak) bölünür ve bir öğrencinin üst kısım ile alt kısım notları arasındaki korelasyona bakılır.
Bir testteki bütün soruların birbirleriyle tutarlılığı da bir açıdan testin güvenilirliği demektir. Burada Kuder-Richardson formülü uygulanır.
Güvenirlik, ölçüm tekrarlarındaki tutarlılık demektir.
Geçerli bir test mutlaka güvenilirdir, ama güvenirliği yüksek bir test her zaman geçerli olmayabilir.

Testin analizi

Testin sağa çarpık olması (pozitif değer) testin kolay, sola çarpık olması (negatif değer) testin zor olduğunu gösterir.
Başarı testlerinin güçlüğü p=test ortalaması/testten alınabilecek en yüksek puan formülüyle bulunur. Ortalama güçlüğün 0.50 civarında olması beklenir.

Aslında testin çeldiricilerinin de mantıklı seçilebilmesi için, bütün sorularda hangi cevap şıklarının ne kadar tercih edildiği tablosunun da çıkartılması gerekir. Burada hiç tercih edilmeyen şıkların bir çeldirici özelliği yoktur veya herhangi bir şık doğru şıktan daha fazla tercih ediliyorsa yanıltıcı bir tercihtir. Bu gibi hususlara dikkat edilmesi gerekir.
 

Test puanları üzerinde istatistiksel işlemler

Merkezi eğilim ölçüleri olan
Ortalama, sınıfın ortalama başarı durumu hakkında bir fikir verir.
Dizi genişliği, en yüksek ve en düşük puanlar arasındaki aralığı vererek puanların dağılımını bildirir.
Standart kayma, sınavdaki dağılımı gösterme açısından dizi genişliğinden daha sağlamdır. Bütün puanların sınıf ortalamasından farklarını verir. Standart sapmasının küçük olması bütün notların belli bir yere toplandığını, bu değerin büyük olması da notların çok fazla dağıldığını göstermektedir.

Korelasyon, bir kişinin iki ders notları arasındaki ilişkiyi gösterir. Bazı derslerde yüksek bir korelasyon aranırken, bazı derslerde negatif bir korelasyon bile çıkabilir.