Geçerlik ve Güvenirlik

Ölçme en basit anlamda bir niteliğin ya da özelliğin gözlenerek, gözlem sonuçlarının matematiksel sembollerle ifade edilmesi olarak tanımlanmaktadır. Sosyal ve beşerî bilimlerdeki ölçümler, fiziksel ölçümlerle kıyaslandığında farklılık göstermektedir. Fiziksel ölçümler doğrudan yapılırken, sosyal bilimlerde bu ölçümler dolaylı olarak yapılmaktadır.

Geçerlik bir ölçme aracından ziyade bu ölçüm sonuçlarına ait bir kavramdır. Bu nedenle ölçme araçlarının geçerli ve güvenilir olmasından ziyade ölçme aracıyla elde edilen sonuçların geçerli ve güvenirliği üzerinde durulması gerekir. Yani bir grup öğrenciye uygulandığında geçerli olan bir ölçme aracı başka bir grup öğrenciye uygulandığında geçerli olmayabilir. Bu sebeple başka bir amaç ve koşullarda geliştirilmiş olan bir ölçme aracı farklı örneklemlerde kullanılacağı zaman dikkatli olunması gerekir. En basit ifade ile geçerlik ölçülmek istenen bir özelliğin başka özellikler karıştırılmadan ne derece doğru ölçülebildiğini belirlemede yararlanılan bir kavramdır.

Geçerlik türleri genel olarak kapsam, ölçüt, yapı ve görünüş geçerliliği olmak üzere dörde ayrılır. Kapsam geçerliği: Kapsam geçerliği incelenirken bir ölçme aracının ölçülmek istenilen özelliği yeterince yansıtıp yansıtmadığı üzerinde durulur. Ölçüte dayalı geçerlik: Bu geçerlik türünde daha önceden geçerliği ve güvenirliği hesaplanmış benzer özellikte farklı bir ölçme aracı ile gerçek ölçme aracından alınan puanların istatistiksel olarak ilişkisi analiz edilir. Yapı geçerliği: Yapı geçerliği bir ölçümden elde edilen puanların ilgili ölçüm ile ölçülmek istenen kavramın gerçekte ne derecede ölçülebildiği ile ilgili bir geçerlik türü olarak tanımlanabilir. Yapılar (constructs) gerçekte var olan ama gözlenemeyen kuramsal kavramlardır. Örneğin kendine güven, mutluluk ya da öz benlik kavramsal olarak var olan ancak gözle görülemeyen psikolojik ya da sosyolojik özelliklerdir. Görünüş geçerliği: Görünüş geçerliği ölçeğin ölçmek istediği şeyi ölçüyor olarak görünmesi şeklinde ifade edilebilir. Geçerliği etkileyen faktörler ölçme sonuçlarının güvenirliği, madde sayısı ve ölçme yöntemi, puanlayıcının tutumu ve çevresel faktörler olmak üzere dört başlıkta ele alınabilir.

Güvenirliğin farklı tanımları olsa da yapılan bir ölçümün hatalardan arınık olma ölçüsü en yaygın olarak kullanılan tanımıdır. Bir ölçme aracı ile elde edilen sonuçların tutarlılığı, duyarlılığı ve kararlılığı güvenirlik için önemlidir. Uygulamada güvenirliğin bu üç kavramla benzer bir şekilde kullanıldığı görülmektedir.

Bilimsel çalışmalarda tutarlık, bir ölçme aracından elde edilen sonuçların aynı ya da benzer ölçme araçları ile farklı zaman, mekân ya da şartlarda da benzer sonuçların elde edilme derecesi olarak ifade edilebilir.

Duyarlılık ise ölçme işleminin daha hassas yapılması ile ilgili bir kavramdır. Örneğin bir derste 5 soru yerine 15 soru sorulması o dersin daha duyarlı ya da hassas ölçüldüğünün göstergesidir.

Güvenirlik tek uygulamaya dayalı ve birden fazla uygulamaya dayalı yöntemler olmak üzere ikiye ayrılmaktadır.

Tek uygulamaya dayalı yöntemlerde eşdeğer yarılar ve maddenin tutarlığına yönelik (KR-20, KR-21 ve Cronbach Alpha) olmak üzere ikiye ayrılmaktadır.

Birden fazla uygulamaya dayalı yöntemler, test-tekrar test ve eşdeğer test olmak üzere ikiye ayrılmaktadır.

Güvenirliğe etki eden faktörler, ölçme aracından, ölçme aracını cevaplayan ve ölçme aracının uygulandığı ortamdan kaynaklanan etmenler olmak üzere üçe ayrılmaktadır.

Güvenirlik geçerlik için bir ön koşuldur ancak yeterli değildir. Dolayısıyla güvenilir sonuçlar elde ettiğini bildiğimiz bir araç geçerli olmayabilir