Güvenilirlik SPSS ile Nasıl Hesaplanır?

Merhaba,

bu yazıda SPSS kullanarak güvenirliğin nasıl hesaplanabileceğine, bu güvenirlik katsayılarının ne anlama geldiğine odaklanmak istedim. Konuyu yalnızca SPSS kullanarak hesaplayabileceğimiz güvenirlik katsayılarıyla sınırlı tutmaya karar verdim. İlk olarak SPSS ile hesaplayabileceğimiz güvenirlik katsayılarının neler olduğunu listeleyerek başlamak istiyorum. Ardından bu katsayıların her biriyle ilgili kısa birer açıklama yapacağım. Ayrıca her bir yöntemi ayrı ayrı açıkladığım daha geniş yazılar oluşturacağım (belki bu zamana yayılabilir, hemen tamamlayamamış olabilirim. Sizden biraz sabır istiyorum bu konuda :))

İç Tutarlılık

Cronbach’ın alpha (α) katsayısı, Mc Donald’ın omega (Ω) katsayısı, iki yarı güvenirliği (split-half) yöntemleri ölçme aracında yer alan maddelerin birbirleriyle olan ilişkisini yani ölçme aracının kendi içindeki tutarlılığını veren istatistiklerdir.

Cronbach’ın alpha (α)katsayısı: Ağırlıklı ya da dereceli puanlanan ölçme araçlarının iç tutarlılığına ilişkin kanıtlar sunar. Ölçme aracının uygulanmasından elde edilen sonuçlarda büyük bir problme yoksa 0-1 arasında bir değer alır. 0,70 ve daha büyük değerler, ölçme aracının uygulanmasından elde edilen sonuçların güvenilir olduğunu gösterir.

Mc Donald’ın omega (Ω) katsayısı: McDonald’s Omega ( $ω$ ), Cronbach’ın Alfa ( $α$ ) katsayısına bir alternatif olarak önerilen ve özellikle $α$ ‘nın kısıtlayıcı varsayımlarının ihlal edildiği durumlarda tercih edilen bir iç tutarlılık katsayısıdır. Yine $α’da olduğu gibi$ ağırlıklı puanlanan, sıralı ya da aralıklı ölçeklerde sonuçlar veren ölçme araçlarından elde edilen verilerle hesaplanır. Maddelerin faktör yüklerinin eşit olma koşulunu gerektirmez.

İki yarı güvenirliği: Ölçme aracının maddelerinin birbirleriyle olan korelasyonunu yani testin iç tutarlılığını verir. Ölçme aracının uygulanmasından elde edilen sonuçlarda büyük bir problem yoksa 0-1 arasında bir değer alır. 0,70 ve daha büyük değerler, ölçme aracının uygulanmasından elde edilen sonuçların güvenilir olduğunu gösterir.

SPSS ile iç tutarlılığın nasıl incelendiğini görsellerle daha detaylı verdiğim sayfaya gitmek için → buraya tıklayın.

NOT: Eğer ilgilendiğiniz konu KR-20 veya KR-21 güvenirliği ise bunu SPSS hesaplayamıyor. KR-20 ve KR-21 (Kuder-Richardson katsayıları), ikili (0–1, doğru–yanlış gibi) puanlanan maddelerden oluşan testlerde iç tutarlılığı hesaplamak için geliştirilmiş özel formüllerdir. Cronbach α formülü, KR-20’nin genelleştirilmiş hâlidir. SPSS’te KR-20 yerine Cronbach α hesaplamanız durumunda, α değerinin KR-20 değerinden büyük bir değer üretme olasılığı söz konusu olabilir. Bu da elde ettiğiniz bulgunun geçerli olmayacağı anlamına gelir. O halde biz excel ile KR-20 ve KR-21’in nasıl hesaplandığını inceleyelim. İlgili sayfaya gitmek için → buraya tıklayın.

Kararlılık

Kararlılık, bir ölçme aracının farklı zamanlarda iki kez uygulanmasından elde edilen ölçülerin zamana karşı dirençli olması yani zaman içinde ölçülen özellikle ilgili verilen yanıtların değişmemesi anlamına gelir. Kalıp yargılarımızı düşünün. Zamana karşı oldukça dirençlidir. Bugün kadınlarla ve erkeklerle ilgili genel kalıp yargılarımız büyük değişimler ya da olaylar yaşamadıysak bir kaç hafta içinde kolaylıkla değişmeyecektir. Değişiyorsa da bu değişim birden bire büyük bir farkla gerçekleşmeyecektir. İşte bu nedenle kararlılık, ölçülen özelliğin zamana karşı direnci olarak tanımlanabilir. Bazı özellikler ise yaşa, duruma vb. özelliklere bağlı olarak çok kararlı olmayabilir. Örneğin ergenlik döneminde kimlikle ilgili özellikleri inceleseydik, ölçülen zamana bağlı olarak çok kararlı ölçümler elde edemeyebilirdik. Döneme özgü biçimde ergenlik dönemindeki bireyler farklı kimlikleri kendi üstlerinde denediklerinden, ölçtüğümüz özellikle ilgili bize zaman içinde değişen yanıtlar verebilirlerdi.

Kararlılık katsayısı, ölçme araçlarının geliştirilme süreçlerinde önemli kanıtlar sağlar. Ölçme aracının farklı zamanlarda birden fazla uygulanmasından elde edilen sonuçlar kararlılığın bir ölçüsü olarak kabul edilir. Kararlılığın araştırılmasında test-tekrar test yöntemi ya da eş değer formlar yöntemi kullanılır.

Test-tekrar test güvenirliği: Belirli bir katılımcı gruba, ölçme aracının bir ya da birkaç hafta arayla iki kez uygulanmasından elde edilen ölçüler arasındaki ilişkilerin incelenmesidir. Test-tekrar test yönteminde aynı ölçme aracının aynı bireylere uygulanması söz konusu olduğundan bazı riskleri vardır. Yanıtlayıcılar ölçme aracındaki maddeleri hatırlayarak, iki uygulama arasında geçen sürede yanıtlarıyla ilgili düşünebilirler, arkadaşlarıyla maddelerdeki durumlarla ilgili tartışabilirler ya da benzer başka bir durum oluşabilir. Buna dayalı olarak yanıtlayıcıların iki uygulamada verdikleri yanıtlar değişebilir ve iki uygulamadan elde edilen sonuçlar arasındaki korelasyon düşebilir. Bu, bizim kullandığımız ölçme aracından kaynaklanan bir sorun olarak değerlendirilmemelidir. Ancak kullandığımız ölçme aracında maddeler, her okumada farklı anlaşılıyorsa, yine iki uygulamadan elde edilen ölçüler arasındaki korelasyon düşer. Bu defa sorun kullandığımız ölçme aracından kaynaklanmaktadır. Bu konuyu daha sonra daha detaylı ele almayı planladığımdan şimdilik bu açıklamalarla sınırlı tutuyorum bu kısmı.

Eş değer Formlar Yöntemi: Test-tekrar test yönteminde aynı ölçme aracının aynı bireylere uygulanması maddelerin hatırlanması ya da yanıtların unutulması gibi sorunlara yol açabileceğinden eş değer formlar yöntemi tercih edilebilir. Eş değer formlar dendiğinde, birbiriyle hemen her özellik (madde sayıları, kapsamları, güçlükleri, varyansları vb.) bakımından aynı ancak maddeleri birbirinden farklı iki ölçme aracı düşünebilirsiniz. Örneğin A formunda 2+3=? diye sormuşsak B formunda 2+2=? diye sorabiliriz. Böylelikle iki farklı formda aynı özelliği ölçen, aynı güçlükte farklı maddeler yer alabilir. Tabi böyle eş değer iki ölçme aracının hazırlanması her durumda kolay olmayacaktır. Hazırlanan bu formlar aynı anda katılımcılara uygulandığında, ölçme araçlarının eş değerlik katsayısı elde edilirken; bir ya da birkaç hafta arayla uygulanmışsa kararlılık katsayısı elde edilir.

Nesnellik

Belirli bir performansın değerlendirilmesindeki nesnellik, puanlamanın güvenirliği ya da puanlayıcılar arası güvenirlik olarak sınıflandırılabilir. Bu, karşınıza performansın nasıl değerlendirildiğine bağlı olarak değerlendiriciler arası güvenirlik, gözlemciler arası güvenirlik gibi kavramlarla da çıkabilir. Burada temel olan aslında adına ne dersek diyelim, nesnel bir değerlendirme yapılıp yapılmadığının araştırılmasıdır.

Puanlama Güvenirliği: Belirli bir performansın, aynı değerlendirici tarafından farklı zamanlarda iki kez değerlendirilmesinden elde edilen ölçüler arasındaki tutarlılığın incelenmesidir. Bir yazılı performansın, bir puanlama anahtarıyla değerlendirildiğini varsayalım. A değerlendiricisinin bu yazılı performansla ilgili, farklı zamanlarda aynı puanı/kararı vermesini bekleriz. Bu durumda A değerlendiricisinin nesnel bir değerlendirme yaptığını iddia edebiliriz.

Puanlayıcılar Arası Güvenirlik: Belirli bir performansın, farklı değerlendiriciler tarafından, aynı ölçütlerle değerlendirilmesi sonucunda elde edilen sonuçların tutarlılığıdır. Bir işe alım sürecinde sözlü performansları değerlendiren jüri üyelerinin, adaylarla ilgili aldıkları kararların ya da yaptıkları puanlamaların benzer olması nesnelliğin bir ölçüsü olarak kabul edilir.

Kılavuz Sayfaya dönmek için → buraya tıklayın.

Sevgilerimle.

Doç. Dr. Fatma Betül KURNAZ