Ölçek Geliştirmede ve Uyarlamada Geçerlik

Geçerlik Nedir? Hangi Geçerlik Türlerinden Söz Edilir?

Ölçek geliştirme ya da uyarlamada araştırmacılar için ölçeğin geçerliğini kanıtlama oldukça güç ve karmaşıktır. Bu güçlükle başa çıkmada, kuramsal yapının ve hedef grubun araştırmacılar tarafından iyi anlaşılmış olması önemli bir avantajdır. Bu yazının konusu ve amacı da, araştırmacıların bu güçlüklerle başa çıkmada daha araştırmayı tasarlarken nelere dikkat etmeleri gerektiğini bilgi ve deneyimlerim doğrultusunda açıklamak. O halde geçerliğin ne olduğunu konuşarak başlayabiliriz.

Geçerlik, oluşturduğumuz ya da uyarladığımız ölçme aracının ölçmek istediğimiz bilişsel, duyuşsal ya da devinişsel özelliği diğer özelliklerden ayırarak, hedef gruba uygun, temsil düzeyi yüksek bir biçimde ölçebilme düzeyidir. Bu süreçte birden fazla kanıtla geçerliği sağladığımızı gösterebilmeliyiz. Neden çok sayıda kanıta ihtiyacımız olduğunu sorabilirsiniz. Ben de geçerliğin birden fazla yönü olduğunu ve geçerliği kanıtlamanın oldukça güç bir iş olduğunu söyleyebilirim. Peki nereden başlamalıyız derseniz, geçerlikle ilgili kavramları ve bu kavramların göstergeleri olacak kanıtların neler olduğunu anlamakla başlayabilirsiniz derim. Aşağıdaki görselde bilmemiz gereken kavramların anahtar sözcüklerle bir görselini oluşturdum. Tek tek kavramları açıklayarak başlayalım.

Kapsam Geçerliği (Content Validity)

Kapsam geçerliği, ölçme aracındaki maddelerin ölçülmek istenen özelliğin tüm boyutlarını temsil edip etmemesiyle ilgilidir. Şöyle bir örnekle açıklayım. Çoklu zekanın sözel–dilsel zekâ, mantıksal–matematiksel zekâ, görsel–uzamsal zekâ, bedensel–kinestetik zekâ, müzikal–ritmik zekâ, kişilerarası (sosyal) zekâ, içsel (içedönük/bireysel) zekâ, doğacı (doğa) zekâ gibi boyutları kuramsal olarak tanımlanmışsa ve biz çoklu zekayı ölçmeyi amaçlayan bir ölçme aracı geliştirme iddiasındaysak, bu boyutların tümünü ölçebilmemiz kapsam geçerliğiyle ilgilidir.

Ölçeğin kapsam (içerik) bakımından bütünlüğünü değerlendirmek için genellikle uzman görüşüne başvurulur; madde-amaç uyum matrisi, madde içerik analizi ve kapsam geçerlik indeksleri (örneğin Lawshe’nin CVI katsayısı) kullanılır. Bu süreçte uzmanlar, her bir maddenin ölçülmek istenen yapıyla ne kadar uyumlu olduğunu değerlendirir ve araştırmacılar uzmanlardan gelen görüşler doğrultusunda ölçeğin herhangi bir boyutunu eksik veya fazla temsil edip etmediğini inceler. Kapsam geçerliği, ölçeğin “ne ölçtüğü” ile “ne ölçmesi gerektiği” arasındaki uyumu somutlaştıran ilk aşama olarak düşünülebilir.

Aşağıya sevgili öğrencim Kübra Aldırmaz’ın tezinde görüş almak amacıyla oluşturduğumuz uzman görüş formu örneğini, onun da izniyle ekliyorum. Sizler de formu geliştirebilir ya da benzer biçimde kendi çalışmanıza uyarlayarak kullanabilirsiniz.

Ölçek_Uzman_Görüş Formu Örneği

Yapı Geçerliği (Construct Validity)

Yapı geçerliği, bir ölme aracının ölçülmesi amaçlanan soyut yapıyı gerçekten ölçüp ölçmediğini gösteren geçerlik türüdür. Yapı geçerliği oldukça kapsamlı bir biçimde incelenmelidir, çok sayıda kanıtla değerlendirilmelidir. Yine çoklu zeka örneğini verirsek her bir maddenin gerçekten ölçmeyi amaçladığı zeka türünü ölçüp ölçmediğine ilişkin kanıtları araştırmamız yapı geçerliğiyle ilgilidir.

Yapı geçerliğini test etmek için Açımlayıcı Faktör Analizi (AFA) ve Doğrulayıcı Faktör Analizi (DFA) yaygın olarak kullanılır. Faktör yükleri, uyum indeksleri, AVE ve CR değerleri, yapının kuramsal çerçeveyle tutarlı olup olmadığını gösteren ana göstergelerdir. Aynı zamanda uzman görüşü de teorik uyumu destekleyen ek bir kanıt sağlar. Bunların dışında ayrışma geçerliğinin, yakınsak geçerliğin sağladığına ilişkin göstergeler de yapı geçerliğiyle ilgilidir. Ayrıca ölçüte dayalı geçerlik de yapı geçerliğine kanıtlar toplamada kullanılır.

Yakınsak Geçerlik (Convergent Validity)

Yakınsak geçerlik, aynı yapıyı ölçmesi beklenen maddelerin ve alt boyutların birbiriyle ilişkili olmasını ifade eder. DFA sonuçlarında yüksek faktör yükleri, AVE değerinin .50’nin üzerinde olması ve benzer yapıları ölçen ölçeklerle yüksek korelasyon bulunması yakınsak geçerliği destekler.

Ayrışma Geçerliği (Discriminant Validity)

Ayrışma geçerliği, ölçeğin alt faktörlerinin birbirlerinden ve ölçeğin tümünün teorik olarak farklı olması beklenen diğer yapılardan ayırt edilebildiğini gösterir. Ölçekteki alt boyutların birbirinden bağımsız olması, ilgisiz ölçeklerle düşük korelasyon göstermesi ve AVE’nin karekökünün, boyutlar arası korelasyonlardan daha yüksek olması beklenir. Aynı zamanda çapraz yüklerin düşük olması maddelerin farklı boyutları ayırt ettiğine kanıt oluşturur.

Ölçüt Geçerliği (Criterion Validity)

Ölçüt geçerliği, ölçeğin dış ölçütlerle kuramsal olarak beklenen yönde ilişki göstermesiyle değerlendirilir. Bu dış ölçütler, bireylerin performansı, davranışları veya aynı kavramı ölçen başka bir ölçme aracı olabilir. Benzer ölçeklerle korelasyonlar, performans göstergeleriyle ilişkiler ve regresyon analizleri ölçüt geçerliğini incelemede yaygın olarak kullanılır.

Yordama Geçerliği (Predictive Validity)

Ölçeğin gelecekteki performans ya da davranışları ne ölçüde doğru tahmin ettiğini gösterir. Eğitim, klinik psikoloji, örgütsel davranış ve gelişim araştırmalarında sık kullanılır. Boylamsal analizler ve regresyon modelleri, ölçeğin zaman içinde davranışları yordama gücünü test etmek için kullanılır. Yordama geçerliği, bir ölçeğin pratikteki ve gerçek yaşamdaki değerini gösterir dersek yanlış da olmaz sanırım 🙂

Ölçüm Değişmezliği (Measurement Invariance)

Bir ölçeğin aynı yapıyı farklı gruplarda (örneğin cinsiyet, yaş, kültür, sosyoekonomik düzey) aynı şekilde temsil edip etmediğini test eder. Çok gruplu DFA modelleriyle metric, scalar ve strict düzeyde karşılaştırmalar yapılır. Uyum indekslerindeki değişimler ve faktör yüklerinin tutarlılığı, ölçeğin gruplar arasında aynı anlamı taşıyıp taşımadığını gösterir. Ölçüm değişmezliği sağlanmadığında, gruplar arası karşılaştırmalar bilimsel açıdan hatalı ve yanıltıcı olabilir.

Kültürler Arası Geçerlik (Cross-Cultural Validity)

Bir ölçeğin farklı kültürlerde aynı yapıyı ölçüp ölçmediğinin değerlendirilmesine yönelik çabaları kapsar. Çeviri–geri çeviri süreçlerinin, dil eşdeğerliğinin, kavramsal uyum ve ölçüm değişmezliğinin kanıtlarının birlikte incelenmesi gerekir. Çok gruplu DFA, çapraz kültürlü karşılaştırmalar için kullanılan güçlü yöntemlerden biridir. Bir ölçek kültürler arasında aynı psikolojik yapıyı ölçüyorsa kültürler arası geçerliği yüksek kabul edilir.

Geçerliğe Bütünsel Bir Bakışla Yaklaşın 🙂

Geçerlik; tek bir yöntemle, analizle ya da tek yönlü bir yaklaşımla değerlendirebileceğimiz bir özellik değildir. Geçerlik çeşitli kanıtların bütünsel biçimde bir araya gelmesiyle kurulmuş bir yapıdır. Bu nedenle geçerlik türleri birbirinden bağımsız değildir; aksine ölçeğin içsel tutarlılığını, kuramsal sağlamlığını ve uygulamadaki işlevselliğini kanıtlamada gereklidir.

Sevgilerimle.

Doç. Dr. Fatma Betül KURNAZ

Okuma Önerileri

Crocker, L., & Algina, J. (1986). Introduction to classical and modern test theory. Holt, Rinehart and Winston, 6277 Sea Harbor Drive, Orlando, FL 32887.

DeVellis, R. F., & Thorpe, C. T. (2021). Scale development: Theory and applications. Sage publications.

Furr, R. M. (2021). Psychometrics: An introduction. SAGE publications.

Kline, R. B. (2023). Principles and practice of structural equation modeling. Guilford publications.

Messick, S. (1995). Validity of psychological assessment: Validation of inferences from persons’ responses and performances as scientific inquiry into score meaning. American Psychologist, 50(9), 741.