SPSS ile Gruplara Ait Ölçümler Arasındaki Farkları İnceliyoruz (Parametrik ve Nonparametrik Testlerle)

Merhaba,

bu yazıda sizlerle araştırmalarda gruplar arası ölçümlere ait farkların incelenmesinde hangi istatistikleri hangi durumlarda kullanacağımızı konuşacağız. Bazı meslektaşlarımız konuya sadece kavramsal çerçeveden bakarak, konunun ortalamalar arasındaki farkların incelenmesi olarak kavramsallaştırılması gerektiğini düşünebilir ve eleştirebilir. Oysa ben bu yazıda ve videoda da sunduğum eğitimde, nonparametrik testleri de birlikte ele aldım. Bu nedenle “gruplar arası ölçümlerin karşılaştırılması” şeklinde ifade etmenin hem öğretimsel olarak daha doğru ve hem de sunduğum içerikler bakımından daha kapsayıcı olduğunu düşünüyor ve iddia ediyorum. Bu nedenle bu eleştirilere kapalı olduğumu, amacımın öğrenmeyi kolaylaştırıcı bir çerçeve sunmak olduğunu belirtmek isterim.

Çoğu araştırmada her birimiz, kadınlarla-erkeklerin, hasta olanlarla-sağlam olanların, başlangıç düzeyindekilerle-ustaların ilgilendiğimiz değişken bakımından farklılaşıp farklılaşmadığını merak ederiz. Bu tür durumlarda elde ettiğimiz ölçümlerin gruplar arasında farklı olup olmadığını, varsa bu farkın istatistiksel olarak önemli olup olmadığını kontrol ederek kanıtlar sunmamız ve onu raporlamamız gerekir. Bu yazının amacı da bu konuda rehberlik sunabilmektir. Yazı boyunca yukarıda eklediğim videoda da görebileceğiniz görsellerle konuyu özetlemeyi tercih ettim. Yazının en sonunda da sözünü ettiğim analizlere ait varsa yazdığım diğer yazılar onlara bağlantı verdim.

Aşağıdaki görselle gruplar arası farkların incelenmesinde kullanılabilecek istatistikleri gruplandırarak hangi durumda hangisinin kullanılmasının uygun olabileceğini basitçe göstermek istedim.

Gruplar arası farkların incelenmesinde kullanılan testler, verinin ölçek türüne ve varsayımların sağlanıp sağlanmamasına göre farklılık gösterir. Genel olarak dört ana başlıkta toplayabiliriz.

Kategorik Değişkenler: Eğer karşılaştırdığımız veriler kategorik düzeydeyse (örneğin cinsiyet, sınıf düzeyi gibi), Ki-kare testi veya küçük örneklemler için Fisher’s Exact Test tercih edilir. Verilerinizi anketler yardımıyla topladıysanız, değişkenlerinizin önemli bir bölümü kategoriktir. Farklı kategorik veriler arasında nasıl bir değişim olduğunu görmek için Ki-Kare kullanabilirsiniz.

Sürekli Değişkenler (Parametrik Testler): İki grup arasında, ölçümler arasında fark olup olmadığını incelemek için Bağımsız Gruplar t-Testini, aynı grubun ön-test / son-test gibi eşleştirilmiş ölçümleri arasında fark olup olmadığını belirlemek için Bağımlı Gruplar t-Testini kullanırız. Üç ve daha fazla grubun ölçümleri arasındaki farkları karşılaştırmada ise ANOVA veya Tekrarlı Ölçümler ANOVA kullanırız. Varsayımların (normal dağılım, varyans homojenliği) ihlal edilmesi durumunda Welch testi ve Greenhouse-Geisser/Huynh-Feldt düzeltmeleri ya da nonparametrik alternatifleri tercih ederiz.

Sürekli Değişkenler (Nonparametrik Testler): Parametrik testlerin varsayımları sağlanamadığında nonparametrik alternatifler tercih edilir. İki gruba ait ölçümlerin medyan değerlerini karşılaştırmak için Mann-Whitney U, bir gruba ait iki ölçüm arasındaki farkları incelemek için Wilcoxon İşaretli Sıralar Testi, üç ve daha fazla gruba ait ölçümlerin medyan değerleri arasında fark olup olmadığını incelemede ise Kruskal-Wallis ve Friedman Testini kullanırız.

Karma ve İleri Düzey Modeller: Birden fazla bağımsız değişkenin veya ölçümün bulunduğu faktöriyel tasarımlarda İki Yönlü ANOVA veya Karma ANOVA, daha karmaşık modeller kurduysak ANCOVA, MANOVA, MANCOVA gibi modelleri kullanırız. Ayrıca iç içe geçmiş veriler için çok düzeyli (karma) modelleri test ederiz.

Bağımsız İki Gruba Ait Ölçümlerin Karşılaştırılması

Bu gruplandırmayı esas alarak oluşturduğum görselleri sizlerle paylaşmak ve üzerinde kısaca konuşmak istiyorum. Böylece hangi durumda hangi analizi kullanmamız ve nasıl bir yol izleyerek analizi gerçekleştirmemiz gerektiğini daha iyi anlayabiliriz. İki bağımsız gruba ait ölçümler arasında fark olup olmadığını incelediğimizi düşünelim. Bu durumda Bağımsız Gruplar t-Testi, Mann Whitney U Testi veya Welch t-Testi kullanmamız gerekir. Aşağıdaki görseli birlikte inceleyelim.

Yukarıdaki görsel, iki gruba ait ölçümler arasındaki farkın istatistiksel olarak anlamlı olup olmadığını test etmek için kullanılan yöntemleri özetliyor. Normal dağılım ve varyans homojenliği varsayımları sağlandığında iki grubun ortalamalarını karşılaştırmak için Bağımsız Gruplar t-Testini; normal dağılım varsayımı sağlanmadığında, bağımsız gruplar t-testine alternatif olarak Mann Whitney U Testini tercih ederiz. Mann Whitney U Testi iki gruba ait ölçümlerin medyanları arasında önemli bir fark olup olmadığını kontrol etmemizi sağlar. Normal dağılım varsayımı sağlanmasına rağmen grupların varyansları homojen değilse Welch t-Testini kullanırız. Özellikle gruplardaki örneklem büyüklükleri eşit değilse daha güvenilir sonuçlar üretir.

Üç ya da Daha Fazla Bağımsız Gruba Ait Ölçümlerin Karşılaştırılması

Peki biz ikiden fazla gruba ait ölçümler arasındaki farklarla ilgileniyorsak bu durumda hangi istatistikleri kullanarak araştırma sorularımıza yanıt arayacağız? aşağıdaki görseli bu soruya yanıt vermesi amacıyla oluşturdum. Birlikte görseli inceleyelim.

Üç veya daha fazla grubun ortalamalarını karşılaştırmak için Tek Yönlü ANOVA’yı kullanırız. Varsayımlar sağlandığında (normal dağılım, varyans homojenliği) güvenilir sonuç verir. Eğer anlamlı bir fark bulunursa, hangi gruplar arasında farklılıklar olduğunu anlamak için post-hoc testler (Tukey, Bonferroni vb.) yapmalıyız. Normal dağılım varsayımı karşılanmadığında Kruskal-Wallis Varyans Analizini kullanmalıyız.

Kruskal Wallis Varyans Analizi, gruplardan elde ettiğimiz ölçümlerin medyanları arasında fark olup olmadığını belirlememizi sağlar ve varyansların homojenliği şartı aranmaz. Anlamlı bir fark bulduğumuzda, hangi gruplar arasında fark olduğunu belirlemek için ikili karşılaştırmalarla Mann-Whitney U testleri yapabiliriz. Normal dağılım varsayımı sağlanmasına rağmen grupların varyansları homojen değilse (Levene F testi ile kontrol edilir) klasik ANOVA yerine Welch ANOVA’yı tercih etmeliyiz. Özellikle grup büyüklükleri eşit değilse daha güvenilir sonuçlar verir. Eğer bu testlerle ilgili daha detaylı bilgi elde etmek istiyorsanız sayfanın en altına sizi videolara ve yazılarıma götürecek bir link ekledim. O bağlantıyı kullanarak ilerleyebilirsiniz.

Örnek Uygulama Yapalım

Videoda gerçekleştirdiğim örnek uygulamaya ait örnek veri setine ait linki aşağıya ekliyorum. Sizler de bu veri setini kullanarak analizi gerçekleştirebilir ve pratik kazanabilirsiniz.

Veri setini indirmek için buraya tıklayın. → Örnek_Veri_Seti

APA formatına uygun tablolar için ilgili kısma tıklayın.

→ APA_t_Testi_Tablo_Örneği

→ APA_Kruskal_Wallis_Varyans_Analizi_Tablosu

Bağımlı Gruplardan Elde Edilen Ölçümlerin Karşılaştırılması

Yukarıda sözünü ettiğimiz testler bağımsız gruplardan elde edilen ölçümlerle ilgiliydi. Peki ya biz deneysel araştırmalar yapmışsak ya da birbiriyle bağımlı ölçümler elde etmişsek yukarıdaki analizler uygun mu? Hayır! Bu konuda açıklama yapmadan önce aşağıdaki görseli inceleyelim.

Deneysel ya da boylamsal araştırmalarda aynı bireylere ait birden fazla ölçüm elde ederiz. Bu durumda ölçümler bağımlı gruplardan elde edilmiş olarak düşünülmelidir. Başka bir anlatımla, aynı bireylerden elde edilen tekrarlanan ölçümler bağımlı gruplardan elde edilen istatistikleri kullanmayı gerektirir. Örneğin, bir eğitim programının uygulanmasından önce ve sonra alınan başarı puanları, ya da belirli bir uygulamanın farklı zamanlardaki etkilerini araştırdığımızda amacımız, aynı grubun zaman içindeki değişimini istatistiksel olarak incelemektir.

Bağımlı (Eşleştirilmiş) t-testi, aynı bireylerden alınan iki ölçümün ortalamaları arasındaki farkı test eder. Normal dağılım varsayımı sağlandığında kullanılır. Eğer dağılım normal değilse, Wilcoxon İşaretli Sıralar Testi tercih edilir. Bu test ortalamalar yerine medyan farkını yani sıralar arası farkın istatistiksel olarak önemli olup olmadığını değerlendirmemizi sağlar. Üç veya daha fazla ölçüm olduğunda Tekrarlı Ölçümler ANOVA kullanılır. Bu istatistiği kullanmadan önce ölçümler arası varyans eşitliği (sferisite) varsayımını kontrol etmeyi unutmayın. Normal dağılım veya sferisite varsayımı sağlanmadığında, Friedman Testi uygun bir alternatiftir. Bu analizler, aynı bireyler zaman içinde ölçülen özellikle ilgili bir değişim göstermişse bu değişimi, değişimin yönünü, büyüklüğünü ve istatistiksel gücünü anlamamızı sağlar.

Karma Tasarımlar ve İleri Düzey Modeller: MANOVA, MANCOVA, ANCOVA

Araştırmamız daha ileri düzey karmaşık bir modeli içeriyorsa yukarıda sözünü ettiğimiz istatistikler, sonuçları incelemede yetersiz kalır. Bu nedenle daha güçlü istatistiksel yöntemlere gereksinim duyarız. MANOVA, ANCOVA ve MANCOVA oldukça güçlü istatistiksel yöntemlerdir. Bu istatistiklerle ilgili konuyu basit bir biçimde kavramsallaştırmamıza yarayan görseller oluşturdum. Görselleri inceleyerek başlayalım.

Bir araştırmada bağımlı değişken üzerindeki grup etkisini test ederken, kovaryans (kontrol) değişkeninden gelen varyansı istatistiksel olarak kontrol etmemizi sağlayan bir istatistiktir ANCOVA. Elde edilen fark, kovaryans etkisinden bağımsız “gerçek” grup farkını yansıtır. Güçlü bir analizdir. Regresyon ve ANOVA’nın birleşimi gibi düşünebilirsiniz. Her bir katılımcının kovaryans değerine göre beklenen puanları hesaplanır, ardından gruplar bu beklenen değerler üzerinden karşılaştırılır. Bu yöntem özellikle eğitim ve sosyal bilimlerde, başlangıç düzeylerinin farklı olduğu gruplarda daha adil karşılaştırmalar yapabilmek için tercih edilir. Bu analizin temel varsayımları şunlardır: (1) Normal dağılım, (2) varyansların homojenliği ve (3) kovaryans ile bağımlı değişken arasındaki doğrusal ve paralel ilişki varsayımları. Bu varsayımlar sağlandığında güçlü ve güvenilir sonuçlar verir.

Araştırma tasarımlarımız bazen birbiriyle ilişkili birden fazla sonuç değişkeniyle yani birden fazla bağımlı değişkenin birlikte değişimini incelemeyi içerebilir. Örneğin öğrencilerin sınıf düzeyine göre matematik, fen ve Türkçe başarı puanlarının birlikte anlamlı biçimde farklılaşıp farklılaşmadığını merak edebiliriz. Birden fazla bağımlı değişkeni aynı anda analize dahil etmek istediğimizde MANOVA (Çoklu Varyans Analizi) kullanabiliriz ve MANOVA, gruplara ait ölçümler arasındaki farkı tüm bağımlı değişkenleri birlikte ele alarak incelememizi sağlar. Bu yaklaşım, her bir bağımlı değişkeni ayrı ayrı test etmekten daha bütüncül bir yaklaşım sunar ve hata olasılığını azaltır.

Eğer bağımlı değişkenler üzerindeki değişimleri incelerken bir veya daha fazla kontrol değişkenini (kovaryans) da hesaba katmak istiyorsak, bu durumda MANCOVA (Kovaryanslı Çoklu Varyans Analizi) ile analizi gerçekleştirmemiz gerekir. MANCOVA, birden fazla bağımlı değişkenin aynı anda analize dahil edilmesi bakımından MANOVA’nın mantığını korur ancak kovaryans değişkenlerinin etkisini de istatistiksel olarak kontrol etmemizi sağlar. Örneğin bir öğretim programının sadece başarı üzerindeki etkisini değil, aynı zamanda motivasyon ve öz yeterlik üzerindeki etkisini de birlikte değerlendirmek istediğimizde en uygun yöntem MANOVA veya MANCOVA’dır. Yukarıda verdiğim görsel, her iki yöntemin ne zaman kullanılacağını ve hangi varsayımlar altında geçerli olduğunu sade biçimde özetlediğini düşünüyorum 🙂

Bu istatistiklerle ilgili daha detaylı yazılar ve videolar oluşturmuş olabilirim. Eğer daha detaylı bilgi edinmek istiyorsanız aşağıda linkini verdiğim kılavuz sayfasına ilerleyebilirsiniz.

Kılavuz sayfaya ilerlemek için için buraya tıklayın.

Doç. Dr. Fatma Betül KURNAZ