SPSS ile Tek Değişkenli Normalliği İnceliyoruz

Normal dağılım, nicel araştırmalarda iki nedenle önemlidir. Birincisi, doğadaki ve insan davranışındaki pek çok ölçüm, çok sayıda küçük ve bağımsız etkinin toplamıdır; bu tip süreçlerin ürettiği değerler çoğu zaman yaklaşık normal görünür. İkincisi, merkezi limit teoremi sayesinde örneklem ortalamalarının dağılımı, tek tek gözlemler normal olmasa bile yeterince büyük örneklemlerde normale yaklaşır. Bu iki olgu, normal dağılımın hem veriyi anlamamızdaki önemini ortaya koyar hem de çıkarımsal istatistikte neden varsayılan durum olduğunu açıklar.

Verilerin Normalliği ve Artıkların Normalliği

Pek çok parametrik yöntem, hataların/artıkların (residuals) normal dağılması varsayımına dayanır. Bunlara t-Testi, tek/çok yönlü ANOVA, Pearson korelasyon, doğrusal regresyon ve faktör analizi gibi yöntemler örnek verilebilir. Varsayım, aslında değişkenin kendisinin normal olması yönünde değildir, model artıklarının veya her grubun kendi içindeki dağılımların normal olması yönündedir. Bunu bir örnekle açıklamak istiyorum. Mesela Türkiye’de belirli bir bölgede küçük bir X ilinde, cinsellikle ilgili X konusunda bir çalışma yapmak istediğimizde, o ildeki bireylerin ölçtüğümüz özellikle ilgili benzer yanıtlar verme olasılığı yüksek olabilir. Bu durumda elde ettiğimiz verilerin belirli bir yönde çarpık olma olasılığı vardır. Yani ölçülen değişken normal dağılmayabilir. Ama diyelim ki biz bu X puanlarını bir modelde (örneğin cinsiyet, yaş, eğitim gibi faktörlere göre regresyon ya da ANOVA ile) açıklıyoruz. Yani önceden gruplarla ilgili bir takım varsayımlar oluşturduk veya hipotezler kurduk. Bu durumda istatistiksel testler ölçülen değişkenin dağılımına değil, modelden geriye kalan hataların normal dağılması dikkate alınarak incelenmelidir. Tüm ölçümlerden elde edilen dağılımın normalliğine bakarak veriler normal dağılmıyor ve parametrik test yapamam derseniz, yanlış bir karar vermiş olabilirsiniz. Çünkü testlerin dayandığı varsayım, bağımlı değişkene ait verilerin tek başına normal dağılması değildir; belirli koşullar altında artıkların normal dağılmasıdır. Katılımcıların X konusundaki verileri çarpık olabilir. Ama biz örneğin yaş gruplarına göre ANOVA yaptığımızda, her yaş grubundaki dağılımlar ve grup içi artıklar “yeterince normal” ise, ANOVA kullanabiliriz. Belki şöyle özetlersem daha kolay anlaşılabilir: Gruplar arası farkların incelendiği ya da belirli bir modele ait hipotezlerin kontrol edildiği çalışmalarda, verinin tümünün normal dağılmasından çok gruplar içinde verilerin normal dağılması ve artıkların normal dağılması önemlidir.

Normal Dağılımı Nasıl Kontrol Ederiz?

Görsel yöntemler: Histogram, Q-Q Plot ve Boxplot grafiklerini inceleyerek verinin genel yapısını görebiliriz. Örnekleminiz büyük ya da küçük olsun, verinin yapısını anlamada en etkili yolun görsel yöntemler olduğunu söylersem abartmış olmam diye düşünüyorum.

Tanımlayıcı istatistikler: Çarpıklık (skewness) ve basıklık (kurtosis) değerleri, dağılımın normalden sapıp sapmadığını yorumlamamıza yardımcı olur. Çarpıklık ve basıklık değerlerinin -1 ile +1 arasında olması beklenir. Örneklem büyükse bu sınır -2 ile +2 aralığına kadar genişletilebilir. Basıklık ve çarpıklık katsayılarının da örneklem büyüklüklerinden etkilenebileceğini unutmamakta fayda var.

İstatistiksel testler: Kolmogorov-Smirnov ve Shapiro-Wilk testleri en sık kullanılan yöntemlerdir. Özellikle örneklem sayısı 50’nin altındaysa Shapiro-Wilk, üstündeyse Kolmogorov-Smirnov testi tercih edilir. Ancak bu testlerle ilgili sonuçları yorumlarken, tek başına p-değerini kontrol ederek karar almak yanıltıcı olabilir. Küçük örneklemlerde (n<50) istatistiksel testler güçsüzdür; belirgin sapmaları gözden kaçırabilir. Büyük örneklemlerde ise en ufak sapmalar bile anlamlı çıkar ve pratikte önemsiz bir farklılık “normal değil” kararı almamıza neden olabilir. Bu yüzden her zaman üç yöntemi (grafikler [histogram, Q-Q plot], betimsel ölçüler [çarpıklık/skewness, basıklık/kurtosis] ve uygun normallik testi [Kolmogorov-Smirnov ya da Shapiro-Wilk]) birlikte kullanarak karar alınması önerilir. Bununla ilgili kaynakları sayfanın altında bir yerde verdim. Dilerseniz o kaynakları da okuyarak bilgilerinizi genişletebilirsiniz.

Ölçüt	Kabul Edilen Aralık	Yorumu
Skewness (Çarpıklık)	-1 ile +1 arası	Normal kabul edilir
Kurtosis (Basıklık)	-1 ile +1 arası	Normal kabul edilir
Shapiro-Wilk p (n<50) veya Kolmogorov-Smirnov p (n≥50)	p > .05	Normal dağılım varsayımı sağlanır

Büyük örneklemlerde (n>200) Shapiro-Wilk testi çok küçük sapmalarda bile anlamlı çıkar. O yüzden daima grafikler, tanımlayıcı değerler ve testler birlikte yorumlanmalıdır.

SPSS’te işlem adımları

SPSS’te bu analizleri yapmak için şu adımları izleyebilirsiniz: Analyze → Descriptive Statistics → Explore

Açılan pencerede “Plots” menüsüne girerek Normality plots with tests seçeneğini işaretleyin. Böylece hem histogram/Q-Q plot grafikleri hem de normallik testleri aynı çıktıda gelecektir. Ben bu adımları uygulamayı videoda ayrıntılı olarak gösterdim. Sayfanın üstündeki videodan birebir SPSS ekran görüntüleri üzerinden nasıl yapılacağını izleyebilirsiniz. Şöyle görseller de hazırlamıştım ekleyim :))

Hangi Analizlerde Normal Dağılım Önemlidir?

Normal dağılım, özellikle parametrik testler için temel varsayımlardan biridir. Bu testler, verilerin ya da daha doğru ifadeyle model artıklarının normal dağıldığı varsayımıyla çalışır.

Başlıca parametrik testler:

t-Testi (independent samples, paired samples): Gruplar arası ya da eşleştirilmiş ölçümler arası karşılaştırmalarda kullanılır.
ANOVA (Analysis of Variance): İkiden fazla grup ortalamasını karşılaştırmak için kullanılır.
Pearson korelasyonu: İki sürekli değişken arasındaki doğrusal ilişkiyi ölçmek için kullanılır.
Regresyon analizleri: Bağımlı değişkeni bir veya daha fazla bağımsız değişkenle açıklamak için kullanılır.
Faktör analizi (özellikle keşfedici): Ölçek geliştirme ve yapısal ilişkilerde önemlidir.

Bu yöntemlerde normal dağılım varsayımının sağlanması, sonuçların güvenilirliği açısından önemlidir. Varsayım ihlali standart hataların, güven aralıklarının ve p-değerlerinin gerçektekinden farklı çıkmasına neden olabilir.

Nonparametrik Testler

Eğer veriler normal dağılıma uymuyorsa veya örneklem çok küçükse, nonparametrik testleri kullanmak istatistiksel gücü düşürse de iyi bir seçenek diye düşünüyorum. Parametrik testlerin yerine kullanabileceğimiz nonparametrik testler şöyle listelenebilir:

Mann-Whitney U testi → Bağımsız t-Testinin alternatifi.
Wilcoxon işaretli sıralar testi → Eşleştirilmiş t-Testinin alternatifi.
Kruskal-Wallis testi → Tek yönlü ANOVA’nın alternatifi.
Spearman korelasyonu → Pearson korelasyonunun alternatifi.

Parametrik testler genellikle daha güçlüdür, ama varsayımlar ciddi biçimde ihlal edildiğinde nonparametrik testler daha güvenilir sonuçlar verir.

Nelere Dikkat Edelim?

200’den büyük örneklemlerde, Kolmogrov Smirnov Testi sonuçlarında ya da Shapiro Wilk Testi sonuçlarında, p < .05 çıktığında hemen veriler normal dağılmıyor kararı almayın. Büyük örneklemlerde her şey anlamlı çıkabilir. Böyle bir durumda grafiklerden elde ettiğiniz sonuçları ve istatistiksel testlerden elde ettiğiniz sonuçları birlikte değerlendirin. Ayrıca aykırı değerleri ve bunların normalliğe etkisini de inceleyin. 50’den daha küçük örneklemlerde Shapiro-Wilk, 50’den daha büyük örneklemlerde Kolmogorov-Smirnov testi daha uygun, unutmayın 🙂
Peki normallik varsayımını ihlal edersek, bu neye yol açar? Aykırı değerler ve kuyrukta uç değerlerin sıklaşması standart hataları şişirip p-değerlerinin gerçektekinden farklı çıkmasına neden olabilir; güven aralıkları dar ya da geniş görünebilir; ANOVA ve t-Testinde Tip-I veya Tip-II hata olasılıkları değişebilir; regresyonda katsayılar değilse bile standart hatalar ve çıkarımlar bozulabilir. Kısacası, sonuçların güvenirliği zayıflar ve bu durum yanlış bilimsel kararlar (reddedilmemesi gereken bir H0’ın reddi ya da tersi bir durum) almamıza neden olabilir.
Normallik varsayımı ne zaman daha çok önemli olmalı? Küçük ya da orta büyüklükte örneklemler, belirgin bir biçimde çarpıklığa veya basıklığa, ortalamayı ve varyansı etkileyebilecek ölçüde aykırı değerlere sahip olabilir; bu nedenle bu tür durumlarda normallik varsayımının karşılanabilmesi daha önemlidir. Bu durumlarda analizlerde sağlam yani robust yöntemlerle ilerleyebilirsiniz ( örneğin log dönüşümler, robust istatistikler, bootstrap temelli güven aralıkları veya olasılıklı olmayan alternatif testler (Mann-Whitney U, Kruskal-Wallis vb.)).
Normal dağılıma birebir uyan bir veri seti elde etmek, çoğu gerçek veri seti için karşılanması zor bir hedeftir 🙂 yani her zaman sağlanamayabilir; analiz için yeterince normal ise küçük sapmalar kabul edilebilir bir durumdur. Bunu da sadece tek bir ölçüte bakarak değil, birden çok kanıtı birlikte değerlendirerek anlarsınız.

Büyük örneklem, ne kadar büyük olmalı?

Videoda sözünü ettiğim gibi bu konuda hiç bir yayında tam olarak belirli bir sayı bulmak mümkün değil. Ancak okuduklarımdan çıkardığım sonuç şu ki; bu sorunun yanıtı dağılımın özelliklerine bağlı olarak değişiyor. Ve çıkarımlarımdan elde ettiğim sonuç simetrik, normale yakın dağılımlarda n ≈ 30–50 genelde yeterli olabilir. Orta düzeyde çarpık dağılımlarda n ≈ 100–200 civarında bir örneklem büyüklüğü gerekebilir. Eğer veri toplamada büyük güçlükler yaşamıyorsanız 200’e yaklaşmaya çalışabilirsiniz. Aşırı çarpık, uzun kuyruklu dağılımlarda 200+ bile yetmeyebilir, robust yöntemler veya dönüşümler gerekir. Tüm bunları yorumlarken ölçtüğümüz özelliğin yapısını ve katılımcı özelliklerini de dikkate almayı önerebilirim. Kaynakları da şuraya bırakayım da, okumak ya da atıf yapmak isteyebilirsiniz.

Normal dağılım ve örneklem büyüklüğü ile ilgili kaynaklar:

Glass, G. V., Peckham, P. D., & Sanders, J. R. (1972). Consequences of failure to meet assumptions underlying the fixed effects analyses of variance and covariance. Review of Educational Research, 42(3), 237–288. (Parametrik testlerin, özellikle ANOVA’nın, normallik ve varyans homojenliği varsayımlarına ne kadar duyarlı olduğunu inceleyen klasik bir makale)
Blanca, M. J., Alarcón, R., Arnau, J., Bono, R., & Bendayan, R. (2017). Non-normal data: Is ANOVA still a valid option? Psicothema, 29(4), 552–557. (ANOVA’nın normal dağılmayan verilerde de çoğu durumda güvenilir sonuçlar verdiğini, ancak bazı koşullarda bozulmalar yaşandığını açıklıyor. ANOVA’nın çoğu durumda n=15–30 civarında da dayanıklı olduğunu ama çok çarpık dağılımlarda bozulmalar başladığını yazıyor.)
Harwell, M. R., Rubinstein, E. N., Hayes, W. S., & Olds, C. C. (1992). Summarizing Monte Carlo results in methodological research: The one- and two-factor fixed effects ANOVA cases. Journal of Educational Statistics, 17(4), 315–339. (Simülasyonlarla normallik ihlallerinde ANOVA’nın performansını değerlendiriyor)
Lumley, T., Diehr, P., Emerson, S., & Chen, L. (2002). The importance of the normality assumption in large public health data sets. Annual Review of Public Health, 23, 151–169. (“n>30 yeterlidir” genellemesinin her durumda doğru olmadığını, özellikle çarpıklık yüksekse daha büyük örneklemler gerektiğini tartışıyor. Çarpıklığa bağlı olarak 100’ün üzerinde örnekleme ihtiyaç olabileceğini yazıyor)
Schmider, E., Ziegler, M., Danay, E., Beyer, L., & Bühner, M. (2010). Is it really robust? Reinvestigating the robustness of ANOVA against violations of the normal distribution assumption. Methodology, 6(4), 147–151. (Küçük örneklemlerde ANOVA’nın normal dağılıma duyarlılığını inceliyor)
Blanca, M. J., Arnau, J., López-Montiel, D., Bono, R., & Bendayan, R. (2013). Skewness and kurtosis in real data samples. Methodology, 9(2), 78–84. (Sosyal bilimlerde kullanılan gerçek veri setlerinde çarpıklık ve basıklığın ne kadar yaygın olduğu üzerinde duruyor)

SPSS ile Uygulama Örneği

Siz de videoda benim gerçekleştirdiğim örnek analizi aşağıdaki örnek veri setini indirerek, tekrar edebilirsiniz.

Örnek veri setini indirmek için tıklayın. → Ornek_Veri_Seti_Tek_Değişkenli_Normallik

APA formatına uygun bir rapor örneği de ekleyelim dimi. İki farklı örnek oluşturdum. İkisini de inceleyerek, kendi raporunuzu en uygun biçimde yazabilirsiniz 🙂 Tıklayın: → APA_örnek_şablon1 Tukenmislik_Tablosu_APA2

Tek değişkenli normal dağılımın araştırmalarda neden önemli olduğunu, SPSS’te nasıl kontrol edileceğini ve hangi analizlerde kritik rol oynadığını yazmaya çalıştım:) Ayrıca araştırmacıların sık yaptığı hataları ve doğru yorumlama ipuçlarını paylaştım. Artık elinizde hem kuramsal bilgi hem de pratik uygulama için bir yol haritası var. Ancak yazılı metin her zaman yeterli olmayabilir; görerek ve adım adım uygulayarak öğrenmek çok daha kalıcıdır. Videoyu da izlemeyi ve beğenmeyi unutmayın. Arkadaşlarınızla bu sayfayı ve kılavuz sayfasını paylaşın. Sevgiler. Betül.

Kılavuza dönmek için tıklayın.