Simpson Paradoksu: Her Alt Grup Doğru Sonuç Verirken Toplam Neden Yalan Söyler?

İstatistikte en rahatsız edici anlardan biri, verinin her parçası doğru olduğu hâlde bütünün yanlış bir hikaye anlatmasıdır. Bir hastane tedavisinde her yaş grubunda bir ilaç daha etkili çıkabilir, ama tüm hastalar bir araya toplandığında sonuç tam tersine dönebilir. Bu tuhaf ama gerçek fenomene istatistikte Simpson Paradoksu deniyor ve veriyle uğraşan herkesin er ya da geç karşılaştığı bir tuzak.

Paradoksun Basit Bir Örneği

İki doktor düşünün: Doktor A ve Doktor B. Küçük taş vakalarında da büyük taş vakalarında da Doktor A’nın başarı oranı Doktor B’den yüksek. Mantıken “Doktor A daha başarılı” demek gerekir, değil mi? Ama tüm vakalar birleştirildiğinde tablo tersine dönebiliyor: genel başarı oranında Doktor B öne çıkabiliyor. Sebep basit: doktorlar hastalarını rastgele almıyor. Biri daha çok zor (büyük taş) vakayı üstleniyor, diğeri daha çok kolay (küçük taş) vakayı. Grupların büyüklüğü, ortalamayı sessizce yeniden şekillendiriyor.

Bu, aslında “ortalama” kavramının ne kadar yanıltıcı olabileceğinin bir başka yüzü. Ortalamanın tek başına neden güvenilmez bir özet olduğunu daha detaylı görmek istersen ortalama, medyan ve standart sapma konulu yazımıza göz atabilirsin.

Neden Oluyor Bu?

Simpson Paradoksu’nun arkasında genelde gizli, fark edilmemiş bir üçüncü değişken var — istatistikte buna “karıştırıcı değişken” (confounding variable) deniyor. Yukarıdaki örnekte bu değişken, taşın büyüklüğü. Grupları ayrı ayrı incelediğinizde her şey net görünüyor, ama grupları birleştirdiğinizde bu gizli değişkenin etkisi sonucu tamamen tersine çevirebiliyor.

Bu da bizi istatistiğin en temel derslerinden birine götürüyor: iki değişken arasında bir ilişki gördüğünüzde, bu ilişkinin gerçek bir neden-sonuç bağlantısı mı yoksa üçüncü bir faktörün eseri mi olduğunu sorgulamak şart. Bu ayrımı daha derinlemesine ele aldığımız korelasyon nedensellik değildir yazımıza buradan ulaşabilirsin — Simpson Paradoksu, o yazıda bahsettiğimiz tuzağın daha sinsi bir versiyonu sayılabilir.

Gerçek Hayattan Bir Vaka: Berkeley Üniversitesi

Simpson Paradoksu’nun en ünlü gerçek dünya örneklerinden biri, 1973 yılında Berkeley Üniversitesi’nin lisansüstü programlarına yapılan başvurularda yaşandı. Genel verilere bakıldığında erkek başvuranların kadın başvuranlara göre daha yüksek oranda kabul edildiği görülüyordu — bu da ilk bakışta bir cinsiyet ayrımcılığı izlenimi veriyordu. Ama bölüm bazında incelendiğinde tablo tam tersine dönüyordu: kadınlar birçok bölümde erkeklerden daha yüksek oranda kabul ediliyordu. Gerçek sebep, kadınların ortalamada daha rekabetçi (ve dolayısıyla kabul oranı düşük) bölümlere başvurma eğiliminde olmasıydı.

Grafiklerle Nasıl Gizlenir?

Simpson Paradoksu’nun sinsi tarafı, doğru sunulmadığında bir grafiğin bu gizli değişkeni tamamen saklayabilmesi. Toplanmış (aggregate) veriyle çizilen bir grafik, alt grupları ayrı ayrı gösteren bir grafikten tamamen farklı bir hikaye anlatabiliyor — ve bu, kasıtlı olmasa bile okuyucuyu yanıltabiliyor. Grafiklerin veriyi nasıl yanıltıcı şekilde sunabileceğini daha geniş bir çerçevede görmek istersen yanıltıcı grafikleri tanıma yazımıza göz atabilirsin.

Bu Tuzağa Düşmemek İçin Ne Yapmalı?

Bir veri setinde beklenmedik ya da “çok net” görünen bir sonuçla karşılaştığınızda, kendinize şu soruyu sormak faydalı: Bu veri hangi alt gruplardan oluşuyor, ve o alt gruplar eşit büyüklükte mi? Eğer büyük bir farkla karşılaştırılan gruplar arasında ciddi büyüklük dengesizliği varsa, Simpson Paradoksu’nun sahnede olma ihtimali yüksek.

Konunun daha akademik ve görsel anlatımına ulaşmak istersen, güvenilir bir ansiklopedik kaynak olan Britannica’nın Simpson Paradoksu maddesine göz atabilirsin.

Son Söz

Simpson Paradoksu, “veriler yalan söylemez ama yanlış sorulan sorulara doğru cevap verir” ilkesinin belki de en çarpıcı örneği. Bir sonraki sefer karşınıza çıkan bir istatistiğe “kesin böyle” diye bakmadan önce, o sonucun hangi gruplardan oluştuğunu bir de o gözle incelemeye ne dersin?