Bir arkadaşınız size “testim pozitif çıktı, o hastalığa yakalanmış olabilirim” dediğinde, çoğumuzun ilk tepkisi paniklemek olur. Ama gerçek şu ki, testin doğruluk oranı ne kadar yüksek olursa olsun, “pozitif çıktı” cümlesi tek başına neredeyse hiçbir şey ifade etmez. Gerçek olasılığı hesaplamak için başka bir şeye ihtiyacınız var: Bayes teoremi.
Önce Basit Bir Senaryo
Diyelim ki bir hastalık nüfusun yalnızca yüzde 1’ini etkiliyor. Test, gerçekten hasta olan kişilerde yüzde 95 doğru sonuç veriyor. Ama sağlıklı kişilerin de yüzde 5’inde yanlışlıkla “pozitif” çıkıyor. Siz teste girdiniz ve sonuç pozitif çıktı. Aklınıza gelen ilk soru: “Gerçekten hasta olma ihtimalim yüzde 95 mi?”
Cevap, çoğu insanın tahmin ettiğinden çok daha düşük. Çünkü nüfusun büyük çoğunluğu zaten sağlıklı olduğu için, “yanlış pozitif” çıkan sağlıklı insan sayısı, gerçekten hasta olup doğru pozitif çıkan insan sayısından çok daha kalabalık olabiliyor. İşte Bayes teoremi tam da bu noktada devreye giriyor: Elinizdeki önsel bilgiyi (nüfusun ne kadarının hasta olduğunu) ve yeni kanıtı (test sonucunu) birleştirerek gerçek olasılığı hesaplıyor.
Formülün Arkasındaki Fikir
Matematiksel gösterimi karmaşık görünse de, mantığı aslında çok insani: Elinizde bir başlangıç inancı var (önsel olasılık), yeni bir kanıt geliyor, ve siz bu kanıt ışığında inancınızı güncelliyorsunuz (sonsal olasılık). Yani Bayes teoremi, aslında “akıllıca düşünmenin” matematiğe dökülmüş hali.
Bu yaklaşım, kumarbazın yanılgısını ele aldığımız yazımızda bahsettiğimiz sezgisel hataların tam tersi bir disiplin sunuyor. Kumarbazın yanılgısında insanlar geçmiş sonuçların gelecekteki bağımsız olasılıkları etkileyeceğini sanıyordu — hatalıydı. Bayes teoreminde ise geçmiş bilgi (önsel), gelecekteki tahminimizi etkilemesi gereken, matematiksel olarak meşru bir unsur. Fark, hangi bilginin gerçekten ilgili olduğunu ayırt edebilmekte yatıyor.
Neden Sezgimiz Bizi Yanıltıyor?
İnsan beyni, “test pozitif çıktı, demek ki hasta olma ihtimalim testin doğruluk oranı kadar yüksek” diye düşünme eğiliminde. Bu, istatistikte sık karşılaşılan bir tuzak ve aslında korelasyon ile nedenselliği karıştırmamız gerektiğini anlattığımız yazımızdaki mantığa benzer bir dikkatsizlik: Görünen ile gerçek olan arasındaki farkı atlamak. Bayes teoremi, bu atlamayı engelleyen bir kontrol mekanizması gibi çalışıyor.
Sadece Tıpta Değil, Her Yerde
Bayes teoreminin kullanım alanı hastane laboratuvarlarıyla sınırlı değil. Spam filtreleri, adli tıp delillerinin değerlendirilmesi, hatta İkinci Dünya Savaşı’nda Enigma şifresinin çözülmesi gibi tarihi olaylarda bile Bayesçi düşünce kilit rol oynadı. Spor analitiğinde de aynı mantık işliyor: Bir takımın sezon başındaki güç tahmini (önsel), her maçtan gelen yeni sonuçlarla (kanıt) güncellenerek daha isabetli hale geliyor — tıpkı xG modellerinde bir takımın gol beklentisinin, maç içindeki her yeni şansla güncellenmesi gibi.
Peki Bu Bilgiyi Nasıl Kullanmalı?
Bir dahaki sefere çarpıcı bir istatistik ya da test sonucuyla karşılaştığınızda kendinize şunu sorun: “Bu sonucun arkasındaki önsel olasılık nedir? Olayın kendisi ne kadar nadir?” Çoğu zaman gözden kaçırdığımız şey, kanıtın kendisi değil, o kanıtın ortaya çıktığı bağlamdaki temel oran (base rate). Bu, yanıltıcı grafikleri tanımayı öğrendiğimiz yazımızdaki gibi, sayılara körü körüne değil, eleştirel bir gözle bakmayı gerektiriyor.
Sonuç olarak Bayes teoremi, bize kesin cevaplar vermez; ama elimizdeki bilgiyle en akılcı tahmini yapmamızı sağlar. Ve modern veri biliminden tıbbi teşhise kadar pek çok alanda, “ne kadar eminiz?” sorusunun en dürüst cevabını bu teorem veriyor.
Teoremin tarihçesi, formülü ve daha ayrıntılı açıklaması için Bayes teoremi üzerine Vikipedi maddesine göz atabilirsiniz.