📊 TEMEL İSTATİSTİK DERSLERİ
Hafta 5: Yayılım Ölçüleri — "Veriler Ne Kadar Dağınık?"
🎬 Ders Videosu
Bu dersin videosunu izleyerek konuyu kavrayabilirsiniz.
Yayılım Ne Demek?
SS (Standart Sapma) verilerin ortalamadan ne kadar uzakta olduğunu gösterir. Küçük SS = veriler birbirine yakın (tutarlı). Büyük SS = veriler dağınık (tutarsız).
🤔 Neden Yayılım Ölçüyoruz?
💡 Kavramsal Açıklama
Yayılım (Dispersion), veri noktalarının bir merkez etrafında ne kadar dağınık olduğunu gösteren istatistiksel bir ölçüdür. Düşük yayılım, verilerin birbirine yakın ve tutarlı olduğunu; yüksek yayılım ise verilerin geniş bir alana yayıldığını gösterir.
📊 Aynı Ortalama = 3, Ama Çok Farklı Performans!
💡 Ortalama = 3 gol (her iki takımda). Ama Takım A tutarlı, Takım B değişken!
💡 Yayılım Ne Söyler?
• Düşük yayılım: Değerler birbirine yakın, tutarlı performans. Örnek: Bir basketbolcunun her maçta 18-22 sayı arası atması.
• Yüksek yayılım: Değerler dağınık, değişken performans. Örnek: Aynı oyuncunun bir maç 5, diğer maç 35 sayı atması.
🎯 Ne Anlama Geliyor?
İki takımın da ortalaması 3 gol. Ama Takım A her maç 3 gol atıyor (tutarlı), Takım B bazen 0, bazen 6 gol atıyor (değişken).
Antrenör olarak hangi takımı tercih edersiniz? Tahmin edilebilir performans mı, yoksa sürprizlerle dolu bir takım mı?
Oyuncu A (Kevin Durant tipi): Son 10 maçtaki sayıları: 28, 25, 30, 27, 26, 29, 24, 31, 25, 28
→ Ortalama: 27.3 sayı | Standart Sapma: 2.2 (tutarlı!)
Oyuncu B (Yüksek riskli): Son 10 maçtaki sayıları: 45, 8, 32, 15, 40, 12, 38, 10, 35, 18
→ Ortalama: 25.3 sayı | Standart Sapma: 13.8 (çok değişken!)
Antrenör perspektifi: Kritik maçta kim oynatılır? Oyuncu A - çünkü performansı öngörülebilir!
📏 Ranj (Aralık)
🎯 Kavramsal Derinlik
Ranj, veri setindeki en uç iki nokta arasındaki mesafeyi ölçer. Ancak bu ölçüde arada kalan tüm veriler göz ardı edilir. Sadece "ne kadar geniş bir alana yayıldığını" gösterir, "bu yayılımın nasıl oluştuğunu" anlatmaz.
📊 Ranj = En Büyük − En Küçük
🍳 Ranj TARİFİ
🎯 Ne Anlama Geliyor?
Ranj 1.6 sn — Bu 5 sporcunun en hızlısı ile en yavaşı arasında 1.6 saniye fark var.
Yorum: Grup oldukça heterojen. Elit kampta bu fark 0.5 sn'nin altında olmalı!
5 sporcunun 100m sprint süresi (sn): 10.5, 10.8, 11.2, 11.7, 12.1
Ranj: 12.1 − 10.5 = 1.6 sn
Yorum: Grup oldukça heterojen (1.6 sn fark). Elit kampta 0.5 sn altında olması beklenir. Antrenör, grubu seviye bazında bölebilir.
Bir haltercinin 5 haftalık squat ağırlıkları (kg): 120, 125, 130, 135, 140
Ranj: 140 − 120 = 20 kg
Yorum: Progresif yükleme yapılıyor. Ranj, 5 haftalık toplam ilerlemeyi hızla gösteriyor. Ancak artmanın düzenli mi gerçekleştiği (doğrusal mı?) için standart sapma gerekir.
✅ Avantaj
Çok kolay hesaplanır!
Tek bir bakışta yayılımı görürsün
❌ Dezavantaj
Sadece 2 değere bakar, arada kalanları görmez!
Aykırı değerlerden çok etkilenir.
⚠️ Dikkat: Aykırı Değer Tuzağı!
Olimpiyat Finali Örneği: 5 atletin koşu süreleri (sn): 9.85, 9.87, 9.89, 9.91, 12.50 (sakatlık ve düşme)
Ranj: 12.50 - 9.85 = 2.65 sn
Yanlış Yorum: "Bu final çok düşük kaliteli, 2.65 sn fark var!"
Doğru Yorum: 4 atlet 0.06 sn arada bitiriyor, sadece 1 atlet sakatlandı. Gerçek performans seviyesi çok yüksek!
📊 Çeyrekler Arası Açıklık (IQR)
🎯 Kavramsal Anlayış
IQR (Interquartile Range), veri setini dört eşit parçaya böldüğümüzde ortadaki iki parçanın (Q1-Q3) yayılımını ölçer. En düşük %25 ve en yüksek %25'i atlayarak "güvenli bölge"deki yayılımı hesaplar. Bu nedenle aykırı değerlere karşı dayanıklıdır.
Robust Statistics: Aykırı değerlerden çok etkilenmeyen, "sağlam" istatistiksel ölçülere denir. IQR bunun en iyi örneğidir!
Q1 = 1. Çeyrek (%25), Q3 = 3. Çeyrek (%75)
🎯 Ne Anlama Geliyor?
IQR = 25 kg — Bu, "ortalama sporcular"ın (ortadaki %50) bench press gücü 25 kg içinde değişiyor.
Bu, uç değerler (en güçlü ve en zayıf) atıldıktan sonra kalanların yayılımıdır.
Senaryo: Bir fitness merkezindeki 9 üyenin bench press maksimumları (kg):
60, 65, 70, 75, 80, 85, 90, 95, 100
Q1 (1. Çeyrek): 67.5 kg (ortalama üyenin %25'i altında)
Q3 (3. Çeyrek): 92.5 kg (ortalama üyenin %75'i altında)
IQR: 92.5 - 67.5 = 25 kg
Yorum: Merkezdeki "tipik" üyelerin 25 kg'lık bir kuvvet yayılımı var. Bu, programların orta seviye üyelere uygun olduğunu gösterir.
Yaş Grubu Analizi: Genç futbol takımındaki 20 oyuncunun yaşları: 16, 17, 17, 17, 18, 18, 18, 18, 19, 19, 19, 19, 20, 20, 20, 21, 21, 22, 25, 28
Q1: 18 yaş | Q3: 20.5 yaş | IQR: 2.5 yaş
Antrenör Kararı: Takımın kalbi 18-20.5 yaş arası (IQR). 25 ve 28 yaşları "aykırı" ama tecrübe için gerekli!
✅ IQR'ın Gücü
Aykırı değerlerden etkilenmez!
Orta %50'yi tam olarak ölçer
⚠️ Sınırları
Tüm verileri kullanmaz
Sadece %50'yi dikkate alır
σ² Varyans
🎯 Derin Kavramsal Anlayış
Varyans, veri noktalarının ortalamadan olan sapmalarının karelerinin ortalamasıdır. Neden kare alıyoruz? Çünkü:
• Negatifleri pozitif yapar: -5 ve +5 sapmaları aynı uzaklıkta
• Büyük sapmaları cezalandırır: 10 birim sapma, 5 birim sapmanın 4 katı etkide
• Matematiksel özellikler: Toplama ve çarpma kurallarına uyar
Önemli Not: Varyans "kare birimdedir" - kg², sn² gibi. Bu yüzden doğrudan yorumlaması zordur. Bu yüzden standart sapma kullanırız!
Örneklem Varyansı:
"Sapmaların karelerini topla, n-1'e böl"
🎯 Ne Anlama Geliyor?
Varyans = 62.5 cm² — Bu, "ortalama karesel hata"nın ölçüsüdür.
Birim sorunu: Sonuç cm² cinsinden. Bu yüzden yorumlamak zor. Standart sapma (√62.5 = 7.91 cm) daha anlaşılır!
🎯 Atış Poligonu Benzetmesi
Senaryo: İki poligon memuru aynı hedefe 10 el ateş ediyor:
Memur A (Tutarlı): Tüm atışlar merkeze 2-3 cm mesafede
Memur B (Değişken): Bazı atışlar merkezde, bazıları 10-15 cm uzağında
Varyans ne söyler? Memur A'nın varyansı düşük (tutarlı), Memur B'nin varyansı yüksek (değişken). Varyans, "ortalama atış hatasının kareli" ölçüsüdür.
Oyuncu A (Curry tipi): 5 maçtaki 3 sayı atış sayısı: 45, 42, 48, 43, 47
→ Ortalama: 45 | Sapmalar: 0, −3, +3, −2, +2 | Kareler: 0+9+9+4+4 = 26
→ Varyans s² = 26/4 = 6.5 (tutarlı!)
Oyuncu B (Yeni oyuncu): 5 maçtaki 3 sayı atış sayısı: 60, 25, 55, 20, 50
→ Ortalama: 42 | Sapmalar: +18, −17, +13, −22, +8 | Kareler: 324+289+169+484+64 = 1330
→ Varyans s² = 1330/4 = 332.5 (çok değişken!)
Koç Kararı: Oyuncu A varyansı (6.5) çok düşük → kritik anlarda çok daha güvenilir!
📋 Neden (n-1)? - Bessel Düzeltmesi
Temel Mantık: Örneklemden evreni tahmin ederken "ceza" uygularız. Çünkü örneklem ortalaması, evren ortalamasına her zaman daha yakındır.
Spor Örneği: Bir takımdan 5 oyuncu seçip boy ölçüsü aldığınızda, bu 5 kişinin ortalaması takımın tüm ortalamasına "daha yakın" olma eğilimindedir. Bu yanlılığı düzeltmek için (n-1) kullanırız.
Unutmayın: Evren varyansı (σ²) için n, örneklem varyansı (s²) için n-1!
⚠️ Varyansın Birimi
Varyans kare birimdir! Mesela kg² veya sn². Yorumlaması zor, o yüzden standart sapma kullanılır.
σ Standart Sapma
🎯 Standart Sapmanın Anlamı
Standart Sapma (SD), veri noktalarının ortalamadan olan "tipik" uzaklığıdır. Varyansın karekökünü alarak orijinal birime geri döneriz - bu da yorumlamayı çok kolaylaştırır.
Normal Dağılım Kuralı (68-95-99.7):
• ±1 SS aralığında verilerin ~%68'i
• ±2 SS aralığında verilerin ~%95'i
• ±3 SS aralığında verilerin ~%99.7'si
Standart Sapma = √Varyans
📊 Normal Dağılımda Standart Sapma
💡 Standart Sapma Ne Söyler?
Değerlerin ortalamadan "tipik" uzaklığını gösterir.
Küçük SS: Değerler ortalamaya yakın → Tutarlı
Büyük SS: Değerler ortalamadan uzak → Değişken
🎯 Ne Anlama Geliyor?
SS = 0.16 sn — Bu atlet koşular arasında sadece 0.16 sn varyasyon gösteriyor.
Yorum: %68 olasılıkla 11.19-11.51 sn arasında koşar. Çok tutarlı performans!
LeBron James (2023-24): Maç başına sayı ortalaması: 25.7 | Standart sapma: 6.2
→ "LeBron genellikle 19.5-31.9 sayı arası atıyor (%68 olasılıkla)"
Stephen Curry (2023-24): Maç başına sayı ortalaması: 26.4 | Standart sapma: 8.1
→ "Curry genellikle 18.3-34.5 sayı arası atıyor (%68 olasılıkla)"
Taktik Analiz: LeBron daha tutarlı (6.2 SS), Curry daha patlayıcı (8.1 SS). Farklı oyun stilleri!
100m Sprint: Genç bir sporcuda 10 koşu süresi (saniye): 11.2, 11.3, 11.5, 11.1, 11.4, 11.6, 11.2, 11.3, 11.4, 11.5
→ Ortalama: 11.35 sn | Standart Sapma: 0.16 sn
Antrenör Yorumu: "0.16 SS çok iyi! Bu atlet koşular arasında sadece 0.16 sn varyasyon gösteriyor. Elit seviye tutarlılığı!"
🧮 Adım Adım Hesaplama
📊 Sayı Doğrusu Üzerinde Sapmalar
Adım 1: Ortalamayı Bul
x̄ = (40+45+50+55+60) / 5 = 250 / 5 = 50 cm
Adım 2: Sapmaları ve Karelerini Hesapla
| Sporcu | Sıçrama (x) | Sapma (x - 50) | Kare (x - 50)² |
|---|---|---|---|
| 1 | 40 | −10 | 100 |
| 2 | 45 | −5 | 25 |
| 3 | 50 | 0 | 0 |
| 4 | 55 | +5 | 25 |
| 5 | 60 | +10 | 100 |
| TOPLAM | 0 | 250 | |
Adım 3: Varyans ve Standart Sapma Hesapla
Varyans (s²): = 250 / (5−1) = 250 / 4 = 62.5 cm²
Standart Sapma (s): = √62.5 = 7.91 cm
🎯 Ne Anlama Geliyor?
Bu 5 sporcunun sıçrama performansı ortalamadan ortalama 7.91 cm sapıyor.
Yorum: Standart sapma 7.91 cm, ortalamanın ~%16'sı. Bu orta seviye bir yayılım gösterir.
🎯 Ekstra: MAD Hesabı
Mutlak Sapmalar: |−10| + |−5| + |0| + |5| + |10| = 10 + 5 + 0 + 5 + 10 = 30
MAD: 30 / 5 = 6.0 cm
Not: MAD (6.0 cm) < SS (7.91 cm) — çünkü MAD kare almaz, mutlak değer alır
5 atıştan alınan puanlar: 8, 9, 8, 10, 9
Adım 1 — Ortalama: (8+9+8+10+9) ÷ 5 = 44 ÷ 5 = 8.8 puan
Adım 2 — Sapmalar: −0.8, +0.2, −0.8, +1.2, +0.2
Adım 3 — Kareler: 0.64+0.04+0.64+1.44+0.04 = 2.8
Adım 4 — Varyans: 2.8 ÷ 4 = 0.7 | SS: √0.7 = 0.84 puan
Yorum: SS = 0.84 puan çok düşük → Bu okçu çok tutarlı! Her atışta 8-10 puan alıyor.
📊 Değişim Katsayısı (CV)
Sonuç yüzde (%) cinsindendir
📈 CV Karşılaştırması
Sıçrama: CV = %16 — Daha değişken performans
100m: CV = %4.5 — Daha tutarlı performans
✅ Sonuç
100m süresi (%4.5), sıçramadan (%16) çok daha tutarlı!
Aynı birimde olmasalar bile CV sayesinde karşılaştırabildik.
🎯 Ne Anlama Geliyor?
CV < %10: Çok tutarlı performans
CV %10-20: Orta seviye değişkenlik
CV > %20: Değişken/öngörülemeyen performans
📏 Mutlak Ortalama Sapma (MAD)
| |xᵢ − x̄| | Her veri noktasının ortalamadan farkının mutlak değeri — eksi işaretini yok sayar; −7 de 7, +8 de 8 olur. |
| Σ | Tüm mutlak değerleri topla |
| n | Veri sayısı — MAD'de n−1 değil, n'e bölünür (popülasyon formülü) |
Veriler: 30, 45, 28, 50, 32 pas
Adım 1 — Ortalama: (30+45+28+50+32) ÷ 5 = 185 ÷ 5 = 37 pas
| Maç | Pas (xᵢ) | Ortalamadan fark (xᵢ − 37) | Mutlak değer |xᵢ − 37| |
|---|---|---|---|
| 1 | 30 | −7 | 7 |
| 2 | 45 | +8 | 8 |
| 3 | 28 | −9 | 9 |
| 4 | 50 | +13 | 13 |
| 5 | 32 | −5 | 5 |
| Toplam Σ|xᵢ − x̄| = | 42 | ||
Adım 2 — MAD: 42 ÷ 5 = MAD = 8.4 pas
Yorum: Bu futbolcunun pas sayısı ortalamadan ortalama 8.4 pas sapıyor. Düşük MAD = tutarlı oyuncu.
⚖️ MAD ile Varyans Arasındaki Temel Fark
📐 Varyans
Sapmaları kare alır → 3 birim sapma 9 olur, 10 birim sapma 100 olur.
Büyük hataları cezalandırır, aykırı değere duyarlıdır.
📏 MAD
Sapmaları mutlak değer alır → 3 birim sapma 3, 10 birim sapma 10 kalır.
Orantılı ceza verir, aykırı değerlere dayanıklıdır.
💡 MAD Ne Zaman Tercih Edilmeli?
• Aykırı değer kesin bilgi taşıyorsa: Sakatlanma, doping, oyun dışı kalma gibi gerçek olaylar
• Finansal verilerde: Kriz dönemleri gereğinden fazla ağırlık taşımamalı
• Küçük örneklemde: n küçükse kare alma tahminleri bozar, MAD daha istikrarlı
• Kontrol kartlarında: Kalite kontrolde yaygın kullanım
📊 Çarpıklık ve Basıklık Katsayıları
🔀 Çarpıklık (Skewness)
Dağılımın simetrisini ölçer
Skew = 0 → Simetrik
Skew > 0 → Sağa çarpık
Skew < 0 → Sola çarpık
📈 Basıklık (Kurtosis)
Dağılımın sivrilğini ölçer
Kurt = 3 → Normal
Kurt > 3 → Sivri (Leptokurtik)
Kurt < 3 → Düz (Platikurtik)
📊 Dağılım Şekilleri — Çarpıklık
Sağa çarpık: Sağ kuyruk uzun, Ortalama > Medyan | Sola çarpık: Sol kuyruk uzun, Medyan > Ortalama
Maraton Bitirme Süreleri (1000 koşucu):
• 2 saat: 50 kişi (elit) | • 3 saat: 200 kişi | • 4 saat: 400 kişi (çoğunluk)
• 5 saat: 250 kişi | • 6+ saat: 100 kişi (yavaşlar)
Analiz: Sağa çarpık! Tepe 4 saat civarında ama sağ kuyruk uzun. Ortalama > Medyan.
Dikey Sıçrama (50 sporcu): Değerler 47–50 cm'de yoğunlaşıyor (biyolojik tavan).
Analiz: Sola çarpık! Tepe sağda, sol kuyruk var. Medyan > Ortalama.
🎯 Ne Anlama Geliyor?
Çarpıklık: Dağılımın "asimetrik" olup olmadığını gösterir.
• Sağa çarpık: Sağ kuyruk uzun → Ortalama > Medyan → Birkaç tane aşırı yüksek değer var
• Sola çarpık: Sol kuyruk uzun → Medyan > Ortalama → Birkaç tane aşırı düşük değer var
Basıklık: Dağılımın "sivri" mi yoksa "basık" mı olduğunu gösterir.
50m serbest stil süreleri (20 yüzücü):
• 22 sn: 2 yüzücü | • 23 sn: 3 yüzücü | • 24 sn: 8 yüzücü (çoğunluk)
• 25 sn: 5 yüzücü | • 26 sn: 1 yüzücü | • 27 sn: 1 yüzücü
Analiz: Hafif sağa çarpık! Birkaç yavaş yüzücü sağ kuyruğu uzatıyor.
Bu, antrenörün "temel gruba" odaklanması gerektiğini gösterir — IQR kullanarak!
❓ Hangi Yayılım Ölçüsünü Kullanmalı?
| Ölçü | Ne Zaman? | Avantaj | Dezavantaj |
|---|---|---|---|
| Ranj | Hızlı bakış, ilk değerlendirme | Çok kolay | Aykırıya duyarlı |
| IQR | Aykırı değer var, çarpık dağılım | Dayanıklı | Sadece %50 |
| SS | Normal dağılım, tüm veri kullanılsın | Tüm verileri kullanır | Aykırıya duyarlı |
| CV | Farklı birimleri karşılaştır | Birimden bağımsız | Ort≈0 ise sorun |
🌳 Karar Ağacı — Hangi Ölçüyü Kullanmalı?
🎯 Altın Kural - Spor Bilimleri Uygulaması
Normal dağılım + aykırı yok → Ortalama + Standart Sapma
Örnek: Profesyonel atletlerde reaksiyon süreleri → Herkes benzer yetenek
Çarpık dağılım veya aykırı var → Medyan + IQR
Örnek: Halk koşusu bitirme süreleri → Yeni başlayanlar ve elitler karışık
Senaryo 1: NBA Draft Kombinasyonu
→ 300 profesyonel adayın vertical jump testleri
→ Normal dağılım, aykırı yok
→ Standart Sapma kullan (ortalamayla birlikte)
Senaryo 2: Toplum Koşusu
→ 5000 kişilik 5km koşusu
→ Çok sağa çarpık (yavaşlar fazla)
→ IQR kullan (median'la birlikte)
💻 Excel ve SPSS Uygulamaları
📊 Excel Formülleri
=MAX(A1:A10)-MIN(A1:A10) <-- Ranj
=QUARTILE(A1:A10,3)-QUARTILE(A1:A10,1) <-- IQR
=VAR.S(A1:A10) <-- Örneklem Varyansı
=STDEV.S(A1:A10) <-- Standart Sapma
=AVEDEV(A1:A10) <-- MAD
📈 SPSS Menü
Analyze → Descriptive Statistics
→ Frequencies/Explore
☑️ Mean, Std Deviation
☑️ Variance, Range
☑️ Quartiles
🖱️ Excel Adım Adım
1. Verileri A sütununa gir (A1:A10)
2. Boş hücreye =STDEV.S(A1:A10) yaz
3. Enter'a bas → Sonuç!
4. Data Analysis ToolPak → Descriptive Statistics
⚠️ Önemli Notlar — Doğru Formül Seçimi
• Excel: VAR.S (örneklem), VAR.P (evren) | STDEV.S (örneklem SS)
• SPSS: Varsayılan örneklem formülleri (n-1) kullanır
• R — Tam Kod Örneği:
data <- c(40, 45, 50, 55, 60)
# Yayılım ölçüleri
diff(range(data)) # Ranj = 20
IQR(data) # IQR = 12.5
var(data) # Varyans = 62.5 (n-1)
sd(data) # Standart Sapma = 7.91
mad(data) # MAD = 7.41
⚽ Spor Senaryoları
Oyuncu A: Ort=18 sayı, SS=2 → Tutarlı skorcu
Oyuncu B: Ort=18 sayı, SS=8 → Değişken (bazen 10, bazen 26)
→ Kritik maçta kimi tercih edersin? Oyuncu A!
Bir sporcunun haftalık bench press değerleri:
Hafta 1-4: 80, 82, 79, 81 kg → SS=1.3 kg (tutarlı)
Hafta 5-8: 75, 90, 70, 85 kg → SS=8.5 kg (değişken!)
→ SS artışı performans sorununa işaret edebilir!
📊 APA Raporlama
"Dikey sıçrama ortalaması M = 49.67 cm (SS = 7.91) olarak bulunmuştur."
✅ Hafta 5 Özet ve Quiz
Ranj
Max - Min
Basit ama kırılgan
IQR
Q3 - Q1
Aykırıya dayanıklı
Varyans
Kare birim
SS² = Varyans
Std Sapma
√Varyans
En yaygın ölçü
S1: 10, 10, 10, 10, 50 verisinde en güvenilir yayılım ölçüsü hangisi?
S2: SS = 0 ne anlama gelir?
S3: Hangisi kare birimlidir? (örn. kg², sn²)
S4: CV (Değişim Katsayısı) ne zaman kullanılır?
S5: MAD ile Varyans arasındaki temel fark nedir?