📊 ILERI ISTATISTIK
Hafta 26: Diskriminant (Ayirma) Analizi
🎯 Ayirma
Hangi degiskenler gruplari ayirir?
📊 Siniflandirma
Yeni birey hangi grupta?
Doç. Dr. İzzet İNCE | Spor Bilimleri Fakultesi
Akademik Yıl: 2025 - 2026
🔍 Diskriminant Analizi Nedir?
📚 SEMBOL VE KAVRAM ACIKLAMA TABLOSU
Asagidaki tablo, diskriminant analizinde kullanilan temel sembolleri ve kavramlari cok basit bir dille aciklar.
| Sembol/Kavram | Ne Demek? | Basit Aciklama |
|---|---|---|
| Wilks' Lambda (Λ) | Ayirma gucu gostergesi | 0 ile 1 arasi deger. Dusuk deger = iyi ayirma! Ornegin Λ=0.20 demek gruplar birbirinden cok farkli demek. |
| Kanonik Korelasyon (Rc) | Fonksiyon-grup iliskisi | Diskriminant fonksiyonu ile grup uyeliginiz arasindaki iliski. Yuksek deger = iyi tahmin! Ornegin Rc=0.85 cok guclu. |
| Siniflandirma Dogrulugu (Hit Rate) | Dogru tahmin yuzdesi | Model kac kisiyi dogru gruba yerlestirdi? %85 demek 100 kisiden 85'i dogru! |
| Chance Baseline (Sans Duzey) | Rastgele tahmin basarisi | Gozlerimizi kapatsak kac dogru tahmin ederdik? 3 grup varsa = %33. Modelimiz bundan iyi olmali! |
| Yapi Matrisi (Structure Matrix) | Degisken onemliligi | Hangi degisken gruplari en cok ayiriyor? Yuksek deger = o degisken cok onemli! |
| Ozdeger (Eigenvalue) | Fonksiyonun gucu | Fonksiyon gruplardaki farki ne kadar acikliyor? Buyuk deger = guclu fonksiyon! |
| Cross-Validation | Capraz dogrulama | Modeli test etme yontemi. Her seferinde 1 kisi disarda birakilir, kalan verilerle model kurulur. Gercek basariyi gosterir! |
MANOVA
Gruplar farkli mi?
Hipotez testi
Diskriminant
Hangi degiskenler nasil ayirir?
Tahmin/siniflandirma
🤔 MANOVA vs Lojistik vs Diskriminant
• MANOVA: Cok degiskenli fark testi
• Lojistik: 2 grup, degisken onemliligi (OR)
• Diskriminant: 2+ grup, kanonik fonksiyonlar, siniflandirma
⚽ SPOR ORNEGI 1: Futbolda Basarili vs Basarisiz Takim Ayirma
Senaryo: 20 futbol takimini "sampiyonluk yarisindan dusenler" ve "sampiyonluk yarisinda kalanlar" olarak ayirmak istiyoruz.
Degiskenler: Top surme yuzdesi, pas isaberti, sut isabeti, km kosma mesafesi
Diskriminant Fonksiyonu:
D = 0.65 × (pas isabeti) + 0.48 × (sut isabeti) + 0.32 × (km) - 4.2
Nasil Yorumluyoruz?
- Pas isabeti en buyuk katsayiya sahip (0.65) → Basariyi en cok etkileyen faktor!
- D degeri pozitifse → Sampiyonluk yarisinda kalir
- D degeri negatifse → Sampiyonluk yarisindan duser
🏊 SPOR ORNEGI 2: Yuzme Kategorileri Ayirma
Senaryo: Yuzuculeri sprint (50-100m), orta mesafe (200-400m) ve uzun mesafe (800-1500m) kategorilerine ayirmak istiyoruz.
Degiskenler: Kol gucu, bacak gucu, VO2max, vucuttaki yag yuzdesi
Diskriminant Fonksiyonlari:
Fonksiyon 1: D1 = 0.78 × (kol gucu) + 0.55 × (bacak gucu) - 0.25 × (VO2max)
Fonksiyon 2: D2 = 0.15 × (kol gucu) - 0.20 × (bacak gucu) + 0.82 × (VO2max)
Ne Anliyoruz?
- Fonksiyon 1: Sprint vs uzun mesafe ayirir (guc odakli)
- Fonksiyon 2: Orta mesafeyi diger kategorilerden ayirir (dayaniklilik odakli)
- 3 grup oldugu icin 2 fonksiyon var (grup sayisi - 1)
🏋️ SPOR ORNEGI 3: Halter Siklet Sinifi Tahmini
Senaryo: Genc haltercilerin hangi siklet sinifinda en basarili olacagini tahmin etmek istiyoruz.
Gruplar: Hafif siklet (61-73 kg), orta siklet (81-96 kg), agir siklet (102+ kg)
Degiskenler: Boy, kas kutlesi, el kavrama gucu, dikey sicrama
Diskriminant Fonksiyonu:
D = 0.72 × (kas kutlesi) + 0.45 × (boy) + 0.38 × (kavrama gucu)
Pratik Kullanim: Yeni gelen bir sporcunun bu degerleri girilince hangi siklete daha uygun oldugu otomatik hesaplanir!
📈 Kanonik Diskriminant Fonksiyonlari
Diskriminant Fonksiyonu:
b = diskriminant katsayilari, c = sabit
📋 Ozdeger ve Wilks' Lambda
Ozdeger (Eigenvalue): Fonksiyonun acikladi varyans
Kanonik Korelasyon: Fonksiyon ile grup arasindaki korelasyon
Wilks' Lambda: Fonksiyonun anlamlilik testi (dusuk = iyi)
📊 Fonksiyon Sayisi
Maksimum fonksiyon sayisi = min(degisken sayisi, grup sayisi - 1)
• 2 grup → 1 fonksiyon
• 3 grup → maksimum 2 fonksiyon
🧠 Katsayilarin Yorumu
Ham katsayilar birimlere baglidir (cm vs kg). Degiskenlerin goreli onemini karsilastirmak icin Standartlastirilmis Kanonik Diskriminant Katsayilari kullanilir. Mutlak degeri buyuk olan degisken, ayirma islemine daha fazla katki saglar.
📊 Yapi Matrisi
📊 Ornek Yapi Matrisi
| Degisken | Fonksiyon 1 | Fonksiyon 2 |
|---|---|---|
| Dikey Sicrama | .85* | .21 |
| Sprint | .72* | .35 |
| Dayaniklilik | .28 | .81* |
| Esneklik | .15 | .69* |
* isaretli yukler en yuksek korelasyonu gosterir
Yorum: Fonksiyon 1 "Patlayici Guc" boyutunu temsil ediyor (sicrama, sprint). Fonksiyon 2 "Genel Fitness" boyutunu temsil ediyor (dayaniklilik, esneklik).
⚠️ Pattern vs Structure Matrix
Degiskenler arasinda yuksek korelasyon (multicollinearity) varsa, katsayilar (pattern) kararsiz olabilir. Bu durumda Yapi Matrisi (Structure Matrix) daha guvenilirdir cunku degiskenin fonksiyonla olan basit korelasyonunu gosterir (etkilesimden bagimsiz).
📊 HANGI DEGISKENLER EN COK AYIRIYOR? - YAPI MATRISI OKUMA
Yapi matrisindeki degerler -1 ile +1 arasindadir. Mutlak degeri buyuk olan degisken gruplari en cok ayiran degiskendir!
| Deger Araligi | Anlami | Ornek |
|---|---|---|
| 0.70 - 1.00 | Cok guclu ayirici | Boy = 0.85 → Boy gruplar arasinda en belirleyici faktor! |
| 0.40 - 0.69 | Orta duzey ayirici | Ceviklik = 0.55 → Gruplari ayirmada yardimci |
| 0.00 - 0.39 | Zayif ayirici | Esneklik = 0.18 → Gruplari pek ayirmiyor |
🏀 HANGI DEGISKEN EN COK AYIRIYOR? ORNEK 1: Basketbol Pozisyonlari
Gruplar: Guard, Forward, Center
Yapi Matrisi Sonuclari:
| Degisken | Fonksiyon 1 | Yorum |
|---|---|---|
| Boy | .92* | EN GUCLU AYIRICI! Center'lar uzun, Guard'lar kisa. |
| Kol Acikligi | .78 | Boy ile paralel, guclu ayirici |
| Sicrama | .45 | Orta duzey ayirici |
| Ceviklik | .62 | Guard'lar daha cevik |
Sonuc: Basketbolda pozisyonlari en cok BOY ayiriyor! Guard isen kisa, Center isen uzun olma ihtimalin yuksek.
🏊 HANGI DEGISKEN EN COK AYIRIYOR? ORNEK 2: Yuzme Mesafe Kategorileri
Gruplar: Sprint (50-100m), Orta (200-400m), Uzun (800-1500m)
Yapi Matrisi Sonuclari:
| Degisken | Fonksiyon 1 | Fonksiyon 2 | Yorum |
|---|---|---|---|
| VO2max | .35 | .89* | Uzun mesafecileri ayiriyor! |
| Kas Gucu | .85* | .22 | Sprinterleri ayiriyor! |
| Vucuttaki Yag % | -.65 | .40 | Dusuk yag = sprint basarisi |
Sonuc: Fonksiyon 1 (kas gucu) sprint vs uzun mesafeyi, Fonksiyon 2 (VO2max) orta mesafeyi ayiriyor!
🏋️ HANGI DEGISKEN EN COK AYIRIYOR? ORNEK 3: Halter Performans Duzeyleri
Gruplar: Milli Takim, Bolgesel, Amator
Yapi Matrisi Sonuclari:
| Degisken | Fonksiyon 1 | Yorum |
|---|---|---|
| Relatif Guc (kg/vucut kg) | .94* | EN GUCLU AYIRICI! Milli takim sporcularinin relatif gucu cok yuksek. |
| Teknik Puan | .76 | Ust duzey sporcular teknik olarak mukemmel |
| Antrenman Yili | .58 | Deneyim de onemli ama guc kadar degil |
| Esneklik | .28 | Zayif ayirici - gruplar arasi fark az |
Sonuc: Halterde basari duzeylerini en cok RELATIF GUC ayiriyor! Vucut agirligina oranla ne kadar guclu oldugun belirleyici.
⚠️ DISKRIMINANT ANALIZI VARSAYIMLARI
📋 Varsayim Testleri Ozeti
| Varsayim | Test | Kabul Kriteri |
|---|---|---|
| Cok Degiskenli Normallik | Mardia, Shapiro-Wilk | p > 0.05 |
| Kovaryans Homojenligi | Box's M | p > 0.001 (daha esnek) |
| Coklu Bagintisizlik | Korelasyon, VIF | |r| < 0.80, VIF < 5 |
| Orneklem Buyuklugu | n sayimi | Grup basina ≥ 20 |
📊 Varsayim 1-2: Normallik ve Kovaryans Homojenligi
📈 Cok Degiskenli Normallik
Her grup icin:
• DV'ler birlikte normal dagilsin
Test: Mardia's test (SPSS'te yok)
Alternatif: Her DV icin Shapiro-Wilk
📊 Kovaryans Homojenligi
Gruplar arasi:
• Kovaryans matrisleri esit
Test: Box's M
p > 0.001 → Varsayim saglanir
📊 Box's M Testi Yorumlama
📋 Normallik Kontrol Adimlari
1. Her grup icin ayri ayri Shapiro-Wilk testi uygula
2. Her DV icin Q-Q plot ciz
3. Carpiklik ve basiklik degerlerini kontrol et (|deger| < 2 kabul edilebilir)
4. n > 30 ise Merkezi Limit Teoremi'ne guvenebilirsiniz
DV'ler: Sprint, Ceviklik, Dayaniklilik
Shapiro-Wilk (Sprint): Guard p=.12, Forward p=.08, Center p=.15 → ✓ Hepsi normal
Box's M: M = 28.4, F(12, 8456) = 2.24, p = .008 → ✓ p > 0.001 kabul!
📐 Varsayim 3-4: Coklu Bagintisizlik ve Orneklem
🔗 Coklu Bagintisizlik
Problem: Yuksek korelasyonlu DV'ler
Katsayilar kararsiz olur
Kriter: |r| < 0.80
VIF: < 5 (ideal < 3)
👥 Yeterli Orneklem
Minimum: n ≥ 20 × DV sayisi
Her grupta ≥ 20
Ideal: Grup basina ≥ 50
Dengesiz gruplar → Prior olasilik ayarla
📊 VIF (Varyans Sisirme Faktoru) Yorumlama
📋 Orneklem Buyuklugu Kurallari
| Kural | Aciklama | Ornek (5 DV, 3 grup) |
|---|---|---|
| n ≥ 20 × DV | Genel minimum | n ≥ 100 |
| Grup basina ≥ DV + 1 | Mutlak minimum | Her grupta ≥ 6 |
| Grup basina ≥ 20 | Guvenilir sonuc icin | Toplam ≥ 60 |
Problem: Guard n=50, Forward n=30, Center n=15
Risk: Model cogunluk grubuna yanli olabilir
Cozum: SPSS'te Prior olasiliklari "All groups equal" olarak ayarla
veya en kucuk grubun n'ine gore ornekleme yap
🔧 Varsayim Saglanmazsa Ne Yapmali?
🔄 Robust Alternatifler
2 grup: Lojistik Regresyon
Normallik ihlali: Quadratic DA
Parametrik olmayan: k-NN
📊 Doğrulama
Görünür: Hit rate
Cross-val: Leave-one-out
Karşılaştır: Chance baseline
Hit Rate: Doğru sınıflandırılan % (örn: %85)
Chance Baseline: Rastgele tahmin başarısı = 1/grup sayısı (3 grup → %33.3)
Kappa: Şansa göre düzeltilmiş başarı (κ > 0.60 iyi)
Not: Hit rate mutlaka chance baseline'ın üzerinde olmalı!
🤖 AI Scout: Sınıflandırma Aracı
📏 Sporcu Olcumleri
🎯 Tahmin Edilen Brans
🛡️ Model Dogrulama: Cross-Validation
Modelin basarisi ayni veri seti uzerinde test edilirse sonuclar "fazla iyimser" cikabilir. Gercek performans icin Leave-one-out Cross-validation kullanilir: Her seferinde 1 kisi disarida birakilir, model kalanlarla egitilir ve o kisi tahmin edilir.
⚽ Spor Senaryolari
📊 SINIFLANDIRMA DOGRULUGU NEDIR?
Model kac kisiyi dogru gruba yerlestirdi? Bunu anlamak icin Confusion Matrix (Karisiklik Matrisi) kullanilir.
Basit Hesaplama: Dogru Tahmin Sayisi / Toplam Kisi Sayisi × 100
🏃 SINIFLANDIRMA ORNEGI 1: Atletizm Brans Tahmini
Senaryo: 90 atletizm sporcusunu 3 kategoriye ayirdik: Sprinter, Atici, Uzun mesafeci
Sonuc Tablosu:
| Gercek Grup | Sprinter Tahmini | Atici Tahmini | Uzun Mesafe Tahmini | Toplam |
|---|---|---|---|---|
| Sprinter | 28 | 2 | 0 | 30 |
| Atici | 1 | 27 | 2 | 30 |
| Uzun Mesafe | 0 | 3 | 27 | 30 |
Hesaplama: (28 + 27 + 27) / 90 = 82/90 = %91.1 Dogru Siniflandirma!
Chance Baseline: 1/3 = %33.3 → Modelimiz cok basarili!
🏐 SINIFLANDIRMA ORNEGI 2: Voleybol Pozisyon Tahmini
Senaryo: 80 voleybolcuyu Pasör, Smasör, Libero olarak ayirdik.
Sonuclar:
- Pasorler: 25 kisiden 22'si dogru → %88
- Smasorler: 35 kisiden 30'u dogru → %86
- Liberolar: 20 kisiden 18'i dogru → %90
Genel Basari: (22 + 30 + 18) / 80 = %87.5
Onemli Not: Libero grubu en iyi tahmin edildi cunku fiziksel ozellikleri (kisa boy, hizli refleks) diger pozisyonlardan cok farkli!
⚽ SINIFLANDIRMA ORNEGI 3: Futbol Kaleci vs Saha Oyuncusu
Senaryo: 60 futbolcuyu Kaleci ve Saha Oyuncusu olarak ayirdik.
Sonuclar:
| Gercek | Kaleci Tahmini | Saha Tahmini |
|---|---|---|
| Kaleci (n=15) | 14 | 1 |
| Saha (n=45) | 2 | 43 |
Hesaplama: (14 + 43) / 60 = %95 Dogru!
Neden Bu Kadar Yuksek? Kaleciler boy, el acikligi ve refleks testlerinde saha oyuncularindan cok farkli!
Gruplar: Guard (n=40), Forward (n=35), Center (n=25) → Toplam n=100
DV'ler: Boy, agirlik, kol acikligi, sicrama, ceviklik (5 degisken)
| Varsayim | Test | Sonuc | Karar |
|---|---|---|---|
| Normallik (Boy) | Shapiro-Wilk | Guard p=.12, Fwd p=.08, Cnt p=.15 | ✓ Saglaniyor |
| Kovaryans | Box's M | M=42.3, F=1.89, p=.004 | ✓ p > 0.001 |
| Coklu Baginti | VIF | Tum VIF < 3.5 | ✓ Sorun yok |
| Orneklem | n kontrolu | En kucuk grup n=25, toplam=100 | ✓ Yeterli |
Sonuc: 2 anlamli fonksiyon
• Fonksiyon 1: Λ = .24, χ²(10) = 89.2, p < .001 → Boy, Agirlik
• Fonksiyon 2: Λ = .78, χ²(4) = 14.8, p = .005 → Ceviklik, Sicrama
• Dogru siniflandirma: %87.5 (Chance: %33.3)
📊 APA Raporlama
"Varsayim kontrolleri sonucunda cok degiskenli normallik (tum Shapiro-Wilk p > .05) ve kovaryans matrisi homojenligi (Box's M = 42.3, p = .004 > .001) varsayimlarinin karsilandigi gorulmustur. Diskriminant analizi iki anlamli kanonik fonksiyon uretmistir. Ilk fonksiyon (Λ = .24, χ²(10) = 89.2, p < .001) toplam varyansin %78'ini aciklamaktadir. Model, orijinal gruplarin %87.5'ini dogru siniflandirmistir (chance baseline = %33.3)."
🎯 Sinif Ici Aktivite: Sporcu Siniflandirma
Amac: Genc futbolcularda fiziksel ozelliklerden mevki tahmini
Gruplar: Kaleci (n=12), Defans (n=28), Ortasaha (n=35), Forvet (n=20)
Toplam: n = 95
DV'ler:
- Boy (cm)
- Kilo (kg)
- Sprint 30m (sn)
- Yo-Yo IR1 (m)
- Dikey sicrama (cm)
- Ceviklik T-test (sn)
Bilinen sorunlar:
• Boy-Kilo korelasyonu r = 0.85
• Kaleci grubunda n = 12 (kucuk)
❓ Sorular
1. Kac tane diskriminant fonksiyonu beklenir? (max = grup - 1)
2. n = 12 olan Kaleci grubu icin ne yapilabilir?
3. Boy-Kilo korelasyonu (r=0.85) sorun mu? Nasil cozulur?
4. Chance baseline yuzde kac olur?
✅ Cevaplar
1. Fonksiyon sayisi: max = 4 - 1 = 3 fonksiyon
2. Kaleci grubu (n=12):
- 6 DV + 1 = 7 → 12 > 7 ✓ Mutlak minimum karsilaniyor
- Ancak 20 kuralina uymaz → Dikkatli yorumla
- Prior olasiliklari "equal" yap veya kaleci grubunu cikararak analizi tekrarla
3. Boy-Kilo r=0.85: Coklu baginti sorunu! Cozumler:
- Birini cikar (BMI hesaplayip onu kullanma!)
- Veya VIF kontrol et - eger VIF < 5 ise devam edilebilir
4. Chance baseline: 1/4 = %25
Model basarili sayilmasi icin: Hit rate > %25 + Cross-validation sonucu da benzer olmali
✅ Hafta 26 Ozet ve Quiz
📋 Diskriminant Varsayim Kontrol Listesi
| Varsayim | Test | Kabul |
|---|---|---|
| Normallik | Shapiro-Wilk | p > 0.05 |
| Kovaryans | Box's M | p > 0.001 |
| Coklu Baginti | VIF | VIF < 5 |
| Orneklem | n sayimi | Grup basina ≥ 20 |
Kanonik F.
max = g - 1
Yapi Matrisi
Degisken onemliligi
Hit Rate
> Chance baseline
🧠 Quiz
Soru 1: 4 gruplu analizde maksimum kac fonksiyon?
Soru 2: Box's M p = 0.002 → Varsayim?
Soru 3: VIF = 7.2 → Ne yapmali?
Diskriminant = MANOVA varsayimlari + Siniflandirma
Hit rate MUTLAKA chance baseline'in uzerinde olmali!
Cross-validation ile gercek performansi kontrol et!