📊 ILERI ISTATISTIK

Hafta 26: Diskriminant (Ayirma) Analizi

Bu hafta: Onceden tanimlanmis gruplari hangi degiskenler en iyi ayirir? Yeni bireyleri hangi gruba atasiniz?

🎯 Ayirma

Hangi degiskenler gruplari ayirir?

📊 Siniflandirma

Yeni birey hangi grupta?

Doç. Dr. İzzet İNCE | Spor Bilimleri Fakultesi

Akademik Yıl: 2025 - 2026

🔍 Diskriminant Analizi Nedir?

Iki Amac: 1) Gruplari en iyi ayiran lineer kombinasyonu bul. 2) Yeni bireyleri siniflandir.

📚 SEMBOL VE KAVRAM ACIKLAMA TABLOSU

Asagidaki tablo, diskriminant analizinde kullanilan temel sembolleri ve kavramlari cok basit bir dille aciklar.

Sembol/Kavram Ne Demek? Basit Aciklama
Wilks' Lambda (Λ) Ayirma gucu gostergesi 0 ile 1 arasi deger. Dusuk deger = iyi ayirma! Ornegin Λ=0.20 demek gruplar birbirinden cok farkli demek.
Kanonik Korelasyon (Rc) Fonksiyon-grup iliskisi Diskriminant fonksiyonu ile grup uyeliginiz arasindaki iliski. Yuksek deger = iyi tahmin! Ornegin Rc=0.85 cok guclu.
Siniflandirma Dogrulugu (Hit Rate) Dogru tahmin yuzdesi Model kac kisiyi dogru gruba yerlestirdi? %85 demek 100 kisiden 85'i dogru!
Chance Baseline (Sans Duzey) Rastgele tahmin basarisi Gozlerimizi kapatsak kac dogru tahmin ederdik? 3 grup varsa = %33. Modelimiz bundan iyi olmali!
Yapi Matrisi (Structure Matrix) Degisken onemliligi Hangi degisken gruplari en cok ayiriyor? Yuksek deger = o degisken cok onemli!
Ozdeger (Eigenvalue) Fonksiyonun gucu Fonksiyon gruplardaki farki ne kadar acikliyor? Buyuk deger = guclu fonksiyon!
Cross-Validation Capraz dogrulama Modeli test etme yontemi. Her seferinde 1 kisi disarda birakilir, kalan verilerle model kurulur. Gercek basariyi gosterir!

MANOVA

Gruplar farkli mi?

Hipotez testi

Diskriminant

Hangi degiskenler nasil ayirir?

Tahmin/siniflandirma

🤔 MANOVA vs Lojistik vs Diskriminant

MANOVA: Cok degiskenli fark testi

Lojistik: 2 grup, degisken onemliligi (OR)

Diskriminant: 2+ grup, kanonik fonksiyonlar, siniflandirma

⚽ SPOR ORNEGI 1: Futbolda Basarili vs Basarisiz Takim Ayirma

Senaryo: 20 futbol takimini "sampiyonluk yarisindan dusenler" ve "sampiyonluk yarisinda kalanlar" olarak ayirmak istiyoruz.

Degiskenler: Top surme yuzdesi, pas isaberti, sut isabeti, km kosma mesafesi

Diskriminant Fonksiyonu:

D = 0.65 × (pas isabeti) + 0.48 × (sut isabeti) + 0.32 × (km) - 4.2

Nasil Yorumluyoruz?

  • Pas isabeti en buyuk katsayiya sahip (0.65) → Basariyi en cok etkileyen faktor!
  • D degeri pozitifse → Sampiyonluk yarisinda kalir
  • D degeri negatifse → Sampiyonluk yarisindan duser

🏊 SPOR ORNEGI 2: Yuzme Kategorileri Ayirma

Senaryo: Yuzuculeri sprint (50-100m), orta mesafe (200-400m) ve uzun mesafe (800-1500m) kategorilerine ayirmak istiyoruz.

Degiskenler: Kol gucu, bacak gucu, VO2max, vucuttaki yag yuzdesi

Diskriminant Fonksiyonlari:

Fonksiyon 1: D1 = 0.78 × (kol gucu) + 0.55 × (bacak gucu) - 0.25 × (VO2max)

Fonksiyon 2: D2 = 0.15 × (kol gucu) - 0.20 × (bacak gucu) + 0.82 × (VO2max)

Ne Anliyoruz?

  • Fonksiyon 1: Sprint vs uzun mesafe ayirir (guc odakli)
  • Fonksiyon 2: Orta mesafeyi diger kategorilerden ayirir (dayaniklilik odakli)
  • 3 grup oldugu icin 2 fonksiyon var (grup sayisi - 1)

🏋️ SPOR ORNEGI 3: Halter Siklet Sinifi Tahmini

Senaryo: Genc haltercilerin hangi siklet sinifinda en basarili olacagini tahmin etmek istiyoruz.

Gruplar: Hafif siklet (61-73 kg), orta siklet (81-96 kg), agir siklet (102+ kg)

Degiskenler: Boy, kas kutlesi, el kavrama gucu, dikey sicrama

Diskriminant Fonksiyonu:

D = 0.72 × (kas kutlesi) + 0.45 × (boy) + 0.38 × (kavrama gucu)

Pratik Kullanim: Yeni gelen bir sporcunun bu degerleri girilince hangi siklete daha uygun oldugu otomatik hesaplanir!

📈 Kanonik Diskriminant Fonksiyonlari

Lineer Kombinasyon: Degiskenlerin gruplari en iyi ayiran agirlikli toplami.

Diskriminant Fonksiyonu:

D = b₁X₁ + b₂X₂ + ... + bₖXₖ + c

b = diskriminant katsayilari, c = sabit

📋 Ozdeger ve Wilks' Lambda

Ozdeger (Eigenvalue): Fonksiyonun acikladi varyans

Kanonik Korelasyon: Fonksiyon ile grup arasindaki korelasyon

Wilks' Lambda: Fonksiyonun anlamlilik testi (dusuk = iyi)

📊 Fonksiyon Sayisi

Maksimum fonksiyon sayisi = min(degisken sayisi, grup sayisi - 1)

• 2 grup → 1 fonksiyon

• 3 grup → maksimum 2 fonksiyon

🧠 Katsayilarin Yorumu

Ham katsayilar birimlere baglidir (cm vs kg). Degiskenlerin goreli onemini karsilastirmak icin Standartlastirilmis Kanonik Diskriminant Katsayilari kullanilir. Mutlak degeri buyuk olan degisken, ayirma islemine daha fazla katki saglar.

📊 Yapi Matrisi

Degisken Onemliligi: Her degiskenin diskriminant fonksiyonuyla korelasyonu.

📊 Ornek Yapi Matrisi

Degisken Fonksiyon 1 Fonksiyon 2
Dikey Sicrama .85* .21
Sprint .72* .35
Dayaniklilik .28 .81*
Esneklik .15 .69*

* isaretli yukler en yuksek korelasyonu gosterir

Yorum: Fonksiyon 1 "Patlayici Guc" boyutunu temsil ediyor (sicrama, sprint). Fonksiyon 2 "Genel Fitness" boyutunu temsil ediyor (dayaniklilik, esneklik).

⚠️ Pattern vs Structure Matrix

Degiskenler arasinda yuksek korelasyon (multicollinearity) varsa, katsayilar (pattern) kararsiz olabilir. Bu durumda Yapi Matrisi (Structure Matrix) daha guvenilirdir cunku degiskenin fonksiyonla olan basit korelasyonunu gosterir (etkilesimden bagimsiz).

📊 HANGI DEGISKENLER EN COK AYIRIYOR? - YAPI MATRISI OKUMA

Yapi matrisindeki degerler -1 ile +1 arasindadir. Mutlak degeri buyuk olan degisken gruplari en cok ayiran degiskendir!

Deger Araligi Anlami Ornek
0.70 - 1.00 Cok guclu ayirici Boy = 0.85 → Boy gruplar arasinda en belirleyici faktor!
0.40 - 0.69 Orta duzey ayirici Ceviklik = 0.55 → Gruplari ayirmada yardimci
0.00 - 0.39 Zayif ayirici Esneklik = 0.18 → Gruplari pek ayirmiyor

🏀 HANGI DEGISKEN EN COK AYIRIYOR? ORNEK 1: Basketbol Pozisyonlari

Gruplar: Guard, Forward, Center

Yapi Matrisi Sonuclari:

Degisken Fonksiyon 1 Yorum
Boy .92* EN GUCLU AYIRICI! Center'lar uzun, Guard'lar kisa.
Kol Acikligi .78 Boy ile paralel, guclu ayirici
Sicrama .45 Orta duzey ayirici
Ceviklik .62 Guard'lar daha cevik

Sonuc: Basketbolda pozisyonlari en cok BOY ayiriyor! Guard isen kisa, Center isen uzun olma ihtimalin yuksek.

🏊 HANGI DEGISKEN EN COK AYIRIYOR? ORNEK 2: Yuzme Mesafe Kategorileri

Gruplar: Sprint (50-100m), Orta (200-400m), Uzun (800-1500m)

Yapi Matrisi Sonuclari:

Degisken Fonksiyon 1 Fonksiyon 2 Yorum
VO2max .35 .89* Uzun mesafecileri ayiriyor!
Kas Gucu .85* .22 Sprinterleri ayiriyor!
Vucuttaki Yag % -.65 .40 Dusuk yag = sprint basarisi

Sonuc: Fonksiyon 1 (kas gucu) sprint vs uzun mesafeyi, Fonksiyon 2 (VO2max) orta mesafeyi ayiriyor!

🏋️ HANGI DEGISKEN EN COK AYIRIYOR? ORNEK 3: Halter Performans Duzeyleri

Gruplar: Milli Takim, Bolgesel, Amator

Yapi Matrisi Sonuclari:

Degisken Fonksiyon 1 Yorum
Relatif Guc (kg/vucut kg) .94* EN GUCLU AYIRICI! Milli takim sporcularinin relatif gucu cok yuksek.
Teknik Puan .76 Ust duzey sporcular teknik olarak mukemmel
Antrenman Yili .58 Deneyim de onemli ama guc kadar degil
Esneklik .28 Zayif ayirici - gruplar arasi fark az

Sonuc: Halterde basari duzeylerini en cok RELATIF GUC ayiriyor! Vucut agirligina oranla ne kadar guclu oldugun belirleyici.

⚠️ DISKRIMINANT ANALIZI VARSAYIMLARI

MANOVA ile Benzer: Diskriminant analizi, MANOVA ile ayni varsayimlara sahiptir. Ancak siniflandirma icin ek gereksinimler var!
DISKRIMINANT VARSAYIMLARI 1. COK DEGISKENLI NORMALLIK • Mardia testi • Shapiro-Wilk (her DV) • Q-Q plot 2. KOVARYANS HOMOJENLIGI • Box's M testi • p > 0.001 kabul • Hassas test! 3. COKLU BAGINTISIZLIK • |r| < 0.80 • VIF < 5 • Tolerans > 0.2 4. YETERLI ORNEKLEM • n ≥ 20 × degisken • Her grupta ≥ 20 • n > degisken sayisi 💡 MANOVA vs DISKRIMINANT Varsayimlar ayni! Fark: Diskriminant siniflandirma yapar, MANOVA sadece fark testi yapar.

📋 Varsayim Testleri Ozeti

Varsayim Test Kabul Kriteri
Cok Degiskenli Normallik Mardia, Shapiro-Wilk p > 0.05
Kovaryans Homojenligi Box's M p > 0.001 (daha esnek)
Coklu Bagintisizlik Korelasyon, VIF |r| < 0.80, VIF < 5
Orneklem Buyuklugu n sayimi Grup basina ≥ 20

📊 Varsayim 1-2: Normallik ve Kovaryans Homojenligi

Parametrik Varsayimlar: Diskriminant fonksiyonlarinin gecerliligi icin kritik oneme sahip.

📈 Cok Degiskenli Normallik

Her grup icin:

• DV'ler birlikte normal dagilsin

Test: Mardia's test (SPSS'te yok)

Alternatif: Her DV icin Shapiro-Wilk

📊 Kovaryans Homojenligi

Gruplar arasi:

• Kovaryans matrisleri esit

Test: Box's M

p > 0.001 → Varsayim saglanir

📊 Box's M Testi Yorumlama

p = 0.001 IHLAL p < 0.001 VARSAYIM SAGLANIYOR p ≥ 0.001 Box's M hassas bir testtir - p > 0.001 kriteri kullanilir

📋 Normallik Kontrol Adimlari

1. Her grup icin ayri ayri Shapiro-Wilk testi uygula

2. Her DV icin Q-Q plot ciz

3. Carpiklik ve basiklik degerlerini kontrol et (|deger| < 2 kabul edilebilir)

4. n > 30 ise Merkezi Limit Teoremi'ne guvenebilirsiniz

🏃 Spor Ornegi: 3 Pozisyon Karsilastirmasi

DV'ler: Sprint, Ceviklik, Dayaniklilik

Shapiro-Wilk (Sprint): Guard p=.12, Forward p=.08, Center p=.15 → ✓ Hepsi normal

Box's M: M = 28.4, F(12, 8456) = 2.24, p = .008 → ✓ p > 0.001 kabul!

📐 Varsayim 3-4: Coklu Bagintisizlik ve Orneklem

Stabilite Varsayimlari: Diskriminant katsayilarinin guvenilirligi icin gerekli.

🔗 Coklu Bagintisizlik

Problem: Yuksek korelasyonlu DV'ler

Katsayilar kararsiz olur

Kriter: |r| < 0.80

VIF: < 5 (ideal < 3)

👥 Yeterli Orneklem

Minimum: n ≥ 20 × DV sayisi

Her grupta ≥ 20

Ideal: Grup basina ≥ 50

Dengesiz gruplar → Prior olasilik ayarla

📊 VIF (Varyans Sisirme Faktoru) Yorumlama

1-3: Ideal 3-5: Kabul 5-10: Sorunlu >10: Ciddi Problem VIF = 1 / (1 - R²) → Degiskenin digerleriyle aciklanamayan varyansi VIF > 5 ise o degiskeni cikarmayi veya birlestirmeyi dusun

📋 Orneklem Buyuklugu Kurallari

Kural Aciklama Ornek (5 DV, 3 grup)
n ≥ 20 × DV Genel minimum n ≥ 100
Grup basina ≥ DV + 1 Mutlak minimum Her grupta ≥ 6
Grup basina ≥ 20 Guvenilir sonuc icin Toplam ≥ 60
⚠️ Dengesiz Gruplar

Problem: Guard n=50, Forward n=30, Center n=15

Risk: Model cogunluk grubuna yanli olabilir

Cozum: SPSS'te Prior olasiliklari "All groups equal" olarak ayarla

veya en kucuk grubun n'ine gore ornekleme yap

🔧 Varsayim Saglanmazsa Ne Yapmali?

Karar Agaci: Her varsayim ihlali icin sistematik cozum yolu.
DISKRIMINANT ANALIZI 1. NORMALLIK SAGLANIYOR MU? Shapiro-Wilk p > 0.05? Evet ✓ Hayir ✗ n > 30 ise devam et Degilse donusum uygula 2. BOX'S M p > 0.001? Kovaryans homojenligi Evet ✓ Hayir ✗ Separate groups covariance kullan 3. VIF < 5? Coklu bagintisizlik Evet ✓ Hayir ✗ Degisken cikar ANALIZ HAZIR ✓ ALTERNATİF YÖNTEMLER • Lojistik Regresyon (daha esnek varsayımlar) • Random Forest (varsayımsız)

🔄 Robust Alternatifler

2 grup: Lojistik Regresyon

Normallik ihlali: Quadratic DA

Parametrik olmayan: k-NN

📊 Doğrulama

Görünür: Hit rate

Cross-val: Leave-one-out

Karşılaştır: Chance baseline

💡 Sınıflandırma Başarısı Nasıl Değerlendirilir?

Hit Rate: Doğru sınıflandırılan % (örn: %85)

Chance Baseline: Rastgele tahmin başarısı = 1/grup sayısı (3 grup → %33.3)

Kappa: Şansa göre düzeltilmiş başarı (κ > 0.60 iyi)

Not: Hit rate mutlaka chance baseline'ın üzerinde olmalı!

🤖 AI Scout: Sınıflandırma Aracı

Interaktif Uygulama: Diskriminant fonksiyonlari kullanilarak yeni bir adayin hangi spora daha yatkin oldugunu tahmin edelim.

📏 Sporcu Olcumleri

180
60
45

🎯 Tahmin Edilen Brans

?
Olasilik: -
Verileri girin...

🛡️ Model Dogrulama: Cross-Validation

Modelin basarisi ayni veri seti uzerinde test edilirse sonuclar "fazla iyimser" cikabilir. Gercek performans icin Leave-one-out Cross-validation kullanilir: Her seferinde 1 kisi disarida birakilir, model kalanlarla egitilir ve o kisi tahmin edilir.

⚽ Spor Senaryolari

Gercek Hayat Uygulamalari - Varsayim Kontrolleri ile Birlikte

📊 SINIFLANDIRMA DOGRULUGU NEDIR?

Model kac kisiyi dogru gruba yerlestirdi? Bunu anlamak icin Confusion Matrix (Karisiklik Matrisi) kullanilir.

Basit Hesaplama: Dogru Tahmin Sayisi / Toplam Kisi Sayisi × 100

🏃 SINIFLANDIRMA ORNEGI 1: Atletizm Brans Tahmini

Senaryo: 90 atletizm sporcusunu 3 kategoriye ayirdik: Sprinter, Atici, Uzun mesafeci

Sonuc Tablosu:

Gercek Grup Sprinter Tahmini Atici Tahmini Uzun Mesafe Tahmini Toplam
Sprinter 28 2 0 30
Atici 1 27 2 30
Uzun Mesafe 0 3 27 30

Hesaplama: (28 + 27 + 27) / 90 = 82/90 = %91.1 Dogru Siniflandirma!

Chance Baseline: 1/3 = %33.3 → Modelimiz cok basarili!

🏐 SINIFLANDIRMA ORNEGI 2: Voleybol Pozisyon Tahmini

Senaryo: 80 voleybolcuyu Pasör, Smasör, Libero olarak ayirdik.

Sonuclar:

  • Pasorler: 25 kisiden 22'si dogru → %88
  • Smasorler: 35 kisiden 30'u dogru → %86
  • Liberolar: 20 kisiden 18'i dogru → %90

Genel Basari: (22 + 30 + 18) / 80 = %87.5

Onemli Not: Libero grubu en iyi tahmin edildi cunku fiziksel ozellikleri (kisa boy, hizli refleks) diger pozisyonlardan cok farkli!

⚽ SINIFLANDIRMA ORNEGI 3: Futbol Kaleci vs Saha Oyuncusu

Senaryo: 60 futbolcuyu Kaleci ve Saha Oyuncusu olarak ayirdik.

Sonuclar:

Gercek Kaleci Tahmini Saha Tahmini
Kaleci (n=15) 14 1
Saha (n=45) 2 43

Hesaplama: (14 + 43) / 60 = %95 Dogru!

Neden Bu Kadar Yuksek? Kaleciler boy, el acikligi ve refleks testlerinde saha oyuncularindan cok farkli!

🏀 Senaryo: Basketbol Pozisyon Tahmini

Gruplar: Guard (n=40), Forward (n=35), Center (n=25) → Toplam n=100

DV'ler: Boy, agirlik, kol acikligi, sicrama, ceviklik (5 degisken)

Varsayim Test Sonuc Karar
Normallik (Boy) Shapiro-Wilk Guard p=.12, Fwd p=.08, Cnt p=.15 ✓ Saglaniyor
Kovaryans Box's M M=42.3, F=1.89, p=.004 ✓ p > 0.001
Coklu Baginti VIF Tum VIF < 3.5 ✓ Sorun yok
Orneklem n kontrolu En kucuk grup n=25, toplam=100 ✓ Yeterli

Sonuc: 2 anlamli fonksiyon

• Fonksiyon 1: Λ = .24, χ²(10) = 89.2, p < .001 → Boy, Agirlik

• Fonksiyon 2: Λ = .78, χ²(4) = 14.8, p = .005 → Ceviklik, Sicrama

• Dogru siniflandirma: %87.5 (Chance: %33.3)

📊 APA Raporlama

"Varsayim kontrolleri sonucunda cok degiskenli normallik (tum Shapiro-Wilk p > .05) ve kovaryans matrisi homojenligi (Box's M = 42.3, p = .004 > .001) varsayimlarinin karsilandigi gorulmustur. Diskriminant analizi iki anlamli kanonik fonksiyon uretmistir. Ilk fonksiyon (Λ = .24, χ²(10) = 89.2, p < .001) toplam varyansin %78'ini aciklamaktadir. Model, orijinal gruplarin %87.5'ini dogru siniflandirmistir (chance baseline = %33.3)."

🎯 Sinif Ici Aktivite: Sporcu Siniflandirma

Uygulama: Varsayimlari kontrol edip diskriminant analizi planlayin.
📋 Senaryo: Futbol Mevki Tahmini

Amac: Genc futbolcularda fiziksel ozelliklerden mevki tahmini

Gruplar: Kaleci (n=12), Defans (n=28), Ortasaha (n=35), Forvet (n=20)

Toplam: n = 95

DV'ler:

  • Boy (cm)
  • Kilo (kg)
  • Sprint 30m (sn)
  • Yo-Yo IR1 (m)
  • Dikey sicrama (cm)
  • Ceviklik T-test (sn)

Bilinen sorunlar:

• Boy-Kilo korelasyonu r = 0.85

• Kaleci grubunda n = 12 (kucuk)

❓ Sorular

1. Kac tane diskriminant fonksiyonu beklenir? (max = grup - 1)

2. n = 12 olan Kaleci grubu icin ne yapilabilir?

3. Boy-Kilo korelasyonu (r=0.85) sorun mu? Nasil cozulur?

4. Chance baseline yuzde kac olur?

✅ Hafta 26 Ozet ve Quiz

Diskriminant Analizi - Gruplari ayirma ve siniflandirma

📋 Diskriminant Varsayim Kontrol Listesi

Varsayim Test Kabul
Normallik Shapiro-Wilk p > 0.05
Kovaryans Box's M p > 0.001
Coklu Baginti VIF VIF < 5
Orneklem n sayimi Grup basina ≥ 20

Kanonik F.

max = g - 1

Yapi Matrisi

Degisken onemliligi

Hit Rate

> Chance baseline

🧠 Quiz

Soru 1: 4 gruplu analizde maksimum kac fonksiyon?

Soru 2: Box's M p = 0.002 → Varsayim?

Soru 3: VIF = 7.2 → Ne yapmali?

💡 Hatirla!

Diskriminant = MANOVA varsayimlari + Siniflandirma

Hit rate MUTLAKA chance baseline'in uzerinde olmali!

Cross-validation ile gercek performansi kontrol et!

1 / 12