📊 TEMEL İSTATİSTİK DERSLERİ
Hafta 6: Klasik Veri Görselleştirme 1 - Temel Grafikler
Bu Hafta Öğreneceklerimiz:
9 Temel Grafik Türü: Histogram, Bar Chart, Column Chart, Pie Chart, Line Plot, Scatter Plot, Boxplot, Dot Plot, Stem-and-Leaf Plot
Ders sonunda neyi ayirt edeceksiniz?
Karsilastirma
Sutun ve cubuk grafiklerin hangi kategorik sorulari daha hizli cevapladigini goreceksiniz.
Dagilim
Histogram, dot plot ve stem-and-leaf ile verinin yayilim yapisini yorumlayacaksiniz.
Oran ve Trend
Pie ve line grafiklerin ne zaman yararli, ne zaman riskli oldugunu ayirt edeceksiniz.
Iliski ve Ozet
Scatter ve boxplot ile iliski, aykiri deger ve merkez-yayilim ipuclarini okuyacaksiniz.
Akis: Once gorsellestirmenin neden gerekli oldugunu, sonra her grafik turunun hangi soruya cevap verdigini goreceksiniz.
Mobil: Alttaki Onceki/Sonraki butonlarini kullanin, saga-sola kaydirin veya menu dugmesi ile istediginiz slayta gecin.
🧠 Neden Veriyi "Görmeliyiz"?
🎯 Hızlı Karar
Antrenöre 50 sayfa rapor yerine tek grafik verin. "Sol bekte sorun var!" diyecektir.
📈 Örüntü Tespiti
Tabloda gizli kalan trendler, grafikte hemen ortaya çıkar.
Oyuncuların şut yüzdelerini tabloda görseniz karışır. Ama çubuk grafikte "Ali herkesin önünde!" diye hemen anlarsınız.
🧠 Derinlemesine Analiz: Preattentive Processing (Ön-Dikkat İşleme)
Veri görselleştirmenin nörolojik temeli "Preattentive Processing" teorisine dayanır. İnsan beyni, görsel uyaranları (renk, boyut, oryantasyon, yoğunluk) bilinçli bir çaba harcamadan, 200-500 milisaniye içinde işler. Bu, evrimsel bir mirastır (ormanda kırmızı meyveyi veya hareketi fark etmek).
| Görsel Özellik | Algı Süresi | Spor Analitiği Örneği |
|---|---|---|
| Uzunluk / Boyut | ~200 ms | Sütun Grafiği (Kim daha çok koştu?) |
| Renk (Hue) | ~200 ms | Isı Haritası (Sahada yoğunlaşılan bölgeler) |
| Oryantasyon (Eğim) | ~250 ms | Trend Çizgisi (Form grafiği düşüşte mi?) |
Referans: Colin Ware (2004). "Information Visualization: Perception for Design".
📊 Sütun Grafik (Column Chart)
🧠 Temel Kavram: Sütun Grafik Ne Demek?
Düşün ki bir yarışma var ve herkesin puanını duvarda işaretliyorsun. Kim daha yükseğe çıktıysa o kazanmış demek. İşte sütun grafik tam olarak bu! Her çubuğun yüksekliği, o kişinin/takımın değerini gösteriyor.
Neden tablo değil de grafik? Çünkü insan beyni sayıları okumaktan çok, boyutları karşılaştırmakta çok daha hızlı. "Ali 7, Can 9, Efe 6" dersen hesaplaması lazım. Ama grafikte bakarsın: "Can'ın çubuğu en uzun, o birinci!" dersin. 0.5 saniye sürer.
Ne zaman SÜTUN, ne zaman ÇUBUK (Bar)? Basit: Etiketler kısaysa (Ali, Can, Efe) → DİKEY sütun kullan. Etiketler uzunsa (Amerika Birleşik Devletleri, Bosna Hersek) → YATAY çubuk (Bar) kullan ki isimler sığsın!
⚠️ Dikkat: Sütun grafik ile Histogram'ı KARIŞTIRMA! Sütun grafikte çubuklar arasında BOŞLUK var (çünkü Ali ile Can farklı insanlar, aralarında süreklilik yok). Histogram'da çubuklar BİTİŞİK (çünkü 170cm ile 175cm arasında süreklilik var, kesintisiz bir ölçek).
🧪 Akademik Standart: Hata Çubukları (Error Bars)
Bilimsel makalelerde ve üst düzey analizlerde, "Ortalama" değeri tek başına YETERSİZDİR. Ortalamanın ne kadar güvenilir olduğunu göstermek için sütunların üzerine "Hata Çubukları" eklenir. Bu çubuklar genellikle şunları temsil eder:
- Standart Sapma (SD): Verinin yayılımını gösterir (Takım içi değişkenlik).
- Standart Hata (SE): Örneklem ortalamasının, gerçek popülasyon ortalamasına ne kadar yakın olduğunun tahmini.
- Güven Aralığı (%95 CI): Gerçek değerin %95 ihtimalle bulunduğu aralık.
Yorum: İki grubun ortalaması AYNI (yükseklik eşit). Ancak Grup B'nin hata çubuğu çok uzun. Bu, Grup B'deki oyuncuların performanslarının çok dalgalı olduğunu, Grup A'nın ise istikrarlı olduğunu gösterir.
Durum: Sezon bitti. Takımın en golcü 4 oyuncusunu yönetime sunacaksın. İsimler kısa: Ali, Can, Efe, Mert.
Haftalık Gol Sayıları
✅ Yorum: Can açık ara önde. Mert durgun, özel çalışma lazım.
Durum: Antrenör soruyor: Hangi oyuncu ribaundda daha etkili?
Maç Başına Ribaund Ortalaması
✅ Yorum: Pivot beklenen şekilde baskın. Guard için düşük sayı normal.
Durum: Kondisyoner analitiği sunuyor: Hangi gün en ağır antrenman yapıldı?
Günlük Toplam Yük (AU - Arbitrary Units)
✅ Yorum: Salı en yoğun gün. Perşembe toparlanma günü olarak planlanmış.
🎯 Altın Kural: Sütun grafikte Y ekseni SIFIRDAN başlamalıdır! Yoksa küçük farklar abartılı görünür (Yalan grafik!).
📊 Hangi Veri Türü?
- KATEGORİK veriler (isimler, takımlar, mevkiler)
- Az sayıda kategori (2-8 ideal)
- Her kategoride TEK bir sayısal değer
✅ Avantajları
- Karşılaştırma için EN ETKİLİ grafik
- Yükseklik = Değer, sezgisel algı
- Herkes tarafından kolayca anlaşılır
- Renk kodlaması ile zenginleştirilebilir
❌ Dezavantajları
- Çok kategori varsa karışır (10+ sorunlu)
- Uzun etiketler sığmaz (Bar Chart kullan)
- Zaman serisi için uygun değil (Line Plot)
- Y ekseni sıfırdan başlamazsa yanıltır
📉 Çubuk Grafik (Bar Chart)
🧠 Temel Kavram: Bar Chart Ne İşe Yarar?
Bar Chart aslında sütun grafiğin yan yatmış hali. "Peki neden yan yatırıyoruz?" diye sorabilirsin. Cevap basit: Etiketler uzun olduğunda!
Düşün: "Amerika Birleşik Devletleri" veya "Bosna Hersek Cumhuriyeti" yazmaya çalışıyorsun. Sütun grafikte bu isimler X eksenine YATAY sığmaz, ya küçücük yazarsın kimse okuyamaz, ya da 45 derece eğersin boyun ağrısı yapar. Çözüm? Grafiği yan yatır! İsimler sol tarafta satır satır yazılır, uzunlukları sorun olmaz.
Pratik Kural: Etiketin 10+ karakteri varsa → Bar Chart kullan. "Ali, Can, Efe" gibi kısa isimler → Sütun Chart yeterli.
💡 Pro Tip: Bar Chart'ta çubukları değere göre sırala (en büyükten en küçüğe). Böylece hem "birinci kim?" sorusu anında cevaplanır, hem de grafik daha profesyonel görünür. Rastgele sıralı bar chart = amatör iş!
🧩 İleri Teknik: Gruplanmış vs. Yığılmış (Grouped vs. Stacked)
Veriyi daha derinlemesine analiz ederken, tek bir kategori yetmez. Örneğin, sadece "Toplam Gol" değil, "İç Saha Golü" ve "Dış Saha Golü"nü aynı anda göstermek istersiniz. İşte burada iki yol ayrımı vardır:
| Grafik Türü | Ne Zaman Kullanılır? | Spor Örneği |
|---|---|---|
| Gruplanmış (Grouped) | Kategorileri tek tek karşılaştırmak için. | Ronaldo vs Messi: Hem gol, hem asist sayılarını yan yana sütunlarla göstermek. |
| Yığılmış (Stacked) | Parça-Bütün ilişkisini ve toplamı görmek için. | Takımın Toplam Golü: Penaltı, frikik ve akan oyun gollerini üst üste yığarak toplamı vurgulamak. |
Tasarım Notu: Yığılmış grafikte parçaları karşılaştırmak zordur (taban çizgileri farklı olduğu için). Eğer odak "karşılaştırma" ise Gruplanmış kullanın!
Durum: Paris 2024 madalya sıralamasını sunuyorsun. Ülke isimleri uzun!
Toplam Madalya Sayısı
✅ Uzun ülke isimleri rahatça okunuyor! Sütun grafikte boyun bükülürdü.
Durum: Futbolcu isimleri + takım bilgisi uzun metin oluşturuyor.
En Çok Asist Yapan 5 Oyuncu
Durum: Sezon boyunca en sık görülen sakatlık türleri neler?
Sezon Sakatlık Dağılımı (n=45)
✅ Hamstring sakatlıkları açık ara önde → Önleyici antrenman programı oluşturulmalı!
💡 İpucu: Bar Chart'ta çubukları değere göre sıralamak (büyükten küçüğe) karşılaştırmayı kolaylaştırır.
SEMBOL ve KAVRAM ACIKLAMA TABLOSU - Cubuk Grafik (Bar Chart)
| Sembol / Kavram | Ne Demek? | Basit Aciklama |
|---|---|---|
| Yatay Cubuk | Her kategoriyi temsil eden yatay dikdortgen | Cubuk ne kadar UZUN ise, deger o kadar BUYUK demek. Yatay oldugu icin uzun isimler rahat okunur. |
| X Ekseni (Yatay) | Sayisal degerlerin yazildigi eksen | Cubuklarin uzunlugunu olctugun cetvel gibi dusun. 0'dan baslar, saga dogru artar. |
| Y Ekseni (Dikey) | Kategorilerin (isimlerin) yazildigi eksen | Her satir bir kategori. Ornegin: "Turkiye", "Almanya", "Fransa" gibi ulke isimleri bu eksende yer alir. |
| Cubuklar Arasi Bosluk | Kategorilerin birbirinden FARKLI oldugunu gosterir | Bosluk = "Bunlar ayri seyler" demek. Histogram'da bosluk OLMAZ cunku orada sureklilik var. |
| Siralama | Cubuklari buyukten kucuge veya kucukten buyuge dizmek | En uzun cubuk ustte veya altta olur. Boylece "birinci kim?" sorusu hemen cevaplanir. |
SOMUT SPOR ORNEKLERI - Cubuk Grafik Nasil Olusturulur?
ORNEK 1: Futbol - Super Lig Takimlarinin Gol Sayilari
Senaryo: Sezon sonu 5 takimin toplam gol sayisini karsilastirmak istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → Galatasaray: 85 gol, Fenerbahce: 78 gol, Besiktas: 72 gol, Trabzonspor: 65 gol, Basaksehir: 58 gol
Adim 2: Y eksenine takim isimlerini yaz (uzun isimler oldugu icin YATAY cubuk seciyoruz!)
Adim 3: X eksenini 0'dan 100'e kadar numaralandir
Adim 4: Her takim icin gol sayisi kadar uzunlukta yatay cubuk ciz
Adim 5: Cubuklari buyukten kucuge sirala (Galatasaray en ustte)
Adim 6: Her cubugun ucuna sayisal degeri yaz (85, 78, 72...)
YORUM: Galatasaray en golcu takim. Basaksehir ile aradaki 27 gollik fark hemen goze carpiyor!
ORNEK 2: Yuzme - Kuluplerin Madalya Sayilari
Senaryo: Turkiye Sampiyonasinda 4 kulubun kazandigi madalya sayisini gostermek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → Galatasaray Yuzme: 24 madalya, Fenerbahce Yuzme: 18 madalya, Atasehir Yuzme Kulubu: 15 madalya, Bursa Buyuksehir SK: 12 madalya
Adim 2: Kulup isimleri UZUN oldugu icin Bar Chart (yatay) seciyoruz
Adim 3: Y eksenine kulup isimlerini alt alta yaz
Adim 4: X eksenini 0'dan 30'a kadar numaralandir (en buyuk deger 24)
Adim 5: Her kulup icin madalya sayisi kadar cubuk ciz
Adim 6: Farkli renkler kullanabilirsin (altin=sari, gumus=gri, bronz=kahve)
YORUM: Galatasaray Yuzme acik ara lider. Uzun kulup isimleri yatay grafikte rahat okunuyor!
ORNEK 3: Halter - Ulkelerin Dunya Sampiyonasi Basarilari
Senaryo: Son Dunya Sampiyonasinda ulkelerin aldigi altin madalya sayisini gostermek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → Cin Halk Cumhuriyeti: 12 altin, Kuzey Kore: 8 altin, Gurcistan Cumhuriyeti: 5 altin, Turkiye Cumhuriyeti: 4 altin, Kolombiya: 3 altin
Adim 2: Ulke isimleri uzun ("Cin Halk Cumhuriyeti") → Bar Chart (yatay) SART!
Adim 3: Y eksenine ulke isimlerini tam olarak yaz
Adim 4: X eksenini 0'dan 15'e kadar numaralandir
Adim 5: Her ulke icin altin madalya sayisi kadar cubuk ciz
Adim 6: Cubuklari buyukten kucuge sirala (Cin en ustte, Kolombiya en altta)
YORUM: Cin halterde dunya lideri. Turkiye 4 altinla 4. sirada - iyi bir performans!
📊 Hangi Veri Türü?
- KATEGORİK veriler (uzun isimli)
- Sıralama/Ranking gösterimi
- Çok sayıda kategori (10+ bile olabilir)
✅ Avantajları
- Uzun etiketler rahat okunur
- Çok kategori sığdırılabilir
- Sıralama görselleştirmesinde ideal
- Mobil cihazlarda da iyi görünür
❌ Dezavantajları
- Yatay yer fazla kaplar
- Negatif değerler karışık görünür
- Zaman serisi için uygun değil
- Etiketler kısaysa sütun tercih edilmeli
📊 Histogram: Dağılımın Röntgeni
🧠 Temel Kavram: Histogram Nedir ve Ne İşe Yarar?
Histogram, bir grubun "genel durumunu" gösterir. "Ortalama boy 180cm" demek bir şey anlatır ama "Çoğunluk nerede yığılmış? Çok uzun veya çok kısa var mı? Dağılım simetrik mi?" sorularına cevap vermez. İşte histogram tam bunu gösterir!
Nasıl çalışır? Verileri "kutulara" (bin) bölersin. Örneğin: 160-170cm, 170-180cm, 180-190cm... Sonra her kutuya kaç kişi düştüğünü sayarsın. En dolgun kutu = en yoğun aralık (mod).
Sütun grafikten FARKI ne? Sütun grafikte "Ali, Can, Efe" gibi ayrık kategoriler var. Ali ile Can arasında "yarım Ali" olmaz! Ama boyda 175cm ile 180cm arasında 176, 177, 178, 179 var. Bu süreklilik yüzünden histogram çubukları BİTİŞİK çizilir.
Gerçek hayat örneği: 500 öğrenci sınava girdi. "Ortalama 65 puan" deyince kimse bir şey anlamaz. Ama histogram gösterirsen: "Aha, 50-60 arası yığılmış, birkaç kişi 90+ almış, bimodal dağılım var!" dersin.
⚠️ Kritik Uyarı - Bin Genişliği: Histogram'da kutu (bin) genişliğini SEN seçersin ve bu seçim grafiğin görünümünü tamamen değiştirir! Çok geniş bin = detay kaybolur, çok dar bin = gürültü artar. Genel kural: √n (örneklem büyüklüğünün karekökü) kadar bin kullan. 100 veri varsa ~10 bin.
📐 Metodoloji: İdeal "Bin" Sayısı Nasıl Bulunur?
Histogram çizerken kafanıza göre aralık belirleyemezsiniz. Akademik çalışmalarda kullanılan formüller vardır:
- Karekök Kuralı: \( k = \sqrt{n} \) (Basit ve hızlı, küçük veriler için).
- Sturges Kuralı: \( k = 1 + \log_2(n) \) (Veri normal dağılıma yakınsa ideal).
- Freedman-Diaconis Kuralı: \( \text{Bin Genişliği} = 2 \times \frac{IQR}{\sqrt[3]{n}} \) (Aykırı değerlere karşı en dirençli ve bilimsel olanı).
📉 Dağılım Şekilleri (Skewness)
Durum: 500 çocuk geldi. Antrenör soruyor: "Gelenler hangi boy aralığında yoğunlaşmış? Çok kısa veya çok uzun var mı?"
Boy Dağılımı (n=500)
✅ Yorum: Çoğunluk 175-185cm bandında. Sağda (200+) tek başına duran "dev" aday var!
Durum: Atletizm takımında 50 sporcunun 100m dereceleri. Performans dağılımı nasıl?
100m Süreleri (saniye)
✅ Yorum: Çoğunluk 11.0-11.5 sn bandında. 10.0-10.5 sn'de sadece 3 elit sporcu var.
Durum: GPS verileriyle takımın haftalık toplam koşu mesafeleri analiz ediliyor.
Haftalık Koşu Mesafesi (km)
🔑 Histogram Okuma İpuçları
- Mod: En yüksek çubuğun olduğu aralık (yığılma noktası).
- Çarpıklık: Kuyruk sağa uzanıyorsa "sağa çarpık", sola uzanıyorsa "sola çarpık".
- Aykırılar: Ana gruptan ayrı duran küçük çubuklar (uç değerler).
SEMBOL ve KAVRAM ACIKLAMA TABLOSU - Histogram
| Sembol / Kavram | Ne Demek? | Basit Aciklama |
|---|---|---|
| Bitisik Cubuklar | Cubuklar arasinda bosluk YOK | 170cm ile 175cm arasinda bosluk yok, sureklilik var. Bu yuzden cubuklar yapisik ciziyor. |
| Bin (Kutu/Aralik) | Verileri grupladgin aralik | Ornegin "170-175cm" bir bin. Bu araliga kac kisi dusuyorsa cubuk o kadar yuksek olur. |
| X Ekseni | Olctugun degiskenin araliklari | Boy histograminda: 160, 165, 170, 175... gibi araliklar X ekseninde siralanir. |
| Y Ekseni (Frekans) | Her aralikta KAC KISI/GOZLEM oldugunu gosterir | Cubuk yuksekligi = o aralikta kac kisi var. Yuksek cubuk = cok kisi yigilmis demek. |
| Mod (Tepe Noktasi) | En yuksek cubugun bulundugu aralik | En cok kisinin toplandigi yer. Ornegin "cogunluk 175-180cm arasinda" demek mod orada demek. |
| Carpiklik (Skewness) | Dagilimin simetrik olup olmadigi | Kuyruk saga uzaniyorsa "saga carpik", sola uzaniyorsa "sola carpik". Simetrikse normal dagilim. |
SOMUT SPOR ORNEKLERI - Histogram Nasil Olusturulur?
ORNEK 1: Basketbol - Altyapi Oyuncularinin Boy Dagilimi
Senaryo: U16 secmelerine 200 cocuk geldi. Antrenor soruyor: "Gelenler hangi boy araliginda yogunlasmis?"
ADIM ADIM YAPILISI:
Adim 1: 200 cocugun boyunu olc ve kaydet (ornegin: 165, 172, 178, 181, 169...)
Adim 2: Boy araligini belirle: En kisa 155cm, en uzun 205cm
Adim 3: Bin (kutu) genisligine karar ver: 5cm'lik araliklar (155-160, 160-165, 165-170...)
Adim 4: Her aralikta kac kisi oldugunu say: 155-160: 8 kisi, 160-165: 22 kisi, 165-170: 45 kisi...
Adim 5: X eksenine araliklari, Y eksenine kisi sayisini yaz
Adim 6: Her aralik icin BITISIK cubuklar ciz (arada bosluk OLMAMALI!)
YORUM: 170-180cm arasinda yigilma var (mod). 200cm ustu sadece 3 kisi - bunlar potansiyel pivotlar!
ORNEK 2: Atletizm - 100 Metre Dereceleri Dagilimi
Senaryo: 80 sporcunun 100m derecelerini analiz ediyorsun. Performans dagilimi nasil?
ADIM ADIM YAPILISI:
Adim 1: 80 sporcunun 100m derecesini kaydet (10.5sn, 11.2sn, 11.8sn, 12.1sn...)
Adim 2: Aralik belirle: En hizli 10.2sn, en yavas 13.5sn
Adim 3: Bin genisligi sec: 0.5 saniyelik araliklar (10.0-10.5, 10.5-11.0, 11.0-11.5...)
Adim 4: Her aralikta kac sporcu oldugunu say
Adim 5: X eksenine sure araliklarini yaz (10.0, 10.5, 11.0...)
Adim 6: Bitisik cubuklar ciz - en yuksek cubuk = en kalabalik performans bandini gosterir
YORUM: Cogunluk 11.0-11.5sn bandinda. 10.5sn alti sadece 5 kisi = bunlar elit seviye!
ORNEK 3: Voleybol - Dikey Sicrema Degerleri Dagilimi
Senaryo: Milli takim adaylarinin dikey sicrema testi sonuclarini gorsellestirmek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: 60 sporcunun dikey sicrema degerini kaydet (45cm, 52cm, 58cm, 62cm...)
Adim 2: Aralik belirle: En dusuk 38cm, en yuksek 72cm
Adim 3: Bin genisligi: 5cm araliklar (35-40, 40-45, 45-50, 50-55...)
Adim 4: Her araliga dusen sporcu sayisini hesapla
Adim 5: X ekseninde sicrema araliklari, Y ekseninde sporcu sayisi
Adim 6: Bitisik cubuklar ciz - dagilimin seklini incele (normal mi, carpik mi?)
YORUM: 50-60cm arasinda normal dagilim gorulur. 65cm ustu = elit sicreyiciler, ozel antrenman programina alinabilir.
📊 Hangi Veri Türü?
- SÜREKLİ (nicel) veriler
- Boy, ağırlık, süre, mesafe
- Büyük veri setleri (n > 30)
- Dağılım şeklini görmek için
✅ Avantajları
- Dağılımın ŞEKLİNİ gösterir
- Mod, çarpıklık, aykırıları ortaya koyar
- Büyük veri setlerini özetler
- Normal dağılım kontrolü için ideal
❌ Dezavantajları
- Bin (aralık) seçimi sonucu değiştirir
- Az veri ile anlamsız (n < 30)
- Kategorik veri için UYGUN DEĞİL
- Kesin değerleri gizler
🥧 Pasta Grafik (Pie Chart)
🧠 Temel Kavram: Pasta Grafik Ne Zaman Kullanılır?
Pasta grafik, "bütünün parçalara nasıl bölündüğünü" gösterir. "Toplam 100 TL'nin 60 TL'si maaşlara, 30 TL'si tesise gitti" gibi durumlarda kullanılır. Buradaki kritik nokta: Parçaların toplamı mutlaka %100 olmalı!
Neden dikkatli kullanmalıyız? Çünkü insan gözü açıları karşılaştırmakta ÇOK KÖTÜ. İki dikdörtgenin hangisinin daha uzun olduğunu anında söylersin. Ama iki dilimin hangisinin daha geniş olduğunu? Beyin zorlanır, yanlış anlar. %27 ile %29'u ayırt edemezsin.
Gerçek hayat örneği: "Antrenman süremizin %60'ı güç, %30'u sürat, %10'u esneklik" dersen 3 dilimlik güzel bir pasta yaparsın. Ama "8 farklı antrenman türümüzün yüzdeleri..." dersen kaos çıkar!
Altın kural: 5'ten FAZLA dilim varsa → Bar Chart kullan, pasta grafik kullanma!
🚨 EN BÜYÜK HATA: Sunumlarda "havalı görünsün" diye 3D pasta grafik yapmak! 3D perspektif, öndeki dilimleri arkadakilerden BÜYÜK gösterir. Bu optik illüzyon = YALAN grafik demek. PowerPoint'teki 3D seçeneğine ASLA dokunma!
Durum: Yönetim kuruluna bütçenin 3 ana kalemini sunuyorsun.
■ %60 Oyuncu Maaşları
■ %30 Tesis & Altyapı
■ %10 Diğer
✅ 3 dilim, farklar belirgin. Pasta burada anlamlı!
Durum: 8 farklı harcama kalemi göstermek istiyorsun.
■ %18 Maaş
■ %15 Transfer
■ %12 Prim
■ %10 Seyahat
■ %13 Tesis
■ %10 Pazarlama
■ %10 Ekipman
■ %12 Diğer
❌ 8 dilim! %12 ile %13 gözle karşılaştırılamaz. Bar chart kullan!
Durum: Elit sporcunun 24 saati nasıl geçiyor? (Sadece 4 ana kategori)
■ %33 Uyku (8 saat)
■ %25 Antrenman (6 saat)
■ %17 Beslenme & Toparlanma
■ %25 Boş Zaman & Diğer
⚠️ Pasta Grafiğin 3 Altın Kuralı:
- Maksimum 4-5 dilim kullan
- Dilimler arasında en az %10 fark olsun
- 3D pasta GRAFİĞİ ASLA kullanma (perspektif yanıltır!)
📊 Alternatif Vizyon: Waffle Chart (Gofret Grafik)
Edward Tufte'nin "Data-Ink Ratio" prensibine göre, pasta grafik genellikle "mürekkep israfıdır". Merkezi boş, kenarları belirsizdir. Modern veri biliminde (özellikle Github katkı haritası gibi alanlarda) Waffle Chart daha üstün kabul edilir.
Neden? Çünkü kareleri saymak, açıları tahmin etmekten daha kolaydır!
%60 Maaş (60 Kare)
%30 Tesis (30 Kare)
%10 Diğer (10 Kare)
SEMBOL ve KAVRAM ACIKLAMA TABLOSU - Pasta Grafik (Pie Chart)
| Sembol / Kavram | Ne Demek? | Basit Aciklama |
|---|---|---|
| Dilim (Slice) | Her kategoriyi temsil eden pasta parcasi | Dilim ne kadar GENIS ise, o kategorinin payi o kadar BUYUK demek. Her dilim farkli renkle gosterilir. |
| %100 Kurali | Tum dilimlerin toplami %100 olmali | Pasta = BUTUN demek. %60 + %30 + %10 = %100. Eger toplam 100 degilse pasta grafik kullanilamaz! |
| Aci (Derece) | Dilimin buyuklugunu belirleyen olcu | 360 derece = %100. %50 = 180 derece (yarim daire). %25 = 90 derece (ceyrek daire). |
| Renk Kodlamasi | Her dilimin farkli renkle gosterilmesi | Renkler birbirinden cok farkli secilmeli. Yesil-mavi gibi yakin renkler karistirabilir. |
| Etiket/Lejant | Hangi rengin neyi temsil ettigini gosteren aciklama | Grafigin yaninda veya altinda "Mavi = Maas, Turuncu = Tesis" gibi aciklamalar olmali. |
| 3D = TEHLIKE! | Uc boyutlu pasta grafik yanilticidir | 3D perspektif ondeki dilimi arkadakinden BUYUK gosterir. Bu optik yanilsama = yalan grafik! |
SOMUT SPOR ORNEKLERI - Pasta Grafik Nasil Olusturulur?
ORNEK 1: Futbol - Takimin Gol Dagilimi
Senaryo: Bu sezon atilan 60 golun hangi yontemlerle atildigini gostermek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → Akan Oyun: 36 gol (%60), Duran Top: 15 gol (%25), Penalti: 9 gol (%15)
Adim 2: Toplami kontrol et: 36+15+9 = 60 gol ve %60+%25+%15 = %100 (tamam!)
Adim 3: Sadece 3 kategori var = Pasta grafik kullanilabilir
Adim 4: Her kategori icin dilim acisini hesapla: %60 = 216 derece, %25 = 90 derece, %15 = 54 derece
Adim 5: Farkli renkler sec: Akan oyun = mavi, Duran top = turuncu, Penalti = gri
Adim 6: Her dilimin ustune veya yanina yuzdeyi yaz (%60, %25, %15)
YORUM: Akan oyundan gelen goller baskinda (%60). Takim iyi pozisyon uretiyor demek!
ORNEK 2: Basketbol - Mac Suresi Kullaniminin Dagilimi
Senaryo: Bir oyuncunun mac suresinin yuzde kacini sahada, yuzde kacini yedek kulubesi'nde gecirdigini gostermek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → Sahada: 28 dakika (%70), Yedek: 12 dakika (%30). Toplam: 40 dakika (%100)
Adim 2: Sadece 2 kategori = Pasta grafik icin ideal!
Adim 3: Dilim acilari: %70 = 252 derece, %30 = 108 derece
Adim 4: Renkler sec: Sahada = yesil (aktif), Yedek = gri (pasif)
Adim 5: Buyuk dilim (yesil) gozde hemen carpar - oyuncu cok oynuyor
Adim 6: Lejant ekle ve yuzdeleri dilim ustune yaz
YORUM: Oyuncu macin %70'inde sahada = ana kadro oyuncusu, cok degerli!
ORNEK 3: Halter - Antrenman Icerigi Dagilimi
Senaryo: Bir haltercinin haftalik antrenman suresinin nasil dagitildigini gostermek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → Klasik Hareketler (Koparma-Silkme): 6 saat (%50), Guc Antrenmani: 3 saat (%25), Teknik Calisma: 2 saat (%17), Esneklik: 1 saat (%8)
Adim 2: Toplam: 12 saat = %100 (tamam!). 4 kategori var = pasta grafik uygun
Adim 3: Dilim acilari: %50 = 180 derece, %25 = 90 derece, %17 = 61 derece, %8 = 29 derece
Adim 4: Renkler: Klasik = kirmizi, Guc = mavi, Teknik = yesil, Esneklik = sari
Adim 5: En buyuk dilim (klasik hareketler) en dikkat cekici olacak
Adim 6: Her dilime isim ve yuzde yaz. Lejant ekle.
YORUM: Klasik hareketlere en cok zaman ayriliyor (%50). Esneklik dusuk (%8) - arttirilabilir!
📊 Hangi Veri Türü?
- PARÇA-BÜTÜN ilişkisi
- Yüzdelikler (toplamı %100)
- Az kategori (2-5 ideal)
- Bütçe, zaman, pazar payı
✅ Avantajları
- Parça-bütün ilişkisi NET görünür
- Sezgisel, herkes anlar
- Baskın kategoriyi vurgular
- Sunumlarda dikkat çeker
❌ Dezavantajları
- Açıları karşılaştırmak ZOR
- 5+ dilim = kaos
- Kesin değerleri göstermez
- 3D versiyonu yanıltıcı
📈 Çizgi Grafik (Line Plot)
🧠 Temel Kavram: Çizgi Grafik Ne Anlatır?
Çizgi grafik "bir şeyin zaman içinde nasıl değiştiğini" gösterir. X ekseninde zaman (gün, hafta, ay) olur, Y ekseninde ölçülen değer (nabız, gol sayısı, ağırlık) olur. Noktalar çizgiyle birbirine bağlanır.
Çizginin EĞİMİ ne anlatır? Çizgi yukarı çıkıyorsa = artış var, aşağı iniyorsa = azalış var, dalgalanıyorsa = değişkenlik var. Çizgi ne kadar DİK ise, değişim o kadar HIZLI demek.
Neden noktaları birleştiriyoruz? Çünkü kronolojik sıra var! "Ocak'tan Şubat'a geçiş" mantıklıdır, arada süreklilik var. Ama "Ali'den Can'a geçiş" mantıksızdır - o yüzden sütun grafikte noktaları birleştirmeyiz.
Gerçek hayat örneği: Bir sporcunun 8 haftalık kilo takibi. Çizgi aşağı iniyorsa kilo veriyor demek. Dalgalanma varsa beslenme tutarsız demek. Düz çizgi ise plato (takılma) döneminde demek!
⚠️ Dikkat - Spagetti Grafiği: Çizgi grafiğe çok fazla seri (çizgi) koyarsan "spagetti grafiği" olur, hiç kimse bir şey anlamaz. Kural: Maksimum 4-5 çizgi. Daha fazlası varsa grafikleri ayır veya etkileşimli görselleştirme kullan.
🔍 Derinlemesine Analiz: Çizgi Nasıl Birleşsin?
Noktaları birleştirmenin tek yolu "dümdüz çizgi" (Linear) değildir. Verinin doğasına göre seçim yapmalısınız:
- Linear (Doğrusal): En güvenlisi. Noktaları en kısa yoldan birleştirir.
- Spline (Kıvrımlı): Yumuşak geçişler sağlar. Doğal süreçler (nabız, sıcaklık) için uygundur ama veriyi olduğundan "pürüzsüz" gösterebilir.
- Step (Basamaklı): Değer ANİDEN değişiyorsa (örn: faiz oranı, oyuncu değişikliği sayısı) kullanılır.
⚠️ Çift Eksen (Dual Axis) Tehlikesi
Bazen "Antrenman Süresi (dk)" ile "Yorgunluk Skoru (1-10)"nu aynı grafikte göstermek istersiniz.
Biri solda, biri sağda iki Y ekseni kullanırsınız.
Risk: Ölçekleri keyfi değiştirerek iki çizgi arasında olmayan bir
ilişki yaratabilirsiniz (Spurious Correlation).
Akademik dünyada bu tür grafiklere şüpheyle yaklaşılır!
Durum: Yarış bitiminde sporcu 180 bpm'de. 5 dakikada ne kadar düştü?
Nabız Değişimi (Yarış Sonrası 5 Dakika)
✅ Yorum: Eğimin dikliği = Toparlanma hızı. Bu sporcu iyi formda!
Durum: Forvet oyuncusu sezonun hangi döneminde en golcü?
Aylık Gol Sayısı (Sezon Boyunca)
✅ Yorum: Kasım ayında zirve yapmış (8 gol). Kış molası sonrası düşüş var, baharda toparlıyor.
Durum: Sakatlık riski için antrenman yükünün haftalık seyri takip ediliyor.
8 Haftalık Antrenman Yükü (ACWR Takibi)
✅ Yorum: 5. haftada tehlikeli bölgeye çıkmış (sakatlık riski!). Kondisyoner yükü düşürmeli.
SEMBOL ve KAVRAM ACIKLAMA TABLOSU - Cizgi Grafik (Line Chart)
| Sembol / Kavram | Ne Demek? | Basit Aciklama |
|---|---|---|
| X Ekseni (Zaman) | Genellikle zamani gosterir (gun, hafta, ay) | Soldan saga gidildikce zaman ilerler. Ocak solda, Aralik sagda olur. |
| Y Ekseni (Deger) | Olculen degiskenin degeri | Asagidan yukariya artar. Nabiz, kilo, gol sayisi gibi degerler burada gosterilir. |
| Cizgi (Trend) | Noktalari birbirine baglayan hat | Yukari cikiyorsa = ARTIS, asagi iniyorsa = AZALIS, duz ise = DEGISIM YOK. |
| Egim (Slope) | Cizginin diklik derecesi | Cizgi ne kadar DIK ise, degisim o kadar HIZLI demek. Yatik cizgi = yavas degisim. |
| Zirve (Peak) | Cizginin en yuksek noktasi | En iyi performansin veya en yuksek degerin oldugu an. "Forvetimiz Kasim'da zirve yapti!" |
| Dip (Trough) | Cizginin en dusuk noktasi | En kotu performansin veya en dusuk degerin oldugu an. "Subat'ta dibe vurdu!" |
| Dalgalanma | Cizginin inip cikmasi | Cok dalgalanma = TUTARSIZLIK demek. Duz cizgi = ISTIKRAR demek. |
SOMUT SPOR ORNEKLERI - Cizgi Grafik Nasil Olusturulur?
ORNEK 1: Yuzme - 100m Serbest Derecesinin Haftalik Takibi
Senaryo: Bir yuzucunun 8 haftalik antrenman donemi boyunca 100m serbest derecesini izlemek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → Hafta 1: 58.5sn, Hafta 2: 57.8sn, Hafta 3: 57.2sn, Hafta 4: 56.9sn, Hafta 5: 57.3sn (sakatlık), Hafta 6: 56.5sn, Hafta 7: 55.8sn, Hafta 8: 55.2sn
Adim 2: X eksenine haftalari yaz (1, 2, 3, 4, 5, 6, 7, 8)
Adim 3: Y eksenine sure araligini yaz (54sn - 60sn arasi)
Adim 4: Her hafta icin bir nokta koy (ornegin Hafta 1'de 58.5sn yuksekliginde)
Adim 5: Noktalari cizgi ile bagla - kronolojik sirada!
Adim 6: Onemli noktalari isaretle (Hafta 5'teki sakatlık gibi)
YORUM: Genel trend asagi (iyilesme). Hafta 5'te hafif yukselis var (sakatlık etkisi). Son hafta en iyi derece!
ORNEK 2: Futbol - Sezon Boyunca Aylik Gol Sayisi
Senaryo: Bir forvetin sezon boyunca aylik gol performansini gorsellestirmek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → Agustos: 2 gol, Eylul: 3 gol, Ekim: 5 gol, Kasim: 7 gol (zirve!), Aralik: 4 gol, Ocak: 3 gol (kis molasi), Subat: 4 gol, Mart: 5 gol, Nisan: 6 gol, Mayis: 5 gol
Adim 2: X eksenine aylari sirasyla yaz (Agu - May)
Adim 3: Y eksenini 0'dan 8'e kadar numaralandir
Adim 4: Her ay icin gol sayisi kadar yukseklikte nokta koy
Adim 5: Noktalari cizgiyle bagla
Adim 6: Zirve noktasini (Kasim) ve dip noktasini (Agustos) ozellikle isaretle
YORUM: Kasim'da zirve (7 gol). Kis molasi sonrasi dusus var. Bahar'da tekrar yukselis trendi!
ORNEK 3: Atletizm - Maratoncu Kalp Atim Hizi Toparlanmasi
Senaryo: Yaris bitiminde sporcunun kalp atim hizinin 5 dakika icinde nasil dusugunu gostermek istiyorsun.
ADIM ADIM YAPILISI:
Adim 1: Verileri topla → 0. dakika: 185 bpm, 1. dakika: 165 bpm, 2. dakika: 145 bpm, 3. dakika: 130 bpm, 4. dakika: 118 bpm, 5. dakika: 108 bpm
Adim 2: X eksenine dakikalari yaz (0, 1, 2, 3, 4, 5)
Adim 3: Y eksenini 100-200 bpm arasi olarak ayarla
Adim 4: Her dakika icin nabiz degerini nokta olarak koy
Adim 5: Noktalari cizgiyle bagla - dusus egimini goster
Adim 6: Ilk 2 dakikadaki dik dusus = hizli toparlanma isaretini koy
YORUM: Ilk 2 dakikada hizli dusus (40 bpm) = iyi kardiyovaskuler fitness. 5 dakikada 77 bpm dusus = elit toparlanma!
📊 Hangi Veri Türü?
- ZAMAN SERİSİ verileri
- Trend ve değişim analizi
- Kronolojik sıralı veriler
- Nabız, sıcaklık, performans takibi
✅ Avantajları
- Trend ve değişimi NET gösterir
- Birden fazla seri karşılaştırılabilir
- Zirve ve dip noktaları görünür
- Tahmin (extrapolation) için uygun
❌ Dezavantajları
- Çok seri = spagetti grafiği
- Kesikli veri için uygun değil
- Y ekseni kesilerek yanıltılabilir
- Karşılaştırma için bar daha iyi
⚫ Saçılım Diyagramı (Scatter Plot)
🧠 Temel Kavram: Scatter Plot Ne Gösterir?
Scatter plot "iki şey arasında ilişki var mı?" sorusunu cevaplar. X eksenine bir değişken (örn: antrenman süresi), Y eksenine başka bir değişken (örn: koşu hızı) koyarsın. Her kişi/gözlem bir NOKTA olur.
Noktalar nasıl yorumlanır?
→ Noktalar sol alttan sağ üste doğru gidiyorsa = POZİTİF korelasyon (biri artınca
diğeri de artar)
→ Noktalar sol üstten sağ alta doğru gidiyorsa = NEGATİF korelasyon (biri artınca
diğeri azalır)
→ Noktalar rastgele dağılmışsa = Korelasyon YOK (ikisi alakasız)
Gerçek hayat örneği: "Daha uzun boylu basketbolcular daha mı çok ribaund alıyor?" X eksenine boy, Y eksenine ribaund koyarsın. Noktalar yukarı doğru eğilim gösteriyorsa EVET demek!
Korelasyon ne kadar güçlü? Noktalar çizgiye ne kadar YAKIN durursa, ilişki o kadar güçlü. Saçılım çok genişse ilişki zayıf veya yok demek.
🚨 ÇOK ÖNEMLİ UYARI: Korelasyon ≠ Nedensellik! Scatter plot'ta güçlü bir ilişki göresen bile "A, B'ye neden olur" diyemezsin. Belki ikisini de etkileyen ÜÇÜNCÜ bir şey vardır. Örnek: Dondurma satışları ↑ boğulma vakaları ↑ demek dondurma boğduruyor demek DEĞİL! İkisi de sıcak havadan etkileniyor!
📐 İstatistiksel Derinlik: \( R^2 \) Değeri
Saçılım diyagramına baktınız, "ilişki var gibi" dediniz. Bilimsel olarak bu "gibi" yetmez. Bunu ölçmek için Korelasyon Katsayısı (r) ve Belirlilik Katsayısı (\( R^2 \)) kullanılır.
| Metrik | Anlamı | Spor Örneği |
|---|---|---|
| r (Pearson) | İlişkinin YÖNÜ ve GÜCÜ (-1 ile +1 arası). | r = 0.85 (Boy uzadıkça ribaund artıyor, güçlü ilişki). |
| \( R^2 \) | Bağımlı değişkendeki varyansın ne kadarının açıklandığı (%0 - %100). | \( R^2 = 0.72 \) → "Ribaund başarısının %72'si boy uzunluğu ile açıklanabilir. Kalan %28 zıplama, pozisyon alma vb." |
Durum: Daha çok antrenman yapan daha mı hızlı koşuyor?
Negatif Korelasyon (-)
Yorum: Sağa gittikçe AŞAĞI → NEGATİF korelasyon
Çok antrenman = Kısa süre = Hızlı!
Durum: Uzun oyuncular daha mı çok ribaund alıyor?
Pozitif Korelasyon (+)
Yorum: Sağa gittikçe YUKARI → POZİTİF korelasyon
Uzun boy = Çok ribaund!
Durum: Forma numarasının performansla ilişkisi var mı? (Spoiler: Yok!)
Korelasyon Yok (0)
✅ Noktalar rastgele dağılmış → İlişki yok. 7 numara giyen 77 numaradan iyi değil!
📊 Hangi Veri Türü?
- İKİ NİCEL değişken
- İlişki/korelasyon analizi
- Boy-kilo, süre-mesafe
- Regresyon öncesi keşif
✅ Avantajları
- İlişkinin yönünü gösterir (+/-/0)
- Aykırı değerler hemen görünür
- Doğrusal olmayan ilişkiler de fark edilir
- Her veri noktası görünür
❌ Dezavantajları
- Çok veri = overplotting (üst üste)
- Sadece 2 değişken gösterir
- Korelasyon ≠ nedensellik hatası
- Kategorik veri için UYGUN DEĞİL
📦 Kutu Grafik (Boxplot)
🧠 Temel Kavram: Boxplot Ne Gösterir?
Boxplot, bir veri setinin "özet istatistiklerini" tek grafikte gösterir. Düşün ki sınıftaki 30 öğrencinin notlarını tek bir kutuya sığdırıyorsun: En düşük not, en yüksek not, ortadaki öğrenci (medyan), ve öğrencilerin %50'sinin hangi aralıkta olduğu.
Kutunun anatomisi:
→ Kutu = Verilerin %50'sinin bulunduğu yer (Q1'den Q3'e)
→ Kutu içindeki çizgi = MEDYAN (ortanca değer)
→ Bıyıklar = Normal veri aralığı (min-max veya 1.5×IQR)
→ Noktalar = AYKIRI değerler (bıyıkların dışında kalan uç veriler)
En önemli özelliği ne? Aykırı değerleri anında yakalamak! Örneğin takımda herkes 50.000-200.000 TL maaş alırken bir kişi 5.000.000 TL alıyorsa, boxplot bunu kutunun dışında kırmızı nokta olarak gösterir. "Aha, yıldız oyuncu bu!"
Gerçek hayat örneği: 3 farklı mevkinin (kaleci, defans, forvet) koşu mesafelerini karşılaştırıyorsun. 3 kutuyu yan yana koyarsın. Hangi mevkinin kutusu daha geniş = o mevkide değişkenlik fazla. Kutu yüksekteyse = o mevki daha çok koşuyor demek.
📐 IQR Nedir? IQR = Q3 - Q1 (Çeyrekler Arası Genişlik). Verilerin tam ortasındaki %50'lik dilimi gösterir. IQR ne kadar darsa, veri o kadar tutarlı ve homojen demek. IQR genişse, değerler çok dağınık ve değişken demek.
🎻 Modern Alternatif: Violin Plot (Keman Grafiği)
Boxplot mükemmeldir ama bir zayıflığı vardır: Verinin yoğunluğunu (şişkinliğini) göstermez. Bimodal bir dağılımı (iki zirveli) boxplot gizleyebilir. İşte bu yüzden "Violin Plot" icat edildi. Violin plot = Boxplot + Yoğunluk Eğrisi (KDE).
Klasik Boxplot
Sadece özet değerleri görürsünüz.
Violin Plot
"Şişkin" yerler verinin yoğunlaştığı yerlerdir.
📐 Boxplot Anatomisi
Durum: Takım maaş adaletini inceliyor. Ortalama çok yüksek çıkıyor ama gerçeği yansıtmıyor.
Futbolcu Maaşları (Milyon TL)
✅ Yorum: Medyan 1.2M (çoğunluk bu civarda). Ama 2 yıldız oyuncu 8M ve 12M alıyor → Ortalamayı şişiriyor!
Durum: Bekler mi, Stoperler mi, Orta Sahalar mı daha çok koşuyor?
Maç Başına Koşu Mesafesi (km) - Mevki Karşılaştırması
✅ Yorum: Orta sahaların kutusu en geniş (değişkenlik fazla). Beklerde aykırı değer var (kanat bek maratonu koşmuş!).
🔑 IQR (Kutular Arası Genişlik): Q3 - Q1. Verilerin %50'sinin bulunduğu aralık. Kutu darsa veri tutarlı, genişse dağınık.
📊 Hangi Veri Türü?
- SÜREKLİ (nicel) veriler
- Grup karşılaştırmaları
- Aykırı değer tespiti
- Maaş, performans, ölçüm verileri
✅ Avantajları
- 5 özet istatistik tek grafikte
- Aykırıları ANINDA görür
- Grupları yan yana karşılaştırır
- Çarpıklığı gösterir (medyan konumu)
❌ Dezavantajları
- Dağılım ŞEKLİNİ gizler (bimodal?)
- Örneklem büyüklüğü belli değil
- Ortalama gösterilmez (sadece medyan)
- Genel izleyiciye karmaşık gelebilir
🔵 Nokta Grafiği (Dot Plot)
🧠 Temel Kavram: Dot Plot Ne İşe Yarar?
Dot plot, az sayıda veriyi HER BİRİNİ göstererek dağılımı ortaya koyar. Histogram'da 100 kişilik veri var, çubuklar oluşur ama kimlerin nerede olduğunu görmezsin. Dot plot'ta ise 10 kişinin her biri bir nokta olarak GÖRÜNÜR.
Nasıl çalışır? X ekseninde değer aralıkları olur (örn: 6 puan, 7 puan, 8 puan...). Her veri noktası o değere karşılık gelen yere bir nokta olarak yerleşir. Aynı değere sahip birden fazla veri varsa, noktalar ÜST ÜSTE yığılır.
Ne zaman kullan, ne zaman kullanma?
✅ Veri sayısı az (n < 30) → Dot plot harika
❌ Veri sayısı çok (n > 50) →
Noktalar birbirine girer, histogram kullan
Gerçek hayat örneği: 12 kişilik yüzme takımının yarış süreleri. Her yüzücü bir nokta, hangi sürelerde yoğunlaşma var görebilirsin. "3 kişi 25 saniyede bitirmiş, 1 kişi çok geride!" dersin.
🔬 Modern Yaklaşım: Veri Granüleritesi (Taneciklilik)
Modern spor analitiğinde "Toplanmış Veri" (Aggregated Data) yerine, mümkün olduğunca "Ham Veri"ye (Raw Data) yakın görseller tercih edilir. Ortalama bir yalandır, ancak Dot Plot gerçektir.
"Her veri noktası bir hikayedir. Onu bir çubuğun içinde eriterek yok etmeyin."
- Veri Görselleştirme Prensibi
Durum: 10 sporcunun yarışma puanlarını analiz ediyorsun.
Okçuluk Puanları (10 Sporcu)
✅ 7 sporcu görünür. 8 puanda 3 kişi yığılmış. Kırmızı nokta: en yüksek!
Durum: 8 oyuncunun son 5 penaltıdaki başarı sayısı (0-5 arası).
Başarılı Penaltı Sayısı (8 Oyuncu)
📊 Hangi Veri Türü?
- KÜÇÜK veri setleri (n < 30)
- Kesikli veya sürekli veriler
- Her veri noktası önem taşıyorsa
✅ Avantajları
- HER veri noktası görünür
- Dağılım şekli basitçe görülür
- Küçük setlerde histogram'dan iyi
- Mod ve aykırılar hemen belli
❌ Dezavantajları
- Çok veri = kaos (n > 50)
- Sürekli veride binning gerekebilir
- Büyük setlerde histogram yeter
🌿 Stem-and-Leaf Plot (Gövde-Yaprak Grafiği)
🧠 Temel Kavram: Stem-and-Leaf Ne Yapar?
Stem-and-Leaf, adından da anlaşılacağı gibi bir ağaç gibi: Sol tarafta GÖVDE (stem = onlar basamağı), sağ tarafta YAPRAKLAR (leaf = birler basamağı) var. Örneğin 175cm → Gövde=17, Yaprak=5.
Histogram'dan farkı ne? Histogram'da "170-180 aralığında 5 kişi var" dersin ama kimler hangi boyda bilmezsin. Stem-and-Leaf'te hem dağılımı görürsün, hem de "171, 174, 175, 177, 179 - işte bunlar!" diye kesin değerleri okuyabilirsin.
Nasıl okursun?
→ 11 | 3 5 8 yazıyorsa = 11.3,
11.5, 11.8 demek
→ 18 | 0 2 5 yazıyorsa =
180cm, 182cm, 185cm demek
Kısıtlaması ne? Büyük veri setlerinde (n > 50) çok yer kaplar ve karışır. Ayrıca 3+ basamaklı sayılarda pratik değil. Ama küçük setlerde harika!
💡 Eski Ama Güçlü: Stem-and-Leaf "eski moda" görünse de, bilgisayar olmadan elle hızlı dağılım analizi yapmak için mükemmel. Ayrıca sırt sırta (back-to-back) versiyonuyla iki grubu karşılaştırabilirsin!
🌿 Karşılaştırmalı Gövde-Yaprak (Back-to-Back)
İki takımı karşılaştırmak için gövde ortaya alınır, yapraklar iki yana açılır. Buna "Back-to-Back Stem Plot" denir. Histogramda iki grubu üst üste bindirmek zordur (renkler karışır), ama burada çok nettir.
Yorum: Takım A, 60-70 bandında kalmış (düşük skorer). Takım B ise 80-90 bandında coşmuş!
Durum: 13 atletin 100m derecelerini antrenöre sunuyorsun.
100m Dereceleri (saniye)
Okuma: 10|2 = 10.2 sn, 11|5 = 11.5 sn, 13|1 = 13.1 sn (en yavaş!)
Durum: Altyapı seçmelerinde 15 adayın boy bilgisi.
Boy Dağılımı (cm)
✅ Çoğunluk 180-189 cm bandında. 2 aday 200+ cm (potansiyel pivot!)
💡 Avantaj: Antrenör hem dağılımı görür (10-11 saniyede yoğunlaşma), hem de "13.1 koşan kim?" diye sorabilir. Histogram'da bu detay kaybolur!
📊 Hangi Veri Türü?
- KÜÇÜK-ORTA veri setleri (n < 50)
- Sürekli nicel veriler
- 2-3 basamaklı sayılar ideal
- Kesin değerleri korumak gerekiyorsa
✅ Avantajları
- Dağılım + kesin değerler görünür
- Veri kaybı SIFIR
- Çeyreklikler hesaplanabilir
- Karşılaştırmalı stem-leaf mümkün
❌ Dezavantajları
- Büyük veride pratik değil (n > 50)
- Sunumlarda "eski moda" görünür
- Ondalık verilerde karmaşık
- Yazılımda üretmek zor
✅ Özet ve Değerlendirme
📊 GRAFİK SEÇİM REHBERİ: "Ne Göstermek İstiyorum?"
📊 KARŞILAŞTIRMA
Sütun/Çubuk Grafik
"Kim daha iyi?" "Hangi takım önde?"
📈 DAĞILIM
Histogram / Dot / Stem
"Veriler nasıl yayılmış?" "Çoğunluk nerede?"
🥧 ORAN
Pasta Grafik (Dikkat!)
"Yüzde kaçı X?" (Max 5-6 dilim!)
📉 TREND
Çizgi Grafik
"Zaman içinde nasıl değişti?" "Artıyor mu?"
🔗 İLİŞKİ
Scatter Plot
"X arttıkça Y de artıyor mu?"
📦 ÖZET
Boxplot
"Medyan, çeyrekler, aykırılar nerede?"
🧠 KENDİNİ TEST ET: Hangi Grafik?
Soru 1: Maratoncu nabzının dakika dakika değişimini göstermek istiyorsunuz.
Soru 2: Takımda aykırı değer (çok yüksek maaş alan) olup olmadığını görmek istiyorsunuz.
Soru 3: 5 farklı takımın gol sayılarını karşılaştırmak istiyorsunuz.
Soru 4: Boy ile kilo arasında ilişki var mı görmek istiyorsunuz.
⚠️ UNUTMA: Grafik Seçiminde 3 Altın Kural
1️⃣ Veri Türü
Kategorik mi? Sürekli mi? Zaman serisi mi?
2️⃣ Mesaj
Ne söylemek istiyorsun? Karşılaştırma? Trend?
3️⃣ Hedef Kitle
Antrenör mü? Akademisyen mi? Basit mi karmaşık mı?
🎯 Gelecek Hafta
İleri Düzey Grafikler: Heatmap, Radar Chart, Violin Plot