Merkezi Eğilim Ölçüleri
Merkezi eğilim, istatistikte, bir veri setini özetlemek için kullanılan temel bir kavramdır. Bu kavram, veri seti içindeki merkezi noktayı veya tipik değeri tanımlar. Bu blogda, merkezi eğilim ölçülerinden üç ana başlığı ele alacağız: ortalama, medyan ve mod. Her birinin tanımını, nasıl hesaplandığını ve hangi durumlarda kullanıldığını ayrıntılı olarak inceleyeceğiz.

1. Ortalama (Aritmetik Ortalama)
Ortalama, bir veri setindeki tüm değerlerin toplamının, değer sayısına bölünmesiyle elde edilen değerdir. En yaygın kullanılan merkezi eğilim ölçüsüdür ve verilerin genel eğilimini gösterir.
Hesaplama: Ortalama=∑Veri Deg˘erleriVeri Sayısı\text{Ortalama} = \frac{\sum \text{Veri Değerleri}}{\text{Veri Sayısı}}Ortalama=Veri Sayısı∑Veri Deg˘erleri
Örnek: Veri setimiz 5, 7, 8, 9 ve 10 olsun. Bu verilerin ortalaması: Ortalama=5+7+8+9+105=7.8\text{Ortalama} = \frac{5 + 7 + 8 + 9 + 10}{5} = 7.8Ortalama=55+7+8+9+10=7.8
Ortalama, özellikle sürekli ve simetrik dağılımlarda veri setinin merkezi eğilimini en iyi şekilde temsil eder. Ancak, uç değerlerden (outliers) etkilenebilir.
2. Medyan
Medyan, bir veri setindeki ortanca değerdir; yani, veriler küçükten büyüğe sıralandığında ortada kalan değerdir. Eğer veri seti çift sayıda ise, ortadaki iki değerin ortalaması alınır.
Hesaplama:
- Veriler küçükten büyüğe sıralanır.
- Tek sayıda veri varsa ortanca değeri bulunur.
- Çift sayıda veri varsa ortadaki iki değerin ortalaması alınır.
Örnek: Veri setimiz 5, 7, 8, 9 ve 10 olsun. Sıralanmış veri setinde medyan 8’dir.
Medyan, özellikle uç değerlerin var olduğu veri setlerinde merkezi eğilimi temsil etmek için ortalamaya göre daha güvenilir bir ölçüdür.
3. Mod
Mod, bir veri setinde en sık rastlanan değerdir. Bir veri seti birden fazla moda sahip olabilir (bimodal, trimodal, vb.).
Hesaplama:
- Veri setindeki her değerin frekansı belirlenir.
- En yüksek frekansa sahip değer mod olarak tanımlanır.
Örnek: Veri setimiz 5, 7, 7, 8, 9 ve 10 olsun. Bu setin modu 7’dir çünkü en sık rastlanan değer budur.
Mod, özellikle kategorik verilerde veya verilerin belirli bir değerde yoğunlaştığı durumlarda kullanışlıdır.
4. Kantiller
Kantiller, bir veri setini %1’lik dilimlere böler. Yani, her kantil verilerin %1’ini temsil eder ve toplamda 100 kantil bulunur. Kantiller, veri dağılımının çok ayrıntılı bir şekilde incelenmesine olanak tanır.
Örnek: Bir sınavdan alınan puanlar 0 ile 100 arasında değişiyorsa, 99. kantil bu sınavda %99’dan daha iyi performans gösteren öğrencilerin aldığı en düşük puanı temsil eder.
5. Kartiller
Kartiller, bir veri setini %25’lik dilimlere böler. Bu nedenle dört kartil (Q1, Q2, Q3, Q4) bulunur. Kartiller, veri setinin dört eşit parçaya ayrılmasıyla ilgili istatistiksel analizlerde sıkça kullanılır.
- Birinci Kartil (Q1): Verilerin %25’inin altında kaldığı değer.
- İkinci Kartil (Q2): Medyan olarak da bilinir ve verilerin %50’sinin altında kaldığı değeri gösterir.
- Üçüncü Kartil (Q3): Verilerin %75’inin altında kaldığı değer.
Örnek: Bir veri setinde Q1=25, Q2=50, Q3=75 ise, bu verilerin %25’i 25’in altında, %50’si 50’nin altında ve %75’i 75’in altında kalmaktadır.
6. Desiller
Desiller, bir veri setini %10’luk dilimlere böler. Bu nedenle 10 desil (D1, D2, …, D10) bulunur. Desiller, verilerin on eşit parçaya ayrılmasıyla ilgili detaylı analizlerde kullanılır.
Örnek: Bir şirketin çalışanlarının maaşları desillere göre analiz edildiğinde, D1 maaşların en düşük %10’unun altında kalan maaşları, D9 ise maaşların en yüksek %10’luk diliminin altında kalan maaşları gösterir.
7. Persentiller
Persentiller, bir veri setini %1’lik dilimlere böler. Bu nedenle 99 persentil vardır (P1, P2, …, P99). Persentiller, genellikle sınav sonuçları, sağlık verileri ve benzeri alanlarda verilerin yayılımını ve bireylerin sıralamasını anlamak için kullanılır.
Örnek: Bir test sonucunda P90’da olan bir öğrenci, öğrencilerin %90’ından daha yüksek puan almıştır. Bu, öğrencinin test performansının en yüksek %10’luk dilimde olduğunu gösterir.
Hangi Ölçüyü Ne Zaman Kullanmalıyız?
- Ortalama, verilerin simetrik olduğu ve uç değerlerin olmadığı durumlarda en uygun ölçüdür.
- Medyan, uç değerlerin bulunduğu veya verilerin dağılımının simetrik olmadığı durumlarda tercih edilir.
- Mod, en sık rastlanan değeri belirlemek için özellikle kategorik veya sınıflandırılmış verilerde kullanılır.
- Kantiller ve Persentiller, özellikle büyük veri setlerinde bireysel veya grup seviyesindeki farklılıkları anlamak için kullanılır.
- Kartiller, veri setini dört eşit parçaya ayırarak veri dağılımını özetler ve genellikle istatistiksel kutu grafikleri (box plot) gibi görselleştirmelerde kullanılır.
- Desiller, verilerin daha geniş dilimler halinde incelenmesi gerektiğinde tercih edilir.
Merkezi eğilim ölçüleri, verilerin genel davranışını anlamak ve özetlemek için kritik öneme sahiptir. Her bir ölçü, veri setinin yapısına ve analiz amacına göre seçilmelidir. Bu rehberde yer alan bilgiler, verilerinizin merkezi eğilimlerini daha iyi anlamanıza ve doğru analizler yapmanıza yardımcı olacaktır.
Ortalama, Medyan ve Mod Arasındaki İlişki ve Çarpıklık
Ortalama, medyan ve mod arasındaki ilişki, bir veri setinin dağılımı hakkında önemli ipuçları verebilir. Bu üç ölçü, verilerin simetrik mi yoksa çarpık mı olduğunu belirlemede kullanılır.
1. Simetrik Dağılım
Bir veri seti simetrik olduğunda, ortalama, medyan ve mod birbirine eşit veya çok yakın olur. Bu tür dağılımlarda, veriler normal dağılım gösterir ve çarpıklık sıfırdır.
2. Çarpık Dağılım
Çarpık dağılımlar, verilerin bir yöne doğru yoğunlaştığı durumlardır. İki tür çarpıklık vardır:
- Pozitif Çarpıklık (Sağa Çarpık): Veri setinin uzun kuyruğu sağ tarafta olduğunda, yani daha büyük değerlerin daha seyrek olduğu durumlarda meydana gelir. Bu durumda, ortalama moddan büyüktür ve medyan ikisi arasında yer alır. Ortalamanın büyük değerlerden etkilenmesi, onu en büyük ölçü yapar.İlişki: Mod < Medyan < Ortalama
- Negatif Çarpıklık (Sola Çarpık): Veri setinin uzun kuyruğu sol tarafta olduğunda, yani daha küçük değerlerin daha seyrek olduğu durumlarda meydana gelir. Bu durumda, ortalama moddan küçüktür ve medyan ikisi arasında yer alır.İlişki: Ortalama < Medyan < Mod
Sonuç
Ortalama, medyan ve mod, veri setlerinin merkezi eğilimlerini anlamak için kullanılan önemli araçlardır. Her biri farklı durumlarda kullanılabilir ve verilerin genel dağılımını veya belirli bir bölümünü özetler. Bu ölçülerin birbirine olan ilişkisi, veri setinin dağılımını ve çarpıklığını anlamamıza yardımcı olur. Veri analizi yaparken, bu üç ölçüyü birlikte kullanarak daha kapsamlı ve doğru sonuçlara ulaşabilirsiniz. Daha fazlası için bizimle iletişim‘e geçin.
İstatistiğe Dair Her Şey sitesinden daha fazla şey keşfedin
Subscribe to get the latest posts sent to your email.