Merkezi Eğilim Ölçüleri: Ortalama, Medyan, Mod

Merkezi Eğilim Ölçüleri

Merkezi eğilim, istatistikte, bir veri setini özetlemek için kullanılan temel bir kavramdır. Bu kavram, veri seti içindeki merkezi noktayı veya tipik değeri tanımlar. Bu blogda, merkezi eğilim ölçülerinden üç ana başlığı ele alacağız: ortalamamedyan ve mod. Her birinin tanımını, nasıl hesaplandığını ve hangi durumlarda kullanıldığını ayrıntılı olarak inceleyeceğiz.

Merkezi Eğilim Ölçüleri: Ortalama, Medyan, Mod

1. Ortalama (Aritmetik Ortalama)

Ortalama, bir veri setindeki tüm değerlerin toplamının, değer sayısına bölünmesiyle elde edilen değerdir. En yaygın kullanılan merkezi eğilim ölçüsüdür ve verilerin genel eğilimini gösterir.

Hesaplama: Ortalama=∑Veri Deg˘erleriVeri Sayısı\text{Ortalama} = \frac{\sum \text{Veri Değerleri}}{\text{Veri Sayısı}}Ortalama=Veri Sayısı∑Veri Deg˘​erleri​

Örnek: Veri setimiz 5, 7, 8, 9 ve 10 olsun. Bu verilerin ortalaması: Ortalama=5+7+8+9+105=7.8\text{Ortalama} = \frac{5 + 7 + 8 + 9 + 10}{5} = 7.8Ortalama=55+7+8+9+10​=7.8

Ortalama, özellikle sürekli ve simetrik dağılımlarda veri setinin merkezi eğilimini en iyi şekilde temsil eder. Ancak, uç değerlerden (outliers) etkilenebilir.

2. Medyan

Medyan, bir veri setindeki ortanca değerdir; yani, veriler küçükten büyüğe sıralandığında ortada kalan değerdir. Eğer veri seti çift sayıda ise, ortadaki iki değerin ortalaması alınır.

Hesaplama:

  • Veriler küçükten büyüğe sıralanır.
  • Tek sayıda veri varsa ortanca değeri bulunur.
  • Çift sayıda veri varsa ortadaki iki değerin ortalaması alınır.

Örnek: Veri setimiz 5, 7, 8, 9 ve 10 olsun. Sıralanmış veri setinde medyan 8’dir.

Medyan, özellikle uç değerlerin var olduğu veri setlerinde merkezi eğilimi temsil etmek için ortalamaya göre daha güvenilir bir ölçüdür.

3. Mod

Mod, bir veri setinde en sık rastlanan değerdir. Bir veri seti birden fazla moda sahip olabilir (bimodal, trimodal, vb.).

Hesaplama:

  • Veri setindeki her değerin frekansı belirlenir.
  • En yüksek frekansa sahip değer mod olarak tanımlanır.

Örnek: Veri setimiz 5, 7, 7, 8, 9 ve 10 olsun. Bu setin modu 7’dir çünkü en sık rastlanan değer budur.

Mod, özellikle kategorik verilerde veya verilerin belirli bir değerde yoğunlaştığı durumlarda kullanışlıdır.

4. Kantiller

Kantiller, bir veri setini %1’lik dilimlere böler. Yani, her kantil verilerin %1’ini temsil eder ve toplamda 100 kantil bulunur. Kantiller, veri dağılımının çok ayrıntılı bir şekilde incelenmesine olanak tanır.

Örnek: Bir sınavdan alınan puanlar 0 ile 100 arasında değişiyorsa, 99. kantil bu sınavda %99’dan daha iyi performans gösteren öğrencilerin aldığı en düşük puanı temsil eder.

5. Kartiller

Kartiller, bir veri setini %25’lik dilimlere böler. Bu nedenle dört kartil (Q1, Q2, Q3, Q4) bulunur. Kartiller, veri setinin dört eşit parçaya ayrılmasıyla ilgili istatistiksel analizlerde sıkça kullanılır.

  • Birinci Kartil (Q1): Verilerin %25’inin altında kaldığı değer.
  • İkinci Kartil (Q2): Medyan olarak da bilinir ve verilerin %50’sinin altında kaldığı değeri gösterir.
  • Üçüncü Kartil (Q3): Verilerin %75’inin altında kaldığı değer.

Örnek: Bir veri setinde Q1=25, Q2=50, Q3=75 ise, bu verilerin %25’i 25’in altında, %50’si 50’nin altında ve %75’i 75’in altında kalmaktadır.

6. Desiller

Desiller, bir veri setini %10’luk dilimlere böler. Bu nedenle 10 desil (D1, D2, …, D10) bulunur. Desiller, verilerin on eşit parçaya ayrılmasıyla ilgili detaylı analizlerde kullanılır.

Örnek: Bir şirketin çalışanlarının maaşları desillere göre analiz edildiğinde, D1 maaşların en düşük %10’unun altında kalan maaşları, D9 ise maaşların en yüksek %10’luk diliminin altında kalan maaşları gösterir.

7. Persentiller

Persentiller, bir veri setini %1’lik dilimlere böler. Bu nedenle 99 persentil vardır (P1, P2, …, P99). Persentiller, genellikle sınav sonuçları, sağlık verileri ve benzeri alanlarda verilerin yayılımını ve bireylerin sıralamasını anlamak için kullanılır.

Örnek: Bir test sonucunda P90’da olan bir öğrenci, öğrencilerin %90’ından daha yüksek puan almıştır. Bu, öğrencinin test performansının en yüksek %10’luk dilimde olduğunu gösterir.

Hangi Ölçüyü Ne Zaman Kullanmalıyız?

  • Ortalama, verilerin simetrik olduğu ve uç değerlerin olmadığı durumlarda en uygun ölçüdür.
  • Medyan, uç değerlerin bulunduğu veya verilerin dağılımının simetrik olmadığı durumlarda tercih edilir.
  • Mod, en sık rastlanan değeri belirlemek için özellikle kategorik veya sınıflandırılmış verilerde kullanılır.
  • Kantiller ve Persentiller, özellikle büyük veri setlerinde bireysel veya grup seviyesindeki farklılıkları anlamak için kullanılır.
  • Kartiller, veri setini dört eşit parçaya ayırarak veri dağılımını özetler ve genellikle istatistiksel kutu grafikleri (box plot) gibi görselleştirmelerde kullanılır.
  • Desiller, verilerin daha geniş dilimler halinde incelenmesi gerektiğinde tercih edilir.

Merkezi eğilim ölçüleri, verilerin genel davranışını anlamak ve özetlemek için kritik öneme sahiptir. Her bir ölçü, veri setinin yapısına ve analiz amacına göre seçilmelidir. Bu rehberde yer alan bilgiler, verilerinizin merkezi eğilimlerini daha iyi anlamanıza ve doğru analizler yapmanıza yardımcı olacaktır.

Ortalama, Medyan ve Mod Arasındaki İlişki ve Çarpıklık

Ortalama, medyan ve mod arasındaki ilişki, bir veri setinin dağılımı hakkında önemli ipuçları verebilir. Bu üç ölçü, verilerin simetrik mi yoksa çarpık mı olduğunu belirlemede kullanılır.

1. Simetrik Dağılım

Bir veri seti simetrik olduğunda, ortalama, medyan ve mod birbirine eşit veya çok yakın olur. Bu tür dağılımlarda, veriler normal dağılım gösterir ve çarpıklık sıfırdır.

2. Çarpık Dağılım

Çarpık dağılımlar, verilerin bir yöne doğru yoğunlaştığı durumlardır. İki tür çarpıklık vardır:

  • Pozitif Çarpıklık (Sağa Çarpık): Veri setinin uzun kuyruğu sağ tarafta olduğunda, yani daha büyük değerlerin daha seyrek olduğu durumlarda meydana gelir. Bu durumda, ortalama moddan büyüktür ve medyan ikisi arasında yer alır. Ortalamanın büyük değerlerden etkilenmesi, onu en büyük ölçü yapar.İlişki: Mod < Medyan < Ortalama
  • Negatif Çarpıklık (Sola Çarpık): Veri setinin uzun kuyruğu sol tarafta olduğunda, yani daha küçük değerlerin daha seyrek olduğu durumlarda meydana gelir. Bu durumda, ortalama moddan küçüktür ve medyan ikisi arasında yer alır.İlişki: Ortalama < Medyan < Mod

Sonuç

Ortalama, medyan ve mod, veri setlerinin merkezi eğilimlerini anlamak için kullanılan önemli araçlardır. Her biri farklı durumlarda kullanılabilir ve verilerin genel dağılımını veya belirli bir bölümünü özetler. Bu ölçülerin birbirine olan ilişkisi, veri setinin dağılımını ve çarpıklığını anlamamıza yardımcı olur. Veri analizi yaparken, bu üç ölçüyü birlikte kullanarak daha kapsamlı ve doğru sonuçlara ulaşabilirsiniz. Daha fazlası için bizimle iletişim‘e geçin.


İstatistiğe Dair Her Şey sitesinden daha fazla şey keşfedin

Subscribe to get the latest posts sent to your email.

Bir Cevap Yazın