Herkes İçin Veri Okuryazarlığı #2

Bölüm 2:

Herkes İçin Veri Okuryazarlığının 1. Bölümünde Temel Kavramlardan bahsedilmişti. Serinin temel akışı için yararlandığım kaynak Turkcell’in Geleceği Yazanlar web sitesindeki Veri Okuryazarlığı eğitimi olacağından “Veri Okuryazarlığına Giriş” konularını Vahit Keskin bu şekilde listelemiştir.

  • Temel Kavramlar
  • Merkezi Eğilim Ölçüleri
  • Dağılım Ölçüleri
  • İstatistiksel Düşünce

Serinin 2. Bölümünde de serinin devamı olan Merkezi Eğilim Ölçülerinden; en çok bilinen temel ölçülerden (mod, medyan, aritmetik ortalama) ek olarak da kartillerden bahsedilecektir. Serinin 2.Bölümü 1.Bölüme göre daha teorik bir anlatımla yazılmıştır.

Öncelikle ”merkezi eğilim ölçülerine neden başvurmalıyız?” Sorusunu sormalıyız. Bunun da cevabını özetleyici bir şekilde Prof. Dr. Fikri AKDENİZ kitabının 22. Baskısının 296. sayfasında açıklamıştır.

“Gözlenen verinin düzenlenerek çizelgelerle, grafiklerle sunulması çoğu kez yeterli olmaz. Genel durumu yansıtacak birtakım ölçülere gereksinim vardır. Öyle ölçüler ki, yalnızca verileri özlü bir biçimde belirtmekle kalmasınlar, yapılacak karşılaştırmalara,  genellemelere yorumlara olanak sağlasınlar.”

Merkezi Eğilim Ölçüleri (Merkezi Konum Ölçüleri)

Merkezi Eğilim: Genellikle ortalama, medyan ve mod gibi istatistiklerle ölçülen değişken dağılımının bir özelliğidir.

 

Ortalama (Aritmetik Ortalama):  Gözlenen değerlerin tümü toplanarak gözlem sayısına bölündüğünde elde edilen değere aritmetik ortalama denir.

Bir örnek gösterilecek olursa;

n=7 birimden oluşan 2 3 5 4 8 3 5 serisi verilmiş olsun bu serinin ortalaması,

aritmetik ortalama formülünü kullanılarak cevabı bulabiliriz.

 

cevabın yaklaşık olarak 4.29 olduğunu söyleyebiliriz.

Medyan (Ortanca):  Bir anakütle ya da örneklem veri serisini küçükten büyüğe doğru sıraladığımızda seriyi ortadan ikiye ayıran değere denir.  Serinin birim sayısına göre medyan formülü değişmektedir.

Birim sayısı (n) tek ise;

Medyan formülü formülü kullanılır.

Örnek olarak;

10, 12, 15, 13, 12, 11, 10 serisi verilsin. Buradaki serinin medyanı;

Serideki birimleri küçükten büyüğe doğru sıraladığımızda serinin düzenlenmiş hali,

10 10 11 12 12 13 15 şeklinde olacaktır.  Formülden yararlanarak;

Medyan formülü

Cevabı bulabiliriz. 7 birimlik tek sayıda birimden oluşan serinin medyanının 4. terimine yani 12’ye denk geldiğini görürüz.

Birim sayısı (n) çift ise;

Medyan formülü formülü kullanılır.                      Örnek:

5, 8, 12, 18, 15, 17, 21, 13 şeklindeki seri verilmiş olsun. Serinin medyanını da formülü kullanarak bulacak olursak;

Öncelikle birimleri küçükten büyüğe doğru sıralamamız gerekmektedir. Serinin düzenlenmiş hali;

5 8 12 13 15 17 18 21 olur. Daha sonrasında serinin çift sayıda birimden oluştuğu göz önüne alınarak kullanılacak olan formül;

Medyan formülü olmalıdır.

Birim sayısı (n) yerine 8 yazılırsa;

olacaktır o da

Yani serinin medyanı (ortanca terimi) 14’e eşittir.

Mod (Tepe Değer): Belirli bir veri kümesi içinde en çok tekrar eden değere mod denir.

Örnek ile gösterilirse;

8, 9, 10, 10, 10, 11, 11, 11, 11, 12, 13 serinin modu terim sayısının gözle görülüp sayabileceğimiz kadar birimden oluşmasından dolayı hesaplamak kolay olacaktır. Tanımdan yararlanarak en çok tekrar eden değerin 11 olduğu görülmektedir.

Basit matematiksel formül kullanımından ayrı olarak mod; hesap makinesi kullanılarak veya bilgisayar paket programları aracılığıyla hesaplanmaktadır.

Merkezi Eğilim ölçülerinin grafiksel olarak gösterimi (mean= aritmetik ortalama), (median= medyan), (mode= mod)

Kartiller:  Bir seride birimleri küçükten büyüğe sıraladığımızda seriyi 4 eşit parçaya bölen değerlere kartiller denir.

Q1  (1. Kartil) =  

Q3  (3. Kartil) =  

Q2  (2. Kartil) = Q3 – Q1  aynı zamanda medyan olarak da tanımlanabilmektedir.

Örnek olarak;

5, 7, 4, 4, 6, 2, 8 serisi verilmiş olsun ve kartilleri (Q1 ,Q2  ,Q3 ) bulunmak isteniyor ise;

Diğer merkezi eğilim ölçülerinin hesaplanmasında da kullanılan ilk kural geçerlidir. Öncelikle serideki birimleri küçükten büyüğe doğru sıralamamız gerekmektedir.

Serinin sıralanmış hali 2, 4, 4, 5, 6, 7, 8 şeklinde olacaktır.

Verilen formülü kullanırsak;

Qn yerine serideki birim sayısı (n=7) yazıldığında Q1’in 2.terime karşılık geldiğini yani 1.Kartilin 4’ eşit olduğunu görebiliriz.

Q3  (3. Kartil) = n yerine serideki birim sayısı (n=7) yazıldığında Q3’ün 6. Terime karşılık geldiğini yani 3.Kartilin 7’ye eşit olduğunu görebiliriz.

Ve aynı şekilde yukarıda verilen formül kullanılarak Q2 de hesaplanabilmektedir.

Q2 = Q3 – Q1  

Q3 = 6.terim ve Q1= 2.terim değerleri bilindiğine göre;

Q2 = 6.terim – 2.terim

Q2 = 4.terim olduğunu söyleyebiliriz seride 4.terime karşılık gelen sayı 5’tir. Serinin medyanı 5’e eşittir demek ile aynı anlama gelmektedir.

Görsel olarak ifade edilirse;

Gösterilen örneklerin yetersizliğini kabul ediyorum ve eğer uygulama imkanınız varsa SPSS (Sosyal Bilimler İçin İstatistik Programı) programında analiz yapmak konuların pekişmesine yardımcı olacaktır diye düşünüyorum.

SPSS programından örnek bir uygulama;

Bir şirkette çalışan 10 kişinin aylık gelirlerinin merkezi eğilim ölçüleri bulunacaktır. Çıkan sonuçlara göre veriler yorumlanacaktır.

Veriler aşağıdaki tabloda verilmiştir.

Açıklama: Spss’ teki “Data view” penceresindeki 10 kişinin aylık gelirleri ayrı ayrı girilmiştir. “Variable view” penceresinde ise değişkenler yer alır. Bu örnekte tek değişken vardır.

Verilerin “Merkezi Eğilim Ölçüsü”nü bulmak için;

1- Verilerin olduğu “Data View” penceresindeki Analyze menüsüne tıklanır.

2- Analyze menüsünden “Descriptive Statistics” alt menüsüne tıklanır.

3- Son olarak “Frequencies” kısmında merkezi eğilim ölçülerinden; mod, medyan ve kartillerin istatistikleri çıkarılır.

Çıktı sayfasında karşılaşacağımız tablo bu şekildedir.

 

Mean (Aritmetik Ortalama): 2987 TL

Median (Medyan=Ortanca): 2850 TL

Mode (Mod): 3500 TL

Percentiles (Yüzbirlikler):

%25 1.Kartili temsil etmektedir. Q1 = 2450 TL

%50 2.Kartili temsil etmektedir. Q2 = 2850 TL

%75 3.Kartili temsil etmektedir. Q3 = 3625 TL

  • “Bu iş yerinde ortalama maaş ne kadardır?” sorusunun cevabını aritmetik ortalama vermektedir.
  • “Bu iş yerinde çalışanların %75 ‘inin maaşı ne kadardır?”Sorusunun yanıtını 3. Kartil vermektedir.
  • Çalışanların %80’i 4000 TL’ den az maaş almaktadır.

‘Herkes İçin Veri Okuryazarlığı’ nın 2.Bölümü bitmiştir. Yazımı buraya kadar okuduğunuz için çok teşekkür ederim. Umarım faydalı olmuştur bir sonraki bölümde görüşmek dileğiyle…

Tanımlamalar İçin Kullanılan Kaynaklar:

Eskişehir Osmangazi Üniversitesi – İstatistik Bölümü ders notları

Prof. Dr. Fikri AKDENİZ – Olasılık ve İstatistik kitabı

The Cambridge Dictionary of Statistics – Central Tendency  (85/480)

 

 

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.