Herkes İçin Veri Okuryazarlığı

Öncelikle verinin hayatımızdaki yeri ve öneminden yola çıkarak Herkes İçin  Veri Okuryazarlığı serisi başlatmaya karar verdim. Temel Seviye olacağı için herkesin yararlanabileceğini düşünüyorum. Bu yazının seri şeklinde olmasının nedeni konuların belli bir parçaya ayrılması ve siz okuyucuları sıkmamak istediğimdendir. Yazının birinci bölümünü temel kavramlar oluşturacaktır. Veri Okuryazarlığı öylesine önemli ki ülkemizde de veri okuryazarlığını destekleyen bir dernek bulunmaktadır. Serinin temel akışı için yararlandığım kaynak; Turkcell’in Geleceği Yazanlar web sitesindeki Vahit Keskin’in Veri Okuryazarlığı eğitimi olacaktır.

Herkese keyifli okumalar diliyorum.

Bölüm 1:

Veri Okuryazarlığı Nedir? Ve Neden Bu Kadar Önemlidir?

Veriler günlük hayatımızda önemli yer kaplamaktadırlar. Gerek günlük hayatımızda gerekse iş yaşantımızda fark etmeden dahi olsa verilerle ilişki halindeyiz. Örneğin; bir analistin bir süpermarketin gelecek ay için stok miktarını hesaplamasında, bir doktorun hastasına laboratuvar tahlil sonuçlarını en basit ifadelerle anlatmasında, anket araştırmacısının topladığı verileri değerlendirmesinde ve bir sonuca varmasında, bir siyasi partinin seçim sandıklarındaki oy alma oranlarının yorumlanmasında veri okuryazarlığından yararlanılması gerekmektedir. Veri Okuryazarlığı’ nın Wikipedia’ daki tanımı “Verileri bilgi olarak okuma, anlama, oluşturma ve iletişim yeteneğidir. Genel bir kavram olarak okuryazarlık gibi veri okuryazarlığı da verilerle çalışmadaki yeterliliklere odaklanır.” olarak verilmiştir. Bir başka tanım da Jordan Morrow tarafından TEDxBoise konuşmasında yapılmıştır. “Veriler değerlidir, ancak tıpkı petrol gibi insanlardan geçmeli ve değer kazanmak için arıtılması gerekir. Bu veri okuryazarlığıdır.

Veri Okuryazarlığı Bileşenleri

Veri Okuryazarlığı (Data Literacy) temelde anlama, kullanma ve analiz etme görevlerinin yerine getirilmesinde rol alır.

Veri Nedir?

Verinin tanımı ilgilenilen alana göre değişmektedir. Bilimsel araştırmalarda veri; “Bir araştırmacı tarafından gözlemlerden elde edilen sayısal olan ya da olmayan sonuçlara veri denilmektedir.“ Diğer taraftan bilgisayar bilimleri açısından veri kavramı; ”Bilgisayar ortamında bulunan bilgilerin, programlar tarafından işlenebilmesini sağlamak amacıyla derlenmiş ve formüle edilmiş şekline veri denilmektedir.” şeklinde ifade edilmektedir. Bu nedenle verilerin anlamlandırılmasına, genellenmesine ve geleceğe yönelik çıkarımda bulunmakta kullanılmalarına ihtiyacımız doğmuştur. Bu ihtiyacımızı da istatistik biliminden yararlanarak karşılayabilmekteyiz.

 İstatistik Bilimi Nedir?

Belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme ve gözlem ilkelerini kapsayan bir bilimdir.

İstatistiksel Veri Analizi Aşamaları:

Öncelikle tablonun net olmamasından dolayı özür diliyorum. Kaynak olarak; Prof. Dr. Fikri AKDENİZ’ in 22. Baskısı olan “Olasılık ve İstatistik” kitabının 289. Sayfasındaki gösterim kullanılmıştır.

VERİ OKURYAZARLIĞINA GİRİŞ:

  • Temel Kavramlar
  • Merkezi Eğilim Ölçüleri
  • Dağılım Ölçüleri
  • İstatistiksel Düşünce

Bu bölümde Temel Kavramlardan bahsedilecektir.

1-Temel Kavramlar:

Anakütle (Kitle, Popülasyon): Üzerinde çalışılan tüm gruba ya da istatistiksel sonuçların genelleştirileceği gruba kitle denir.

Parametre: Bir kitlenin tanımlayıcı sayısal ölçüsüdür.

Örneklem: Bir kitlenin belli bir özelliğini incelemek üzere, kitleden belirli kurallara göre seçilen birimler topluluğuna örneklem denir.

Örneklem İstatistiği: Bir örneklemin tanımlayıcı sayısal ölçüsüdür.

Örneğin; belirli bir konuda anket araştırması yapılırken kitlenin tamamına ulaşmak mümkün olmayabilir. Anket yapılacak yerin uzaklığından doğan ulaşım imkanları sıkıntısı, araştırma için yeterli ücretin olmaması, araştırma için ayrılan zamanın çok uzun sürmesi gibi sorunlar anakütleyi en iyi şekilde temsil eden bir alt grup oluşturmayı gerekli hale getirmektedir.

İçinde bulunduğumuz dönemden örnekle; Covid-19 aşısının bulunması yeterli örneklemin sağlanmasına dayanmaktadır. Açık olarak ifade edilirse; virüse yakalanmış kişilerden kaçında iyileşme görülecek? veya aşının kişilerde olumsuz etkileri olacak mı? gibi sorulara örneklemdeki grup üyeleri karar verecektir.

Koronavirüs Bilim Kurulu Üyesinden aşı tarihi öngörüsü

Sağlık Bakanlığı Koronavirüs Bilim Kurulu Üyesi Prof. Dr. İlhami Çelik, “Aşı için öngörülen süre 2022 gibi duruyor. Biz tabi inşallah o dönemlere kalmayız.” dedi.

Ramazan Kaya   |30.06.2020

 

sample-size

Örneklem seçimine bir örnektir.

Gözlem Birimi: Araştırmacının analiz ettiği verilerle tanımlanan birimdir. Örneğin; 1985 senesinde yapılan bir sualtı araştırmasında belli bir balık türünün iskelet boy uzunluklarının incelenmesi isteniyor ise burada gözlem birimi balıklar olacaktır.

Değişken (Variable): Kısaca birimlerin farklı değerler alabildikleri nitelik veya niceliklerine değişken denir. Gözlem birimindeki örneği kullanacak olursak burada balık türünün iskelet boy uzunlukları değişken kavramını ifade etmektedir.

Veri organizasyonu, özetlenmesi ve istatistiksel analizi için yöntemler düşünüldüğünde iki tür verinin araştırılması gerekmektedir. Değişkenler, nitel ve nicel olarak ikiye ayrılmaktadır.

Data-type

Sayısal Değişken (Quantitative Variable): Nümerik olarak ifade edilen, yaş vücut kitle indeksi, hemoglobin, kolesterol gibi kandan cihaz yardımıyla ölçülebilen değişkenler olarak tanımlanır.

Kategorik Değişken (Qualitative Variable): Doğal sayısal ölçek üzerinde ölçülemeyen ve kategorilerin bir grubu içine sınıflandırılan ölçümlerdir. Örneğin; cinsiyet, medeni durum, bir sağlık araştırmasında kişilerin pozitif-negatif test sonuçları, çevre ile ilgili bir araştırmada bireylerin sigara kullanıp kullanmamaları gibi veriler sınıflandırıcı özellik taşımaktadır.

Değişkenler temel olarak 3’e ayırabilmektedir.

  • Ölçme ve Sayma Değişkenleri
  • Sıralama Değişkenleri
  • Özellik belirten değişkenler

Ölçme ve Sayma Değişkenleri: (Sayısal Değişkenler)

  1. Sürekli değerler alan değişkenler (Yükseklik, ağırlık, uzunluk, zaman, sıcaklık, hacim vs.). Belli bir aralıktaki her değeri alabilen değişkenlerdir.

X rastgele sürekli değişkeninin düzgün dağılımda 3 ile 6 arasında bulunması olasılığını grafikteki taralı alan ifade etmektedir.

  1. Kesikli değer alan değişkenler (Satılan birimlerin sayısı, giriş hatalarının sayısı, bir evde beslenen evcil hayvan sayısı, bir hastanede bulunan toplam yatak sayısı vs.). Tam değerler alabilen değişkenlerdir.

 

Sıralama Değişkenleri: Bazı değişkenlere ölçümle belirlenememekle beraber büyüklükleri itibariyle sıralanabilirler. (1.,2.,3.,… vs. sıralama işlemi yapılır.). Örneğin; Hastalığın evresinin belirlenmesinde (1-2-3) kullanılır.

Özellik Belirten Değişkenler: Özellikle kalite ve durum gibi nitel özellik belirten değişkenleri bu sınıfa koyabiliriz. Örneğin; siyah-beyaz, ölü-canlı, evli-bekar, öğrenim durumu-meslek gibi nitel bir özellik söz konusu olduğunda gözlenen durumlara dayanarak dağılım düzenlenir.

Ölçek Türleri:

1-Sınıflayıcı (Nominal) Ölçek: Ortak özelliklere göre alt gruplara ayrılma (eşit-eşit değil). Cinsiyet, medeni durum, hastalığın var olup olmaması vb.

2-Sıralayıcı (Ordinal) Ölçek: Ölçme sonuçlarını sıralayabilmeye dayanmaktadır. Bir online alışveriş sitesinin memnuniyet derecesini belirtmesinde sıralayıcı ölçek kullanılır.

3-Aralıklı (İnterval) Ölçek: Ölçme birimleri arasındaki farkların eşit olduğu durumlarda kullanılır. Eşit aralıklı ölçek düzeyindeki bir değişkende ‘izafi/göreli/yapay/sıfır’ ya da ‘izafi başlangıç noktası’ tanımlıdır. Bu nokta mutlak yokluğu ifade etmez. Verilerle doğrudan çarpma-bölme gibi işlemler bir anlam ifade etmez bu ölçekte değişkenler arasındaki farklar önemlidir. 150°C her zaman 100°C daha yüksektir ve bu iki sıcaklık arasındaki fark 80°C ile 30°C arasındaki farka eşittir.

4-Oranlı (Ratio) Ölçek: Eşit oranlı ölçeklerde birimler eşittir ancak sıfır mutlak olmalıdır. Sıfırın anlamlı olduğu bilinmelidir. Örneğin;  metre ile yapılan ölçümler, kilo ile yapılan ölçümler, hasta sayısı, hız, gelir gibi değişkenler bu ölçme düzeyinde ölçülmektedir.

‘Herkes İçin Veri Okuryazarlığı’nın 1.Bölümü bitmiştir. Yazımı buraya kadar okuduğunuz için çok teşekkür ederim. Umarım faydalı olmuştur bir sonraki bölümde görüşmek dileğiyle…

Tanımlamalar için kullanılan kaynaklar:

Olasılık ve İstatistik kitabı – Prof. Dr. Fikri AKDENİZ

https://www.alfaistatistik.com/blog/9/olcme-turleri-olcekler-nelerdir-

https://acikders.ankara.edu.tr/pluginfile.php/1374/mod_resource/content/3/B1_Temel%20Kavramlar.pdf

https://acikders.ankara.edu.tr/pluginfile.php/53565/mod_resource/content/0/Temel_Kavramlar-2.pdf

http://www.p005.net/degisken-nedir-nasil-siniflandirilir

 

 

 

 

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.