Veri Bilimi ve İstatistik

veri bilim nedir grafik

Veri Bilimi çok temelde 3 ana disiplin üzerinde yükselir. Bunlar:

  • İstatistik
  • Bilgisayar Bilimleri
  • İş

Bu üçlüyü kendi aralarında bir araya getirirsek aşağıdaki formülasyonu elde etmiş oluruz.

İstatistik + Bilgisayar Bilimleri = Makine Öğrenmesi

Bilgisayar Bilimleri + İş = İş Zekası

İş + İstatistik = Veri Analizi

İş + İstatistik + Bilgisayar Bilimleri = Veri Bilimi

İstatistik bu 3 ana temel içerisinde belki de Veri Bilimi en açıkça şekillendiren disiplindir. Tabi burada çok derin bir istatistik betimlemesine girmeyeceğim ama insanlığın gelişimi süresince geliştirilen anlama pratiklerinin matematiksel yapılarla ifade edilmesine istatistik diyebilirim.

Tabi bu erken zamanlarda başlayan anlama çabaları özellikle tıp alanındaki deneysel çalışmalarla birlikte daha kuramsal bir çizgiye taşınmış ve bugün istatistik olarak bildiğimiz yapısına kavuşmuştur. Yani 1800 yılında bir hekimin yaptığı deneyi anlamaya çalışırken kullandığı teknik ile bu gün kullandığımız teknik temel itibarı ile aynıdır.

Sonraki yıllarda bu anlama çabası eldeki verinin miktarının artması ve bilgisayarların ortaya çıkması ile birlikte bilgisayar ortamına uyarlanmıştır. Burada istatistik kendi içerisinden Makine Öğrenmesi tekniklerini çıkartmıştır.

Daha sonraki yıllarda yani içerisinde bulunduğumuz 2000 sonrasındaki yıllarda, yavaş yavaş verinin yapılan işi destekleyen bilgiler üretmek için kullanılmasının yanı sıra kendisinin bir iş haline gelmesi ve verinin bir ürünün ham maddesi olması ile birlikte Veri Bilimi kavramının ortaya çıktığını görüyoruz.

Bu süreç içerisinde geldiğimiz nokta itibarı ile yaptığımız iş ve işin isimlendirilmesi farklılaşmış olsa da, yaptığımız iş hala temelde insanoğlunun anlama macerasının bir parçasıdır.

İstatistik için ne kullanmalı?

Ben istatistiksel analizler için R ya da SPSS tercih ediyorum. Python çok yüzeysel kalıyor gibi geliyor bana. Zamanında java da kullandım ama orada birçok şeyi kendim yazmak zorunda kalıyordum ve zordu.

Burada tavsiyem R olur. Zaten bu konuda çalışan şirketlerin çoğu R tarafında etkinler.

 

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.