Veri Bilimci Olma Koşulları!

Veri Bilimci olmak

Veri bilimi alanında çalışma ve veri ile değer üretmek için bilinmesi gerekenler noktasında bir kaç bilgi paylaşacağım, bundan önceki yazımda veri bilimci olma klavuzu ile başladığımız yolculuğumuza bugün de öncelikle Veri bilimci olabilmek için ihtiyacımız olan  teknik ve teknik olmayan alanlara kısaca değinmek istiyorum.

Teknik yeterlilik gerektirmeyen durumlar;

Merak; Merak veriden değer üretmenin ön koşulu sayılabilir, çünkü veriden değer üretebilmek için ve elde edilecek verileri anlamlı çıktılar olarak kullanabilmek için, işin merak konusu önemlidir. Ne , nasıl, nerede, ne zaman gibi soruları soruyor olabilmek bize veriden çıkaracağımız anlamlar için bir ön koşuldur diyebiliriz.

Stratejik düşünce; Bir veri bilimci  bir problemin çeşitli yöntemler ile en etkili sonucu elde edebilmek için düşünsel anlamda farklı stratejiler geliştirebilme yetkinliğinde, çok yönlü düşünce yapısına sahip olan bir birey olmalıdır.

İletişim Yeteneği; Genelde teknik yeterliliği yüksek olan bireylerin iletişim becerilerinin çok iyi olmadığı hepimizin malumu olan bir durum ancak iyi bir  veri bilimci, çevresi ile iyi etkileşim içerisinde olmalı etkin sorular sorabilmeli ve işin süreçlerini anlayacak, takım çalışmasına uyumlu bireyler olmalıdır.

Teknik Yeterlilikler;

Makine Öğrenmesi; Veri bilimi sürecinin ilk aşaması ve en önemli yeterliklik alanı diyebiliriz, çünkü  bir Veri Bilimci, makine öğrenmesi algoritmaları ile veriyi en anlamlı şekilde sonuçlar üretmek için yöntemler geliştirmenin arka planındaki çalışmalarının en yoğun olarak  çalışıldığı yani kısaca işin mutfağı olan alandır diyebiliriz.  Makine öğrenmesi konusunda dünya genelinde, alanın en iyi uzmanlarından ilgili kurslar ile bu yetkinliğimizi geliştirebiliriz.

Matematiksel Modelleme;  Elde edilen dataların bilgisayar dilinde maksimum hız, minimum süre ve en doğru sonuçları üretebilmesi için iyi bir şekilde modelin oluşturulması gerekir,  bu sebeple de matematiksel olarak modelin hesaplanması için iyi bir matematik (lineer cebir) bilmek işin doğası gereği kaçınılmazdır.

İstatistik; Bir diğer önemli alan bilgisi istatistiktir.  Elde edilen sonuçları değerlendirmek ve istatistiksel sonuçları yorumlayabilmek(ortalama, mod, medyan vb) için istatistik bilimide alan uzmanlığı bakımından önemlidir.  Bu alandaki makine öğrenmesi ve istatistik bilgilerinizi  artırmak için ekteki dökümandan faydalanabiliriz.

Programlam dili; Yukarıda bahsettiğimiz durumların bilgisayar ile iletişim kuruması ve bilgisayar dilinde bir anlama dönüşmesi için programlama bilgisi de ihtiyacımız olan en önemli alanlardan biridir. Veri bilimi alanında en çok kullanılan programlara baktığımızda, C/C++, R, Python, Scala, Excel, Spark, Java vb dillerin en çok kullanılan diller olduğu görülmektedir. Türkiye’de yapılan ekteki araştırma sonuçlarında da dünya ile ortak düşüncede olduğumuz görülmektedir.

Veri Tabanları; Verinin depolandığı alanların ve bu alanlarda veriyi nasıl kullanabileceğimiz eldeki verileri işleyebileceğimi veri tabanı sistemlerini de bilmek yapacağımız çalışmalarda veriyi gün yüzüne çıkarmak ve eldeki veriden en üst düzeyde faydalanmak için ihtiyacımız olan yeterlilikler arasındadır.  Örnek veri tabanı programları SQL, MongoDB, Cassandra vb.   Ferhat bey’in kaleme aldığı NoSQL veri tabanları yazısına linkten erişebilirsiniz.

Kısaca değindiğimiz ama işin özeti ile bu şekilde olduğunu düşünecek olursak, yukarıda belirtilen alanlarda kendimizi geliştirerek veri bilimi alanında ilgi duyduğumuz sektörlerde (Sağlık, Tarım, Sosyal Medya, E-Ticaret vb..)  verinin gücünden faydalanarak çok faydalı çözümler üretebiliriz.

Aşağıda, ana hatları ile Veri Bilimi ve İş zekası alanlarını  basitçe karşılaştırma tablosunu görebilirsiniz.

Veri bilimci olma, veri bilimi alanında çalışma yolculuğunda temel bir birikim oluşturduktan sonra, artık alanlar ile ilgili ayrıntıya geçebiliriz. Bir sonraki yazıda, makine öğrenmesi ile başlayıp, temel makine öğrenmesi algoritmalarını örneklendirmeye çalışacağım. Yazılarımı kısa tutmaya çalışıyorum, amaç verdiğim bilgilerin  bir temel oluşturması ve fikir vermesine yöneliktir,  bahsi geçen konular ile ilgili seçilecek alan gerek sektörel(Sağlık, Eğitim, Hukuk, Sigorta, E-Ticaret), gerek teknik olarak(NLP(Naturel Language Processing), CV(Computer Vision), DS(Data Science), ML(Machine Learning))  ilgili uzmanlık alanları belirleyerek araştırma ve öğrenmelerimizi derinleştirebiliriz.

Keyifli vakit geçirdiğinizi ümit ederek, veriyi anlama ve değerlendirme noktasında başarılı çalışmalar yapmanızı dilerim.

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.