Veri Bilimi
Veri bilimi mesleği dünya genelinde yapılan araştırmalarda en iyi meslekler sıralamasında son yıllarda ilkler arasında yer almaktadır. Bu sebeptendir ki şirketlerde yeni iş alanları açarak bu alandaki insan kaynağını temin etmek için değişik rollerde yeni istihdamlar sağlamakta ve veri ile değer üretme noktasında bir adım ileri çıkmak istemektedirler. Bizde bu yazımızda Veri bilimine giriş ve veri bilimi alanındaki meslekler, veri bilimi çalışmalarında faydalanılan araçlar ve veri bilimi uygulamalarına örnekler vereceğiz.
Veri Bilimi Nedir ?
Veri bilimi disiplinler arası bir çalışma alanıdır, bu alanlar içerisinde matematik, istatistik, programlama, iş bilgisi gibi bir çok disiplinin ortak çalışması sonucu ortaya çıkan bir çalışma alanıdır. Bilimsel yöntemler, algoritmalar ve farklı teknolojiler kullanılarak ham, yapılandırılmış yada yapılandırılmamış verilerden anlamlı sonuçlar çıkarma ve çıkan sonuçların otomatize olacak şekilde sisteme uyarlanmasıdır.
Veri bilimi çalışmalarında, veriden anlamlı sonuçlar çıkarmak ve bu sonuçların uygulanmasını sağlamak amacı ile en yüksek donanıma sahip araçlar, en gelişmiş programlama dillerinden ve çok ileri seviye algoritmalardan faydalanılır.
Aşağıdaki başlıklar altında toparlayacak olursak;
- Doğru sorular sorarak ham verilerden sonuç üretme,
- Farklı algoritmalar kullanılarak karmaşık modelleme işlemleri ile veriyi modellemek,
- Veriye en anlamlı kılacak şekilde görselleştirme,
- En iyi kararları vermek için niha-i noktada elde edilen sonuçlardan faydalanmaktır.
Örneğin;
İstanbul’da X noktasından Y noktasına araçla gideceğimizi düşünelim, bu işlem için trafiğe çıkmadan önce ilk yaptığımız şey, navigasyon cihazı yardımı ile gideceğimiz noktaya bir rota oluşturmak. Bu işlem için kullanmış olduğumuz navigasyon cihazı bize gideceğimiz noktaya alternatif yollar için rotalar çizer ve bizde zaman, maliyet, kolaylık açılarından işimize en yararlı olan seçenekle rota belirleriz ve yola çıkarız, işte bize bu imkanı sağlayan sistem kullandığımız navigasyon cihazındaki(Telefon, Tablet, Bilgisayar, Navigasyon Cihazı vb.) ileri seviye algoritma yazılımları ve yapılan işlem ise veri analizi yani Veri biliminin bir alt dalı olan çalışma disiplinidir.
Veri Bilimine İhtiyaç var mıdır ?
Verinin son yıllarda, sosyal medya, dijital dünyada önlemez bir şekilde arttığı bu zamanda veriden anlamlı sonuçlar çıkarmak çok büyük bir ihtiyaçtır, önceleri belki elde olan verileri temel bir excel dosyasında tutup yine temel iş zekası araçları ile görselleştirebiliyor iken, şimdi verinin kapasitesinin hızla artması ve yığılan bir çok sorunun(verinin) üstesinden gelmek için eldeki verileri en faydalı şekilde kullanma ve en anlamlı uygulamalar ve sonuçlar üretmek için veri bilimi ihtiyacı doğmuştur.
Araştırmalara göre 2020’de her saniye başına yaklaşık 1.7MB veri üretilmekte dolayısı ile bu verilerin elde edilerek depolanması, görselleştirilmesi, verilerden en faydalı çıktıların elde edilmesi gibi sebepler veriye olan önemi aşağıda belirtilen birkaç ana sebepten dolayı daha fazla artırmaktadır:
- Veri bilimi teknolojileri yardımı ile elde oluşan kapasiteleri yüksek(terabyte) verileri en anlamlı şekilde görselleştirip faydalı çıktılar elde edebiliriz.
- Dünya genelindeki bir çok teknoloji firması Google, Amazon, Alibaba vb. kuruluşlar ve yüzlercesi kullanıcılarınının en iyi şekilde araçlarından faydalanmaları için veriyi yüksek düzeyde değerlendirmektedirler.
- Veri bilimi bir çok işin otonom(insan müdahalesi olmaksızın) edilmesi süreçlerinde örneğin, sürücüsüz araçlar, robotlar vb. gibi alanlarda yoğun olarak kullanılmaktadır.
- Tahminleme işlemlerinde yine veri bilimi alanından faydalanmakta, örneğin seçimler, hava durumları, borsa vb gibi alanlarda tahminleme algoritmaları aracılığı ile önemli katkılar sağlamaktadır.
Ayrıntıları ile açıklamaya çalıştığımız “Veri Bilimi” alanı ve bu alanda oluşan meslekler yada iş kollarını ayrıntılı olarak inceleyelim.
Günümüz ve geleceğin dünyasında verinin hızlı bir şekilde artması ve bu verilerin anlamlı kılınması eldeki verilerden en yüksek seviyede faydalanılması için “Veri Bilimi” alanındaki mesleklerinde önemi her geçen gün artmakta ve alana olan insan kaynağı ihtiyacıda artmaktadır. Tahminlere göre 2030 yılında yaklaşık bu alandaki insan kaynağı ihtiyacı 13 milyon seviyelerinde olacaktır.
Veri Bilimi Alanındaki Meslek Türleri Nelerdir ?
Eğer veri bilimci olmak ve veri ile çalışmak istiyorsak bu alandaki iş kollarını ana hatları ile bilmeli ve gelişim süreçlerimizi ve planlarımızı bu ana dallar çerçevesinde ilerletmemiz faydamıza olacaktır.
- Veri Bilimci
- Veri Analisti
- Makine Öğrenmesi Uzmanı
- Veri Mühendisi
- Veri Mimarı
- Veri Yöneticisi
- İş Analisti
- İş Zekası Yöneticisi
Aşağıda bazı Veri bilimi meslek dallarını açıklamaya çalışalım.
1.Veri Analisti:
Veri Analisti, veri madenciliği yapan, verileri modelleyen veriler arasındaki örüntüsel ilişkileri anlamaya çalışan kişidir. Günün sonunda karar verme ve problem çözme süreci için verileri analiz edip görselleştirme görevini üstlenen ve raporlama işlemi görevlerini alan bireydir diyebiliriz.
Yeterlilikler; Eğer iyi bir “Veri Analisti” olmak istiyorsak , matematik, istatistik, iş zekası ve veri madenciliği alanlarında yeterliliklerimizi ve bilgilerimizi artırmamız gerekir. Aynı zamanda MATLAB, Ptyhon, R, SQL, Hive, Pig ,JavaScript, Excel, Spark gibi programlama dillerinden en az bir yada iki tanesinden ileri seviye bilgi ve uygulama düzeyinde yeterlilik sahibi olmamız gerekmektedir.
2. Makine Öğrenmesi Uzmanı:
Makine Öğrenmesi mühendisi daha çok işin algoritma tarafında görev alan kişidir, yani regresyon, kümeleme, sınıflandırma, karar ağaçları, rastgele orman algoritmaları gibi teknik kodlama ve algoritmaları uyarlayan ve geliştiren kişilerdir.
Yeterlilikler: Algoritmaların kodlamak için bilgisayar programlama dillerinden olan, C/C++, Python, R, Java, Hadoop, Scala gibi diller kullanılmaktadır.
3. Veri Mühendisi:
Veri Mühendisleri, Büyük veri kümeleri/setleri ile çalışan kişidir. Bir veri bilimi projesinin oluşturulmasında veri hazırlama, model oluşturma süreçlerini takip ederek model mimarisini oluşturmadan sorumlu bireydir.
Yeterlilikler: Bir Veri Mühendisi’nin sahip olaması gereken yeterlilikler, Veri tabanı yönetimleri, SQL, MongoDB, Cassandra, Hbase, Apache Spark gibi yeterlikliklerler birlikte bazı programlama dilleri olan, Python, C/C++, Java, Perl gibi dillerle de code yazabilme yeterliliğinde olması gerekir.
4.Veri Bilimci:
Veri Bilimci, multi disipliner bir yapıya sahip, yüksek kapasiteli verilerin işlenmesi, algoritmaların optimize edilmesi, eldeki kaynaklardan en optimum çözümün üretilmesi ve uygulamaya alınması noktasında görev üstlenen bireydir.
Yeterlilikler: R, Python, SQL, Hadoop, Apache Spark, MATLAB gibi programlama dillerinde yüksek seviyede bilgi ve deneyim sahibi olmalı. Aynı zamanda veri bilimci, matematik, istatistik, görselleştirme, iletişim gibi alanlardada bilgi birikimine sahip olması gereken çok yönlü çalışmalarda görev alan kişidir.
Bu yazımızda veri bilimi ve veri bilimi için meslek dalları ile ilgili özet bilgiler vermeye çalıştım. Bundan sonraki yazımda veri bilimi alanında kullanılan araçlar, veri bilimi alanındaki meslekler ve ortak noktaları konusunda ayrıntılı olarak bilgiler paylaşacağım.
Fatma Keremgil
Çok teşekkür ederim sait faydalı bir yazı olmuş
Sait Alay
Değerli yorumunuz için teşekkür ederim.
Çağrı Aksu
Elinize sağlık Sait bey.
Sait Alay
Teşekkürler Çağrı bey.
Yunus Emre Mızrakçı
Bir solukta okunabilecek, kıymetli bir makele olmuş. Teşekkürler.
Sait Alay
Teşekkür ederim Yunus bey.
Cahit İŞLEYEN
Elinize sağlık dolu dolu bir yazı olmuş
Sait Alay
Teşekkürler.
Ezgi Demir
Teşekkür ederiz
Sait Alay
Teşekkürler.
Didem Sönmez Ekin
Sait Bey, elinize sağlık.
Sait Alay
Teşekkürler.
Halil ibrahim AKCA
Sait bey yazınızı hiç sıkılmadan tek solukta okudum ve benim için gerçekten faydalı bir yazı oldu, devamının gelmesi dileğiyle 🙂
Mert EKİNCİ
Emeğinize sağlık, çok güzel bir anlatım olmuş.
Zeliha ÇERİBAŞI
Elinize sağlık çok faydalı oldu Sait Bey