Veri Bilimi Anketi Sonuçları 2021


Giriş

Data Science Earth, 2019 yılında üst düzey veri bilimi çözümleri üretmek amacıyla kurulmuştur. Üyelerinin tamamı gönüllülerden oluşan topluluk, öncelikle veri farkındalığını geliştirmeyi ve küreselleşen rekabet ortamında veri gücünün doğru kullanımını sağlamayı amaçlamaktadır.

Organizasyonumuzun bir parçası olan Veri Bilimi Anket Ekibi, tüm dünyadaki Veri Bilimcileri hakkında bazı keşifsel içgörüler elde etmek için 2020’de ilk anketini yayınladılar. Geçtiğimiz günlerde ise 2021 yılı için bu anketi gerçekleştirdiler. Gerçekleştirilen bu anket çalışması, yalnızca bazı içgörüleri keşfetmeyi değil, aynı zamanda Veri Bilimi ekosisteminde yeni olan ya da halihazırda bu sektörde bulunan ve kendilerini geliştirmek isteyen tüm Veri Bilimciler için bir rehber olmayı hedeflemektedir.

Bu rehber, Veri Bilimi hakkında günümüzde sıkça sorulan bir çok soruyu yanıtlamaktadır:

  • Veri Bilimine nereden başlamalı?
  • Mevcut becerilere daha ne eklenebilir?
  • Hangi araçları öğrenmek gerekli ve yakın gelecekte hangileri önem kazanacak?
  • Becerilerimizi geliştirmek için seçenekler nelerdir?
  • Veri biliminin amacı nedir?

Anketin sonuçlarına baktığımızda, elde edilen veri seti, dünyanın farklı bölgelerinden birçok farklı alanda çalışan Veri Bilimcilere dair özniteliklere sahiptir. Buradaki farklı bölgelerden kasıt neredeyse 20’den fazla ülke ve tüm dünyada birçok şehir anlamına gelmektedir. Anket Ekibimiz veri kümesinin ön işlem sürecini gerçekleştirdikten sonra, bizlere bazı içgörüler keşfetmek için etkileşimli gösterge panelleri oluşturdular.

Gelin bu gösterge panellerinde ortaya çıkan sonuçları adım adım birlikte inceleyelim.

Veri Bilimcilerin Demografik Analizi

İşte tüm dünyadaki veri bilimcilerinin demografisi hakkındaki keşiflerimizden bazıları!

Katılımcıların ülkesi, yaşı, cinsiyeti, branşı, eğitim düzeyi ve iş düzeyi hakkında bazı bilgiler bulabilirsiniz;

  • Ankete katılanların çoğu Türkiye’den gelse bile, bu sırasıyla ABD, Hindistan, Azerbaycan ve Avustralya ile devam ediyor. Brezilya ise 2021 anket sonuçlarına göre listeye adını yazdırmıştır.
  • Erkeklerin sayısının kadınlara göre açık bir şekilde baskın olmasına rağmen Z kuşağına odaklanıldığında erkek ve kadın sayıları birbirine yaklaşıyor ve hatta 2021 yılında kadın sayısı erkek sayısından biraz fazla olmaktadır. Bu durum önümüzdeki dönemde Veri Bilimi alanında kadınların işgücüne katılım oranının artacağını bize açıkça gösteriyor.
  • Y ve Z kuşağının toplamının neredeyse araştırmanın tamamı olduğu kolayca görülebilir. Buradan çıkarılacak içgörü, verilerle ilgili alanların ve Veri Bilimcisi olarak iş unvanının iş hayatı için yeni kavramlar olduğu olabilir. Ancak, sadece X nesline odaklanıldığında, iş kolu çoğunlukla akademisyenler oluyor. Bu durum akademinin veri bilimi noktasında iş hayatının önüne geçtiği şeklinde yorumlanabilir. 2021 ile birlikte akademisyenlerin özel sektörde kıdemli uzmana dönüştüğü görülüyor. Bu dönüşüm özel sektörün her zamankinden daha fazla uzman veri bilimciye ihtiyacı olduğu şeklinde yorumlanabilir.
  • Ankete katılanların çoğu genellikle profesyonel (kıdemsiz), uzman veya öğrencidir. Tersine mentörlüğün şirketler için çok önemli olduğu açıkça görülmektedir. Çünkü bu genç yetenekler, şirketlerin gelecekte veri odaklı şirketler olmasını sağlayacak.
  • Katılımcıların büyük çoğunluğu sırasıyla Bilgisayar / Yazılım Mühendisliği, İstatistik ve Endüstri / İşletme Mühendisliği ve dereceleri çoğunlukla lisans olmaktadır. İstatistik ve Bilgisayar Bilimleri, yüksek lisans derecesi için büyük ölçüde tercih edilmektedir. Bu tercih bizlere İstatistik ve Bilgisayar Biliminin Veri Biliminin temeli olduğunu bize gösteriyor. Ayrıca Ekonomi / Finans / İşletme Yönetimi son zamanlarda küresel ekonomiyi olumsuz etkileyen pandemi göz önüne alındığında yüksek lisans derecesi için en önemli ana dallardan biri olduğu kolayca görülebilir.
  • Veri Analizi / Raporlama, Veri Bilimi, Yapay Zekâ, İş Zekâsı / Karar Destek ve İş Analizi, özel sektör için Veri Bilimi alanının baskın iş kollarıdır.

Veri Bilimciler nerelerde hangi alanlarda ve yetkinliklerde çalışıyor?

Dünyanın farklı bölgelerinden ankete katılan veri bilimcilerin iş alanları, çalıştıkları şirket yapıları, veri boyutu, dil becerileri ve maaşları hakkında keşifleyici analiz ve yorumlara aşağıdan ulaşabilirsiniz;

  • Katılımcıların çoğu Türkiye’den geldiği için Türkçeyi yeterli düzeyde biliyor. Bunu ise İngilizce, Portekizce, İspanyolca, Fransızca ve Arapça takip ediyor. Bu diller dünya genelinde yaygın olarak konuşulduğu için beklenen bir durum olarak yorumlanabilir. Ancak bu dillerde İngilizce, Portekizce ve İspanyolca bildiğini söyleyen katılımcıların dil seviyeleri üst-orta ve ileri düzeydeyken, bu düzey Arapça ve Fransızca için henüz başlangıç düzeyindedir.
  • Veri Bilimcilerin deneyimlerine baktığımızda ortalama yaklaşık 5 yıl ve bu, Veri Biliminin işletmeler için neredeyse yeni bir çalışma alanı olduğunu destekliyor. Deneyimli liderlere odaklanıldığında danışmanlık ve eğitim gibi iş alanları doğrudan dikkat çekiyor. Bu liderler kesinlikle iş dünyasının geleceğini şekillendirecekler.
  • Ankete katılanların çoğu, çalışan sayısı açısından büyüklüğü <10 olan şirketlerde çalışıyor. Geçen yıl 10’dan az çalışanı olan şirketler bu sıralamada yine öne çıkmıştı. Bu butik şirketler, özellikle yeni mezun olmuş veya nispeten daha az deneyimli yetenekler tarafından kabul edilirken, aynı zamanda çoğunlukla  daha küçük boyutlu verileri işliyorlar.
  • Yanıtlayanların çoğu, boyutu 100 MB ile 1 TB arasında olan veriler üzerinde çalışıyor. İş alanlarına baktığımızda Bilgisayar (Donanım, Yazılım, Barındırma), Bilgi Teknolojileri, Finans ve Sigorta, Danışmanlık, Eğitim, Hukuk Hizmetleri, Otomotiv ve Tekstil gibi iş alanları göze çarparken, daha fazla veri boyutunun ile çalışan alanlar ise Bilgisayar (Donanım, Yazılım, Barındırma), Bilgi Teknolojisi, Finans ve Sigorta olarak ortaya çıkıyor.
  • Maaş, üzerinde konuşulması gereken gerçekten önemli bir konu. Veri ön işleme adımından önce elimizdeki ham veri seti aylık ve yıllık ayrım ile birlikte TRY, USD, EUR ve GBP dahil olmak üzere dört farklı para birimi türünü de içermekteydi. Bu durum, ham verileri aylık maaş dönemi ve USD para birimi türü olarak tek bir türe dönüştürmek için kritik bir veri işleme sürecidir. Bu süreçten sonra maaş analiz edilebilir hale getirelebildi. Sonuçlara baktığımızda daha çok tecrübenin daha çok maaş olduğu açıkça görülmektedir. Özellikle 16 yıllık sektör tecrübesinden sonra, organizasyon şemasında yönetici ve üzeri unvanlara sahip olunması ile daha fazla maaş alınabilmektedir. Burada ortaya çıkan, sektörde belirli bir deneyimden sonra maaşın keskin bir şekilde arttığıdır.

Yaygın olarak kullanılan Veri Bilimi araçları nelerdir ve hangi amaçla kullanılırlar?

İşte tüm dünyadaki veri bilimcilerinin demografisi hakkındaki keşiflerimizden bazıları!

Bu bölümde, Veri Bilimcilerin hangi araçları sıklıkla kullandığı ve bu araçları hangi amaçlarla kullandığı hakkında bazı bilgiler vereceğiz. Günümüzde en sık sorulan sorulardan biri, Veri Bilimi için hangi araçları öğrenmeliyim ve nereden ve nasıl başlamalıyım. Bu anketin sonuçları, bu soru işaretlerini yanıtlayan bilgileri tam olarak göstermektedir.

  • Gelen cevaplar neticesinde yaklaşık 30 farklı aracın Veri Bilimciler tarafından yoğun olarak kullanıldığı anlaşılmaktadır. Veri Bilimi, en iyi işi yapmak için her zaman en uygun araçları bir araya getirerek çalışır. Bu nedenle Veri Bilimi projeleri yaparken şu araçları kullanmak gereklidir gibi standartlar koymak yanlış olur. Her zaman aklımızda tutmamız gereken gerçek şudur ki, her iş için doğru aracı kullanmak kaliteyi artıracak ve maliyetleri en aza indirecektir.
  • İlk 5 Veri Bilimi aracına baktığımızda; Excel, Python, SQL, Anaconda ve R öne çıkıyor. 2021 anketiyle, araçları kendi içinde karşılaştırmak için Veri Bilimi araçları; Veri Tabanı Araçları, Makine Öğrenimi Platformları, Programlama Araçları ve Yazılım Paketleri olmak üzere dört kategoriye ayrılmıştır.
  • Dünyadaki verilerin çoğu veri tabanlarında bulunur. SQL (veya Yapılandırılmış Sorgu Dili), veri tabanlarıyla iletişim kurmak ve veri tabanlarından veri çıkarmak için kullanılan güçlü bir dildir. Katılımcıların verdiği sonuçlarda olduğu gibi Veri Bilimciler tarafından günlük hayatta kullanılan sistemlerden biri de SQL’dir. Bir veri bilimcisi olmak istiyorsanız, ilişkisel veri tabanları ve sorgular hakkında çalışma bilgisi gereklidir. Ancak MongoDB, Hadoop, Spark, Hive ve Kafka gibi NoSQL araçlar SQL’in hemen ardından geliyor.
  • AWS, Google Cloud ve Microsoft Azure sırasıyla çok yaygın olan ML Platformlarıdır ve bu üç platformun sektörde son derece baskın olduğu söylenebilir. Katılımcıların tercihleri, bu 3 platformun sektörde ciddi bir rekabet içinde olduğunu göstermektedir.
  • Anaconda, bilimsel bilgi işlem için Python ve R programlama dillerinin ücretsiz ve açık kaynaklı bir dağıtımıdır. Böylelikle katılımcıların kullandığı araçlar arasında İlk 5 içinde yerini almaktadır. Bir başka keşif niteliğindeki iç görü, Python kullanıcılarının Anaconda platformunu ve içindeki Jupyter Notebook’u tercih etmeleridir. Numpy, Pandas, Scikit-Learn, Matplotlibt ve SciPy gibi bazı faydalı kütüphaneler de katılımcılar tarafından kullanılmaktadır.
  • Bugün farklı kaynaklardan gelen doğrudan verileri kullanma fırsatımız olmasına rağmen, Excel‘in geçmişten günümüze en sık kullanılan veri kaynaklarından biri olduğunu kabul etmeliyiz. Matlab, SPSS, Power BI ve Tableau, katılımcılar tarafından sıklıkla kullanılan diğer yazılım paketleridir.
  • Veri Bilimi, İstatistik ve Bilgisayar Bilimleri bir arada kullanılarak iş süreçlerinin iyileştirilmesi ve yeni ürünlerin geliştirilmesinde kullanılmaktadır. İstatistik ve bilgisayar bilimi ile ilgili anket sonuçlarında da görülebileceği gibi, en çok kullanılan araçlar Python ve R‘dir. Geçmişte R bu konuda daha çok tercih edilirken, günümüzde Python güçlü bir yorumlayıcıya sahip olduğundan, büyük teknoloji firmaları tarafından kullanılıyor olmasından ve birçok farklı kütüphane içeriyor olmasından dolayı tercih edilmektedir. Ayrıca kullanımı da oldukça kolaydır. Özellikle Junior çalışanları ve Y-Z nesillerini filtrelerseniz bu farkı kolayca görebilirsiniz.
  • Günümüzde Veri Bilimi alanında pek çok araç bulunsa da her biri bir özelliği ile diğerinden farklılık göstermektedir. Veri Bilimcilerin en büyük esnekliği, bu araçların çeşitliliğinden kaynaklanmaktadır. Ankette bunu sorduğumuzda Veri Bilimcilerinin % 89’u bu araçlardan memnun olduğunu belirtti. 2021 ile karşılaştırıldığında bu teknolojik araçlara olunan tatmin % 93’e yükseliyor. Artmaya devam eden bu yüksek memnuniyetin bir nedeni, Veri Bilimi araçlarının çoğunun açık kaynak olması ve arkasında çok güçlü toplulukların bulunması olabilir.
  • Veri biliminin kullanım amacına baktığımızda sonuçlar bizi hiç şaşırtmıyor. İlk 5 sırasıyla İstatistiksel Analiz, Rapor Hazırlama ve Raporlama Çözümleri, Veri Yönetimi, Yapay Zekâ Uygulamaları ve Veri İşleme / Biriktirme olmaktadır. Bu durum Veri Biliminin temel sürecini bizlere yansıtıyor. Süreç, verileri toplamak ve yönetmek, üzerinde istatistiksel analizler uygulayarak bir model oluşturmak ve günün sonunda oluşturulan raporlar üzerinde kararlar almaktan oluşmaktadır.

Bir Veri Bilimcisi günde ne kadar çalışıyor?

Burada öncelikle bir ayrım yapmak anlamlı olacaktır. Çalışmak yerine, bu çalışılan vaktin ne kadarını verimli geçiriyoruz? Bu bizim için en sık sorulan sorulardan biriydi. Anketimizde bununla ilgili bir bölüm ayırdık. Veri bilimcilerine ne kadar verimli çalıştıklarını ve günde ne kadar Ar-Ge yaptıklarını sorduk. Aykırı değerler üzerinde gerekli işlemleri yaptıktan sonra sonuçlara baktığımızda;

  • Araştırmadan Veri Bilimcilerin günde ortalama 5,3 (geçen yıl 5,4 idi) saat verimli bir şekilde çalışabildikleri anlaşılıyor. Dünya genelinde beyaz yakalılar günde ortalama 7-9 saat çalışıyor. Bu, bugün çok tartışılan bir konudur. Microsoft, 2019’da Japonya ofislerinde bir hafta boyunca dört günlük bir çalışmayı test etti ve sonuç olarak çalışanların yalnızca daha mutlu değil, aynı zamanda önemli ölçüde daha üretken olduğunu gördü.
  • Veri Bilimi sürekli değişen ve gelişen bir alandır. Bu nedenle Veri Bilimciler, günlük işlerinden ayrı olarak kendilerini geliştirmek için zaman ayırmalıdır. Bu noktada araştırma sonuçlarını incelediğimizde, Veri Bilimcilerin Ar-Ge çalışmalarına günde ortalama 2,4 saat (geçen yıl 2,5 idi) ayırdığı görülmektedir.
  • Öte yandan, Veri Bilimcilerin ortalamada 2.4 saat / gün kendilerini geliştirmek için neler yaptıklarına baktığımızda; Katılımcıların yüksek bir yüzdesi (% 84) çevrimiçi kanalları kullanıyor gibi görünüyor. Özellikle çevrimiçi eğitimler, içerik ve topluluklar Veri Bilimcilerin kendilerini geliştirmek için seçtikleri kanallardır. Görünüşe göre bu durum COVID-19’dan sonra önemli ölçüde artacaktır. Bunun haricinde Veri Bilimciler, şirket içi eğitimlere katılarak kendilerini geliştirdiklerini ifade ettiler. Verilerden fark yaratmak isteyen firmaların Veri Bilimi alanında sahip oldukları insan kaynağını korumak ve geliştirmek için şirket içi eğitime önem vermesi gerektiği anlaşılmaktadır.
  • Bu iki ortalamaya baktığımızda Veri Bilimciler günde ortalama 8 saat çalışıyorlar. Bu durumda tüm veri bilimcilerinin kalan 8 saat ile eğlenmesini ve kalan 8 saati dinlenmesini öneriyoruz.

Veri Bilimciler mevcut durumlarından memnun mu ve gelecek için ne planlıyorlar?

Bilim bir gerçek olsa da, Veri Bilimcilerin insan olduğunu unutmamalıyız. İnsanlar yaşam ve çalışma koşullarından ciddi şekilde etkilenir. Bilim adamlarına en uygun yaşam ve çalışma koşulları sağlanabilirse, bilimi hak ettiği yere en yüksek kalitede taşıyacaklardır. Bu nedenle gelişmiş ülkeler bilimde her zaman öndedir.

  • Rakamlara baktığımızda durum maalesef pek tatmin edici değil. Katılımcıların bir kısmı (% 30-40) hem iş hem de yaşam koşulları hakkında yorum yapmamayı tercih ederken, diğerleri (% 40-50) memnun olmadıklarını belirtti. 2021 anketiyle birlikte elde edilen sonuçlar, hem yaşam hem de çalışma koşullarının her geçen gün daha da kötüleştiğini açıkça gösteriyor. Katılımcılar (% 45-60) maalesef memnun olmadığını ifade ediyor. Tüm dünyada yaşanan sorunlar ve bu sorunların uzun süre tekrarlaması insanların görüşlerini etkilemektedir. Bir başka gerçeklik de küreselleşme gerçeğidir. İyi yanları olmasına rağmen, problemli zamanlarda kötü etkileri daha hızlı ve büyüktür. Tedarik zincirindeki tüm bağlantılar etkilenir. Bu nedenle Bilim Dünyasında başarı istiyorsak belli bir kesimi değil bütünün mutlu olması lazım. Dünyanın her yerinden insanların yaşadığı bir diğer sorun da Covid 19 salgınıdır. Covid 19 salgınının başlangıcında dünyanın her yerinden insanlar evden çalışma deneyimi yaşadı ve ilk başta herkes bundan memnun olsa da artan çalışma saatleri, uzun toplantılar ve yoğun iş temposu iş-yaşam dengesinin bozulmasına neden oldu. Yaşam ve çalışma ortamını değerlendirdiğimiz bu soruya verilen cevapların kötüleşmesinde Covid 19’un da etkisinin olabileceği unutulmamalıdır. Önümüzdeki günlerde hem devletlerin hem de şirketlerin gerekli önlemleri alacaklarına inanıyoruz.
  • Veri Bilimciler (% 40) anket sonuçlarında işlerinden ve yaşam koşullarından memnun olmamakla birlikte gelecek planı olarak çalışma alanlarında kendilerini geliştirmek istediklerini belirtmişlerdir. Bunu olumlu bir durum olarak görüyoruz. Bu oran bize, Veri Bilimcilerin işlerine ve bilimlerine yönelik büyük umutları olduğunu gösteriyor. 2021 anketi ile bu oranın %60’a çıkması gerçekten sevindirici. Covid 19 salgını bize çevrimiçi eğitimin bu gibi durumlarda bir fırsat olduğunu gösterdi. 2021 anketinin sonuçları bize gösterdi ki çevrimiçi eğitimlere katılma isteği özellikle Z kuşağı için %83’ten %88’e yükseldi. Bunun dışında mevcut durumdan memnun olmayan ve iş değiştirip yurt dışına çıkmak isteyenlerin de ciddi bir oranı var (%30). Son olarak, kendi işinin patronu olmak isteyen girişimciler (% 15) umudunu kaybetmeyenler arasındadır. Ancak bu oran maalesef 2021 sonuçlarıyla %11’e geriledi. Bu düşüşün en büyük nedenlerinden biri muhtemelen Covid 19 salgınıdır. Umarız tüm Veri Bilimciler istediklerini en iyi şekilde yapabilirler.

Sonuçlar

Genel olarak Veri Bilimi ekosisteminin genç yetenekler ve dinamik yapısı ile gelişmeye devam ettiğini görüyoruz. Her teknolojinin bir heyecan(hype) çemberi olduğu için bu alanda da geçerli. Sonuçları derinlemesine analiz ettiğimizde, hala bu çemberin ilk aşamalarında olduğumuzu anlıyoruz.

Özellikle Y ve Z kuşağının önümüzdeki yıllarda bu alanda ciddi bir söz sahibi olacağı ve bu alana yön vereceği görülmektedir. Verilerle fark yaratmak isteyen firmaların bu genç yetenekleri desteklemesi ve bu alana yatırım yapması gerektiği anlaşılıyor.

Özellikle öğrenme yönünde online içerik tüketiminin arttığı bu alanda çözümler de hızlı bir şekilde üretilmektedir. Kullanılan araçların esnekliği ve çeşitliliği ve bu araçların arkasındaki güçlü topluluklar, Veri Bilimciler için önemli ölçüde esneklik ve kolaylık sağlamaktadır.

Son olarak, bu çalışmaya katkıda bulunan araştırmacılarımıza@mehmet, @yunusemre-mizrakci ‘ya çok teşekkür ediyoruz. Veri Bilimi, bilgi ve deneyimin paylaşıldığı, keyifli bir şekilde çözümlerin üretildiği bir alan diyebiliriz. Bu çalışmayı Veri Bilimciler için bir rehber olması amacıyla oluşturduk. Sizlerden ricamız, Veri Bilimi’ne hep birlikte katkıda bulunmaya ve Veri Bilimi ile dünyayı güzelleştirmeye devam edelim.

+5
+5

Patreon

üzerinden bize destek olabilirsiniz!

.

Birlikten kuvvet doğar! Sizde #patreon üzerinden bizim yanımızda olabilirsiniz. Yaptığımız gönüllü çalışmaları arttırmak için bize destek olun.

Ücretli ve Ücretsiz Eğitimler

Türkiye'nin en büyük veri bilimi topluluğu ile kariyerinizi inşa edin.

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.