Veri Bilimi ve Yetenek Yönetimi

veri bilimi takımları nasıl oluşur, nasıl yönetilir

Her “Veri Bilimi” dediğimizde aklımızda sürekli yeni şeyler belirdiği bu dönemde, elbetteki tam ve net bir veri bilimi tanımı yapmak oldukça zor ve daha zor olan bir şey de; Veri Bilimi tanımını netleştirmeden bir Veri Bilimci tanımı yapmak oluyor.

Burada bir Veri Bilimi tanımı yapmakta fayda var.

veri bilim nedir grafik

Veri Bilimi Nedir?

Veri bilimi benim için çok temelde Veriye dayalı bir ürün üretme sürecini tasarlamak, yönetmek ve gerçeklemektir. Burada ürün elbetteki şirket içi ya da müşterilere yönelik bir ürün olabilir. Bu ürün hali hazırda yürütülen bir operasyonu destekleyici nitelikte olabilir ya da müşteri ile direkt buluşan bir ürün olabilir.

Ben kendi içimde, Veri Bilimini bir takım görevi ve Veri Bilimciyi de bu takımın bir üyesi olarak tanımlayarak bu belirsizliği biraz dizginlemeye çalışıyorum. Ve fakat gel gör ki; yinede her gün genişleyen bu çatı kavram(Veri Bilimi) ile baş edebilmek zor. Sürekli yeni unvanlar yeni görevler beliriyor zihnimde.

Burada Veri Bilimi ve Veri Bilimci kavramlarını irdelerken önemli bir ayrımım olduğunu da söylemem gerekir, yazımın bu bölümünde. Ben şirketleri Veri Bilimi üreticileri ve kullanıcıları olarak birbirinden ayırıyorum. Tabi bu ayrımı sadece Türkiye şirketlerini düşünerek yapmıyorum. Burada değerlemem bütün dünya için oluyor. En azından internetten ya da çeşitli organizasyonlardan gözlemleye bildiğim kadarı ile.

Veri Bilimi kullanıcıları

Bu şirketler bakımından Veri Bilimi, üretilmiş araçlar ve tekniklerin kullanılması yolu ile çok fazla efor sarf etmeden bu çatı kavramdan fayda elde etmek anlamını taşıyor. Ve bu durum elbetteki eleştirilecek bir durum değil. Çünkü Veri Bilimi başlığı altında yeni bir şeyler üretmek oldukça büyük maliyetleri göğüslemeyi gerektiriyor. Bu maliyet kalemleri içerisinde elbetteki en büyük pay insan kaynağına ayrılmak durumundadır. Sebebi basit; yeni fikir ya da yeni bir fikri hayata geçirmek deneyimli ve yetenekli bir ekip kurulmasını gerektiriyor. Ve tabi bu tip konusunun uzmanı deneyimli kişileri çalıştırmak çok maliyetli. Buna birde alt yapı maliyetleri eklenince durum iyice içinden çıkmaz bir hal alıyor.

Ülkemizde özellikle Ar-Ge merkezleri başlığı altında bu tip maliyetlere Kamu desteği sağlanmakla birlikte, çoğu zaman bu desteğin, ülkemiz ekonomik şartlarını ve bu konudaki gelişmiş insan kaynağımızın yetersizliğini(Elbetteki bu yetersizliğin önemli bir kaynağı da yurt dışına göç olgusudur.) düşününce yetersiz kaldığını gözlemliyoruz.

Belki de bu durumun bir sonucu olarak son zamanlarda çokça karşılaştığım ve benim “Süpermen aranıyor!” ilanları olarak nitelediğim, içerisinde görüntü işlemeden ETL’e, ETL’den NLP’ye neredeyse duyulmuş/bilinen bütün görevleri içeren ilanlar ortaya çıkıyor. Bu ilanları eleştiriyor olsam da, bu ilanların ihtiyaçların bir karşılığı olarak ortaya çıkmış olduğu durumunu inkar etmem doğru olmaz.

Şirket yetkilileri oturup hedefler ve ihtiyaçları değerlendirip lazım olan özgeçmişleri belirliyorlar. Ve fakat bu konudaki deneyim eksikliği sebebi ile aynı anda bir insanın yapamayacağı kesin olan bazı işler aynı arama kriterleri içerisine dahil edilebiliyor. Ediliyor edilmesine de acaba aradığını bu şirketler bulabiliyor mu? Elbetteki hayır.

Veri Bilimi üreticileri

Bu tip şirketler genellikle ülkemizde mali bakımdan güçlü ve Türkiye dışarısında hedefleri olan şirketler olarak karşımıza çıkıyorlar. Bu şirketlerin ayırabildikleri bütçe payları yeterli olduğu için yeterli bir takım kurabiliyorlar. Fakat bu “yeterli” takımın kurulmasının sadece para ile olabileceği yanılgısına kapılmayalım lütfen. Çünkü o iş o kadar kolay değil.

Bu şirketlerde benim gözlemlediğim kişisel referans yani bilgi ve deneyimine güvenilen insanların “X bu işi yapar!” demesi önemli. Bunun dışında bu şirketleri yeni insanlara ulaşmak için yarışmalar düzenlerken görebiliyoruz. Bu yarışmalar ciddi anlamda insanların yaptıkları işleri değerlendirmek bakımından önemli oluyor. Ülkemizde bu yöntem genellikle genç yeteneklere ulaşmak için yapılıyor. Bir diğer çalışma da GitHub, Kaggle çalışmaları ve yayınlanmış makale/yazıları taramak. Bu yol da oldukça efektif çalışıyor bence.

Ve tabi kısmen de olsa yeterli insan kaynağına ulaşan bu şirketler, yaptıkları işi en iyilemek için gerekli olduğunu düşündükleri araçları ya da yöntemleri geliştirebiliyorlar.

 

Zihnimdeki bu ayrımı anlattıktan sonra, Veri Bilimci derken kast ettiğim Veri Bilimi Takımı kavramını anlatmak isterim.

Veri Bilimi Takımı

Veri Bilimi takımı elbetteki çok temel anlamı ile yukarıda yaptığımız Veri Bilimi tanımının uygulayıcısı konumdadır. Yani verinin ürüne dönüşme macerasını gerçekleştiren çalışma grubudur. Bu çalışma grubu;

  • verinin nasıl ve nerede toplanacağı
  • verinin analize hazır hale getirilmesi
  • verinin analiz edilmesi
  • ürün tasarımı

görevlerini yerine getirirler. Dolayısı ile yapılan iş;

  • planlama
  • modelleme
  • senaryolaştırma
  • kodlama
  • yönetim

görevlerinin bir toplamıdır. Ve elbetteki bu kadar farklı yeteneği bir araya getirip kusursuz çalışmalarını sağlamak zorlu bir süreçtir. Bu süreç içerisinde elbetteki birçok farklı unvanlı uzmanın bir araya getirilmesi ile oluşturulur fakat ben birkaç tane önemli gördüğümü sıralamak istiyorum:

  • Veri Mühendisi : Verinin toplanması, biriktirilmesi ve dağıtılması
  • Veri Analisti : Verinin istatistiki ve makine öğrenmesi yöntemleri ile araştırılması
  • Ürün Tasarımcısı : Verinin işlenmesi ile ortaya çıkan bilgi ve desenlerin ürünleştirilme süreçlerinin tasarlanması
  • Süreç Yöneticisi : Veri Bilimi süreçlerinin planlanması ve yönetilmesi
  • İş Analisti : Teknik ile iş birimlerini birleştirmek, birlikte çalışmalarına aracılık edecek dokümanları oluşturmak
  • İş Sahibi(Ürün sahibi) : Verinin üretildiği prosesleri ve ürün tasarımını betimlemek

Tabii bu süreç katılımcılarının konularında uzman olmaları önemli ama bu takımı destekleyecek ve takımın devamlılığını ve çevikliğini sağlayacak genç arkadaşlar da bu takıma ek olarak katılmalıdır.

 

Burada sanıyorum bir ayrımda şirket büyüklükleri için yapmakta fayda var.

Küçük ve Orta Boy Şirketler için Veri Bilimi Takımları

Nispeten mali bakımdan daha küçük takımlar kurmak zorunda olan şirketlerde doğal olarak bir kişi birden fazla görev üstlenmek zorunda kalıyor. Bu anlamda hayatımıza Veri Biliminde çok yönlülük kavramı da girmiş oluyor.

Çok yönlülük yani birden fazla konuda odaklanarak çalışmak hazır araçların kullanılması durumunda çok büyük bir sıkıntı yaratmamaktadır. Fakat yeniliklerin fark edilip şirket süreçlerine uygulanması süreçleri gecikmeli olarak gerçekleştirilebilmektedir.

Burada veri üzerinde çalışan personelin çalışma yükü iyi ayarlanmalıdır. Çünkü birden fazla işi ağır yük altında yapmak hatalara yol açabilecektir.

Benim bu şirketlere genel önerim daha genç arkadaşların istihdam döngüsünde daha fazla yer almalarıdır.

Yenilikçi çalışmalar için ise Teydeb ar-ge fonları ve diğer ar-ge araştırmacısı fonlarının etkin kullanımı ile sağlanacak iş gücü kullanılmalıdır.

Büyük boy şirketler için Veri Bilimi Takımları

Mali açıdan bir sıkıntısı bulunmayan şirketler yukarıda saydığım pozisyonları doldurmaları çalışmaların sürekliliği bakımından faydalı olacaktır. Burada çok yönlü çalışma sistematiğini bir kenara bırakmak ve çalışanların bir konu üzerinde derinlemesine çalışmalarına izin vermek oldukça önemlidir.

Bir işe odaklanmış Veri Bilimi çalışanı üzerinde çalıştığı konuda yenilikçi çözümler deneyebilir ya da yeni çözümleri kendisi üretebilir.

Fakat burada çalışanların belli bir zamanı makale okumak araştırma yapmak ya da makale yazmak ile geçirmesinin önü açılmalı ve teşvikler uygulanmalıdır.

Bu düzeyde şirketlerin yurt içi Ar-Ge fonları yerine uluslararası Ar-Ge projelerine dahil olması gerekir. Bu tip projeler hem çalışanlarınızın motivasyonunu üst seviyede tutacak hem size Türkiye dışarısında bir bilinirlik kazandıracak hem de Veri Bilimi süreçlerinizin daha hızlı gelişmesini sağlayacaktır.

Burada tabi çok önemli bir konuda yeni yeteneklerin Veri Bilimi takımına kazandırılmasıdır. Fakat kazandırmak da yeterli değil. Yetenekli arkadaşların bir geliştirme programına dahil edilmeleri gerekir.

 

Zihnimdeki Veri Bilimi takımını anlattığıma göre artık birazda gelişimden bahsedebilirim.

Sürekli Gelişim

Veri Bilimi takımlarında gelişim olgusunun sürekliliğinin sağlanması motivasyonu bence paylaşmak üzerine kurgulanmalıdır. Bu paylaşım süreci hem toplam takımın hem de kişisel çalışmaları ile takım üyelerinin kendileri ön plana koyabilecekleri senaryoları içermelidir. Ve tabi bu paylaşım süreci içerisinde yapılacak yazılı/görüntülü paylaşımların kalitesinin ve sürekliliğinin belli bir seviyede olması içinde kesintisiz bir araştır–>üret–>uygula süreci kurgulanmalıdır.

Ve fakat unutulmamalıdır ki bir Veri Bilimi takımının gelişimi sadece takım üyelerinin geliştirilmesi ya da motivasyonu ile olamaz. Veri Bilimi takımının gelişmesisinin önemli bir ayağı da Veri Bilimi ekosistemi ile bütünleşmesidir.

Burada gelişim için uygulanacak birkaç yöntemi saymak isterim.

Blog uygulaması

Veri Bilimi takım üyelerinin kesinlikle her ay bir tane araştırma ödevi olmalı ve bu araştırmalar yazıya dökülmeli. Bu yazılar şirket blog uygulamasında yayınlanmalı. Junior takım üyeleri için bu ödevler ayda 2 tane olabilir. Tabii burada araştırmanın kapsamı da önemli bu sayının belirlenmesinde.

Araştırmalar yeni araç ya da yaklaşımların uygulanması, birbirleri ile performans bakımından karşılaştırılmaları ve diğer araçlarla birlikte kullanımlarının değerlendirilmeleri şeklinde olabilir.

Eğitim Günleri

Veri Bilimi takım üyeleri yaptıkları araştırmalar sonrasında elde ettikleri bilgi ve tecrübeleri ayda bir yapılacak eğitim günleri ile paylaşmalı ve insanlara anlatmalıdırlar. Burada eğitimler şirket içi veya içeriğe bağlı olarak herkese açık şekilde kurgulanabilir. Fakat herkese açık eğitimlerin, şirketinizin yeni yetenekli insanlara ulaşması bakımından çok faydalı olabileceğini unutmamanızı tavsiye ederim.

Eğitimler hem teorik altyapının anlatılması hem de uygulama yapılması şeklinde ilerlemelidir. Şirket içi eğitimlerde, eğitim konusunun nasıl kullanılacağı diğer süreçlerle nasıl adapte edileceği konusunda birlikte çalışmalar yapılmalı.

Açık Veri ve Hackathon

Kesinlikle şirketinizin sorunlarının irdelenebileceği bir açık veri kaynağı oluşturmalısınız. Bu açık verinin oluşturulmasının amacı elbetteki yarışmalar düzenlemenize olanak sağlamasıdır.

Bu yarışmalar elbetteki bir mekanda toplanıp yapılabileceği gibi Kaggle gibi bir platformda online da düzenlenebilir.

Bu yarışmaların;

  • Farklı bakış açılarının problemlerinizi değerlendirmesi
  • Yetenekli, becerikli insanlara ulaşma
  • Kendi başarınızın karşılaştırılması

konularında büyük faydası olacaktır. Ve fakat kurgunun iyi oluşturulması burada çok önemli. Çok geniş başlıklı yarışmalar istenilen faydayı sağlayamayabilir. Burada yarışma hedefi ve hedefin gerçekleştirilmesi sırasında katılımcıları sınırlamayacak verisetlerinin oluşturulması önemlidir. Burada dışarıdan destek almak faydalı olabilir. Çünkü Veri Bilimi takımı üyeleriniz kendi bakış açılarını bu sürece çok fazla katmaları, yakalamak istediğiniz farklı bakış açılarının bir çoğunu ve belki de sizinkinden daha iyi bir çözümü kaçırmanıza sebep olabilir.

Seminer Programları

Ben Veri Bilimi takımlarının uzun süreli eğitimlere katılmasına karşıyım. Çünkü uzun süreli eğitimler genelde verimsiz oluyor ve Veri Bilimi takımlarını hazırcılığa alıştırıyor. Burada benim önerim seminerler düzenlemek ya da şirket dışında düzenlenen seminerlere katılmak.

Kendi işinizle ilgili başarılı çalışmaları olmuş olan insanların şirketinize gelmesi ve başarı hikayelerini ya da başarılı oldukları yöntemleri anlatması hem bilgilendirici hemde motive edici olacaktır.

Belli dönemlerde konunuz ile ilgili çalışmalarda bulunan akademisyenleri de şirketinize çağırmanız faydalı olacaktır. Fakat bu akademisyen ziyaretleri bir seminer havasında olsa da günübirlik çalışma ortamlarının oluşturulması da önemli olur.

Üniversite İşbirlikleri

Kesinlikle üniversitelerle bir bağınız olsun. Üniversite TTO ile birlikte çalışabilir ve akademisyenleri belli periodlarla çalışmalarınıza dahil edebilirsiniz. Bu birlikte çalışma düzeni Veri Bilimi takımınızın araştırma kültüründen kopmamasını sağlayacaktır. Bu durum hem akademik çalışmalara(ortak makale, çalıştay katılımı vb .gibi) katılmaları ile hem de yaratacağı bilim çalışma motivasyonu ile sağlanacaktır.

Genç Yetenek Programı

Yukarıda birçok kere “Yetenek” kelimesi geçti. Çünkü hakikaten önemli bir realite var ki; zaman içerisinde kendi Veri bilimi yıldızlarını üretemeyen şirketler gelişimlerini istenilen düzeye çekmekte çok zorlanırlar. Çünkü tabir yerindeyse; çekirdekten yetişmiş hem işinizi hemde Veri Bilimi metodolojilerini iyi bilen takım üyeleri problemlere daha hızlı ve daha hedefe yönelik çözümler üretebilmektedirler.

Yetenek programınız genç arkadaşları içerisine almalı ve onları hem yapılan iş hem de Veri Bilimi konularında eğitmelidir. Dolayısı ile Yetenek programınız şirketin farklı departmanlarını içermeli ve katılımcılarına farklı sürelerle farklı departmanlarda bulunma fırsatı vermelidir.

Yetenek programına dahil olan genç arkadaşlardan farklı konularda birlikte çalışarak araştırmalar yapmaları istenmelidir. Örnek kodlamalar uygulamalar yapmaları için gerekli alt yapı sağlanmalıdır.

 

Burada en zor başlık olan ölçme ve değerlendirme konusunda bir şeyler yazmak istiyorum.

Veri Bilimi Takımlarının Başarılarının Değerlendirilmesi

Ciddi anlamda Veri Bilimi takımlarını ölçmek zor. Çünkü yapılan işin önemli bir kısmı araştırma/geliştirme faaliyetlerinden oluşuyor. Ar-Ge faaliyetlerinin doğası gereği yapılan çalışmalar çoğu zaman faydalı bir sonuç üretmemektedir. Üretse bile faydanın ortaya çıkması, yani rakamlarda görünmesi, yine çoğu zaman sonraki dönemlerde olmaktadır. Tabi bu ortaya çıkan faydanın zamanla ortaya çıkabilmesi durumu gibi zararında zamanla ortaya çıkma durumu var. Örneğin önerilen bir çözüm kısa vadede rakamlarda bir iyileşme sağlasa bile uzun vadede bir zarara yol açabilir ya da tam tersi bir durum olabilir.

Yine de bir şekilde ölçmek, gelişimi anlamak bakımından da önemli olduğundan, bir mecburiyet olarak karşımıza çıkmaktadır. Kullandığım birkaç kriteri burada yazmak isterim.

Takım Çalışması Uyumu

Burada kesin bir metrik olmasa da takım üyelerinin birbirini değerlemesi benim güvendiğim bir yöntemdir.

  • “Takıma katkısını 1-10 aralığında değerlendirin”
  • “Sorunlara/Sorulara geri dönüş başarısını 1-10 aralığında değerlendirin”
  • “Araştırmalarını 1-10 aralığında değerlendirin”
  • “Yazılarını 1-10 aralığında değerlendirin”

gibi sorular ile bir genel değerlendirme ölçeği oluşturulabilir. Burada çok genel ya da çok özel(göreve göre değişebilecek) sorular sormamak önemli. Tabi burada ortalama üzerinden bir değerlendirme yapılabilir ama kesinlikle bir alt uyarı bandınız olsun. Mesela herhangi bir soru için herhangi birinden 5 ve altı değerleme alan bir çalışan için özel bir araştırma yapmak gerekebilir.

Gelişim

Bu değerlemeyi yazılan makale/yazılar ya da çekilen videolar üzerinden yapabiliriz. Tabi bu değerlemeyi yapabilmek için bu paylaşımlar için beğeni derecesini belirleyen bir skor sisteminin okuyucu ya da izleyicilere açık olması gerekir.Burada bu yayınların genele açık olanlarının etkisi önemli. Bağımsız bir denetleyici rolü üstlenebilir burada paylaşımları gören/okuyan takipçiler.

Fakat unutmamak gerekir ki; daha basit ya da temel içerikler daha fazla ilgi çekecektir. Zor ya da çok spesifik içerikler daha az ilgi çekecektir. Dolayısı ile içeriğinde bir uzman tarafından değerlendirilmesi gerekir. Bu süreçleri insan kaynaklarına bırakmayın lütfen.

Burada gelişim odaklı seminerlere, çalıştaylara ya da eğitimlere katılımlar da ayrıca değerlendirilmelidir.

 

Fayda

Ve tabii ki Veri Bilimi takımlarını ve bu takıların üyelerini değerlendirirken kullanacağınız en önemli kriter ortaya çıkarılan veriye dayalı ürünün yarattığı faydadır. Bu fayda çok açık konuşmak gerekir ise bilançoda görünmelidir. Yani takımın üretiminin şirketinizin rakamlarına olumlu bir etkisinin olması lazım.

Burada fayda ürün satışlarının artması, karlılığın artması, yeni müşterilere erişilmesi gibi şirketinizin çalışma konusu ile ilgili olarak belirlenecektir elbetteki. Fakat burada yukarıda da bahsettiğim fayda ya da zararın belli bir dönem sonrasında ortaya çıkması durumunu da dikkate almalısınız.

Örneğin Veri Bilimi takımınız bir müşteri grubunu belirleyip “onlara A ürününü B fiyatından önerelim” dediklerinde, bu uygulama sonucunda kısa vadede bir satış artışı sağlanabilir fakat uzun vadede bu uygulama, belki bir çok tekrarı sonrasında bir müşteri memnuniyetsizliği ya da müşteri beklentisini değiştirerek, karlılıkta düşüş ya da müşteri kaybına neden olabilir.

Dolayısı ile ölçme aralıklarını iyi belirlemek ve bu ölçümleri bir bütün olarak değerlendirmek gerekecektir.

 

Burada yazımı bitirmeden önce Veri Bilimi takımlarının organizasyon şemasındaki yerleri ile ilgili birkaç şey yazmak istiyorum.

Veri Bilimi hem teknik hemde iş ile ilgili bir bütün olduğu için bazen şirketlerde IT altında bazen de direkt iş birimlerinin altlarında konumlandırıldıklarını görüyoruz. Tabi yapılan iş ya da şirkette kaç Veri Bilimi takımı olduğuna(Bazı şirketlerde farklı konularda farklı takımlar kurulabiliyor) göre bu konumlardırmaların doğru oldu durumlar olabiliyor. Fakat benim genel anlayışım Veri Bilimi takımlarını bağımsız ayrı bir iş birimi olarak konumlandırmaktan yanadır. Bu durumun ana sebebi Veri Bilimi takımlarının yaptıkları iş bakımından diğer birimlerin yönetsel etkilerinden uzak olmasının, yani yürütülen işin bağımsız olmasının, çalışmaların daha özgür yapılmasını sağlayacak olmasıdır. Bu özgürlük, Veri Bilimi takımlarının yaptıkları çalışmalarla, diğer birimlerinde bu sürece uyum sağlamasının önünü açacaktır. Yani Veri Bilimi takımınız şirketinize değil, şirketiniz Veri Bilimi takımınıza uyum sağlamalıdır.

Yazımı okumak için vakit ayırdığınız için teşekkür ederim.

Çağrı Aksu

 

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.