Veri Madenciliği (Data Mining) Nedir?
Veri madenciliği, büyük miktarlarda bilginin toplanması ve içerisinden yararlı bilgilerin ayrıştırılmasıdır. Veriler işlenmediği sürece bir değer taşımazlar, yığın halinde yer alan tüm veriler işlenerek bilgiye dönüştürülür. Bilgisayar ortamında yer alan yığınla veri, veri madenciliği ile anlam kazanır ve ileriye yönelik olarak doğru tahminlerde bulunulmasını kolaylaştırır.
Veri madenciliğinin temel amacının, şirketlerin ya da kurumların karar organları için değerli olan veriyi belirli yöntemler ve işlemler ile ortaya çıkarmak olduğunu söyleyebiliriz.
Veri Madenciliği (Data Mining) Nasıl Yapılır?
Veri madenciliğine başlarken öncelikle ulaşılmak istenen bilgiye karar verilir. Bu konuda ne istediğini bilmek ve planlı olmak sonuca ulaşmada faydalı olacaktır.Planlamanın belirlenmesinin ardından bilgi bir sınıflandırmaya yerleştirilir ve bilginin işleneceği en uygun veri tabanları seçilir. Araştırmanın yapıldığı veri tabanı içerisinde bizleri hedef bilgimizden uzaklaştıracak olan alakasız verilerin yani aykırı değerlerin temizlenmesi yada baskılanması gerekir. Ardından hedefe en uygun olarak seçilmiş tabanda toplanan en doğru veriler farklı metotlarla işlenir. Ortaya çıkan sağlıklı, işlenmiş veriler amacına uygun kullanılmak üzere hazırdır.
Veri Madenciliği Hangi Alanlarda Uygulanabilir?
Veri işlenmediği sürece değersizdir demiştik bu sebeple yığın halinde yer alan veriler işlenerek, değerli hale gelir ve bilgiye dönüşür. Niteliklerine göre tanımlanmış sınıflara ayrılır. Firmalar karar alırken bu verileri kullanır ve gelecek yatırımlarına karar verirler. Uygulama alanları her sektörde oldukça geniştir, önemli olan hangi verilere doğru olarak ulaşmak istediğinizdir.
Uygulanma alanlarına değinilecek olursa;
- Müşterilerin daha iyi tanınması ,
- Müşteri sınıflandırılması yapılmasına fırsat tanınması,
- Müşteriler için davranış modelleri oluşturulması için yardımcı olunması,
- Geçmiş anlaşmaların yada müşteriye ait ödeme planlarından oluşan bir veri seti oluşturularak müşterilerin ödeme performanslarının ölçülmesi ve elde edilen bilgilere göre risk yönetim politikalarının oluşturulması,
- İyi müşteri sınıflandırmasının yapılması ve hem bu müşteriler hem de diğer müşteriler için farklı pazarlama stratejileri oluşturulması,
- Müşterilerin davranışlarına göre kampanya hazırlanması ve kampanyalara göre müşteri kitlesi belirlenmesi,
- Elde edilen sonuçlara göre çapraz ve dikey satış artırma stratejilerinin oluşturulması,
- İnternet işlemleri, e-nakit dolandırıcılığı
- Bilgisayar sistemleri ve bilgisayar ağlarına girilmesi,
- Kredi taleplerinin değerlendirilmesinin kolaylaştırılması,
- Kredi kartı dolandırıcılıklarının tespit edilmesi,
- Müşterilere kişiselleşmiş ürün ve hizmet sunulması,
- Tıp alanında, hastalara tanı konulmasına destek olunması ve hastaya özel tedavi yöntemi belirlenmesi
- Spor alanında, rakip taktiklerinin belirlenmesine yardımcı olunması gibi sayabiliriz.
Örnek üzerinden ilerleyecek olursak, aynı süpermarketten alışveriş yapan müşteriler için özel olarak kart çıkartarak aslında müşterilerinin bilgilerini saklarlar. Alışveriş eğilimleri, en çok haftanın hangi günleri alışveriş yaptıkları ya da en çok promosyonu kullandıkları bilgilerini kayıt ederler. İlk bakışta çok anlamsız gibi görünse de elde ettikleri bilgiler ile, o müşteriye özel promosyon oluşturarak daha fazla satış gerçekleştirirler.
Ek olarak internet üzerinden alışveriş yaparken tıkladığımız ürünlerin farklı zamanlarda reklam olarak karşımıza çıkmasıda online reklamcılıkta veri madenciliğine örnektir.
ENDÜSTRİ MÜHENDİSLİĞİ & VERİ MADENCİLİĞİ
1 |
Prof. Dr. Filiz ERSÖZ'ün bir röportajından bir kesit alacak olursak; |
- Bir Endüstri Mühendisi veri madenciliğinde uzman olmalı mı? Yetkinlikler arasında kesinlikle olmalı diyebilir miyiz?
Endüstri mühendisleri üretim, yönetim ve hizmet sektörleri başta olmak üzere pek çok çalışma alanlarında çalışmaktadır. Geleceğin Endüstri Mühendisleri, analitik düşünme yeteneği ve sistematik yaklaşıma sahip, sürekli gelişen teknoloji ve bilişimin sunduğu imkânları da kullanarak, çözümler üretebilen ve endüstrinin ihtiyaç duyduğu uygulama becerisi yüksek mühendislerin olacaktır. Bu yüzden bilgisayar destekli olmaya çalışın ve kendinizi asla sınırlamayın. Bu kapsamda değerlendirdiğimizde veri madenciliği kesinlikle bir endüstri mühendisinin yetkinlikleri arasında olmalıdır.
- Veri madenciliği üzerine yoğunlaşmak isteyen mühendis adaylarına ne önerirsiniz?
İş analisti veya benim deyimim ile iş mühendisi, veri mühendisi veya veri bilimci olmaya çalışın. Bunun için;
“İstatistik bilgisini artırmaya çalışın ve veri madenciliği hazır yazılım programlarından ticari veya ticari olmayan (free) bir kaçını öğreniniz. Temel işi anlama ve o işe yönelik çıkarımlarda bulunmak için kullanılacak temel metotlar bellidir. Bunlardan IBM SPSS Modeler, Rapid miner, Pyhton veya ticari olmayan kaynaklardan R veya Weka öğrenin. Piyasada veri madenciliği yapmak için bu yazılımlara daha iyi hâkim olmanız gerekir.”
Bilgisayara hâkim iseniz; matematik, istatistik bilimi veya modelleme konuları hakkında daha bilgi edinin.
Görselleştirme günümüzde oldukça popülerdir. Rakam veya modelleri görselleştirerek (Visualization) iş analitiği çalışmanızın daha fazla anlaşılması ve okunabilmesine katkı sağlayacaktır. İyi bir istatistik bilgisi, yöneylem araştırma ve veri madenciliği bilgilerinizi güçlendirirseniz hedeflerinize ulaşabileceğinizi düşünüyorum.
Veri madenciliği yaparak iş analist çıktılarınıza kendi bakış açınızı geliştirmeye yönelik çalışmaya hazır olunuz. Önemli olan yapılan çalışmaya farklı bakış açıları kazandırmaktır.
İş analisti/iş mühendisi/Veri bilimcisi olmasanız da, geçmişin ya da bugünün mühendisi değil, geleceğin mühendisi olmaya hazırlanınız.