Birliktelik Kuralları Yönteminde Matematiksel Süreç

Birliktelik Kuralları Yönteminde Matematiksel Süreç

Birliktelik Kuralları

Birliktelik Kuralları Analizinin temelleri 1993 tarihinde atılmış ve günümüzde popüler bir analiz olarak gelişimi devam etmektedir. Bu analiz türünün popüler olmasının en büyük sebepleri uygulama alanının fazla oluşu, araştırmacı açısından kullanım kolaylığı sağlaması ve anlaşılabilir olmasıdır.

Birliktelik Kuralları (Association Rules), veritabanında yer alan birimlerin aynı anda ve sıklıkla gerçekleşme kıstaslarını dikkate alarak birimler arasındaki gizli ilişkileri keşfetmektedir. Birliktelik kuralları ile yapılan veri madenciliği çalışmasında en önemli olay kural çıkarmadır.

Birliktelik Kuralları yöntemine dair daha detaylı bilgilere ulaşmak için aşağıda yer alan linklere başvurulabilir.

Birliktelik Kuralları ve Uygulama Alanları

https://www.datasciencearth.com/birliktelik-kurallari-ve-uygulama-alanlari/

Nicel Birliktelik Kuralları

https://www.datasciencearth.com/nicel-birliktelik-kurallari/

Birliktelik Kuralları Türleri

https://www.datasciencearth.com/birliktelik-kurallari-turleri/

Birliktelik Kuralları Algoritmaları

https://www.datasciencearth.com/birliktelik-kurallari-algoritmalari/

Terminoloji ve Notasyon

Birliktelik kuralları modelinde diğer veri madenciliği modellerindeki gibi başlangıçta bir araştırma problemi bulunmamaktadır. Sadece araştırmacı veya araştırma ekibi tarafından belirlenen minimum destek değeri (Minimum Support Value) ve minimum güven değeri (Minimum Confidence Value) ile verilerden kurallar üretilir ve sonucunda geçerli ve güvenilir kurallara ulaşılmaya çalışılır. Bu noktada hızlı ve güvenilir örüntü tanıma işlemi için algoritmalara başvurulmaktadır.

Birliktelik kuralları analizinde kuralların elde edilmesi için veri tiplerine özgü algoritmalar olmasının yanında araştırmacının kural tipini ve sayısını belirleyebileceği yöntemler mevcuttur. Birliktelik kuralları çalışmalarında genellikle Apriori algoritması tercih edilmiştir.

Birliktelik kuralları analizinin matematiksel sürecinin iyi yürütülmesi için Tablo 1’de verilen temel kavramların iyi anlaşılması gerekmektedir.

Temel Kavramlar
Tablo 1: Temel Kavramlar

Veritabanında yer alan her bir kayıt (𝓉𝑘), her bir faktör öge küme (𝒳) ve bu öge kümede yer alan her bir birim öge (𝓍𝑘) ve veritabanındaki ortak olarak gerçekleşen olgular birliktelik olarak adlandırılmaktadır. Aşağıda 𝒯 kayıt kümesi ve 𝒳 öge küme verilmiştir.

Formül 1

Yaygın Öge Küme

Analiz sonucunda elde edilen kurallar ile ortaya konan ilişkiler veritabanında birlikte en çok tekrarlanan ögelere aittir. Bu ögelerin yer aldığı öge kümeler “Yaygın Öge Küme” olarak ifade edilir. Öge kümelerin yaygın öge küme olabilmesi için her bir ögeye ait destek değerinin minimum destek değerine eşit veya daha büyük olması yani veritabanında bu değer kadar tekrar gündeme gelmesi gerekmektedir.

Minimum Destek Değeri ve Minimum Güven Değeri

Birliktelik kuralları, önceki kayıtların işlenmesi ile spesifik kararların alınmasını sağlayan ve kayıtlar arasındaki ilişkileri ortaya çıkararak alınacak kararların güvenilirliğini arttırmayı hedefleyen bir analizdir. Bu analizdeki amaç, veritabanından araştırmacının baz aldığı minimum olasılık değeri ile şartlı olasılık değerlerine uygun kuralların ortaya çıkarılmasıdır. Araştırmacı tarafından belirlenecek olan bu olasılık değerleri literatürde “Minimum Destek Değeri” ve “Minimum Güven Değeri” olarak adlandırılmaktadırlar. Bu kriterler için kesin bir sınır değer yoktur. Bu yüzden bu değerlerin belirlenmesi araştırmacının ulaşmak istediği kurallar için ciddi önem taşımaktadır.

Veritabanından çıkarılacak kurallara sayısal olarak sınır koyan bu değerlerin çok düşük tutulması kural patlamasına ve araştırmacının ulaşmak istediği faydalı kuralları elde edememesine sebep olabilmektedir. Bu kriterler için bazı kaynaklarda minimum destek değeri için evrenin küçük olması durumunda %30-40 ve çok büyük olması durumunda %1-2 aralıklarında atanmasının uygun olacağı savunulmuştur. Minimum güven değeri içinde %60-80 gibi yüksek aralıklarda bir değerin atanması önerilmiştir.

Destek (s) ve Güven (c) Değerleri

Birliktelik kuralları analizinde elde edilen kuralların geçerliliğinin %100 olması beklenmemektedir. Ancak, veritabanındaki veriden anlamlı bağıntıları ortaya çıkaracak kuralların elde edilmesi ve bu kuralların kabul görmesi için destek ve güven parametreleri hesaplanmaktadır. Literatürde bu parametreler için ilginçlik ölçüleri adı da verilmiştir.

Genel bir ifade ile, güven ölçüsü herhangi bir olgunun gerçekleşmesi anında bir başka olayın gerçekleşme ihtimalini ve destek ölçüsü veritabanındaki birlikteliklerin sayısının, toplam gerçekleşen olguların sayısına oranını vermektedir. Destek ve güven değerleri minimum destek ve minimum güven değerleri ile karşılaştırılır ve bu değerlerden yüksek olan destek ve güven değerlerine sahip kurallar kabul edilmektedir. Elde edilen bir birliktelik kuralının gücünü yani öncül (kuralın sol tarafındaki durum) olgunun gerçekleşmesi sonucunda ardıl (kuralın sağ tarafındaki durum) olgunun ne kadar ihtimal ile meydana geleceğini güven parametresi gösterirken, veritabanındaki öge kümelerin kaç kez meydana gelişini yani birlikteliklere ait frekansı destek parametresi göstermektedir.

Kaldıraç (Lift) Değeri

Güçlü birliktelik kuralları içinde kurallara ait destek ve güven değerlerinin yüksek olması beklentisi mevcuttur. Ancak, her zaman bu şekilde destek ve güven değerleri de elde edilememektedir. Örneğin; bir ürün ile beraber nadiren satılan başka bir ürün söz konusu olduğunda iki ürün arasındaki bağıntı yöneticiler tarafından çok faydalı bilgiler sağlamamaktadır. Destek ve güven değerleri yüksek olan her bir kural da bazen önemli olmayabilmektedir. Bu durumda elde edilen kuralların farklılığını ve önemi ölçmek için “Kaldıraç (Lift)” değeri hesaplanmaktadır. Bu değer, ilgili kuralın destek değerinin beklenen değere oranı şeklindedir. Daha açık bir ifadeyle, ilk gerçekleşen olayın sonrasında gerçekleşecek olayı hangi (0-1) oran ve hangi yönde (+/-) etkilediğini ortaya koymaktadır.

Kaldıraç değeri 1 değerine göre değerlendirilir. Değerin 1’e eşit olması öge kümeler arasında bir bağlantının olmadığını, 1’den büyük olması öge kümeler arasında pozitif bir korelasyon olduğunu (Yani, bir öge kümenin gerçekleşmesi ile diğer öge küme de gerçekleşecektir) ve 1’den küçük olması öge kümeler arasında negatif bir korelasyon olduğunu göstermektedir.

Matematiksel Süreç

Birliktelik kurallarının kendisine özel bir kural yapısı mevcuttur. Elde edilen birliktelik kuralı iki bölümden oluşmaktadır. Kuralın sol kısmı “Öncül” ve sağ kısmı “Ardıl” olarak ifade edilir. Bu iki bölümde gerçekleştirilen kayıtlara dair nitelikler ve verilerin birbiri ile arasındaki bağıntılar, “IF (Eğer)” ve “THEN (Sonra)” döngüleri kullanılarak ifade edilmektedir. Model mantığı aşağıda gösterilmektedir.

IF <bazı şartlar sağlanırsa> THEN <bazı niteliklerin değerlerini tahmin et>

Daha açık bir ifadeyle; IF döngüsünde aynı anda meydana gelen nitelikler kendini göstermekte ve THEN döngüsünde bu nitelikler arasında bağıntıyı temsil eden olaylar meydana gelmektedir.

Yukarıdaki verilen yol ile ulaşılan birliktelik kuralları, 𝐴 ⇒ 𝐵 şeklinde semboller ile gösterilebilir.

Birliktelik kuralları için oluşturulan ilk modele göre;

Formül 2

D kümesi ise her bir kayıt (T) için bir tanımlayıcısı olan veritabanını ifade etmektedir. D veritabanında gerçekleşen her bir kayıt ve her bir (𝐼) ise öge olarak adlandırılmaktadır. Veritabanlarında her bir kaydı gerçekleştiren veri grupları vardır. Kayıt numarası (Transaction Identification/ TID), her bir kaydı ifade eden tekil bir numaradır. D veritabanı 𝑇 ⊆ 𝐼 şeklinde atanan ögelerin kümesi (öge küme) olsun. Veritabanında her bir kayıt t ikili bir vektör olarak ifade edilir ve t ögesinin satın alımı gerçekleştiğinde 𝑡[𝑘] = 1, gerçekleşmediğinde ise 𝑡[𝑘] = 0 sonucuna ulaşılır.

Birliktelik kuralları analizinin matematiksel süreci için Tablo 2 aydınlatıcı olacaktır.

Örnek Veri Seti
Tablo 2: Örnek Veri Seti

Tablo 2’de yer alan T veritabanında yer alan kayıtlara ait tekil numaraların olduğu kümedir. T kümesinde k adet kayıt bulunmaktadır. X ve Y ise birer öge kümedir. Burada, X ve Y öge kümeleri yer aldıkları kayıtlarda 1, yer almadıkları kayıtlarda o değerini almıştır.

Tablo 2’de yer alan herhangi bir 𝑇𝑘 kaydı X öge kümesini içeriyorsa, 𝑋 ⊆ 𝑇 şeklinde gösterilir. Bu ifade X öge kümesinin T kümesinin bir alt kümesi olduğunu göstermektedir. Bu tablodan bir birliktelik kuralı elde etmek için 𝑋 ∩ 𝑌 = ∅; 𝑋, 𝑌 ⊂ 𝐼 yapısı sağlanmalıdır. Bu yapı gereği, X ve Y öge kümeleri arasında bir bağıntı gerçekleşmiştir ve bu bağıntı I öge kümeleri birimini oluşturmuştur.

Matematiksel olarak, analiz iki veya ikiden fazla öge küme arasındaki kesişimin boş küme olmaması ve gerçekleşen kayıtlar arasında kesişim olması durumunda, bu öge kümeler arasındaki gizli ilişkiyi bulmaktadır. Bu şekilde ulaşılan bir birliktelik kuralı aşağıdaki gibi gösterilmektedir.

X ⇒ Y

Yukarıdaki denkliğe göre, X öge kümesi Y öge kümesini belirlemektedir. Yani, Y öge kümesinin yer aldığı kayıtlar, X öge kümesinin yer aldığı kayıtlar içerisindedir. Daha açık bir ifadeyle, Y öge kümesinin gerçekleşmesi öncelikle X öge kümesinin gerçekleşmesine bağlıdır. Birliktelik kuralları analizinde genel matematiksel süreç bu şekilde ilerlemektedir.

Birliktelik kuralları analizi süreci araştırmacı tarafından minimum destek ve minimum güven değerlerinin atanması ile başlar. Daha sonrasında süreç yaygın öge kümelerin elde edilmesi ve elde edilen yaygın öge kümelerden güçlü örüntülerin çıkarılması şeklinde ikiye ayrılmaktadır.

  1. Adım: Analizde kullanılacak olan algoritmaların çalışma kalitesini belirlemektedir. Burada her bir öge için destek değeri hesaplanmaktadır. Daha sonra her bir ögeye ait destek değeri minimum destek değeri ile kıyaslanır. Minimum destek değerine eşit veya büyük olan destek değerleri tespit edilir. Bu destek değerlerinin ait olduğu ögelerin bulunduğu öge kümeler yaygın öge küme olarak seçilir.
  1. Adım: Yaygın öge kümeler minimum destek ve minimum güven değerleri ile kıyaslanarak birliktelik kuralları elde edilir. Bir birliktelik kuralı için destek ve güven değerleri aşağıdaki gibi hesaplanmaktadır.

D veritabanındaki toplam kayıt sayısı T olmak üzere,

Formül 3

Destek değeri, veritabanındaki A ve B ögesinin kapsayan kayıtların sayısının, veritabanındaki toplam kayıt sayısına oranlanması ile elde edilmektedir. Bir birliktelik kuralı için destek parametresi, ile kuralın öncül ve ardıl taraflarında yani evrenin yüzde kaçında bağıntının gerçekleştiğine ulaşılır. Yani, destek değeri bir birliktelik kuralının istatistiksel olarak ifade ettiği anlamını göstermektedir.

Güven değeri, A ve B ögesini kapsayan kayıt sayısının, A ögesini kapsayan kayıt sayısına oranlanması ile elde edilmektedir. Bir birliktelik kuralı için güven parametresi, kuralın öncül kısımda sağlanan durum veya durumların yüzde kaçının kuralın ardıl kısmında gerçekleştiğini vermektedir. Yani, güven değeri iki veya daha fazla öge kümeleri arasındaki karşılıklı olan ilişkinin derecesini göstermektedir.

Düzenlenmiş bir veritabanından elde edilen ve geçerliliği sağlanan bir birliktelik kuralı aşağıdaki gibi olsun.

Formül 4

Destek Değeri Yorumu: İncelenen tüm kayıtlarda A ve B öge kümeleri beraber meydana gelme olasılığı %40’tır.

Güven Değeri Yorumu: A öge kümesinin gerçekleştiği kayıtların %50’sinde B öge kümesi de gerçekleşmektedir.

Kaldıraç değeri, veritabanından çıkarılan bir kuralın ne kadar ilginç olduğunu tespit etmek amacıyla kullanılmaktadır. Kaldıraç değeri hesaplanırken, ilgili kuralın her iki tarafındaki öge kümelerin beraber görülme olasılıklarının beklenen değeri gündeme gelmektedir. Burada beklenen değer, her iki taraftaki öge kümenin destek değerlerinin çarpımı ile hesaplanmaktadır.

Formül 5

Birliktelik kuralları analizinde kaldıraç değerinin önemini anlatmak için Tablo 3’teki örnek veri seti verilmiştir. Bu veri seti 10.000 kayıt ve X ve Y adında iki öge kümeden oluşmaktadır. Öge kümelerin kayıtlarda yer alıp almadıklarına göre 1-0 değeri atanmıştır.

Kaldıraç Değeri için Örnek Veri Seti
Tablo 3: Kaldıraç Değeri için Örnek Veri Seti

Veri seti için yapılan incelemelerde kayda alınan kayıtların 6.000’inde sadece X, 7.500’ünde sadece Y öge kümeleri görülmüştür. X ve Y değerlerinin ortak görüldüğü kayıt sayısı 4.000’dir. Analiz sürecinde minimum destek değeri %30 ve minimum güven değeri %60 olarak atanmıştır.

Analiz sonucunda aşağıdaki birliktelik kuralı elde edilmiştir.

Formül 6

Yukarıda destek ve güven değerleri belirlenen birliktelik kuralı minimum destek ve minimum güven değerlerini sağlamıştır. Bu durumda kural kabul görmektedir. Kuralın geçerliliğinin sınanması için aşağıdaki hesaplamalar yapılmıştır.

Formül 7

Yukarıda, Y faktörünün gerçekleşme olasılığının %75 olup, güven değeri %66 dan büyük olması elde edilen kuralın geçerliliğini tehlikeye sokmaktadır. Bu iki öge küme arasındaki ilişki yanlış ilişkilendirilmiş olup, öge kümelerden birinin gerçekleşmesi diğer öge kümenin gerçekleşme olasılığını aşağıya çekmektedir. Böyle bir durumda destek ve güven değerleri önemini yitirmekte ve bu problem için kaldıraç değerine ihtiyaç duyulmaktadır.

Kaldıraç değeri hesabındaki pay kısmı öge kümelerin beraber gerçekleşme olasılığını ve payda kısmı iki öge kümenin birbirinden bağımsız olarak meydana gelme olasılığı ile ilgilidir. Aslında bu değer, öge kümeler arasındaki korelasyonu değerlendirmektedir. Yukarıda ulaşılan 0,89 değeri ile bu iki öge küme arasında negatif bir korelasyon olduğu anlaşılmaktadır. Böyle bir sonuca destek ve güven değerleri ile ulaşılması imkansızdır.

Literatürde yukarıda uygulanan yöntem dışında araştırmacı tarafından sınırlanmış öge tanımlaması şeklinde farklı bir yöntem daha mevcuttur. Bu yönteme göre, sınırlandırılan öge kuralların detayına getirilen kısıtlama için kullanılan mantıksal bir söyleyiştir. Sınırlanmış öge olarak veritabanındaki bir veya birden fazla öge seçilir. Böylece, çalışmada sadece bu öge/ögeleri içeren kurallar ile ilgilenilmektedir.

 

Birliktelik Kuralları ve Ardışık Zamanlı Örüntüler Yöntemlerinin Karşılaştırılması

Güçlü istatistikleri ortaya koyan birliktelik kuralları, ardışık zamanlı örüntüler yöntemi ile benzer amacı taşımaktadır. Her iki analizinde amacı birbirine bağlı olarak gelişen olgular arasındaki birliktelikleri, ilişkileri ortaya çıkarmaktır. Yöntemler arası tek fark, olguların gerçekleşme zamanlarının farklı olmasıdır. Aşağıda verilen örnekler ile bu fark daha iyi anlaşılabilir.

Birliktelik Kuralları

Bir mağazadan X ürününü satın alan bir bireyin aynı anda Y ürününü satın alması ile oluşan ilişkiyi incelemektedir.

Ardışık Zamanlı Örüntüler

Bir mağazadan X ürününü satın alan bir bireyin 3 hafta gibi bir süre sonrasında Y ürününü satın alması ile oluşan ilişkiyi incelemektedir.

Birliktelik Kuralları ve Sınıflandırma Yöntemlerinin Karşılaştırılması

Birliktelik kuralları ve sınıflandırma yöntemleri veritabanında sürekli meydana gelen durumları farklı amaç ve teknikler ile incelemektedir. Yöntemler arası en büyük fark veri madenciliğinde model ayrımlarında göze çarpmaktadır. Sınıflandırma modeli, ayrıcalıklı bir değere sahip kategorik bir niteliğin değerini tahmin etmektedir.

Sınıflandırma, verilerin işlenmesi ve seçilen amaç değişkeninin veritabanındaki hangi değişkenlerin etkisi ile oluştuğunu belirleyip, bir model oluşturmaktadır. Bu model aracılığıyla veri setinde yeni bir birim söz konusu olduğunda amaç değişkeninin hangi değeri alacağı tahmin edilmeye çalışılmaktadır. Sınıflandırma kuralı tamamen tahmin yapabilme becerisi olacak bir model ortaya koymayı amaçlamaktadır.

Birliktelik kuralları, bir veritabanından türetilebilecek herhangi bir bağıntıyı çıkararak daha genel bir yaklaşım izlemektedir. Birliktelik Kuralları analizinde “IF” ve “THEN” döngüleri aracılığıyla oluşturulan “nitelik=değer” eşitliğinden çıkan kurallara odaklanılmaktadır. Öncül (Antecedent/ LHS) ve ardıl (Consequent/ RHS) bölümleri bulunan kuralların çıkarıldığı veri setindeki niteliklerin kategorik olduğu varsayılmaktadır. Birliktelik kuralları, keşfedilmeyen ve bilinemeyen ilişkileri ortaya çıkaracak karakteristik kurallar oluşturma amacı taşımaktadır.

Yukarıdaki açıklamalardan hareketle, bu modellerden biri geleceğe yönelik öngörüler oluşturma odağında çalışırken diğer model bilgi sağlamaya yönelik çalışmaktadır. Birliktelik kuralları analizinde sınıflandırma analizinden farklı olarak, veritabanındaki herhangi bir nitelik test edilebilir. Sadece, her bir kuralın ardıl ve öncül taraflarındaki en az bir nitelik için bazı açık kısıtlamalara tabi olan hiçbir nitelik görünmeyebilir. Ayrıca, sınıflandırma modelinde yer alan amaç değişkeni birliktelik kurallarında yer almamaktadır.

Bu iki model arası farklılık için uzmanlar aşağıdaki yorumlarda bulunmuşlardır.

Witten ve Frank, birliktelik kurallarının veritabanında var olan bütün değişkenler arasındaki korelasyonları incelediğini ve sınıflandırma modelinin ise sadece bir sınıfı baz alarak kuralları ortaya çıkardığını savunmaktadır.

Ghosh ve Nath ise sınıflandırma modelinde sonuç bölümünün sadece bir özelliğe ait değerleri kapsadığını ve bu özelliğin geçmiş verilerden hareketle daha önceden belirlendiğini ifade etmişlerdir. Ayrıca, bu kısıtlamanın birliktelik kurallarında geçerli olmadığını ve bu modeldeki tek bir kısıtlamanın her iki taraf içinde ortak bir özelliğe sahip olmamasını dile getirmişlerdir.

KAYNAKÇA

Adlakha, N., Khare, N., & Pardasani, K. R. (2009, September 28). An Algorithm for Mining Multidimensional Fuzzy Assoiation Rules. International Journal of Computer Science and Information Security (IJCSIS), 5(1), 72-76. http://sites.google.com/site/ijcsis/ adresinden alındı

Agrawal, R., Imielinski, T., & Swami, A. (1993). Mining Association Rules Between Sets of Items in Large Databases. SIGMOD ’93 Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data. 22, s. 207-216. Washington: ACM.

Berry, M. J., & Linoff, G. S. (2004). Data Mining Techniques for Marketing, Sales and Customer Relationship Management (2 b.). Wiley Publishing, Inc., Indianapolis.

Bramer, M. (2007). Principles of Data Mining (2 b.). London: Springer-Verlag.

Çıngı, H. (2007). Veri Madenciliğine Giriş Ders Notları. 1-35. Ankara. http://yunus.hacettepe.edu.tr/~hcingi/ist376a/6Bolum.doc adresinden alındı

Doğan, O. (2015). Bir E-Ticaret Sitesi Kullanıcı Hesaplarında Şifre Yapılarının Birliktelik Kuralları ile İncelenmesi. İnternet Uygulamaları ve Yönetimi Dergisi, 6(2), 49-61.

Dolgun, M. Ö. (2006). Büyük Alışveriş Merkezleri için Veri Madenciliği Uygulamaları, Yüksek

Lisans Tezi. Ankara: Hacettepe Üniversitesi Fen Bilimleri Enstitüsü.

Fayyad, U. M., Piatetsky-Shapiro, G., Smyth, P., & Uthurusamy, R. (1996). Advances in Knowledge Discovery and Data. California: American Association for Artificial Intelligence Series- AAAI.

Ghosh, A., & Nath, B. (2004, June 14). Multi-Objective Rule Mining Using Genetic Algorithms. Information Sciences-Informatics and Computer Science, Intelligent Systems, Applications, 163(1-3), 123-133.

Gürgen, G. (2008). Birliktelik Kuralları ile Sepet Analizi ve Uygulaması, Yüksek Lisans Tezi. İstanbul: Marmara Üniversitesi Sosyal Bilimler Enstitüsü.

Han, J., & Kamber, M. (2006). Data Mining Concepts and Techniques (2 b.). San Francisco: Morgan Kauffmann Publishers Inc.

Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques (3 b.). USA: Morgan Kaufmann Publishers.

Karaibrahimoğlu, A. (2014, Ağustos). Veri Madenciliğinden Birliktelik Kuralı ile Onkoloji Verilerinin Analiz Edilmesi: Meram Tıp Fakültesi Onkoloji Örneği, Doktora Tezi. Konya: Selçuk Üniversitesi Fen Bilimleri Enstitüsü.

Oğuzlar, A. (2004). Veri Madenciliğine Giriş. Bursa: Ekin Kitabevi.

Yarımağan, Ü. (2000). Veri Tabanı Sistemleri (2 b.). Ankara: Akademi & Türkiye Bilişim Vakfı Ortak Yayını.

Witten, I. H., & Frank, E. (2005). Data Mining Practical Machine Learning Tools and Techniques- WEKA (2 b.). San Francisco, USA: Morgan Kaufmann Publishers.

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.