İLİŞKİ ANALİZİ

veri madenciliği

Para, şüphesiz insan toplumunun en eski ve önemli icatlarından biridir. Milattan önce takas yöntemiyle gerekliliğinin ilk temellerini atarken devam eden süreçte milattan sonra 2008’e dayanan ilk kripto para biriminin doğması gibi uzun bir yolculuğa sahiptir.[1] Günümüzde uygulamalar aracılıyla bir tıkla istediğimiz her ürüne erişebiliyor, uygulamalarda kayıtlı kredi kartlarımız aracılığıyla parayı en aktif şekilde kullanıyoruz. Peki bu yolculukta değişen ve gelişen tek şey para mıdır?

ilişki analizi Resim 1

Amerikalı psikolog Abraham Maslow, 1943 yılında yayınlandığı bir çalışmada ortaya atılmış ve sonrasında geliştirilmiş bir insan psikolojisi teorisi olan Maslow Teorisi’nde (Maslow’un İhtiyaçlar Hiyerarşisi) besini, insanların en temel ihtiyaçları arasında belirlemiştir.

Maslow’a göre, eylemlerimiz belirli ihtiyaçların karşılanması hedefine yönelik motivasyondan doğar. Diğer bir deyişle, kendi ihtiyaçlarımızı refahımız üzerindeki etkilerine göre sıralarız.[2] Tüketici toplumumuz değişen yaşam koşulları dolayısıyla derin kültürel değişiklikler yaratmış dolayısıyla Maslow Teorisi de para gibi oluştuğu şekilde kalmamıştır. Hatta artık umursadığımız tek şey, ne kadar yararlı olursa olsun mümkün olduğunca çok maddi mal ve hizmeti biriktiriyor gibi görünmektedir.

ilişki analizi Resim 2

Hepimiz ihtiyaçlarımızı karşılayabilmek için belli zamanlarda belli miktarda, kullandığımız ödeme aracıyla alışveriş yapıyoruz. Bazen, hiç ihtiyaç duymadığımız şeyleri de isteğimiz doğrultusunda satın alıyoruz. Maslow Teorisi’ni ele alarak sadece ihtiyaçlarımız doğrultusunda bir markete alışverişe gittiğimizi varsayalım. Ürün satın alırken her zaman ihtiyaçlarımıza sadık kalıyor muyuz? Bir adet süt almak için girdiğimiz marketten bir adet süt alarak mı çıkıyoruz? Kasaların yakınlarına konulan promosyon ürünleri almadan çıkıyor muyuz ya da en azından bakmadan?

Amerika’da zincir marketlerden olan Wal-Mart, müşterilerin yapmış oldukları alışveriş hareketlerini incelediklerinde cuma akşamları bebek bezi alan erkek müşterilerin beraberinde bira aldıkları ortaya çıkarmıştır.

Paranın gelişmesi gibi Maslow’un Teorisi’nin de aynı kalmadığını söylemiştik. Bunun sonucunda gelişen ve değişen şeyler kategorisine insanı da aldığımızda aslında bazı şeylerin belirli bir süreç olduğunu ve zamanın en önemli faktör olduğunu söyleyebiliriz. Peki zamanla değişime uğrarken bunu kendi isteğimizle mi yapıyoruz yoksa bazen zihnimizle oynandığını düşündüğümüz oluyor mu?

Veri madenciliğinin sihir olmadığını, bir amaca yönelik teknikleri içerdiğini ispatlar nitelikte olan bu durum veri madenciliğinde tanımlayıcı modellerden biri olan ve “İlişki Analizi” olarak adlandırılan kavramı karşımıza çıkarıyor. İlişki analizi, Birliktelik Kuralları ve Ardışık Zamanlı Örüntüleri ile bireylerin ürünleri satın alma eğilimlerini tanımlamaya yardımcı olup bunun sonucunda pazarlama (marketing) sektörüne katkı sağlıyor ve bir nevi zihnimizi bizden daha iyi tanıyor diyebiliriz.

BİRLİKTELİK KURALLARI

Olayların birlikte gerçekleşme durumlarını çözümleyen veri madenciliği yöntemlerine birliktelik kuralları denir.[3] İlk olarak Rakesh Agrawal, Tomasz Imieliński ve Arun Swami tarafından 1993 yılında yayınlanan “Mining Association Rules Between Sets of Items in Large Databases” [4] makalesinde ele alınan birliktelik kuralları, Ağustos 2015 itibarıyla Google Scholar’a göre 18.000’den fazla alıntı alan ve bu nedenle Veri Madenciliği alanında en çok alıntı yapılan makalelerden biridir.[5] Bir alışveriş sırasında veya birbirini izleyen alışverişlerde pazarlama amaçlı olarak Pazar Sepeti Analizi (Market Basket Analysis) kullanılır. Müşterilerin hangi ürün veya hizmeti almaya eğilimli olduğu veya aldığı bir ürünle başka hangi ürünleri alabileceğinin analiz edilmesi satıcı firmanın daha fazla satış yapmasına dolayısıyla daha etkili ve kaliteli pazarlama yollarına neden olmaktadır. Ayrıca Pazar Sepeti Analizi, promosyon analizi çalışmaları, raf dizimi, müşteri alışkanlıkları analizi, mağazanın düzenlenmesi, stok kontrolü, kupon verilmesi, etkili satış yöntemlerinin geliştirilmesi gibi konularda fayda sağlamaktadır.[6]

ilişki analiziResim 3

Birliktelik kurallarını tanımsal olarak ifade etmek istersek X grubu ürününü alanların Y grubu ürününü de alma durumu (birliktelik kuralı) X⇒Y şeklinde gösterilir. Diyelim ki bir marketteki müşterilerden ekmek alanların süt alma durumu yüksek olsun. Bu durumu {ekmek}⇒{süt} şeklinde gösterebiliriz.

Birliktelik kuralı oluşturmak için tüm sık geçen nesnelerin kümeleri bulunup bu sık geçen nesne kümelerinden güçlü ilişki kuralları oluşturulur. Bu iki kural minimum destek ve minimum güven durumunu sağlamalıdır. Birliktelik kuralı algoritmalarının performansını etkileyen adım birinci kısımdır çünkü veri tabanındaki tüm sık geçen nesnelerin kümelerini bulmak, tüm olası nesne kümelerini aramayı gerektirdiğinden zordur. Her kural, X öğe kümeleri olarak da bilinen iki farklı öğe kümesinden oluşur ve Y, burada X’in öncülü veya sol taraf (LHS) ve Y ardışık veya sağ taraf (RHS) olarak adlandırılır.[7]

Pazar sepet çözümlemelerinde satılan ürünler arasındaki ilişkileri ortaya koymak için destek (support) ve güven (confidence) gibi iki ölçütten yararlanılır. [8] Bu ölçütlerin hesaplanmasında destek sayısı adı verilen bir değer kullanılır (sayı(X,Y)). Destek ölçütü, bir ilişkinin tüm alışverişler içinde hangi oranda tekrarlandığını belirlerken güven ölçütü X ürün grubunu alan müşterilerin Y ürün grubunu da alma olasılığını ortaya koyar.

Destek (X⇒Y):  sayı(X,Y)/N                  (N: Tüm alışverişlerin sayısı)

Güven (X⇒Y):  sayı(X,Y)/sayı(X)         (sayı(X): X grubunu satın alan müşteri sayısı)

Güven ve destek ölçütleri ne kadar büyükse birliktelik kurallarının da o kadar güçlü olduğuna karar verilir.[9]

birliktelik analiziŞekil 1[10]

Birliktelik kuralları oluşturmak için birçok algoritma önerilmiştir. Birliktelik kurallarında sık tekrarlanan öğeleri bulmak (birliktelik kuralı oluşturmanın ilk aşaması) için en temel algoritma Apriori Algoritması’dır. Apriori algoritması ilk defa 1994 yılında Agrawal ve Srikant tarafından önerilmiş ve işlemleri içeren veritabanları üzerinde çalışmak üzere tasarlanmıştır. Algoritmanın ismi, kendinden önceki çıkarımlara bağlı olduğu için, Latince önce anlamına gelen “prior” kelimesinden gelmektedir. Algoritma yapı olarak, aşağıdan yukarıya (bottom-up) yaklaşımı kullanmakta olup her seferinde tek bir elemanı incelemekte ve bu elemanla diğer adayların ilişkisini ortaya çıkarmaya çalışmaktadır.[11] Apriori algoritmasına göre k adet elemana sahip nesne kümesi minimum destek ölçütünü sağlıyorsa bu kümenin alt kümeleri de minimum destek ölçütünü sağlar.[12] Apriori, tarihsel olarak önemli olsa da, diğer algoritmalara yol açan bir dizi verimsizlikten veya uzlaşmadan muzdariptir.[13] Bunlardan bazıları sık veritabanı taramasının çok maliyetli olması ve uzun örüntüleri çıkarmak için tekrar tekrar tarama gerektirip çok fazla sayıda aday yaratmasıdır.

Apriori algoritmasına yönelik örnek uygulamalardan bazıları aşağıda verilmiştir:

ARDIŞIK ZAMANLI ÖRÜNTÜLER

Ardışık zamanlı örüntülerde birliktelik kurallarından farklı olarak işlem hareketlerinde zaman faktörü de ele alınmaktadır. Örüntü “sürekli devam eden ve tekrar eden yapılar” olarak ele alınır. Bir müşterinin birinci gün X ürünü, onu izleyen gün veya diğer günlerden birinde Y ürünü ve daha sonraki gün de Z ürününü alması bir örüntü oluşturmaktadır. Burada birbirini izleyen, yani zaman içinde ardışık olan bir örüntü söz konusudur.

Bir araba muayenesi örneği verelim. Araba bakımı için önce A ve onu izleyen zamanda B bakımı yapılsın. B bakımının A bakımından sonra gerçekleştiğini bilmek önemlidir ancak B bakımının ortaya çıkmasından önceki tahmini süreyi bilmek ve bunun sonucunda araba hasarını önlemek için bakımı doğru zamanda planlamak daha değerlidir.

KAYNAKÇA
  1. Paranın Tarihi Serüveni, Attila Timur, https://attilatimur.wordpress.com/2018/02/20/paranin-tarihi-seruveni/ 
  2. Maslow’un İnsan İhtiyaçları Teorisi, https://aklinizikesfedin.com/maslowun-insan-ihtiyaclari-teorisi/ 
  3. Birliktelik Kuralları Kullanılarak Pazar Sepeti, Metin USLU, https://www.slideshare.net/uslumetin/birliktelik-kurallar-kullanlarak-pazar-sepeti-analizi-market-basket-analysis-using-association-rules
  4. https://www.researchgate.net/publication/200043124_Mining_Association_Rules_Between_Sets_of_Items_in_Large_Databases_SIGMOD_Conference 
  5. Association rule learning, History, Wikipedia, https://en.wikipedia.org/wiki/Association_rule_learning#cite_note-mining-2 
  6. Sepet Analizi ve Birliktelik Kuralları, Zeynep Aygün, https://zeynepaygun.wordpress.com/2016/01/07/sepet-analizi-ve-birliktelik-kurallari/ 
  7. Association rule learning, Definition, Wikipedia, https://en.wikipedia.org/wiki/Association_rule_learning#Process 
  8. Balıkesir Üniversitesi MMF Endüstri Mühendisliği Bölümü Veri Madenciliği Dersi, VERİ MADENCİLİĞİ (Birliktelik Kuralları), http://kergun.baun.edu.tr/veri_madenciligi_hafta10.pdf 
  9. BİRLİKTELİK ANALİZİ, Zübeyde Karcı, https://prezi.com/p5man_rphyvc/birliktelik-analizi/ 
  10. BİRLİKTELİK KURALLARI ALGORİTMALARI, Şengül Gedleç, https://www.datasciencearth.com/birliktelik-kurallari-algoritmalari/ 
  11. Balıkesir Üniversitesi MMF Endüstri Mühendisliği Bölümü Veri Madenciliği Dersi, VERİ MADENCİLİĞİ (Birliktelik Kuralları), http://kergun.baun.edu.tr/veri_madenciligi_hafta10.pdf 
  12. Makine Öğrenmesi, Birliktelik Kuralları Analizi, Birliktelik Kuralları Analizi (Association Rules Analysis), Metin USLU, https://www.veribilimiokulu.com/blog/associationrulesanalysis/ 
  13. Apriori algorithm, Wikipedia, https://en.wikipedia.org/wiki/Apriori_algorithm 

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.