REGRESYON ANALİZİ

Regresyon , bir bağımlı değişken (genellikle Y ile ifade edilir) ile bir dizi diğer değişken (bağımsız değişkenler -X- olarak bilinir) arasındaki ilişkinin gücünü belirlemeye çalışan finans, yatırım ve diğer disiplinlerde kullanılan istatistiksel bir ölçümdür. Regresyon analizi, iki ya da daha çok değişkenin yer aldığı istatiksel modellerde, genellikle neden-sonuç ilişkileri araştırılır. Yani değişkenlerden biri ya da […]

Metin Madenciliği

Giriş Doğal dil işleme (NLP), bilgisayarların insan dilini anlamasına, yorumlamasına ve manipüle etmesine yardımcı olan bir yapay öğrenme  dalıdır . NLP, insan iletişimi ve bilgisayar anlayışı arasındaki boşluğu doldurma arayışında, bilgisayar bilimi ve hesaplamalı dilbilim dahil olmak üzere birçok disiplinden yararlanır.  NLP yani Doğal Dil İşleme, doğal dillerin kurallı yapısının çözümlenerek anlaşılması veya yeniden üretilmesi […]

Tidymodels ile Modelleme ve Makine Öğrenmesi

Tidymodels, tidyverse ilkeleri kullanan modelleme ve makine öğrenmesi için paketler koleksiyonudur. Tidyverse ile ilgili yazdığım yazıya ulaşmak için tıklayınız. Tidymodels paketler koleksiyonu bir veri bilimi projesi için gerekli olan veri ön işlemeden model seçimine kadar tüm aşamaları içerisinde barındıran paketlerden oluşmaktadır. Bu paketler kullanılarak popüler makine öğrenmesi algoritmaları veri setlerine uygulanabilir ve sonuçlar çok hızlı […]

Doğal Dil İşleme+1: 8.Düzenli İfadeler

Doğal Dil İşleme yazı serüvenimiz heyecanla devam ediyor. Veri ön işleme, veriyi tanıma olarak adlandırabileceğimiz son yazılarımıza ek olarak, bu yazımızda düzenli ifadeler konusuna girmek istedik. Dışarıdan her ne kadar doğrudan doğal dil işleme konusu olarak görülmese de biz bu konunun çok önemli olduğunu ve eğer bol pratik yapılır, iyi öğrenilirse, sonraki işlemler öncesinde işlerinizi […]

Rastgelelik Nedir ? Tahmin Edilebilir mi ?

Geçmiş dönemlerden beri insanlar, olayların sonuçlarındaki belirsizliği merak etmişlerdir. Bir zarın yuvarlanışından tutun bir kartın iki ardı arasındaki dönüşü rastlantı kavramının gelişmesini sağlamıştır. Rastgelelik, bir tanım olarak sağlam temellere oturtulmamışsa da basit olarak bir olay yığınının öngörülemeyen hali diyebiliriz. Örnek olarak bir zar atıldığında, sonucu tahmin edilemezken; çift gelme olasılığı, 1 gelmesine kıyasla 2 kat […]

Yapay Zeka Dünyamızı Nasıl Değiştirecek?

Yapay Zeka (AI), makinelerin verileri yorumlayabilme ve akıllı bir şekilde hareket edebilme yeteneklerini ifade eder, yani makineler bir insanın yaptığı gibi eldeki verilere dayanarak kararlar verebilir ve görevlerini yerine getirebilir. Son yıllarda Yapay Zeka (AI) hakkında bir çok şey okuduk ve hala okuyoruz; özellikle de dünyayı nasıl koruyacağı ve/veya herkesin de bildiği üzere insanlık medeniyetini […]

Robotik Proses Otomasyonu (RPA) Nedir?

Sıkıcı ve tekrarlayan görevler yapmaktan ve müşterilerinizi üzen çok fazla hataya tanık olmaktan bıktıysanız, işletmeniz yazılım robotları ve yapay zeka yetenekleriyle güçlendirilmiş Robotik Proses Otomasyonu (RPA) teknolojisine ihtiyaç duyuyor olabilir. Bu makalede amacım, Robotik Proses Otomasyonunun (RPA) ne olduğunu, ticari değerini, temel kullanım durumlarını, nasıl çalıştığını, nasıl geliştirebileceğimizi ve müşteri gereksinimlerini karşılamak açısından çözümler tasarlama […]

R ve Python ile Sıfırdan Sinir Ağlarını (NNs) Anlama ve Kodlama

Bu makalede, sinir ağlarının yapı taşını sıfırdan anlatmaya çalışacağım ve Sinir ağlarını uygulamak için bir sezgi geliştirmeye daha fazla odaklanacağım. Hem “Python” hem de “R” ile kodlamalar yapacağız. Bu makalenin sonunda, Sinir ağlarının nasıl çalıştığını, ağırlıkları nasıl başlatacağımızı ve geri yayılımı kullanarak bunları nasıl güncelleyeceğimizi öğrenmiş olacaksınız. Genel Bakış Sinir Ağları (Neural Networks), en popüler […]

Boosting Algoritmaları

Herkese merhabalar bu yazımızda Boosting ailesinden XGBoost, GradientBoost, AdaBoost ve CatBoost algoritmalarını inceleyeceğiz. Boosting algoritmaları makine öğrenme modellerinde doğru tahminleri güçlendirmek için uygulanmaktadır. Diğer bir anlamıyla arttırma, yükseltme anlamına gelen Boosting, zayıf modelleri güçlendirme eğilimindedir. Peki temelde zayıf öğrenme modelini güçlü bir öğrenme modeli haline getirmek için kullanılıyorsa, zayıf öğrenme modellerini nasıl tespit edebiliriz ? […]

Veri Bilimcisi Olmanın Yol Haritası

Veri bilimi, her geçen gün gelişen ve hızla büyüyen alanlardan biridir. Ve bu giderek daha fazla veri bilimcisine ihtiyaç duyulmasına neden olmaktadır. Kasım 2020 itibariyle bu ihtiyacın azalmak bir tarafa giderek daha da artacağına inanıyorum. Neyse ki, veri bilimcisi olmak bir üniversite vs. derecesi gerektirmiyor. Yeni şeyler öğrenmeye açık olduğunuz ve çaba ve zaman ayırmaya […]

Python ve Makine Öğrenmesi: Önemli Değerleri Anlamak – Bölüm 12

Makine Öğrenmesi (Machine Learning), verileri ve istatistikleri inceleyerek bilgisayarın öğrenmesini sağlar. Makine Öğrenmesi, verileri analiz eden ve sonucu tahmin etmeyi öğrenen bir program gibidir. Belki de gibisi fazla 🙂 Makine Öğrenmesi, yapay zeka (Artifical Intelligence) yönünde atılan ilk adımdır. Bu bölümde matematik ve istatistik bilgimizi yeniden yoklayacağız ve veri setlerine dayalı olarak önemli sayıların nasıl […]

Başaracaksın: Google Machine Learning Crash Course Dersleri 4 – Train – Test – Validation Set Üçgeni

Hepinize merhabalar tekrardan, Serimizin bir önceki yazısında Train-Test kümelerinden ve  Generalization kavramından bahsetmiştik. Bugün sizlere Validation Set’i anlatmaya çalışacağım. Bu verimizi ayıracağımız son küme (train ve testin yanında) 🙂 Öyleyse hadi başlayalım! VALIDATION SET NEDİR VE NEDEN İHTİYAÇ DUYARIZ? Bu soru oldukça mantıklı bir soru. Verimizi zaten hali hazırda train ve test olarak bölmüştük. E […]

Robotik Proses Otomasyonu (RPA) ve Yapay Zeka (AI) İşbirliği

RPA ile AI arasındaki fark nedir? RPA ile AI birlikte nasıl çalışabilir? Makine öğrenimine nasıl uyum sağlarlar? Bazı RPA ve AI kullanım örnekleri ve en iyi uygulamaları nelerdir? Basitçe açıklayalım… Yapay zekanın giderek yaygınlaşarak meydana getirdiği kendine özgü evreni birçok terimi ve teknolojiyi içinde barındırmaktadır. Bu doğal olarak bir takım örtüşmelere ve doğası gereği bir […]

Başaracaksın: Google Machine Learning Crash Course Dersleri 3 - Generalization ve Train – Test Split

Herkese merhabalar, Bugün yine yeniden sizlerle birlikteyiz. Şahsen benim için hava hoş, umarım sizin için de öyledir 🙂 Serimizin bir önceki yazısında Learning Rate parametresinden bahsetmiştik. Bugünkü yazımızda Gradient Descent Çeşitlerini ve onunla ilgli bazı kavramları öğrenmemiz gerekiyordu ancak onunla ilgili bilgileri bu yazımda verdiğimi farkettim. Yine aynı serinin son yazısında Tensorflow kullanarak bir model […]

Kümeleme

“Ne kadar başarılı olursanız olun, öğrenimlerinizi daima başkalarıyla paylaşın.” Michael Jorden Herkese merhaba, Bugün kümele konusuna değineceğim.Kümeleme hem veri madenciliği hemde veri bilimi alanları için oldukça önemlidir.Yanlışlarım olursa şimdiden affınıza sığınıyorum. Kümeleme birbirlerine benzeyen veri parçalarını ayırma işlemidir ve kümeleme yöntemlerinin çoğu veri arasındaki uzaklıkları kullanır. Örneğin Öklid, Manhattan ve Minkowski uzaklık bağıntıları kümeleme işlemlerinde […]

Başaracaksın: Google Machine Learning Crash Course Dersleri 2 - Learning Rate ve Optimizasyonu

Herkese merhabalar, Yeni yazı serimizin 2.yazısında Learning Rate Nedir ve Nasıl Optimize Edilir sorularının cevabını öğreneceğiz. Önceki yazımızda seriye giriş niteliğinde bilgilendirmelerden ve iteratif bir hata düşürücü bir algoritma olan Gradient Descent algoritmasından bahsettik. Şimdi sırada bu algoritmada kullanılan Learning Rate Hiperparametresinden bahsedeceğim. Hiperparametrenin ne olduğunu önceki yazı serimin 3. yazısında açıklamıştım. Buradan ulaşabilirsiniz. O […]

R Uygulamaları – Bölüm 7: Doğrusal Olmayan Regresyon Modelleri

Doğrusal regresyon modellerinde model parametreleri doğrusal bir yapıda bulunmaktadır. Doğrusal regresyon modelleri ile ilgili yazılarıma aşağıdaki bağlantılardan ulaşabilirsiniz. R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon R Uygulamaları – Bölüm 2: Çoklu Doğrusal Regresyon Doğrusal olmayan regresyon modellerinde ise model parametreleri doğrusal değildir ancak bağımsız değişkenler doğrusal veya doğrusal olmayan yapıda olabilir. Doğrusal olmayan modeller […]

Numerai’de Veri Bilimcisi Olmak

Veriler, Yapay Zeka ve Veri Biliminin gelişmesiyle birlikte hemen her alanda kullanılır hale gelmektedir. Eğitim, sağlık, iş süreçleri, finans, satış, pazarlama ve daha birçok alanda oluşan ve kullanılan veriler bulunmaktadır. Bu yazıda, veri çeşitlerinden biri olan ‘finansal verilerin’ Makine Öğrenmesi probleminde kullanılması için oluşturulmuş bir veri bilimi sisteminden bahsedeceğim. Numerai oluşturduğu verisetiyle birlikte hem veri […]

R’da Makine Öğrenmesi için Yeni Paket: Tidymodels

tidymodels paketi makine öğrenmesi için oluşturulmuş bir koleksiyondur. R’da tidymodels paketini yüklemek için;

komutunu kullanabilirsiniz. İster bugün yeni başlıyor olun, isterseniz modelleme konusunda yılların deneyimine sahip olun, tidymodels işiniz için tutarlı ve esnek bir çerçeve sunmaktadır. tidymodels başlangıçta yüklenen bazı paketler içermektedir. Şimdi bu paketlere göz atalım: rsample rsample, analizler için farklı türde örnekler ve […]