Okunma süresi: 4 dakika

Tidymodels ile Modelleme ve Makine Öğrenmesi

Okunma süresi: 4 dakika Tidymodels, tidyverse ilkeleri kullanan modelleme ve makine öğrenmesi için paketler koleksiyonudur. Tidyverse ile ilgili yazdığım yazıya ulaşmak için tıklayınız. Tidymodels paketler koleksiyonu bir veri bilimi projesi için gerekli olan veri ön işlemeden model seçimine kadar tüm aşamaları içerisinde barındıran paketlerden oluşmaktadır. Bu paketler kullanılarak popüler makine öğrenmesi algoritmaları veri setlerine uygulanabilir ve sonuçlar çok hızlı […]

Okunma süresi: 4 dakika

Tidyverse ile Veri Bilimi

Okunma süresi: 4 dakika Tidyverse, veri bilimi için tasarlanmış R paketler koleksiyonudur. Tidyverse içerisinde yer alan tüm paketler temel bir tasarım felsefesini, sözdizimini ve veri yapılarını paylaşır. Tidyverse paketler koleksiyonu ilk olarak 2016 yılında Hadley Wickham ve arkadaşları tarafından tasarlanmıştır. Farklı paketler yardımıyla R programlama dili üzerinde veri görselleştirme, veri birleştirme ve düzenleme, veri manipülasyonu gibi çeşitli analizler yapılabilmektedir. […]

Okunma süresi: 5 dakika

Shiny ile Web Uygulamaları

Okunma süresi: 5 dakika Shiny, R kodlarını kullanarak web uygulamaları oluşturmak için geliştirilmiş R paketlerinden biridir. Öncelikle veri bilimciler düşünülerek tasarlanmıştır ve bu amaçla HTML, CSS veya JavaScript bilgisi olmadan oldukça karmaşık Shiny uygulamaları oluşturulabilmektedir. Shiny ile kullanıcı arayüzü bileşenleri kolayca özelleştirilebilir veya genişletilebilir ve server ile birlikte R kodları yazılarak arka planda reaktif programlama kullanılabilir. Böylece, web uygulamanız […]

Okunma süresi: 22 dakika

R ve Python ile Sıfırdan Sinir Ağlarını (NNs) Anlama ve Kodlama

Okunma süresi: 22 dakika Bu makalede, sinir ağlarının yapı taşını sıfırdan anlatmaya çalışacağım ve Sinir ağlarını uygulamak için bir sezgi geliştirmeye daha fazla odaklanacağım. Hem “Python” hem de “R” ile kodlamalar yapacağız. Bu makalenin sonunda, Sinir ağlarının nasıl çalıştığını, ağırlıkları nasıl başlatacağımızı ve geri yayılımı kullanarak bunları nasıl güncelleyeceğimizi öğrenmiş olacaksınız. Genel Bakış Sinir Ağları (Neural Networks), en popüler […]

Okunma süresi: 4 dakika

Forcats Kütüphanesi 3

Okunma süresi: 4 dakika Forcats Kütüphanesi Seviyelerin değerini değiştiren fonksiyonlar 1- fct_anon() Faktör seviyelerini anonim hale getirir. İçerisine bir karakter yazdığımızda ise örnekteki gibi bir faktör haline gelir.

  2- fct_collapse faktörü belirli gruplara ayırmamızı sağlar.

3- fct_lump() fct_lump belirli kriterleri sağlayan seviyeleri(levels) bir araya getiren bir fonksiyondur. fct_lump fonksiyonu artık kullanılan bir fonksiyon […]

Okunma süresi: 5 dakika

Forcats Kütüphanesi 2

Okunma süresi: 5 dakika Forcats Kütüphanesi Önceki yazımızda faktörleri ve forcats kütüphanesinin bazı önemli fonksiyonlarına bakmıştık. Bu yazımızda faktör birleştirmek için fonksiyonlar ve seviye sırasını değiştiren fonksiyonları göreceğiz. faktör birleştirmek için fonksiyonlar 1- fct_c() faktörleri ve seviyeleri birleştirir.

2- fct_cross() 2 veya daha fazla faktörü kombine eder.

Seviye sırasını değiştiren fonksiyonlar 1- fct_relevel() Bu fonksiyon faktör seviyelerini […]

Okunma süresi: 2 dakika

Forcats Kütüphanesi 1

Okunma süresi: 2 dakika Forcats Kütüphanesi Forcats kütüphanesi faktörler ile ilgili olan bir kütüphanedir. Faktörler, kategorik değişkenleri seviyeler halinde depolayan bir R’ nesnesidir ve faktörlerde sıralama önemlidir.

Yukarıda da gördüğümüz üzere 2 çeşit cinsiyet vardır; Erkek ve Kadın. Verimizin sınıfı ise karakterdir.

karakter sınıfında olan verimizi faktör sınıfına geçirdiğimizde ise bize levels (seviyeler) olarak “E” ve “K” değerlerini […]

Okunma süresi: 3 dakika

Tidyverse Giriş Eğitimi 3

Okunma süresi: 3 dakika Tidyverse Giris eğitimi Etkin veri analizi için dplyr 3 Bu yazımızda arrange ve mutate fonksiyonlarını inceleyeceğiz. Arrange bize verileri belirli bir kurala göre sıralamamızı sağlar.

Arrange default olarak küçükten büyüğe doğru sıralar. Büyükten küçüğe sıralamak için desc()  fonksiyonu kullanılır.

Mutate fonksiyonu bize yeni sütunlar yapmamıza olanak verir. Özellikle bazı veri setlerinde 2 farklı değişkeni […]

Okunma süresi: 2 dakika

Janitor ile Sütun İsimleriyle Oynamak

Okunma süresi: 2 dakika Janitor ile Sütun İsimleriyle Oynamak Veri analizi yaparken sütun isimlerinin büyük veya küçük harflerle yazılması zorlandığımız ama düzeltilmesi basit bir konudur. Bu yazımda “janitor” kütüphanesinin clean_names fonksiyonu ile bu sorunu nasıl çözdüğümüzü anlatmaya çalışacağım. Öncelikle kütüphanemizi indirip kuruyoruz.

Bu yazımda https://github.com/sfirke/janitor/blob/master/dirty_data.xlsx sitesinden aldığım bir excel dosyası üzerinde gösterim yapacağız. Öncelikle dirty_data.xlsx verimizi çağıralım.

[…]

Okunma süresi: 2 dakika

Tidyverse Giriş Eğitimi 2

Okunma süresi: 2 dakika Tidyverse Giris eğitimi Etkin veri analizi için dplyr 2 Bu yazımızda select() fonksiyonunu inceleyeceğiz. Select fonksiyonu tablodan istenilen sütunları seçmek için kullanılır.

Üstteki kodu yazdığımız zaman, R bize sadece mpg, cyl, disp ve qsec sütunlarını verecek. Select fonksiyonunun içine contains fonksiyonu yazılıp aranan bir karakter girdiğimizde fonksiyon bize o karakteri içeren sütunları verecektir.

Sütunları […]

Okunma süresi: 3 dakika

Tidyverse Giriş eğitimi

Okunma süresi: 3 dakika Tidyverse Giris egitimi   Etkin Veri Analizi için dplyr 1 Öncelikle kütüphanemizi indirip çağıralım

dplyr paketini yüklediğimize göre fonksiyonlara geçebiliriz. filter()  fonksiyonu belirli özellikleri taşıyan verileri çekmemizi sağlar. Mtcars  veri setini çağırıp bakalım. Head  fonksiyonu bize ilk 6 veriyi verir.

  Mtcars veri setindeki değişkenlerin ne anlama geldiğine bakalım. Sizde R […]

Okunma süresi: 2 dakika

Monte Carlo Simülasyonu

Okunma süresi: 2 dakika Monte Carlo simülasyonu adını Monte Carlo vilayetindeki kumarhanelerden almıştır. Bunun sebebi kumarhanelerde oynatılan ruletlerin sonuçlarının tahmin edilemiyor ve rastgele olmasıdır.  Geçmişte atom bombasını üretirken de etkin olarak kullanılan bu simülasyon günümüzde kantitatif analizlerde çokça kullanılmaktadır. Risk analizleri, finans, fizik, proje yönetimi, sigorta gibi birçok alanda kullanılıyor. Peki, Monte Carlo simülasyonu nedir ve nasıl çalışır? Sistem […]

Okunma süresi: 3 dakika

R Uygulamaları – Bölüm 7: Doğrusal Olmayan Regresyon Modelleri

Okunma süresi: 3 dakika Doğrusal regresyon modellerinde model parametreleri doğrusal bir yapıda bulunmaktadır. Doğrusal regresyon modelleri ile ilgili yazılarıma aşağıdaki bağlantılardan ulaşabilirsiniz. R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon R Uygulamaları – Bölüm 2: Çoklu Doğrusal Regresyon Doğrusal olmayan regresyon modellerinde ise model parametreleri doğrusal değildir ancak bağımsız değişkenler doğrusal veya doğrusal olmayan yapıda olabilir. Doğrusal olmayan modeller […]

Okunma süresi: 3 dakika

R’da Makine Öğrenmesi için Yeni Paket: Tidymodels

Okunma süresi: 3 dakika tidymodels paketi makine öğrenmesi için oluşturulmuş bir koleksiyondur. R’da tidymodels paketini yüklemek için;

komutunu kullanabilirsiniz. İster bugün yeni başlıyor olun, isterseniz modelleme konusunda yılların deneyimine sahip olun, tidymodels işiniz için tutarlı ve esnek bir çerçeve sunmaktadır. tidymodels başlangıçta yüklenen bazı paketler içermektedir. Şimdi bu paketlere göz atalım: rsample rsample, analizler için farklı türde örnekler ve […]

Okunma süresi: 5 dakika

R Uygulamaları – Bölüm 6: Parametrik Olmayan Regresyon Yöntemleri

Okunma süresi: 5 dakika Regresyon analizi, parametrik ve parametrik olmayan regresyon olmak üzere iki gruba ayrılmaktadır. Parametrik regresyon analizinin en önemli özelliği değişkenler arasındaki ilişkinin bir fonksiyon ile açıklanabilir olmasıdır. Ayrıca; parametrik regresyonda bazı önemli varsayımların sağlanması gerekmektedir. Bu varsayımlara ve parametrik regresyon analizi ile ilgili yaptığım uygulamalara aşağıdaki bağlantılardan ulaşabilirsiniz: R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon […]

Okunma süresi: 4 dakika

Power BI’da R Betiği ve Bir Uygulama

Okunma süresi: 4 dakika Herkese merhaba! Veri görselleştirme için kullanılan popüler uygulamalardan biri olan Power BI’da gerçek hayatta kulandığımız veriler için farklı görselleştirmeler yapılmaktadır. Verileri görselleştirmemizdeki amaç elimizdeki verilerin karmaşık olması ve bu verilerin ham haliyle yorumlanmasının da oldukça zor olmasıdır. Bu yüzden verilerden başarılı çıkarsamalar yapabilmek için bu verileri görselleştirmek ve yorumlamak gerekmektedir. Power BI ile ilgili detaylı […]

Okunma süresi: 4 dakika

R Uygulamaları – Bölüm 5: Kantil Regresyon

Okunma süresi: 4 dakika Kantil Regresyon (Quantile Regression) yöntemi Koenker ve Bassett tarafından 1978 yılında önerilmiştir. Doğrusal regresyon modelleri uç değerlere karşı esnek olmadığı için özellikle; uç değerlerin olduğu veri setlerinde kantil regresyon modelleri tercih edilmektedir. Ayrıca kantil regresyon modeli aykırı gözlemlere karşı etkili olduğundan doğrusal regresyondaki gibi varsayımlara gerek duymamaktadır. Doğrusal regresyon ile ilgili detaylı bilgilere aşağıdaki bağlantılardan […]

Okunma süresi: 5 dakika

R Uygulamaları – Bölüm 4: Doğrusal Olmayan Regresyon

Okunma süresi: 5 dakika Herkese merhaba! R uygulamalar serisinin önceki bölümlerinde doğrusal regresyon ve lojistik regresyon ile ilgili uygulamalar yapmıştık. Yazılarıma aşağıdaki bağlantılardan ulaşabilirsiniz: R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon R Uygulamaları – Bölüm 2: Çoklu Doğrusal Regresyon R Uygulamaları – Bölüm 3: Lojistik Regresyon R uygulamalar serisinin bu bölümünde değişkenler arasındaki ilişkinin doğrusal olmadığı veri yapılarını […]

Okunma süresi: 5 dakika

R Uygulamaları – Bölüm 3: Lojistik Regresyon

Okunma süresi: 5 dakika Serinin ilk iki yazısında doğrusal regresyon analizine değinmiştim. İlgili yazılara aşağıdan erişebilirsiniz: R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon R Uygulamaları – Bölüm 2: Çoklu Doğrusal Regresyon Doğrusal regresyonda açıklamaya çalıştığımız bağımlı değişken sürekli verilerden oluşmaktaydı. Lojistik regresyon analizi ile bağımlı değişkeni açıklayabilmek için bağımlı değişken, kategorik verilerden (hasta-sağlıklı, iyi-kötü vb.) oluşmalıdır. Bu verilere […]

Okunma süresi: 5 dakika

R Uygulamaları – Bölüm 2: Çoklu Doğrusal Regresyon

Okunma süresi: 5 dakika Herkese merhaba! R uygulamalar serisinin ilk bölümünde bir veri setinin basit doğrusal regresyon ile modellenmesini incelemiştik. Basit doğrusal regresyon analizi ile ilgili yazdığım yazıya ulaşmak için tıklayınız. Serinin ikinci bölümünde çoklu doğrusal regresyon analizine değineceğim. Çoklu doğrusal regresyon, bir bağımlı değişken birden fazla bağımsız değişkenle açıklanmak istendiğinde kullanılan analiz yöntemlerinden biridir. Aşağıda çoklu doğrusal regresyon […]

Veri Bilimci Yetiştirme Programı

Her yerde geçerli @datasciencearth sertifikası

Bu program ülkemizde büyük işgücü açığı bulunan Veri Bilimi konusunda çalışabilecek yeterliliklerde Veri Bilimciler yetiştirmek için kurgulanmıştır.

Ücretli ve Ücretsiz Eğitimler

Türkiye'nin en büyük veri bilimi topluluğu ile kariyerinizi inşa edin.

Gruplarımıza katılın!

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.