flexdashboard ile Gösterge Panelleri

Flexdashboard’un amacı, R Markdown kullanarak R için etkileşimli gösterge tabloları oluşturmayı kolaylaştırmaktır. R Markdown ile ilgili yazdığım yazıya ulaşmak için tıklayınız. Peki, flexdashboard ile neler yapılabilir ?: Bir grup ilgili veri görselleştirmesini gösterge tablosu olarak yayınlamak için R Markdown kullanabilirsiniz. base, lattice, ızgara grafikler, tablo verileri göstergeler gibi çeşitli htmlwidgetslar için destek sağlar. Satır ve […]

Tidymodels ile Modelleme ve Makine Öğrenmesi

Tidymodels, tidyverse ilkeleri kullanan modelleme ve makine öğrenmesi için paketler koleksiyonudur. Tidyverse ile ilgili yazdığım yazıya ulaşmak için tıklayınız. Tidymodels paketler koleksiyonu bir veri bilimi projesi için gerekli olan veri ön işlemeden model seçimine kadar tüm aşamaları içerisinde barındıran paketlerden oluşmaktadır. Bu paketler kullanılarak popüler makine öğrenmesi algoritmaları veri setlerine uygulanabilir ve sonuçlar çok hızlı […]

Tidyverse ile Veri Bilimi

Tidyverse, veri bilimi için tasarlanmış R paketler koleksiyonudur. Tidyverse içerisinde yer alan tüm paketler temel bir tasarım felsefesini, sözdizimini ve veri yapılarını paylaşır. Tidyverse paketler koleksiyonu ilk olarak 2016 yılında Hadley Wickham ve arkadaşları tarafından tasarlanmıştır. Farklı paketler yardımıyla R programlama dili üzerinde veri görselleştirme, veri birleştirme ve düzenleme, veri manipülasyonu gibi çeşitli analizler yapılabilmektedir. […]

Shiny ile Web Uygulamaları

Shiny, R kodlarını kullanarak web uygulamaları oluşturmak için geliştirilmiş R paketlerinden biridir. Öncelikle veri bilimciler düşünülerek tasarlanmıştır ve bu amaçla HTML, CSS veya JavaScript bilgisi olmadan oldukça karmaşık Shiny uygulamaları oluşturulabilmektedir. Shiny ile kullanıcı arayüzü bileşenleri kolayca özelleştirilebilir veya genişletilebilir ve server ile birlikte R kodları yazılarak arka planda reaktif programlama kullanılabilir. Böylece, web uygulamanız […]

R ve Python ile Sıfırdan Sinir Ağlarını (NNs) Anlama ve Kodlama

Bu makalede, sinir ağlarının yapı taşını sıfırdan anlatmaya çalışacağım ve Sinir ağlarını uygulamak için bir sezgi geliştirmeye daha fazla odaklanacağım. Hem “Python” hem de “R” ile kodlamalar yapacağız. Bu makalenin sonunda, Sinir ağlarının nasıl çalıştığını, ağırlıkları nasıl başlatacağımızı ve geri yayılımı kullanarak bunları nasıl güncelleyeceğimizi öğrenmiş olacaksınız. Genel Bakış Sinir Ağları (Neural Networks), en popüler […]

Forcats Kütüphanesi 3

Forcats Kütüphanesi Seviyelerin değerini değiştiren fonksiyonlar 1- fct_anon() Faktör seviyelerini anonim hale getirir. İçerisine bir karakter yazdığımızda ise örnekteki gibi bir faktör haline gelir.

  2- fct_collapse faktörü belirli gruplara ayırmamızı sağlar.

3- fct_lump() fct_lump belirli kriterleri sağlayan seviyeleri(levels) bir araya getiren bir fonksiyondur. fct_lump fonksiyonu artık kullanılan bir fonksiyon […]

Forcats Kütüphanesi 2

Forcats Kütüphanesi Önceki yazımızda faktörleri ve forcats kütüphanesinin bazı önemli fonksiyonlarına bakmıştık. Bu yazımızda faktör birleştirmek için fonksiyonlar ve seviye sırasını değiştiren fonksiyonları göreceğiz. faktör birleştirmek için fonksiyonlar 1- fct_c() faktörleri ve seviyeleri birleştirir.

2- fct_cross() 2 veya daha fazla faktörü kombine eder.

Seviye sırasını değiştiren fonksiyonlar 1- fct_relevel() Bu fonksiyon faktör seviyelerini […]

Forcats Kütüphanesi 1

Forcats Kütüphanesi Forcats kütüphanesi faktörler ile ilgili olan bir kütüphanedir. Faktörler, kategorik değişkenleri seviyeler halinde depolayan bir R’ nesnesidir ve faktörlerde sıralama önemlidir.

Yukarıda da gördüğümüz üzere 2 çeşit cinsiyet vardır; Erkek ve Kadın. Verimizin sınıfı ise karakterdir.

karakter sınıfında olan verimizi faktör sınıfına geçirdiğimizde ise bize levels (seviyeler) olarak “E” ve “K” değerlerini […]

Tidyverse Giriş Eğitimi 3

Tidyverse Giris eğitimi Etkin veri analizi için dplyr 3 Bu yazımızda arrange ve mutate fonksiyonlarını inceleyeceğiz. Arrange bize verileri belirli bir kurala göre sıralamamızı sağlar.

Arrange default olarak küçükten büyüğe doğru sıralar. Büyükten küçüğe sıralamak için desc()  fonksiyonu kullanılır.

Mutate fonksiyonu bize yeni sütunlar yapmamıza olanak verir. Özellikle bazı veri setlerinde 2 farklı değişkeni […]

Janitor ile Sütun İsimleriyle Oynamak

Janitor ile Sütun İsimleriyle Oynamak Veri analizi yaparken sütun isimlerinin büyük veya küçük harflerle yazılması zorlandığımız ama düzeltilmesi basit bir konudur. Bu yazımda “janitor” kütüphanesinin clean_names fonksiyonu ile bu sorunu nasıl çözdüğümüzü anlatmaya çalışacağım. Öncelikle kütüphanemizi indirip kuruyoruz.

Bu yazımda https://github.com/sfirke/janitor/blob/master/dirty_data.xlsx sitesinden aldığım bir excel dosyası üzerinde gösterim yapacağız. Öncelikle dirty_data.xlsx verimizi çağıralım.

[…]

Tidyverse Giriş Eğitimi 2

Tidyverse Giris eğitimi Etkin veri analizi için dplyr 2 Bu yazımızda select() fonksiyonunu inceleyeceğiz. Select fonksiyonu tablodan istenilen sütunları seçmek için kullanılır.

Üstteki kodu yazdığımız zaman, R bize sadece mpg, cyl, disp ve qsec sütunlarını verecek. Select fonksiyonunun içine contains fonksiyonu yazılıp aranan bir karakter girdiğimizde fonksiyon bize o karakteri içeren sütunları verecektir.

Sütunları […]

Tidyverse Giriş eğitimi

Tidyverse Giris egitimi   Etkin Veri Analizi için dplyr 1 Öncelikle kütüphanemizi indirip çağıralım

dplyr paketini yüklediğimize göre fonksiyonlara geçebiliriz. filter()  fonksiyonu belirli özellikleri taşıyan verileri çekmemizi sağlar. Mtcars  veri setini çağırıp bakalım. Head  fonksiyonu bize ilk 6 veriyi verir.

  Mtcars veri setindeki değişkenlerin ne anlama geldiğine bakalım. Sizde R […]

Monte Carlo Simülasyonu

Monte Carlo simülasyonu adını Monte Carlo vilayetindeki kumarhanelerden almıştır. Bunun sebebi kumarhanelerde oynatılan ruletlerin sonuçlarının tahmin edilemiyor ve rastgele olmasıdır.  Geçmişte atom bombasını üretirken de etkin olarak kullanılan bu simülasyon günümüzde kantitatif analizlerde çokça kullanılmaktadır. Risk analizleri, finans, fizik, proje yönetimi, sigorta gibi birçok alanda kullanılıyor. Peki, Monte Carlo simülasyonu nedir ve nasıl çalışır? Sistem […]

R Uygulamaları – Bölüm 7: Doğrusal Olmayan Regresyon Modelleri

Doğrusal regresyon modellerinde model parametreleri doğrusal bir yapıda bulunmaktadır. Doğrusal regresyon modelleri ile ilgili yazılarıma aşağıdaki bağlantılardan ulaşabilirsiniz. R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon R Uygulamaları – Bölüm 2: Çoklu Doğrusal Regresyon Doğrusal olmayan regresyon modellerinde ise model parametreleri doğrusal değildir ancak bağımsız değişkenler doğrusal veya doğrusal olmayan yapıda olabilir. Doğrusal olmayan modeller […]

R’da Makine Öğrenmesi için Yeni Paket: Tidymodels

tidymodels paketi makine öğrenmesi için oluşturulmuş bir koleksiyondur. R’da tidymodels paketini yüklemek için;

komutunu kullanabilirsiniz. İster bugün yeni başlıyor olun, isterseniz modelleme konusunda yılların deneyimine sahip olun, tidymodels işiniz için tutarlı ve esnek bir çerçeve sunmaktadır. tidymodels başlangıçta yüklenen bazı paketler içermektedir. Şimdi bu paketlere göz atalım: rsample rsample, analizler için farklı türde örnekler ve […]

R Uygulamaları – Bölüm 6: Parametrik Olmayan Regresyon Yöntemleri

Regresyon analizi, parametrik ve parametrik olmayan regresyon olmak üzere iki gruba ayrılmaktadır. Parametrik regresyon analizinin en önemli özelliği değişkenler arasındaki ilişkinin bir fonksiyon ile açıklanabilir olmasıdır. Ayrıca; parametrik regresyonda bazı önemli varsayımların sağlanması gerekmektedir. Bu varsayımlara ve parametrik regresyon analizi ile ilgili yaptığım uygulamalara aşağıdaki bağlantılardan ulaşabilirsiniz: R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon […]

Power BI’da R Betiği ve Bir Uygulama

Herkese merhaba! Veri görselleştirme için kullanılan popüler uygulamalardan biri olan Power BI’da gerçek hayatta kulandığımız veriler için farklı görselleştirmeler yapılmaktadır. Verileri görselleştirmemizdeki amaç elimizdeki verilerin karmaşık olması ve bu verilerin ham haliyle yorumlanmasının da oldukça zor olmasıdır. Bu yüzden verilerden başarılı çıkarsamalar yapabilmek için bu verileri görselleştirmek ve yorumlamak gerekmektedir. Power BI ile ilgili detaylı […]

R Uygulamaları – Bölüm 5: Kantil Regresyon

Kantil Regresyon (Quantile Regression) yöntemi Koenker ve Bassett tarafından 1978 yılında önerilmiştir. Doğrusal regresyon modelleri uç değerlere karşı esnek olmadığı için özellikle; uç değerlerin olduğu veri setlerinde kantil regresyon modelleri tercih edilmektedir. Ayrıca kantil regresyon modeli aykırı gözlemlere karşı etkili olduğundan doğrusal regresyondaki gibi varsayımlara gerek duymamaktadır. Doğrusal regresyon ile ilgili detaylı bilgilere aşağıdaki bağlantılardan […]

R Uygulamaları – Bölüm 4: Doğrusal Olmayan Regresyon

Herkese merhaba! R uygulamalar serisinin önceki bölümlerinde doğrusal regresyon ve lojistik regresyon ile ilgili uygulamalar yapmıştık. Yazılarıma aşağıdaki bağlantılardan ulaşabilirsiniz: R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon R Uygulamaları – Bölüm 2: Çoklu Doğrusal Regresyon R Uygulamaları – Bölüm 3: Lojistik Regresyon R uygulamalar serisinin bu bölümünde değişkenler arasındaki ilişkinin doğrusal olmadığı veri yapılarını […]

R Uygulamaları – Bölüm 3: Lojistik Regresyon

Serinin ilk iki yazısında doğrusal regresyon analizine değinmiştim. İlgili yazılara aşağıdan erişebilirsiniz: R Uygulamaları – Bölüm 1: Basit Doğrusal Regresyon R Uygulamaları – Bölüm 2: Çoklu Doğrusal Regresyon Doğrusal regresyonda açıklamaya çalıştığımız bağımlı değişken sürekli verilerden oluşmaktaydı. Lojistik regresyon analizi ile bağımlı değişkeni açıklayabilmek için bağımlı değişken, kategorik verilerden (hasta-sağlıklı, iyi-kötü vb.) oluşmalıdır. Bu verilere […]