Forcats Kütüphanesi 3

Forcats Kütüphanesi

Seviyelerin değerini değiştiren fonksiyonlar

1- fct_anon()

Faktör seviyelerini anonim hale getirir. İçerisine bir karakter yazdığımızda ise örnekteki gibi bir faktör haline gelir.

 

2- fct_collapse

faktörü belirli gruplara ayırmamızı sağlar.

3- fct_lump()

fct_lump belirli kriterleri sağlayan seviyeleri(levels) bir araya getiren bir fonksiyondur.

fct_lump fonksiyonu artık kullanılan bir fonksiyon değildir ancak baktığımız zaman bize çağırdığımız elemanları getirir geri kalanları ise diğer (other) olarak adlandırır.

4- fct_lump_n()

fct_lump_n bize sayısı en fazla olan n kadar kategoriyi getirir. Eğer -n olarak yazarsak sayısı en az olan n kadar kategoriyi getirir.

5- fct_lump_prop()

fct_lump_prop fonksiyonu bize belirlediğimiz yüzdeden fazla olanları getirir geri kalanları diğer (other) olarak adlandırır.

6- fct_lump_min()

fct_lump_min fonksiyonu bize minimum n kadar olan değişkenleri çağırmamızı sağlar. Örneğin n = 100 için 100’den fazla olan tüm kategorileri getir.

7- fct_lump_lowfreq()

fct_lump_lowfreq fonksiyonu ise en az sıklıkta olan seviyeleri bir araya toplayarak, “diğer” in hala en küçük seviye olmasını sağlar.

daha anlaşılır olması açısından https://forcats.tidyverse.org/reference/fct_lump.html sitesinden aldığım bir örneği vereceğim.

seviye ekleme ve kaldırma

1- fct_expand()

Bir faktöre yeni seviyeler ekler.

2- fct_explicit_na()

Eksik verileri vektör olarak verir ve grafiklerde görülmesini sağlar.

3- fct_drop()

Kullanılmayan seviyeleri atar.

only argümanı ile istediğimiz başka seviyeleri de çıkarabiliriz.

4- fct_unify()

Bir listedeki faktörlerin seviyelerini birleştirir.

 

Kaynakça

https://www.datacamp.com/community/tutorials/factors-in-r

https://forcats.tidyverse.org/reference/index.html#section-change-order-of-levels

Hadley Wickham, Garrett Grolemund, R for Data Science

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.