Tidyverse Giris egitimi
Etkin Veri Analizi için dplyr 1
Öncelikle kütüphanemizi indirip çağıralım
1 |
install.packages(“dplyr”) |
1 |
library(dplyr) |
dplyr paketini yüklediğimize göre fonksiyonlara geçebiliriz.
filter() fonksiyonu belirli özellikleri taşıyan verileri çekmemizi sağlar. Mtcars veri setini çağırıp bakalım. Head fonksiyonu bize ilk 6 veriyi verir.
1 2 |
data("mtcars") head(mtcars) |
1 2 3 4 5 6 |
mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1 |
Mtcars veri setindeki değişkenlerin ne anlama geldiğine bakalım. Sizde R da bulunan veri setlerini veya fonksiyonların özelliklerini araştırmak için https://www.rdocumentation.org web adresini kullanabilirsiniz.
mpg = “Miles/(US) gallon”// mil başına harcanan yakıtı gösterir.
cyl = “Number of cylinders”// araçlardaki silindir sayısını gösterir.
disp = “Displacement”// motor hacmini gösterir.
hp = “Gross horsepower”// Brüt beygir gücünü gösterir.
drat = “Rear axle ratio”// Arka aks oranını gösterir.
wt = “Weight(1000 ıbs)”// Aracın ağırlığını gösterir. Ibs yaklaşık 0.45 grama denk gelen bir ağırlık ölçüsüdür.
qsec = “1/4 mile time”// 400 metreye kaç saniyede ulaştığını gösterir.
vs = “Engine(0 = V-shaped, 1 = straight)”// motor şeklini belirtir. 0 için V-şekli, 1 için düz.
am = “Transmission(0 = automatic, 1 = manual)”// aracın otomatik yada manuel vites olup olmadığını gösterir.
gear = “Number of forward gears”// ileri vites sayısı.
carb = “number of carburetors”// karbüratör sayısı.
Artık veri setindeki değişkenlerin ne olduğunu bildiğimize göre veri analizine başlayabiliriz.
Veri içinden sadece 6 silindirli araçları görmek için
1 2 3 4 5 6 7 8 9 10 |
filter(mtcars, cyl == 6) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4 Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1 Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1 Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4 Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4 Ferrari Dino 19.7 6 145.0 175 3.62 2.770 15.50 0 1 5 6 |
şeklinde yada,
1 2 3 4 5 6 7 8 9 10 11 |
mtcars %>% filter(cyl == 6) mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4 Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1 Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1 Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4 Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4 Ferrari Dino 19.7 6 145.0 175 3.62 2.770 15.50 0 1 5 6 |
şeklinde yazmalıyız. Buradaki “ %>% ” (operatörün) adı pipe(okunuş = payp) olup her fonksiyonda mtcars veri setini çağırmamızın önüne geçer.
Hem 6 silindirli hemde otomatik araçları çağırmak için
1 2 3 4 5 6 7 8 |
mtcars %>% filter(cyl == 6, am == 0) mpg cyl disp hp drat wt qsec vs am gear carb Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1 Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1 Merc 280 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4 Merc 280C 17.8 6 167.6 123 3.92 3.440 18.90 1 0 4 4 |
şeklinde yazarız.
Hem 6 silindirli, hem otomatik, hem de 4 veya 4 den fazla ileri vitesi olan arabaları seçmek icin
1 2 3 4 5 6 |
mtcars %>% filter(cyl == 6, am == 0, gear >= 4) mpg cyl disp hp drat wt qsec vs am gear carb Merc 280 19.2 6 167.6 123 3.92 3.44 18.3 1 0 4 4 Merc 280C 17.8 6 167.6 123 3.92 3.44 18.9 1 0 4 4 |
şeklinde çağırmalıyız.