Tidyverse Giriş Eğitimi 3

Tidyverse Giris eğitimi

Etkin veri analizi için dplyr 3

Bu yazımızda arrange ve mutate fonksiyonlarını inceleyeceğiz.

Arrange bize verileri belirli bir kurala göre sıralamamızı sağlar.

Arrange default olarak küçükten büyüğe doğru sıralar. Büyükten küçüğe sıralamak için desc()  fonksiyonu kullanılır.

Mutate fonksiyonu bize yeni sütunlar yapmamıza olanak verir. Özellikle bazı veri setlerinde 2 farklı değişkeni çekip yeni bir değişken yapmak gerekebilir. Mutate fonksiyonuna bakarken gapminder  veri setini kullanacağım.

Gapminder, 6 tane sütunu olan bir veri setir. Ülke, kıta, sene, ortalama ömür beklentisi, nüfus, ve kişi başına düşen gayri safi yurt içi hasıla verileri vardır.

Veri 1952-2007 senesi arasında sonu 2 ve 7 ile biten seneler mevcuttur.

Öğrendiklerimizle önce Türkiye verisini çağıralım.

ardından verimizden continent (kıta) ve lifeExp sütunlarını çıkartalım.

şimdi ise mutate fonksiyonunu kullanarak ülkemizin Gayri safi yurt içi hasılasını hesaplayalım. Bunun için kişi başına düşen GSYH’yi nüfus ile çarpmamız gerekiyor. Çarptıktan sonra 1.000.000(10^6) sayısına bölersek milyon dolar cinsinden gösteririz.

Elde ettiğimiz veriye göre ülkemizin GSYH’si 1952 senesinde 43 milyar 784 milyon dolara seviyesindeyken 2007 senesine geldiğmizde 601 milyar 879 milyon dolar seviyesine geldiğini görüyoruz.

 

Serinin bir önceki yazısına ulaşmak için buraya tıklayabilirsiniz.

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.