Numpy For Data Science – Part 1

Bir veri bilimi projesine attığımız ilk adımlarda veriyi tanıyıp bazı istatistiki değerlerine göz atmak ve üzerinde array işlemleri yapabilmek için Numpy adlı Python kütüphanesini kullanırız. Matematiksel array işlemlerinde temel python fonksiyonlarına göre daha yüksek performansla çalışan Numpy bir veri bilimcinin olmazsa olmaz yeteneklerinden biri haline gelmiştir.

Bu yazıda temel olarak kullanılan Numpy özelliklerine giriş yapıp küçük örneklerde kodları açıklamaya çalışacağım.

Aşağıda paylaştığım kod bloğunda ilk 4 satırda öncelikle import numpy as np ifadesiyle kütüphaneyi yüklüyoruz. X değişkeni üzerinden np kısaltmasını kullanarak bir array oluşturuyoruz. İfadelerin sonuçlarını terminalde göstermek için print fonksiyonuyla beraber tanımlamış oluğumuz değişken adını giriyoruz.

Satır 6′ da oluşturduğumuz değişkenin veri tipini, Satır 8’de değişkenin sahip olduğu boyutları, Satır 10’da ise değişkenin sahip olduğu toplam eleman sayısını terminale yazdırıyoruz. Satır 12, değişkenin boyut sayısını Satır 14 ise arraydeki veri ve verilerin tipini döndürüyor.

Veri setine ilk eriştiğimizde ilk 15 satırdaki kodlarla beraber veriye kabaca göz atmış oluruz. 15 ve 30. satırlar arasında yukarıdaki işlemler bu kez iki boyutlu bir array için gerçekleştirilmiştir. Boyut sayılarını arttırmak için virgül koyup sonrasında köşeli parantez ile verileri girmemiz yeterli.

Np ifadesinden sonra zeros ve ones fonksiyonlarıyla istediğimiz boyutlarda 0 ve 1’lerden oluşan array ya da matrisler oluşturabilir, full fonksiyonu ile bir arrayi belirtilen veri tipinde doldurabiliriz. Full fonksiyonuna ek olarak empty fonksiyonu ile boş bir array/matris oluşturabiliriz.

Lineer Cebir ile ilgili küçük çalışmalar için eye ya da identity fonksiyonları ile birim matris oluşturabilir, diag fonksiyonu ile diagonal bir matris üzerinde çalışmaya başlayabiliriz.

61–70 numaralı satırlar arasında görmüş olduğunuz arange fonksiyonu bize belirli aralıklar içerisinde bizim belirlediğimiz artış miktarına göre veriler üretir. Hemen altında yer alan linspace fonksiyonunun 3. argümanı bize belirlemiş olduğumuz aralıkta kaç adet veri istediğimizi sorar.

Reshape fonksiyonuyla önceden belirlenen bir array yapısında boyutları değiştirebilir tek boyutlu bir arrayi kare ya da dikdörtgensel matris haline getirebiliriz. Delete fonksiyonu girilen argümanlara göre arrayde istenmeyen verileri silmede bize yardımcı olur.

101–110. satırlarda gördüğümüz append fonksiyonu ile çeşitli argüman değerlerini girerek matrise eklemeler yapabiliriz. 115. satırda Append fonksiyonuna yakın olan Insert fonksiyonu ile oluşturulan arrayde 0 numaralı indekse sahip birime 59 değerini atadık ve başlangıç değeri olarak gösterdik.

Bloğun son satırlarına geldiğimizde ilk olarak X22 ve Y3 adlı değişkenleri oluşturuyoruz. Sonra vstack fonkiyonu ile X22 adlı arrayi Y3 matrisinin üstüne dikey pozisyonda ekleyip birleştiriyoruz. Son kod parçası olan 128. satırdan itibaren hstack fonksiyonu ile yukarıda gerçekleştirdiğimiz işlemi bu sefer yatay olarak gerçekleştiriyoruz.

Yakın zamanda biraz daha detaylısını yayınlayacağım Veri Bilimi İçin Numpy yazımın sonuna geldik. Umarım giriş seviyesi için bilgi edinmek isteyen herkese yararı dokunur. Bir sonraki yazıda görüşmek üzere.

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.