REGRESYON ANALİZİ

Regresyon , bir bağımlı değişken (genellikle Y ile ifade edilir) ile bir dizi diğer değişken (bağımsız değişkenler -X- olarak bilinir) arasındaki ilişkinin gücünü belirlemeye çalışan finans, yatırım ve diğer disiplinlerde kullanılan istatistiksel bir ölçümdür. Regresyon analizi, iki ya da daha çok değişkenin yer aldığı istatiksel modellerde, genellikle neden-sonuç ilişkileri araştırılır. Yani değişkenlerden biri ya da […]

Doğal Dil İşleme+1: 7. Part of Speech Tagging ve Saklı Markov Modeli

Doğal Dil İşleme – Konuşma Bölümü Etiketleme (Part of Speech Tagging) ve Saklı Markov Modeli Bu yazımızda biraz hikâyelere yer verelim ne dersiniz? Dünyada ki en güçlü ülkelerin liderlerinin bulunduğu bir toplantıda bir ülke liderinin çevirmeni olarak görevlisiniz diyelim. Ülkenizin aleyhine siyaset güden diğer ülkelerin, ne söylediklerini hatasız bir şekilde anlamanız ve çevirmeniz hayati bir […]

Rastgelelik Nedir ? Tahmin Edilebilir mi ?

Geçmiş dönemlerden beri insanlar, olayların sonuçlarındaki belirsizliği merak etmişlerdir. Bir zarın yuvarlanışından tutun bir kartın iki ardı arasındaki dönüşü rastlantı kavramının gelişmesini sağlamıştır. Rastgelelik, bir tanım olarak sağlam temellere oturtulmamışsa da basit olarak bir olay yığınının öngörülemeyen hali diyebiliriz. Örnek olarak bir zar atıldığında, sonucu tahmin edilemezken; çift gelme olasılığı, 1 gelmesine kıyasla 2 kat […]

Parçacık Sürü Optimizasyonu Üzerine…

Parçacık sürü optimizasyonu (PSO) sürülerle ilgili problemleri çözmek için yaygın olarak kullanılan bir algoritmadır. 1995 yılında James Kennedy ve Russell C. Eberhart tarafından bir olasılıksal arama süreci olarak geliştirilmiş ve ilk olarak sürü halinde hareket eden kuş ve balık türlerinin yiyecek bulmak, avcılardan kaçmak gibi temel ihtiyaçlarını ne şekilde yaptıklarını, sürü içindeki sosyal davranışlarını ve […]

Boosting Algoritmaları

Herkese merhabalar bu yazımızda Boosting ailesinden XGBoost, GradientBoost, AdaBoost ve CatBoost algoritmalarını inceleyeceğiz. Boosting algoritmaları makine öğrenme modellerinde doğru tahminleri güçlendirmek için uygulanmaktadır. Diğer bir anlamıyla arttırma, yükseltme anlamına gelen Boosting, zayıf modelleri güçlendirme eğilimindedir. Peki temelde zayıf öğrenme modelini güçlü bir öğrenme modeli haline getirmek için kullanılıyorsa, zayıf öğrenme modellerini nasıl tespit edebiliriz ? […]

Veri Bilimcisi Olmanın Yol Haritası

Veri bilimi, her geçen gün gelişen ve hızla büyüyen alanlardan biridir. Ve bu giderek daha fazla veri bilimcisine ihtiyaç duyulmasına neden olmaktadır. Kasım 2020 itibariyle bu ihtiyacın azalmak bir tarafa giderek daha da artacağına inanıyorum. Neyse ki, veri bilimcisi olmak bir üniversite vs. derecesi gerektirmiyor. Yeni şeyler öğrenmeye açık olduğunuz ve çaba ve zaman ayırmaya […]

Forcats Kütüphanesi 1

Forcats Kütüphanesi Forcats kütüphanesi faktörler ile ilgili olan bir kütüphanedir. Faktörler, kategorik değişkenleri seviyeler halinde depolayan bir R’ nesnesidir ve faktörlerde sıralama önemlidir.

Yukarıda da gördüğümüz üzere 2 çeşit cinsiyet vardır; Erkek ve Kadın. Verimizin sınıfı ise karakterdir.

karakter sınıfında olan verimizi faktör sınıfına geçirdiğimizde ise bize levels (seviyeler) olarak “E” ve “K” değerlerini […]

Herkes İçin Veri Okuryazarlığı #3

Bölüm 3: Herkes İçin Veri Okuryazarlığı‘nın bir önceki bölümünde temel kavramlardan ziyade teorik olarak merkezi eğilim ölçülerinden bahsedilmişti. Daha önceki bölümlerde ifade etmiş olduğum gibi serinin temel akışı için yararlandığım kaynak; Turkcell’in Geleceği Yazanlar  web sitesindeki Vahit Keskin’in Veri Okuryazarlığı eğitim programıdır. Dağılım Ölçüleri olarak tek bir başlık altında toplanmasının doğru olmayacağına karar verdim bu […]

Makine Öğrenimi için Matematik

Merhabalar bugün ilk yazımla sizlere sesleniyorum. Ben Eren Can ARDIÇ endüstri mühendisliği öğrencisiyim. Bugün sizlere makine öğrenimi için matematik adı altında bir yazı hazırladım. Herkes biliyor matematik önemli ama ne kadar önemli!!! Makine öğrenimi, verilerden otomatik olarak önemli bilgileri çıkaran algoritmalar tasarlamakla ilgilidir. Buradaki vurgu ‘otomatik’, yani makine öğrenimi, bir şey üretirken birçok veri setine […]

İti An Çomağı Hazırla

Başlık için kusura bakmayın ama genel olarak sıklıkla kullanılan bir terim olunca ve biraz olasılık öğrenmek isteyince dilime yapıştı. Hepimizin sık sık başına gelir, birisi hakkında konuşurken ya da bir olayı anlatırken ilgili kişi ya da kişilerin hem de hiç ihtimal vermediğiniz bir anda karşınıza çıkması durumudur. Bunun gibi günlük hayatımızdaki karşılaştığımız benzer birçok olaya […]

DCGAN Kısaca Nasıl Çalışır ?

DCGAN Generative Adversarial Networks’ün popüler alt dallarından biri diyebiliriz. DCGAN ın içinde ise generator ve discriminator denilen iki farklı model bulunuyor. Generator alınan bir dağılımdan model içinde upsampling işlemleri gerçekleştirerek bir resim uydurmaya çalışırken Discriminator ise bu uydurduğumuz resim ile bizim modele verdiğimiz resim arasındaki bu gerçek mi yoksa sahte mi ayrımını yapmaya çalışıyor. Modeli […]

Temel İstatistik Bilgileri Serisi 3

Tekrardan herkese merhaba. İstatistik dünyasının büyük önem kazandığı bu zamanda, insanlara İstatistik olarak bir şeyler katmayı hedefliyor ve bu seriyi o sebepten oluşturmuştum. Sizden aldığım güzel geri dönüşler ile birlikte devam ediyorum. Bugün giriş kısmında ölçeklendirmelerden bahsetmek istiyorum. Ardından arkası gelecek şekilde devam edeceğim. Değişkenler dört düzeyde ölçeklenebilir: 1 – Sınıflama Ölçeği 2 – Sıralama […]

Veri Madenciliği nedir? Endüstri mühendisliğinde veri madenciliğinin önemi nedir?

Veri Madenciliği (Data Mining) Nedir? Veri madenciliği, büyük miktarlarda bilginin toplanması ve içerisinden yararlı bilgilerin ayrıştırılmasıdır. Veriler işlenmediği sürece bir değer taşımazlar, yığın halinde yer alan tüm veriler işlenerek bilgiye dönüştürülür. Bilgisayar ortamında yer alan yığınla veri, veri madenciliği ile anlam kazanır ve ileriye yönelik olarak doğru tahminlerde bulunulmasını kolaylaştırır. Veri madenciliğinin temel amacının, şirketlerin […]

Veri Bilimcileri Tarafından En Çok Talep Gören 8 Matematik Kursu

Veri bilimi alanında gelecek vaad eden biri olmak istiyorsanız, bu alana ilk adımlarınızı atarken matematik alanında belirli bir seviyede olmanız gerekir. Matematikte güçlü bir temele sahip olmak, özellikle henüz yolun başında olanların sadece makine öğrenimi tekniklerini öğrenmelerine değil, aynı zamanda rekabetçi piyasa nezdinde sıyrılarak ön plana çıkmalarına da yardımcı olacaktır ve sonuçta, veri bilimci adayıysanız, […]

Temel İstatistik Bilgileri Serisi 2

Önceki bölümde ufaktan bir giriş yaparak istatistiksel kavramlara değinmiştim. Bugün yazımda da aynı şekilde tanımlamalar ve onların ne anlamlara geldiklerinden bahsederek başlayacağım. Herkesin bildiği gibi veri bilimi mesleği bir kodlama işi değildir. Aslında arka planı yoğun bir matematik ve istatistik bilgisine dayanmaktadır. Tanımlara ufaktan başlamak istiyorum. Örneklem Uzayı : Bir deneyin örneklem uzayı, o deneyin […]

İstatistiksel Önyargı ve Yapay Zeka

  Artık hepimizin farkında olduğu bir şey var; Veri 21. yüzyılın petrolü ve gelecekteki başarının anahtarıdır. Bu noktada da veriler, güçlü bir yapay zeka için hayati yakıttır. Veri bilimcilerin  yapay zeka algoritmalarını doğru verilerle beslemek ve eğitmek için verileri kullanılabilir formda sunmak adına önemli sorumlulukları vardır. Ayrıca verilerde gerekli tutarlılık seviyesini elde etmek için veri […]

Doğrusal (Lineer) Regresyon

Regresyon analizi, istatistik ve makine öğreniminde en önemli alanlardan biridir. Birçok regresyon yöntemi mevcuttur. Doğrusal regresyon da bunlardan biridir. Regresyon Nedir? Regresyon değişkenler arasındaki ilişkileri ortaya koyan ve buna göre tahminler üretilmesini sağlayan istatistiksel bir ölçümdür. Örneğin, bir şirkette çalışanları gözlemleyerek maaşlarının deneyim, eğitim seviyesi, rol, çalıştıkları şehir vb. özelliklere bağlı olarak nasıl değiştiğini anlayabiliriz. […]

istatistik bölümü tercihi – lisans

İstatistik lisans Programı nedir? Öncelikle söylemek gerekir ki “istatistik ve bilgisayar bilimleri” ve “istatistik” bölümleri genellikle aynı müfredata sahip oluyor. Yani aşağıda yazdıklarımı iki bölüm içinde değerlendire bilirsiniz. İstatistik en temel anlamıyla olaylar, nesneler ve bunlar arasındaki ilişkileri veri toplayarak anlamaya çalışan alandır. Yani işiniz veri ile ve aşağıda saydığın 4 soru ile ilgileneceksiniz öğrenim […]

Temel İstatistik Bilgileri Serisi

Öncelikle merhaba ben Taner, İstatistik Bölümü 1.sınıf öğrencisiyim. Öğrendiklerimi ve öğrenmeye devam ettiğim şeyleri sizlerle paylaşarak bilgiyi yaymak istedim. İstatistik, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme […]

Herkes İçin Veri Okuryazarlığı #2

Bölüm 2: Herkes İçin Veri Okuryazarlığının 1. Bölümünde Temel Kavramlardan bahsedilmişti. Serinin temel akışı için yararlandığım kaynak Turkcell’in Geleceği Yazanlar web sitesindeki Veri Okuryazarlığı eğitimi olacağından “Veri Okuryazarlığına Giriş” konularını Vahit Keskin bu şekilde listelemiştir. Temel Kavramlar Merkezi Eğilim Ölçüleri Dağılım Ölçüleri İstatistiksel Düşünce Serinin 2. Bölümünde de serinin devamı olan Merkezi Eğilim Ölçülerinden; en […]

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.