Okunma süresi: 6 dakika

Doğal Dil İşleme+1: 7. Part of Speech Tagging ve Saklı Markov Modeli

Okunma süresi: 6 dakika Doğal Dil İşleme – Konuşma Bölümü Etiketleme (Part of Speech Tagging) ve Saklı Markov Modeli Bu yazımızda biraz hikâyelere yer verelim ne dersiniz? Dünyada ki en güçlü ülkelerin liderlerinin bulunduğu bir toplantıda bir ülke liderinin çevirmeni olarak görevlisiniz diyelim. Ülkenizin aleyhine siyaset güden diğer ülkelerin, ne söylediklerini hatasız bir şekilde anlamanız ve çevirmeniz hayati bir […]

Okunma süresi: 4 dakika

Rastgelelik Nedir ? Tahmin Edilebilir mi ?

Okunma süresi: 4 dakika Geçmiş dönemlerden beri insanlar, olayların sonuçlarındaki belirsizliği merak etmişlerdir. Bir zarın yuvarlanışından tutun bir kartın iki ardı arasındaki dönüşü rastlantı kavramının gelişmesini sağlamıştır. Rastgelelik, bir tanım olarak sağlam temellere oturtulmamışsa da basit olarak bir olay yığınının öngörülemeyen hali diyebiliriz. Örnek olarak bir zar atıldığında, sonucu tahmin edilemezken; çift gelme olasılığı, 1 gelmesine kıyasla 2 kat […]

Okunma süresi: 4 dakika

Parçacık Sürü Optimizasyonu Üzerine…

Okunma süresi: 4 dakika Parçacık sürü optimizasyonu (PSO) sürülerle ilgili problemleri çözmek için yaygın olarak kullanılan bir algoritmadır. 1995 yılında James Kennedy ve Russell C. Eberhart tarafından bir olasılıksal arama süreci olarak geliştirilmiş ve ilk olarak sürü halinde hareket eden kuş ve balık türlerinin yiyecek bulmak, avcılardan kaçmak gibi temel ihtiyaçlarını ne şekilde yaptıklarını, sürü içindeki sosyal davranışlarını ve […]

Okunma süresi: 12 dakika
2

Boosting Algoritmaları

Okunma süresi: 12 dakika Herkese merhabalar bu yazımızda Boosting ailesinden XGBoost, GradientBoost, AdaBoost ve CatBoost algoritmalarını inceleyeceğiz. Boosting algoritmaları makine öğrenme modellerinde doğru tahminleri güçlendirmek için uygulanmaktadır. Diğer bir anlamıyla arttırma, yükseltme anlamına gelen Boosting, zayıf modelleri güçlendirme eğilimindedir. Peki temelde zayıf öğrenme modelini güçlü bir öğrenme modeli haline getirmek için kullanılıyorsa, zayıf öğrenme modellerini nasıl tespit edebiliriz ? […]

Okunma süresi: 6 dakika
1

Veri Bilimcisi Olmanın Yol Haritası

Okunma süresi: 6 dakika Veri bilimi, her geçen gün gelişen ve hızla büyüyen alanlardan biridir. Ve bu giderek daha fazla veri bilimcisine ihtiyaç duyulmasına neden olmaktadır. Kasım 2020 itibariyle bu ihtiyacın azalmak bir tarafa giderek daha da artacağına inanıyorum. Neyse ki, veri bilimcisi olmak bir üniversite vs. derecesi gerektirmiyor. Yeni şeyler öğrenmeye açık olduğunuz ve çaba ve zaman ayırmaya […]

Okunma süresi: 2 dakika

Forcats Kütüphanesi 1

Okunma süresi: 2 dakika Forcats Kütüphanesi Forcats kütüphanesi faktörler ile ilgili olan bir kütüphanedir. Faktörler, kategorik değişkenleri seviyeler halinde depolayan bir R’ nesnesidir ve faktörlerde sıralama önemlidir.

Yukarıda da gördüğümüz üzere 2 çeşit cinsiyet vardır; Erkek ve Kadın. Verimizin sınıfı ise karakterdir.

karakter sınıfında olan verimizi faktör sınıfına geçirdiğimizde ise bize levels (seviyeler) olarak “E” ve “K” değerlerini […]

Okunma süresi: 6 dakika

Herkes İçin Veri Okuryazarlığı #3

Okunma süresi: 6 dakika Bölüm 3: Herkes İçin Veri Okuryazarlığı‘nın bir önceki bölümünde temel kavramlardan ziyade teorik olarak merkezi eğilim ölçülerinden bahsedilmişti. Daha önceki bölümlerde ifade etmiş olduğum gibi serinin temel akışı için yararlandığım kaynak; Turkcell’in Geleceği Yazanlar  web sitesindeki Vahit Keskin’in Veri Okuryazarlığı eğitim programıdır. Dağılım Ölçüleri olarak tek bir başlık altında toplanmasının doğru olmayacağına karar verdim bu […]

Okunma süresi: 2 dakika

Makine Öğrenimi için Matematik

Okunma süresi: 2 dakika Merhabalar bugün ilk yazımla sizlere sesleniyorum. Ben Eren Can ARDIÇ endüstri mühendisliği öğrencisiyim. Bugün sizlere makine öğrenimi için matematik adı altında bir yazı hazırladım. Herkes biliyor matematik önemli ama ne kadar önemli!!! Makine öğrenimi, verilerden otomatik olarak önemli bilgileri çıkaran algoritmalar tasarlamakla ilgilidir. Buradaki vurgu ‘otomatik’, yani makine öğrenimi, bir şey üretirken birçok veri setine […]

Okunma süresi: 2 dakika

İti An Çomağı Hazırla

Okunma süresi: 2 dakika Başlık için kusura bakmayın ama genel olarak sıklıkla kullanılan bir terim olunca ve biraz olasılık öğrenmek isteyince dilime yapıştı. Hepimizin sık sık başına gelir, birisi hakkında konuşurken ya da bir olayı anlatırken ilgili kişi ya da kişilerin hem de hiç ihtimal vermediğiniz bir anda karşınıza çıkması durumudur. Bunun gibi günlük hayatımızdaki karşılaştığımız benzer birçok olaya […]

Okunma süresi: 3 dakika

DCGAN Kısaca Nasıl Çalışır ?

Okunma süresi: 3 dakika DCGAN Generative Adversarial Networks’ün popüler alt dallarından biri diyebiliriz. DCGAN ın içinde ise generator ve discriminator denilen iki farklı model bulunuyor. Generator alınan bir dağılımdan model içinde upsampling işlemleri gerçekleştirerek bir resim uydurmaya çalışırken Discriminator ise bu uydurduğumuz resim ile bizim modele verdiğimiz resim arasındaki bu gerçek mi yoksa sahte mi ayrımını yapmaya çalışıyor. Modeli […]

Okunma süresi: 2 dakika

Temel İstatistik Bilgileri Serisi 3

Okunma süresi: 2 dakika Tekrardan herkese merhaba. İstatistik dünyasının büyük önem kazandığı bu zamanda, insanlara İstatistik olarak bir şeyler katmayı hedefliyor ve bu seriyi o sebepten oluşturmuştum. Sizden aldığım güzel geri dönüşler ile birlikte devam ediyorum. Bugün giriş kısmında ölçeklendirmelerden bahsetmek istiyorum. Ardından arkası gelecek şekilde devam edeceğim. Değişkenler dört düzeyde ölçeklenebilir: 1 – Sınıflama Ölçeği 2 – Sıralama […]

Okunma süresi: 3 dakika

Veri Madenciliği nedir? Endüstri mühendisliğinde veri madenciliğinin önemi nedir?

Okunma süresi: 3 dakika Veri Madenciliği (Data Mining) Nedir? Veri madenciliği, büyük miktarlarda bilginin toplanması ve içerisinden yararlı bilgilerin ayrıştırılmasıdır. Veriler işlenmediği sürece bir değer taşımazlar, yığın halinde yer alan tüm veriler işlenerek bilgiye dönüştürülür. Bilgisayar ortamında yer alan yığınla veri, veri madenciliği ile anlam kazanır ve ileriye yönelik olarak doğru tahminlerde bulunulmasını kolaylaştırır. Veri madenciliğinin temel amacının, şirketlerin […]

Okunma süresi: 3 dakika

Veri Bilimcileri Tarafından En Çok Talep Gören 8 Matematik Kursu

Okunma süresi: 3 dakika Veri bilimi alanında gelecek vaad eden biri olmak istiyorsanız, bu alana ilk adımlarınızı atarken matematik alanında belirli bir seviyede olmanız gerekir. Matematikte güçlü bir temele sahip olmak, özellikle henüz yolun başında olanların sadece makine öğrenimi tekniklerini öğrenmelerine değil, aynı zamanda rekabetçi piyasa nezdinde sıyrılarak ön plana çıkmalarına da yardımcı olacaktır ve sonuçta, veri bilimci adayıysanız, […]

Okunma süresi: < 1 dakika

Temel İstatistik Bilgileri Serisi 2

Okunma süresi: < 1 dakika Önceki bölümde ufaktan bir giriş yaparak istatistiksel kavramlara değinmiştim. Bugün yazımda da aynı şekilde tanımlamalar ve onların ne anlamlara geldiklerinden bahsederek başlayacağım. Herkesin bildiği gibi veri bilimi mesleği bir kodlama işi değildir. Aslında arka planı yoğun bir matematik ve istatistik bilgisine dayanmaktadır. Tanımlara ufaktan başlamak istiyorum. Örneklem Uzayı : Bir deneyin örneklem uzayı, o deneyin […]

Okunma süresi: 4 dakika

İstatistiksel Önyargı ve Yapay Zeka

Okunma süresi: 4 dakika   Artık hepimizin farkında olduğu bir şey var; Veri 21. yüzyılın petrolü ve gelecekteki başarının anahtarıdır. Bu noktada da veriler, güçlü bir yapay zeka için hayati yakıttır. Veri bilimcilerin  yapay zeka algoritmalarını doğru verilerle beslemek ve eğitmek için verileri kullanılabilir formda sunmak adına önemli sorumlulukları vardır. Ayrıca verilerde gerekli tutarlılık seviyesini elde etmek için veri […]

Okunma süresi: 3 dakika

Doğrusal (Lineer) Regresyon

Okunma süresi: 3 dakika Regresyon analizi, istatistik ve makine öğreniminde en önemli alanlardan biridir. Birçok regresyon yöntemi mevcuttur. Doğrusal regresyon da bunlardan biridir. Regresyon Nedir? Regresyon değişkenler arasındaki ilişkileri ortaya koyan ve buna göre tahminler üretilmesini sağlayan istatistiksel bir ölçümdür. Örneğin, bir şirkette çalışanları gözlemleyerek maaşlarının deneyim, eğitim seviyesi, rol, çalıştıkları şehir vb. özelliklere bağlı olarak nasıl değiştiğini anlayabiliriz. […]

Okunma süresi: 2 dakika

istatistik bölümü tercihi – lisans

Okunma süresi: 2 dakika İstatistik lisans Programı nedir? Öncelikle söylemek gerekir ki “istatistik ve bilgisayar bilimleri” ve “istatistik” bölümleri genellikle aynı müfredata sahip oluyor. Yani aşağıda yazdıklarımı iki bölüm içinde değerlendire bilirsiniz. İstatistik en temel anlamıyla olaylar, nesneler ve bunlar arasındaki ilişkileri veri toplayarak anlamaya çalışan alandır. Yani işiniz veri ile ve aşağıda saydığın 4 soru ile ilgileneceksiniz öğrenim […]

Okunma süresi: 2 dakika

Temel İstatistik Bilgileri Serisi

Okunma süresi: 2 dakika Öncelikle merhaba ben Taner, İstatistik Bölümü 1.sınıf öğrencisiyim. Öğrendiklerimi ve öğrenmeye devam ettiğim şeyleri sizlerle paylaşarak bilgiyi yaymak istedim. İstatistik, belirli bir amaç için veri toplama, tablo ve grafiklerle özetleme, sonuçları yorumlama, sonuçların güven derecelerini açıklama, örneklerden elde edilen sonuçları kitle için genelleme, özellikler arasındaki ilişkiyi araştırma, çeşitli konularda geleceğe ilişkin tahmin yapma, deney düzenleme […]

Okunma süresi: 5 dakika

Herkes İçin Veri Okuryazarlığı #2

Okunma süresi: 5 dakika Bölüm 2: Herkes İçin Veri Okuryazarlığının 1. Bölümünde Temel Kavramlardan bahsedilmişti. Serinin temel akışı için yararlandığım kaynak Turkcell’in Geleceği Yazanlar web sitesindeki Veri Okuryazarlığı eğitimi olacağından “Veri Okuryazarlığına Giriş” konularını Vahit Keskin bu şekilde listelemiştir. Temel Kavramlar Merkezi Eğilim Ölçüleri Dağılım Ölçüleri İstatistiksel Düşünce Serinin 2. Bölümünde de serinin devamı olan Merkezi Eğilim Ölçülerinden; en […]

Okunma süresi: 4 dakika

SymPy ile Sembolik Matematik İşlemleri

Okunma süresi: 4 dakika SymPy Nedir?  SymPy sembolik matematik işlemlerini gerçekleştirebileceğimiz, Python diliyle geliştirilmiş bir kütüphanedir. Türev, integral, diferansiyel, denklem çözme, matris işlemleri ve istatistiksel işlemler gibi birçok alanda fayda sağlar. Ayrıca fizik ve kimya alanlarında da oldukça faydalı işlevler barındırmaktadır. Öncelikle SymPy kütüphanemizi ve diğer gerekli kütüphaneleri yükleyelim. 1. Temel İşlemler Temel bazı matematiksel işlemleri yapabilmek için öncelikle […]

Veri Bilimci Yetiştirme Programı

Her yerde geçerli @datasciencearth sertifikası

Bu program ülkemizde büyük işgücü açığı bulunan Veri Bilimi konusunda çalışabilecek yeterliliklerde Veri Bilimciler yetiştirmek için kurgulanmıştır.

Ücretli ve Ücretsiz Eğitimler

Türkiye'nin en büyük veri bilimi topluluğu ile kariyerinizi inşa edin.

Gruplarımıza katılın!

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.