Veri Ambarı Eğitimi – Bölüm 1 – Veri Ambarı Nedir?

Veri ambarı Nedir?

Veri ambarı, daha iyi iş zekası için karşılaştırılıp analiz edilebilmesi veya daha fazla kaynaktan yapılandırılmış verileri toplayan bir teknolojidir. Mevcut ve geçmiş verileri, kuruluş genelinde çalışanlar için analitik raporlar oluşturur ve kullanılan tek bir yerde depolarlar. Verileri bilgiye dönüştürme ve fark yaratmak için zamanında kullanıcılara ulaştırma sürecidir.

Bir envanter sistemi için 3NF tasarımlı bir veritabanının çoğunun birbiriyle ilişkili tablolara sahip olduğunu birçoğunuz biliyorsunuz. Örneğin, mevcut envanter bilgileriyle ilgili bir rapor 12’den fazla birleştirilmiş koşulu içerebilir. Bu, sorgu ve raporun yanıt süresini hızla yavaşlatabilir. Bir veri ambarı, yanıt süresini azaltmaya yardımcı olabilecek ve raporlar ve analitik için sorguların performansını artırmaya yardımcı olabilecek yeni bir tasarım sağlar.

Veri Ambarı Nasıl Çalışır?

Bir veri ambarı birden çok veritabanı içerebilir. Her veritabanı içinde, veriler tablolar ve sütunlar halinde düzenlenir. Her sütunun içinde, tamsayı, veri alanı veya dize gibi verilerin bir açıklamasını tanımlayabilirsiniz. Tablolar, klasörler olarak düşünebileceğiniz şemaların içinde düzenlenebilir. Veriler alındığında, şema tarafından açıklanan çeşitli tablolarda saklanır. Sorgu araçları, hangi veri tablolarına erişilip analiz edileceğini belirlemek için şemayı kullanır.

Veriler şunlar olabilir:

  1. Yapılandırılmış
  2. Yarı yapılandırılmış
  3. Yapılandırılmamış veriler

Veri ambarı, veri madenciliğini mümkün kılar. Veri madenciliği, verilerde daha yüksek satış ve karlara yol açabilecek kalıplar arıyor.

 

Veri ambarına kimin ihtiyacı var?

Aşağıdakiler gibi tüm kullanıcı türleri için veri ambarı gereklidir:

  • Büyük miktarda veriye güvenen karar vericiler
  • Birden çok veri kaynağından bilgi almak için özelleştirilmiş, karmaşık süreçler kullanan kullanıcılar.
  • Ayrıca verilere erişmek için basit teknoloji isteyen kişiler tarafından da kullanılmaktadır.
  • Karar vermek için sistematik bir yaklaşım isteyen kişiler için de gereklidir.
  • Kullanıcı, raporlar, ızgaralar veya grafikler için zorunlu olan büyük miktarda veride hızlı performans istiyorsa, Veri ambarı yararlıdır.
  • Veri ambarı, veri akışlarının ve gruplamaların ‘gizli kalıplarını’ keşfetmek istiyorsanız ilk adımdır.

 

Veri Ambarı Ne İçin Kullanılır?

Veri ambarının kullanıldığı en yaygın sektörler şunlardır:

Havayolu:

Havayolu sisteminde mürettebat atama, rota karlılık analizleri, sık uçan yolcu programı promosyonları vb. Operasyon amaçlı kullanılmaktadır.

Bankacılık:

Bankacılık sektöründe masa başı mevcut kaynakları etkin bir şekilde yönetmek için yaygın olarak kullanılmaktadır. Pazar araştırması, ürün ve işlemlerin performans analizi için çok az banka da kullandı.

Sağlık hizmeti:

Sağlık sektörü ayrıca, sonuçları strateji oluşturmak ve tahmin etmek, hastanın tedavi raporlarını oluşturmak, bağlantılı sigorta şirketleri, tıbbi yardım hizmetleri vb. İle veri paylaşmak için Veri ambarını kullandı.

Kamu sektörü:

Kamu sektöründe istihbarat toplama için veri ambarı kullanılmaktadır. Devlet kurumlarının her birey için vergi kayıtlarını, sağlık politikası kayıtlarını tutmasına ve analiz etmesine yardımcı olur.

Yatırım ve Sigorta sektörü:

Bu sektörde depolar öncelikle veri modellerini, müşteri eğilimlerini analiz etmek ve piyasa hareketlerini izlemek için kullanılır.

Zincir tutma:

Perakende zincirlerinde Veri ambarı, dağıtım ve pazarlama için yaygın olarak kullanılmaktadır. Ayrıca öğeleri, müşteri satın alma modelini, promosyonları takip etmeye yardımcı olur ve ayrıca fiyatlandırma politikasını belirlemek için kullanılır.

Telekomünikasyon:

Bu sektörde ürün promosyonları, satış kararları ve dağıtım kararları vermek için bir veri ambarı kullanılmaktadır.

Konaklama Sektörü:

Bu Sektör, müşterileri geri bildirimlerine ve seyahat modellerine göre hedeflemek istedikleri reklam ve promosyon kampanyalarını tasarlamak ve tahmin etmek için depo hizmetlerini kullanır.

 

Veri Ambarını Uygulama Adımları

Bir Data Warehouse uygulamasıyla ilişkili iş riskini ele almanın en iyi yolu, aşağıdaki gibi üç uçlu bir strateji uygulamaktır

  1. Kurumsal strateji: Burada, mevcut mimari ve araçlar dahil olmak üzere teknik özellikleri belirleriz. Ayrıca gerçekleri, boyutları ve nitelikleri de belirleriz. Veri eşleme ve dönüştürme de geçilir.
  2. Aşamalı teslimat: Veri ambarı uygulaması konu alanlarına göre aşamalı olmalıdır. Rezervasyon ve faturalama gibi ilgili ticari varlıklar önce uygulanmalı ve ardından birbirleriyle entegre edilmelidir.
  3. Yinelemeli Prototipleşme: Uygulamaya büyük patlama yaklaşımı yerine, Data Warehouse yinelemeli olarak geliştirilmeli ve test edilmelidir.

Veri Ambarı uygulamak için en iyi uygulamalar

  • Verilerin tutarlılığını, doğruluğunu ve bütünlüğünü test etmek için bir plan belirleyin.
  • Veri ambarı iyi entegre edilmiş, iyi tanımlanmış ve zaman damgalı olmalıdır.
  • Data Warehouse tasarlarken doğru aracı kullandığınızdan, yaşam döngüsüne bağlı kaldığınızdan, veri uyuşmazlıklarına dikkat ettiğinizden ve hatalarınızı öğrenmeye hazır olduğunuzdan emin olun.
  • Operasyonel sistemleri ve raporları asla değiştirmeyin
  • Verileri çıkarmak, temizlemek ve yüklemek için çok fazla zaman harcamayın.
  • Data Warehouse uygulama sürecine iş personeli dahil tüm paydaşların dahil edilmesini sağlayın. Veri ambarının bir ortak / ekip projesi olduğunu belirleyin. Son kullanıcılar için yararlı olmayan Veri ambarı oluşturmak istemezsiniz.
  • Son kullanıcılar için bir eğitim planı hazırlayın.

Veri Ambarına Neden İhtiyacımız Var? Avantajlar dezavantajlar

Veri Ambarı Avantajları:

  • Veri ambarı, iş kullanıcılarının bazı kaynaklardaki kritik verilere tek bir yerden hızla erişmesine olanak tanır.
  • Veri ambarı, çeşitli işlevler arası etkinlikler hakkında tutarlı bilgiler sağlar. Ayrıca anlık raporlama ve sorgulamayı da destekliyor.
  • Veri Ambarı, üretim sistemindeki stresi azaltmak için birçok veri kaynağını entegre etmeye yardımcı olur.
  • Veri ambarı, analiz ve raporlama için toplam geri dönüş süresini azaltmaya yardımcı olur.
  • Yeniden Yapılandırma ve Entegrasyon, kullanıcının raporlama ve analiz için kullanmasını kolaylaştırır.
  • Veri ambarı, kullanıcıların çok sayıda kaynaktan kritik verilere tek bir yerden erişmesine olanak tanır. Bu nedenle, kullanıcının birden çok kaynaktan veri alma zamanından tasarruf sağlar.
  • Veri ambarı, büyük miktarda geçmiş veriyi depolar. Bu, kullanıcıların gelecekteki tahminlerde bulunmak için farklı zaman dönemlerini ve eğilimleri analiz etmelerine yardımcı olur.

Veri Ambarının dezavantajları:

  • Yapılandırılmamış veriler için ideal bir seçenek değil.
  • Veri Ambarının Oluşturulması ve Uygulanması kesinlikle zaman kafa karıştırıcı bir olaydır.
  • Veri Ambarı nispeten hızlı bir şekilde eski hale gelebilir
  • Veri türleri ve aralıklarında, veri kaynağı şemasında, dizinlerde ve sorgularda değişiklik yapmak zordur.
  • Veri ambarı kolay görünebilir, ancak aslında ortalama kullanıcılar için çok karmaşık.
  • Proje yönetimindeki en iyi çabalara rağmen, veri ambarı proje kapsamı her zaman artacaktır.
  • Bazen depo kullanıcıları farklı iş kuralları geliştirecektir.
  • Kuruluşlar, eğitim ve Uygulama amacıyla kaynaklarının çoğunu harcamalıdır.

Veri Ambarlamanın Geleceği

  • Düzenleyici kısıtlamalardaki değişiklik, farklı verilerin kaynağını birleştirme yeteneğini sınırlayabilir. Bu farklı kaynaklar, saklanması zor olan yapılandırılmamış verileri içerebilir.
  • As boyut veritabanlarının büyür, çok büyük bir veritabanı içeriğine ilişkin tahminler büyümeye devam ediyor. Her zaman boyutu artan veri ambarı sistemleri oluşturmak ve çalıştırmak karmaşıktır. Günümüzde mevcut olan donanım ve yazılım kaynakları, büyük miktarda verinin çevrimiçi tutulmasına izin vermemektedir.
  • Multimedya verileri, metin verileri olarak kolayca manipüle edilemezken, metin bilgileri bugün mevcut olan ilişkisel yazılımla alınabilir. Bu bir araştırma konusu olabilir.

Veri Ambarı Araçları

Piyasada birçok Veri Ambarı aracı bulunmaktadır. İşte en öne çıkanlardan bazıları:

  1. MarkLogic:

MarkLogic, bir dizi kurumsal özelliği kullanarak veri entegrasyonunu daha kolay ve daha hızlı hale getiren kullanışlı bir veri ambarı çözümüdür. Bu araç, çok karmaşık arama işlemlerinin gerçekleştirilmesine yardımcı olur. Belgeler, ilişkiler ve meta veriler gibi farklı veri türlerini sorgulayabilir.

https://developer.marklogic.com/products/

  1. Oracle:

Oracle, sektör lideri veri tabanıdır. Hem şirket içi hem de bulut için çok çeşitli veri ambarı çözümleri sunar. Operasyonel verimliliği artırarak müşteri deneyimlerini optimize etmeye yardımcı olur.

https://www.oracle.com/index.html

  1. Amazon RedShift:

Amazon Redshift, Veri ambarı aracıdır. Standart SQL ve mevcut BI araçlarını kullanarak tüm veri türlerini analiz etmek için basit ve uygun maliyetli bir araçtır. Ayrıca, sorgu optimizasyonu tekniğini kullanarak pet baytlarca yapılandırılmış veriye karşı karmaşık sorguların çalıştırılmasına izin verir.

https://aws.amazon.com/redshift/?nc2=h_m1

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.