Veri Ambarı Eğitimi – Bölüm 2 – Veri Ambarı Türleri

Host-Based Data Warehouses

(Ana Bilgisayar Tabanlı Veri Ambarları)

Uygulanabilecek iki tür ana bilgisayar tabanlı veri ambarı vardır:

  • Yüksek hacimli bir veritabanında bulunan ana bilgisayar tabanlı ana bilgisayar depoları. IBM system / 390, UNISYS ve Data General Sequent gibi sağlam ve güvenilir yüksek kapasiteli yapılardır. Sybase, Oracle, Informix ve DB2 gibi veritabanları tarafından desteklenir.
  • Veri dağıtımının merkezi olarak veya çalışma grubu ortamından yapılabildiği veri ambarlarıdır. Veritabanının veri ambarlarının boyutu platforma bağlıdır.

Veri Çıkarma ve dönüştürme araçları, üretim sistemlerinden verilerin otomatik olarak çıkarılmasına ve temizlenmesine olanak tanır. Aşağıdaki nedenlerden ötürü, bu yöntem kategorilerine sorgu araçlarıyla doğrudan erişim sağlamak geçerli değildir:

  1. Büyük bir karmaşık ambarlama sorguları yükü, görev açısından kritik işlem işleme (TP) odaklı uygulama üzerinde muhtemelen çok fazla zararlı etkiye sahip olacaktır.
  2. Bu TP sistemleri, işlem hacmi için veritabanı tasarımlarında geliştirilmektedir. Tüm yöntemlerde, bir veritabanı, optimum sorgu veya işlem işleme için tasarlanmıştır. Karmaşık bir iş sorgusu, birçok normalleştirilmiş tablonun birleştirilmesini gerektirdi ve sonuç olarak performans genellikle zayıf olacak ve sorgu büyük ölçüde karmaşık oluşturacaktır.
  3. İki veya daha fazla üretim yöntemindeki verilerin tutarlı olacağının garantisi yoktur.

Host-Based (MVS) Data Warehouses

(Ana Bilgisayar Tabanlı (MVS) Veri Ambarları)

 

MVS üzerindeki büyük hacimli veritabanlarında bulunan bu veri ambarı, ana bilgisayar tabanlı veri ambarları türleridir. Genellikle DBMS, VSAM, DB2, düz dosyalar ve Bilgi Yönetim Sistemi (IMS) dahil olmak üzere eski bilgiler için çok çeşitli orijinal kaynaklara sahip DB2’dir.

Böyle bir ambar tasarlamaya, inşa etmeye ve uygulamaya başlamadan önce, bazı ek hususlar verilmelidir, çünkü

  1. Bu tür veritabanları genellikle çok yüksek hacimli veri depolamasına sahiptir.
  2. Bu tür ambarlar hem MVS hem de müşteri bazlı rapor ve sorgu olanakları için destek gerektirebilir.
  3. Bu depoların karmaşık kaynak sistemleri vardır.
  4. Bu tür sistemler, görev açısından kritik hedefler için de kullanılmaları gerektiğinden, sürekli bakıma ihtiyaç duyuyordu.

Bu tür veri ambarlarının başarılı bir şekilde kurulmasını sağlamak için genellikle aşağıdaki aşamalar izlenir:

  1. Unload Phase: İşlem verilerinin seçilmesini ve temizlenmesini içerir.
  2. Transform Phase: Bunu uygun bir forma çevirmek ve ona erişim ve saklama kurallarını açıklamak için kullanılır.
  3. Load Phaseı: Kaydı, başka bir veritabanına ya da MVS olmayan ambarlara taşımak üzere doğrudan DB2 tablolarına veya belirli bir dosyaya taşımak içindir.

Entegre bir Metadata havuzu, herhangi bir veri ambarı ortamının merkezidir. Böyle bir tesis, veri kaynaklarını, veri çeviri kurallarını ve kullanıcı alanlarını depoya belgelemek için gereklidir. Birden çok veri kaynağı veritabanı ile koşullu veri ambarlarının DB2’si arasında dinamik bir ağ sağlar.

DB2 Nedir?

DB2, IBM tarafından geliştirilen ve pazarlanan ilişkisel veritabanı sunucuları da dahil olmak üzere ilgili veri yönetimi ürünleri ailesidir.

IBM, 1970’lerden bu yana, Sanal Makine (VM), Genişletilmiş Sanal Depolama (VSE) ve Çoklu Sanal Depolama (MVS) gibi ana bilgisayar platformlarında başlatılan eksiksiz bir veritabanı sunucusu ailesi geliştirmiştir.

Kaynak: https://www.db2tutorial.com/getting-started/what-is-db2/

 

Host-Based (UNIX) Data Warehouses

(Ana Bilgisayar Tabanlı (UNIX) Veri Ambarları)

Oracle ve Informix RDBMS’ler, bu tür veri ambarları için tesisleri destekler. Bu veri tabanlarının her ikisi de MVS- tabanlı veri tabanlarından ve daha yüksek sayıda diğer UNIX- tabanlı veri tabanlarından bilgi çıkarabilir. Bu tür ambarlar, ana bilgisayar tabanlı MVS veri ambarlarıyla aynı aşamayı izler. Ayrıca farklı ağ sunucularından gelen veriler de oluşturulabilir.

 

LAN-Based Workgroup Data Warehouses

(LAN Tabanlı Çalışma Grubu Veri Ambarları)

LAN tabanlı bir çalışma grubu deposu, bir LAN ortamında bir veri ambarı oluşturmak ve sürdürmek için entegre bir yapıdır. Bu depoda, çeşitli kaynaklardan bilgi alabilir ve birden çok LAN tabanlı depoyu, genellikle DB2 ailesi, Oracle, Sybase ve Informix’i içerecek şekilde seçilen depo veritabanlarını destekleyebiliriz. Seyrek olarak içerilen diğer veritabanları IMS, VSAM, Düz Dosya, MVS ve VH’dir.

Çalışma grubu ortamı için tasarlanmış, LAN tabanlı bir çalışma grubu deposu, genellikle veri pazarı olarak adlandırılan bir veri ambarı oluşturmak isteyen tüm iş organizasyonları için idealdir. Bu tür bir veri ambarı genellikle minimum bir ilk yatırım ve teknik eğitim gerektirir.

Data Delivery (Veri Sağlama): LAN tabanlı bir çalışma grubu deposu ile müşteri, departman, iş birimi veya çalışma grubu düzeyinde kullanım için özelleştirilmiş bir veri deposu oluşturmak ve sürdürmek için minimum teknik bilgiye ihtiyaç duyar. LAN tabanlı bir çalışma grubu deposu, depodaki verilere taşıma erişimi sağlayarak kurumsal kaynaklardan bilgi teslimini sağlar.

Host-Based Single Stage (LAN) Data Warehouses

(Ana Bilgisayar Tabanlı Tek Aşamalı (LAN) Veri Ambarları)

LAN tabanlı bir veri ambarı içinde, veri teslimi merkezi olarak veya çalışma grubu ortamından gerçekleştirilebilir, böylece iş grupları merkezi BT kaynaklarını zorlamadan ihtiyaç duydukları verileri işlemeyi karşılayabilir ve genel veri bütünlüğü ve güvenlikten ödün vermeden veri pazarlarının özerkliğinin keyfini çıkarabilir.

Sınırlamalar

Hem DBMS hem de donanım ölçeklenebilirlik yöntemleri genellikle LAN tabanlı ambarlama çözümlerini sınırlar.

Birçok LAN tabanlı işletme, sağlam depolama çözümleri sağlamak için yeterli iş planlama, kurtarma yönetimi, organize bakım ve performans izleme yöntemleri uygulamamıştır.

Genellikle bu depolar, kaynak kaydı için diğer platformlara bağımlıdır. Veri bütünlüğü, kurtarılabilirlik ve güvenliğe sahip bir ortam oluşturmak dikkatli tasarım, planlama ve uygulama gerektirir. Aksi takdirde, kaynaklardan sunucuya dönüşüm ve yüklerin senkronizasyonu sayısız soruna neden olabilir.

Bir LAN tabanlı depo en az bir ilk yatırım ve teknik bilgi gerektiren birçok kaynaktan gelen verileri sağlar. LAN tabanlı bir depo, veri ambarını doldurmak ve güncellemek için replikasyon araçlarını da çalıştırabilir. Bu tür bir ambar, işletme görünümlerini, geçmişleri, toplama, sürümleri ve heterojen kaynak desteğini içerebilir.

  • DB2 Ailesi
  • IMS, VSAM, Düz Dosya [MVS ve VM]

Tek bir mağaza genellikle LAN tabanlı bir depoyu çalıştırır ve mevcut DSS uygulamalarını sağlayarak iş kullanıcısının veri ambarındaki verileri bulmasını sağlar. LAN tabanlı depo, iş kullanıcılarını eksiksiz veriden bilgiye çözüm çözümüyle destekleyebilir. LAN tabanlı depo, iş verilerini kataloglama ve ihtiyaç duyan herkes için uygun hale getirme yeteneği ile meta verileri de paylaşabilir.

 

Multi-Stage Data Warehouses

(Çok Aşamalı Veri Ambarları)

Toplama yoluyla verileri analiz etmek için dönüştürme yöntemlerinde birden çok aşamayı ifade eder. Başka bir deyişle, verilerin veri ambarına yüklenmesinden önce birden çok kez aşamalandırılması. Veriler ilk olarak kaynak sistemlerinden aşamalandırma alanına çıkarılır, ardından değişiklikten sonra veri ambarına ve son olarak departmanlaştırılmış veri reyonlarına yüklenir.

Bu konfigürasyon, çeşitli kapasitelerdeki son müşterilerin hem dakikaya kadar taktik kararlar için özetlenmiş bilgilere hem de uzun vadeli stratejik kararlar için değişmeli bir kayıt olan özetlenmiş bilgilere erişime ihtiyaç duyduğu ortamlar için çok uygundur. Hem Operasyonel Veri Deposunda (ODS) hem de hacme ve özel gereksinimlere bağlı olarak ana bilgisayar tabanlı veya LAN Tabanlı veritabanlarında bulunabilir. Bunlar DB2, Oracle, Informix, IMS, Düz Dosyalar ve Sybase içerir.

ODS yalnızca en güncel kayıtları saklar. Veri ambarı, dosyaların geçmiş hesaplamalarını depolar. İlk başta, her iki veritabanındaki bilgiler çok benzer olacaktır. Örneğin, yeni bir müşterinin kayıtları aynı görünecektir. Kullanıcı kaydında değişiklikler meydana geldikçe, OD’ler yalnızca en güncel verileri yansıtacak şekilde yenilenirken, veri ambarı hem geçmiş verileri hem de yeni bilgileri içerecektir. Bu nedenle, veri ambarının hacim gereksinimi ODS fazla mesainin hacim gereksinimlerini aşacaktır. Pratikte 4’e 1 oranına ulaşmak aşina değildir.

Stationary Data Warehouses

(Sabit Veri Ambarları)

Bu tür veri ambarlarında, veriler şekilde gösterildiği gibi kaynaklardan değiştirilmez:

Bunun yerine müşteriye verilere doğrudan erişim hakkı verilir. Pek çok kuruluş için, seyrek erişim, hacim sorunları veya kurumsal gereklilikler gibi yaklaşımları belirler. Bu şema, müşteri için aşağıdakiler gibi birkaç sorun yaratır:

  • Kullanıcılar için bilgilerin yerinin belirlenmesi
  • Müşterilere, hepsi tek bir API ile tek bir DBMS olduğu gibi farklı DBMS’leri sorgulama yeteneği sağlar.
  • Müşteri, üretim veri depoları ile rekabet edeceği için performansı etkiler.

Böyle bir ambar, muhtemelen müşteriyle tek bir etkileşimle son derece uzmanlaşmış ve sofistike ‘ara katman yazılımına’ ihtiyaç duyacaktır. Bu aynı zamanda bir tesisin, rapor oluşturmadan önce kullanıcı için çıkarılan kaydı görüntülemesi için gerekli olabilir. Entegre bir meta veri havuzu, bu ortamda mutlak bir gereklilik haline gelir.

Distributed Data Warehouses

(Dağıtılmış Veri Ambarları)

Dağıtılmış bir veri ambarı kavramı, iki tür dağıtılmış veri ambarı ve bunların kuruluş genelinde dağıtılan yerel işletme ambarları ve şekilde gösterildiği gibi küresel bir ambarlar için modifikasyonları olduğunu göstermektedir:

Yerel veri ambarlarının özellikleri

  • Etkinlik yerel düzeyde görünür
  • Operasyonel işlemenin toplu
  • Yerel site özerktir
  • Her yerel veri ambarının kendine özgü mimarisi ve veri içerikleri vardır
  • Veriler benzersizdir ve yalnızca bu yerellik için çok önemlidir
  • Kaydın çoğunluğu yereldir ve kopyalanmamıştır
  • Yerel veri ambarları arasındaki herhangi bir veri kesişimi durumsaldır
  • Yerel depo farklı teknik topluluklara hizmet eder
  • Yerel veri ambarlarının kapsamı yerel siteyle sınırlıdır
  • Yerel depolar ayrıca geçmiş verileri içerir ve yalnızca yerel site içinde entegre edilir.

Virtual Data Warehouses

(Sanal Veri Ambarları)

Sanal Veri Ambarları aşağıdaki aşamalarda oluşturulur:

  1. Bir dizi veri yaklaşımı, veri sözlüğü ve süreç yönetimi olanağı kurma.
  2. Son müşterileri eğitmek.
  3. DW tesislerinin nasıl kullanılacağının izlenmesi
  4. Gerçek kullanıma dayalı olarak, yüksek frekanslı sonuçlar sağlamak için fiziksel olarak Veri Ambarı oluşturulur

Bu strateji, son kullanıcıların, veri erişim ağına uygulanan araçları kullanarak doğrudan operasyonel veritabanlarına girmelerine izin verildiğini tanımlar. Bu yöntem, nihai esnekliğin yanı sıra yüklenmesi ve bakımı yapılması gereken minimum miktarda fazlalık bilgi sağlar. Veri ambarı harika bir fikirdir, ancak inşa edilmesi zordur ve yatırım gerektirir. Neden meta veri ve başka bir veritabanı için depoların dönüşüm aşamasını ortadan kaldırarak ucuz ve hızlı bir yöntem kullanmıyorsunuz? Bu yönteme ‘ Virtual Data Warehouse ‘ denir.

Bunu başarmak için dört tür veriyi tanımlamaya ihtiyaç vardır:

  1. Çeşitli veritabanlarının tanımlarını içeren bir veri sözlüğü.
  2. Veri bileşenleri arasındaki ilişkinin açıklaması.
  3. Yöntemin açıklaması, kullanıcı sistem ile arayüz oluşturacaktır.
  4. Ne yapılacağını ve nasıl yapılacağını açıklayan algoritmalar ve iş kuralları.

 

Dezavantajları

  1. Sorgular, üretim kaydı işlemleriyle rekabet ettiğinden, performans düşebilir.
  2. Meta veri, özet kayıt veya bireysel DSS (Karar Destek Sistemi) entegrasyonu veya geçmişi yoktur. Tüm sorgular kopyalanmalıdır ve sisteme ek bir yük getirir.
  3. Sorguların çok karmaşık olmasına neden olan yenileme süreci yoktur.

 

Data Science Earth

Data Science Earth ekibi, üst düzey Veri Bilim çözümleri üretmek amacı ile toplanmış akademisyenler ve uzmanlardan oluşmaktadır. Öncelikli olarak veri bilincini geliştirmeyi ve küreselleşen rekabet ortamında verinin gücünün doğru kullanılmasını sağlamayı amaçlamaktadır.

Sponsor

QuestionPro 35 farklı soru seçim özelliği ile anket çalışmalarımıza güç katmaktadır.