Datový sklad a jeho tvorba

Datový sklad, z angličtiny „Data Warehouse“, též označován jako „DWH“, je složen z trvale uložené a ucelené kolekce dat, která je databázově propojena a poskytuje informace o daném předmětu na základě jeho druhu a požadavků na něj.

Digitální data

Dle jedné z definic DWH, jež je autorem Bill Inmon, který je brán jako „otec datového skladu“, se jedná o:

Podnikově strukturovaný depositář subjektově orientovaných, integrovaných, časově proměnlivých, historických dat použitých na získávání informací a podporu rozhodování ve firmě, obsahuje atomická i sumární data.

Je to tedy takové strukturované úložiště nejrůznějších údajů z minulosti pro analýzu, což slouží pro podporu rozhodování v různých činnostech a procesech v podnicích, a to v současnosti i v budoucnu. Nabízí prostředky jak pro uložení dat, tak pro jejich analýzu k inspiraci do budoucna i poučení se z případných minulých chyb.
Archiv dokumentů

Znaky datových skladů


·      Orientace na předmět (poskytují informace o dané činnosti, nikoliv o probíhajících operacích)


·      Integrovanost (data z různých zdrojů jsou uložena jako jeden celek)


·      Časová organizace (informace ze stejného časového období jsou spojeny a tvoří historii dat)


·      Trvalé uložení (data se pouze přidávají a nikdy neodstraňují, jsou tedy uložena nastálo)

Datové sklady jsou nejčastěji tvořeny podnikovými IT manažery. Lze říci, že jde o jejich asi nejnáročnější úkol. Existuje několik metod jejich tvorby. Těmi nejčastěji používanými je „Metoda velkého třesku“ a „Přírůstková metoda“.

Metoda velkého třesku

Celý plán je možné kompletně zpracovat již před začátkem jeho vlastní realizace. Nevýhodou je komplikovaná až nemožná implementace případných změn jak ze strany uživatelů, tak technologie. Tvorba touto metodou je rovněž značně zdlouhavá. Skládá se ze tří částí:

1. Analýza požadavků podniku

2. Vytvoření firemního datového skladu

3. Vytvoření přístupu buď přímo, nebo nepřímo

Přírůstková metoda

Zde se datový sklad buduje po jednotlivých etapách, což umožňuje rychlejší uvedení do provozu a zároveň zpětnou vazbu od uživatelů. Tato metoda se skládá z 6 fází:

1. Strategie (definice obchodních cílů, účel a stavba datového skladu)

2. Definice (rozsah a cíl vývoje přírůstků včetně dokumentace zdrojů dat)

3. Analýza (informace o uživatelích, požadavcích na přístup, kvalita dat)

4. Návrh (přeměna požadavků na konkrétní návrhy a tvorba modelů)

5. Sestavení (vytvoření a testování databázové struktury)

6. Produkce (využívání datového skladu, řízení jeho údržby a růstu)

Posted in IT

Comments are closed.