Datový sklad

Datový sklad (DWH) & Datamart

Datový sklad nebo tržiště (datamart) je centralizované místo, kde jsou uložena data z různých informačních systémů ve formě vhodné k reportování a distribuci k uživatelům. Zároveň je to místo, kde dochází k transformacím dat, čištění a obohacování dat o nové informace nebo výpočty nad základními daty. Slouží jako zdroj pravdy pro reporting.

Nejčastěji při vývoji pracuji s nástroji a platformami MS SQL Server, Azure, Fabric, dbt, Power BI, Excel, Visual studio, Git/Sourcetree, dokumentační software (např. Confluence) a systém na zadávání úkolů (např. JIRA, Teams)

K čemu je datový sklad dobrý?

  • Místo, kde se nachází pravda – nekolují excely s různými výsledky, management ví čemu může věřit
  • Důležitá data na 1 místě – pohodlně jednoduše dostupná pro reporting aplikace (Excel, Power BI, atp.)
  • Automatizace – data jsou do DWH nahrávána periodicky a automaticky
  • Přátelské pojmenování objektů a polí – zjednodušuje používání dat pro běžné uživatele, uvolnění IT kapacit z důvodu odpadnutí požadavků na sestavy
  • Flexibilita – při správně navrženém systému je možné velmi rychle vytvářet reporty i pro netechnické uživatele
  • Historizace – snímkování provozních systému, možnost zobrazit stav systému k nějakému datu zpětně

Zavedení datového skladu – činnosti

  • Vyhodnocení připravenosti společnosti na projekt, časový plán
  • Business analýza – Jaké informace potřebujeme (třídění), kde se nacházejí a v jaké jsou kvalitě.
  • Definice metodik, jmenných konvencí, příprava prostředí (platformy, vývojové prostředí)
  • Implementace – Inkrementální vrstva, historizační, prezentační
  • Testování implementace
  • Tvorba reportů
  • Prezentace, zaškolení
  • Support – Po skončení projektu jsem Vám k dispozici

Podrobně jsem se o řízení projektu datového skladu rozepsal v článku Datový sklad – Cena? Projektová dokumentace a Jak řídit projekt

Blog – SQL a Datové sklady