Archív

Data Interface Area (INT) – landing zóna

Místo, kde jsou data uložena v jejich přirozené podobě tak, jak vypadají na primárním systému. Tento termín (Interface area) se nejčastěji využívá u datových skladů a je to databáze, kde jsou uloženy incrementy ze zdrojových systémů. Najdeme tam změnové záznamy za daný časový úsek, které dále proudí do Stage Area (STG), kde jsou historizována a… Čtěte více »

Rubrika:

Data lakehouse – vysvětlení

Data lakehouse speciální typ úložistě, které kombinuje flexibilitu data lake a formální správu datového skladu. Nad datovými soubory přidává transakční vrstvu, schémata, ACID vlastnosti a podporu pro analytické i operativní dotazy. Lakehouse umožňuje ukládat strukturovaná, polostrukturovaná i nestrukturovaná data v jednom úložišti. Typickými technologiemi jsou Delta Lake, Apache Hudi nebo Iceberg. Na blogu se poměrně… Čtěte více »

Rubrika:

Data lineage – význam a použití

Data lineage je kompletní cesta dat od zdrojového systému až po finální reporty. Zahrnuje sledování všech datových toků, a transformací mezi jednotlivými fázemi procesu. Používá se pro rychlou orientaci při debuggingu chyb (lokalizace jejich původu), ověření kvality dat, auditech. Moderní platformy využívají automatickou lineage pro monitoring a data governance.

Rubrika:

Data Mart – tematicky zaměřený datový sklad

Data mart (neboli datové tržiště) je specificky zaměřená databáze. Dá se označit jako menší nebo tématická verze datového skladu. Většinou je i hůře organizovaná a objemově menší. Data marty jsou často používány ve společnostech v rámci jednotlivých oddělení (marketing, prodej, atd). Datová tržiště bývají dobrých výchozím bodem pro budování datového skladu – obsahují výpočetní logiku.

Rubrika:

Data mesh – co to je, princip architektury

Data mesh je decentralizovaný přístup (koncept) k datové architektuře, ve kterém mají jednotlivé business domény (např. sales, finance, marketing, produkt, atd) odpovědnost za svá data a publikují je jako datové produkty. Zdůrazňuje autonomii týmů, federovanou správu a standardizaci rozhraní. Cílem je lépe škálovat datové platformy ve velkých organizacích a snížit závislost na jednom centrálním datovém… Čtěte více »

Rubrika:

Data mining – objevování vzorců v datech

Data mining neboli dolování dat je funkcionalita specializovaného software. Ten provádí pokročilé vyhledávací techniky, kterými hledá paterny (vzory) v informacích a následně z nich tvoří smysluplnou informaci. Data mining pomáhá uživatelům pochopit data z nových perspektiv, zefektivnit procesy a v konečném důsledku finanční výsledek. Často se používá v online marketingu, pojišťovnictví a bankovnictví. Pomáhá lépe pochopit chování zákazníků… Čtěte více »

Rubrika: