Archív

Data democratization – zpřístupnění dat všem uživatelům

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 30.9.2018

Přístup, který uživatelům umožňuje přistupovat k datům tak, aby mohli data používat a analyzovat v jakýkoliv okamžik všichni uživatelé bez problémů s pochopením – Data | Demokratizace a data driven přístup

Data Interface Area (INT) – landing zóna

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 30.9.2018

0 Comment

Místo, kde jsou data uložena v jejich přirozené podobě tak, jak vypadají na primárním systému. Tento termín (Interface area) se nejčastěji využívá u datových skladů a je to databáze, kde jsou uloženy incrementy ze zdrojových systémů. Najdeme tam změnové záznamy za daný časový úsek, které dále proudí do Stage Area (STG), kde jsou historizována a… Čtěte více »

Data Lake – centrální úložiště pro strukturovaná i nestrukturovaná data

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 30.9.2018

0 Comment

Místo, kde je uloženo velké množství dat v jejich surové podobě (raw data) před tím než jsou využita (např. integrována na jiné umístění). Ekvivalentně se v některých systémech označuje Data Lake jako Lakehouse (např. ve Fabricu).

Data lakehouse – vysvětlení

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 18.11.2025

0 Comment

Data lakehouse speciální typ úložistě, které kombinuje flexibilitu data lake a formální správu datového skladu. Nad datovými soubory přidává transakční vrstvu, schémata, ACID vlastnosti a podporu pro analytické i operativní dotazy. Lakehouse umožňuje ukládat strukturovaná, polostrukturovaná i nestrukturovaná data v jednom úložišti. Typickými technologiemi jsou Delta Lake, Apache Hudi nebo Iceberg. Na blogu se poměrně… Čtěte více »

Data lineage – význam a použití

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 18.11.2025

0 Comment

Data lineage je kompletní cesta dat od zdrojového systému až po finální reporty. Zahrnuje sledování všech datových toků, a transformací mezi jednotlivými fázemi procesu. Používá se pro rychlou orientaci při debuggingu chyb (lokalizace jejich původu), ověření kvality dat, auditech. Moderní platformy využívají automatickou lineage pro monitoring a data governance.

Data Mart – tematicky zaměřený datový sklad

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 6.4.2017

0 Comment

Data mart (neboli datové tržiště) je specificky zaměřená databáze. Dá se označit jako menší nebo tématická verze datového skladu. Většinou je i hůře organizovaná a objemově menší. Data marty jsou často používány ve společnostech v rámci jednotlivých oddělení (marketing, prodej, atd). Datová tržiště bývají dobrých výchozím bodem pro budování datového skladu – obsahují výpočetní logiku.

Data mesh – co to je, princip architektury

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 18.11.2025

0 Comment

Data mesh je decentralizovaný přístup (koncept) k datové architektuře, ve kterém mají jednotlivé business domény (např. sales, finance, marketing, produkt, atd) odpovědnost za svá data a publikují je jako datové produkty. Zdůrazňuje autonomii týmů, federovanou správu a standardizaci rozhraní. Cílem je lépe škálovat datové platformy ve velkých organizacích a snížit závislost na jednom centrálním datovém… Čtěte více »

Data mining – objevování vzorců v datech

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 6.4.2017

0 Comment

Data mining neboli dolování dat je funkcionalita specializovaného software. Ten provádí pokročilé vyhledávací techniky, kterými hledá paterny (vzory) v informacích a následně z nich tvoří smysluplnou informaci. Data mining pomáhá uživatelům pochopit data z nových perspektiv, zefektivnit procesy a v konečném důsledku finanční výsledek. Často se používá v online marketingu, pojišťovnictví a bankovnictví. Pomáhá lépe pochopit chování zákazníků… Čtěte více »

Data Mirroring – replikace pro zálohování

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 6.4.2017

0 Comment

Data Mirroring nebo “zrcadlení dat” je metoda, kterou datový software provádí přesné kopie dat na externí paměťové zařízení. Data Mirroring je metoda pro sdílení dat na různých místech. Má také velký význam z hlediska zabezpečení dat proti různým rizikům, např. neočekávaný výpadek systému

Data Quality Services – služby pro kontrolu kvality dat

Autor: Ing. Jan Zedníček - Data Engineer & Controlling | 25.11.2018

0 Comment

Data Quality Services (DQS) patří do skupiny features, které je možno nainstalovat v rámci SQL Server. Poskytuje nástroje pro management datové kvality zdrojových dat