Tento článek slouží jako základní seznámení s MS Fabricem a jako zdroj pro základní evaluaci tohoto nástroje. Slouží také jako rozcestník na další články, ve kterých se jednotlivým pojmům a tématům věnuju podrobněji. Cílovou skupinou jsou lidé uvažující o možnosti si Fabric vyzkoušet nebo implementovat do své firmy. Microsoft Fabric je moderní analytická platforma typu SaaS, která sjednocuje práci s daty od jejich pořízení (akvizice/ingestion) až po reporting a analytiku v Power BI. Cílem Fabricu je odstranit složitost a roztříštěnost datových nástrojů – nabídnout jednu platformu, jedno úložiště dat a jednotný způsob práce napříč rolemi. Architektura Fabricu tohle vše umožňuje.
Jak Microsoft Fabric pokrývá celý datový životní cyklus – klíčové artefakty
Níže najdete jednoduchý diagram základního členění Fabricu z hlediska architektury a pokrytí různých fází Datového inženýrství a reportingu. Můžeme se na to koukat jako na datový tok z pohledu Fabricu – od zdrojových dat až po reporting. Je vidět, že Fabric dokáže pokrýt celý datový proces v rámci jedné platformy, bez nutnosti data kopírovat mezi různými systémy a bez nutnosti používát různé nástroje pro různé úkoly.
[Datové zdroje]
↓
[Data Factory] (nástroj pro ETL/ELT - Datová akvizice & Orchestrace)
↓
[OneLake] (Centrální uložení dat)
↓
[Lakehouse | Data Warehouse] (Data Engineering / SQL Analytics)
↓
[Semantický Model] (Business logika, DAX)
↓
[Power BI] (Reporty & Dashboardy)
--------------------------------------------------
Data Governance | Bezpečnost | Kapacita | Lineage
--------------------------------------------------
Fabric samozřejmě nabízí a neustále vylepšuje i další důležité aspekty datového inženýrství a to je Data governance, Bezpečnost (oprávnění, role, row level security, atd), škálovatelnost ve formě různých pricing plánů, lineage (závislosti). Tyto aspekty se prolínají napříč všemi výše zmíněnými artefakty a jsou základem pro bezpečný a planulý provoz.
Základní pojmy a informace kolem Microsoft Fabric pro začátek
Microsoft Fabric
Microsoft Fabric je sjednocená analytická platforma, která poskytuje v rámci jediné platformy nástroje (artefakty) pro data engineering, data science, data warehousing, real-time analytiku a Power BI reporting do jednoho prostředí. Uživatelé tak pracují s jednou sadou dat napříč různými rolemi. Zde na webu máme pro Fabric zvláštní kategorii – Microsoft Fabric články.
Pricing Fabricu a Capacity (F-SKU)
Fabric používá kapacitní model (F-SKU), kde se výpočetní výkon sdílí mezi jednotlivými službami. Správná volba kapacity je důležitá pro optimální výkon a řízení nákladů. Spoustu infromací ohledně členění kapacit, jejich podrobného popisu, vlivů na cenu a pricingu obecně najdete v článku – Fabric – Cena a struktura Fabricu – Modely, Tiery, Výběr a doporučení.
OneLake ve Fabricu – Popis možností pro práci a uložení dat
OneLake 1 je jedním z největších přínosů Microsoft Fabricu a tvoří základní datovou vrstvu celé platformy. Jedná se o jednotné centrální datové úložiště, které lze přirovnat k „OneDrive pro data“. Z architektonického pohledu platí, že všechna persistovaná data ve Fabricu jsou fyzicky ukládána do OneLake. Nad touto vrstvou pak jednotlivé služby (artefakty) Fabricu (například Lakehouse, Data Warehouse nebo Power BI) poskytují různé způsoby práce se stejnými daty.
OneLake je tedy centrální datová vrstva, která je pro uživatele abstrahována (nevidíme ji, ale existuje na pozadí). Neurčuje jak s daty pracujeme, ale kde jsou data uložena. To, jak s daty konkrétně pracujeme si volíme pomocí artefaktů a služeb Fabricu, např:
- Lakehouse je služba/artefakt založená na Delta Lake formátu, který umožňuje ukládat strukturovaná a semi-strukturovaná data s podporou ACID transakcí, což zabezpečuje datovou kvalitu a integritu. Často slouží jako první Bronze vrstva pro datovou akvizici v medailonové architektuře, ale může sloužit i jako silver a gold vrstva.
- Data Warehouse je artefaktem poskytujíci SQL orientovaný pohled, používá se jako Silver/Gold vrstva.
- Power BI reporty mohou data z OneLake a jejich artefaktů číst přímo pomocí režimu Direct Lake, bez nutnosti jejich kopírování
Díky tomuto přístupu:
- nejsou data duplicitně ukládána napříč nástroji,
- je zajištěna jednotná governance a zabezpečení,
- a celý datový ekosystém zůstává přehledný a škálovatelný.
Články na různé artefakty Fabricu najdete níže
- Fabric | dbt – Vytvoření Fabric Lakehouse/Data Warehouse a Konfigurace
- Fabric | dbt – Architektura a Role dbt v Medailonové Architektuře
- Fabric – Bronze: Datová Akvizice do Delta Tabulek přes pipeline (notebook)
- Fabric – ADLS Gen2 a Parquet – Nastavení Úložiště a Formát Bronze Dat
- Fabric | dbt – Shortcuts Propojení ADLS Gen2 s Fabric Lakehouse
- Fabric | dbt – Jak Modeluju Dimenzní Gold Tabulky (SCD2) v Data Projektech?
- Fabric | dbt – Slowly changing dimension (SCD 2) – Snapshots a Check Strategie v dbt s příkladem
- Fabric | dbt – Docker dbt kontejner a Azure Container Apps (CI/CD)
- Fabric | dbt – Konfigurace profiles.yml pro SPN Autentizaci k SQL Endpointu
Fabric Data Factory (Ingestion & Orchestration)
Data Factory ve Fabricu slouží k načítání dat, jejich plánování a orchestraci. Je to velmi podobná služba jako Azure data factory 2, ale ta se narozdíl od Fabricu plátí zvlášť. Fabric data factory je v ceně kapacity Fabricu. Podporuje jak low-code přístup, tak i komplexnější integrační scénáře (Python, spark apod). Jedná se o klíčovou funkcionalitu pro prvotní stažení externích dat do Fabric artefaktů (Lakehouse/Data warehouse).
Mezí věci co bych vypíchnul patří:
- Konektory na různé datové zdroje (Data Sources) Fabric dokáže pracovat s různými typy zdrojů dat, například:
- relační databáze
- různé cloudové služby (Azure a jiné)
- soubory (CSV, Parquet)
- streaming a event data
- Pipelines (datové toky) – Pipelines definují tok dat a závislosti mezi jednotlivými kroky datového procesu. Používají se pro automatizaci ingestování, transformací a publikace dat. Jedná se o low code alternativu k vývoji datových toků stylem drag and drop
- Notebooks – Notebooky jsou artefaktem, který je nositelem nějakého kódů – např python, spark, SQL apod. Jedná se o flexibilní možnost pro práci s daty. Notebooky mohou být spouštěny separátně nebo v rámci datrových toků (pipelines)
Články zaměřené na Data factory:
- Fabric | Data Factory, Pipelines, Konektory – Úvod do datových toků
- Hromadný Import Tabulek v Microsoft Fabric pomocí for Each kontejneru a json config souboru
- Fabric – Bronze: Datová Akvizice do Delta Tabulek přes pipeline (notebook)
- Fabric – Pipeline a Key Vault pro bezpečné předání Secretů (riziko kompromitace SecureString)
- Fabric – Azure Service Principal (SPN) a RBAC pro dbt v Entra ID
- Fabric | dbt – Docker dbt kontejner a Azure Container Apps (CI/CD)
Sémantický model a Power BI
Power BI je nástroj pro vizualizaci a reporting. Tento nástroj se nejčastěji provozuje mimo prostředí Fabricu, ale ve Fabricu dostává jeho používání další rozměr. Umožňuje číst data přímo z OneLake nebo z artefaktů jako Lakehouse a Data Warehouse pomocí režimu Direct Lake. Díky tomu není potřeba data kopírovat mezi úložišti tak, jako v tradičních datových platformách (data tečou datový sklad -> Power BI). To zajišťuje konzistenci a aktuálnost dat napříč všemi reporty. Uživatelé tak mohou rychle vytvářet interaktivní dashboardy a reporty přímo nad centrální datovou vrstvou. Zde je však férové poznamenat, že tento způsob “online/direct” používání s sebou přináší značné režie navíc a pravděpodobně nutnost posílit kapacitu Fabricu (vyšší pricing Tier) a je vhodnější spíše pro klienty s vyšším budgetem. Fabric lze ale samozřejmě s Power BI používat i tradičním, levnějším způsobem.
Semantický model v Power BI je vrstva, která definuje logiku nad daty – vztahy, hierarchie a výpočty. Pro pokročilé výpočty se používá jazyk DAX (Data Analysis Expressions), který umožňuje vytvářet složité metriky, agregace a časové analýzy a dává analytikovi flexibilitu. Kombinace vhodně navrženého semantic modelu a DAX umožňuje efektivně transformovat surová data na smysluplné business insighty bez nutnosti měnit zdrojová data.
Na Power BI a nástroje s tím související máme na webu kategorii – Power BI články
Závěr a největší síla Microsoft Fabric
To by tak na úvodní seznámení stačilo. Long story short – Microsoft Fabric sjednocuje tradičně oddělené části datové architektury do jedné platformy. Díky tomu umožňuje jednodušší správu dat, přehled nad architekturou, škálovatelnost, nákladovou optimalizaci (nízké CAPEX náklady) a silného vendora s velkou komunitou lidí kolem Fabricu.
Reference
- Microsoft, OneLake, the OneDrive for data [online]. [cited 2026-01-18]. Available from: https://learn.microsoft.com/en-us/fabric/onelake/onelake-overview
- Microsoft, Azure data Factory [online]. [cited 2026-01-18]. Available from: https://azure.microsoft.com/en-us/products/data-factory