Fabric | Úvod, Základní Pojmy a Architektura Microsoft Fabric – Proč je tak silný (OP)?

Tento článek slouží jako základní seznámení s MS Fabricem a jako zdroj pro základní evaluaci tohoto nástroje. Slouží také jako rozcestník na další články, ve kterých se jednotlivým pojmům a tématům věnuju podrobněji. Cílovou skupinou jsou lidé uvažující o možnosti si Fabric vyzkoušet nebo implementovat do své firmy. Microsoft Fabric je moderní analytická platforma typu… Čtěte více »

Fabric | Data Factory, Pipelines, Konektory – Úvod do datových toků

Tento článek je určen především pro manažery, IT specialisty a technické decision makery, kteří se s Fabricem seznamují a uvažují o implementaci. Je také určen pro širokou odbornou veřejnost, která se s Fabricem seznamuje a pro vzdělávací účely.  Text je zaměřen na principy fungování Fabric data factory, klíčové technické koncepty a praktické přínosy – detailní… Čtěte více »

Excel | XLOOKUP – syntaxe, návod, příklady hledání hodnot, rozdíly s VLOOKUP

Už jsem hodně dlouho nenapsal nic k Excelu a dnes jsem si vybral funkci XLOOKUP, kterou tu ještě ostudně nemám popsanou. Funkce byla oficiálně uvedena v září 2019 nejprve ve verzích Office 365 a postupně se stala standardní součástí Excelu i ve starších verzích. Hlavním důvodem zavedení XLOOKUP je nahrazení zastaralých funkcí VLOOKUP a HLOOKUP.… Čtěte více »

Hromadný Import Tabulek v Microsoft Fabric pomocí for Each kontejneru a json config souboru

Tento článek je technickým návodem, jak ve Fabric Data Factory (nebo Azure data factory) realizovat hromadný import tabulek pomocí jediné pipeline pomocí ForEach kontejneru a externího JSON konfiguračního souboru Tento postup umožňuje snadné přidávání, odebírání i úpravu tabulek bez změn samotné pipeline. V json souboru si můžeme nastavit spoustu užitečných nastavení, které následně můžeme spravovat… Čtěte více »

Top 10 pokročilých T-SQL příkazů pro vývoj v SQL Serveru

Tento článek je seznamem příkazů a technik pro práci se SQL Serverem, které jsou rutinní součástí práce zejména pokročilých vývojářů v T-SQL. Pokud vás zajímají spíše základy SQL tak doporučuju rozcestník s návody SQL. Na většinu níže uvedených příkazů existuje tady na webu článek s detailním popisem, příkladem a screenshoty. STRING_SPLIT s parametrem “ordinal” pro… Čtěte více »

Fabric – Bronze: Datová Akvizice do Delta Tabulek přes pipeline (notebook)

V několika předchozích článcích jsem řešil jak nastavit ADLS Gen2 pro ukládání zdrojových .parquet dat a také jak si přes shorcut ADLS gen 2 propojit přímo s Fabric Lakehouse. Pro shrnutí – ve Fabric prostředí tedy máme připraven Bronze Lakehouse a v tomto lakehousu máme vytvořené propojení na parquet data. Nyní je čas na to… Čtěte více »

Fabric – ADLS Gen2 a Parquet – Nastavení Úložiště a Formát Bronze Dat

V datové architektuře založené na medailonovém přístupu (Medallion Architecture) představuje Bronze vrstva první stupeň zpracování dat – sem přicházejí surová, minimálně transformovaná data z různých zdrojových systémů. V sérii článků o Fabricu implementujeme datové řešení, kde je Bronze vrstva realizována jako Lakehouse ve Fabricu ve formě delta tabulek a Silver/Gold vrstva jako Data Warehouse plněný… Čtěte více »

Fabric | dbt – Jak Modeluju Dimenzní Gold Tabulky (SCD2) v Data Projektech?

V předchozím článku – Fabric | dbt – Slowly changing dimension (SCD 2) – Snapshots a Check Strategie v dbt s příkladem jsme si ukázali, jak v prostředí Fabric a pomocí nástroje dbt implementovat historizaci dimenzních dat v Silver medailonu prostřednictvím snapshotů. Tyto snapshoty máme připraveny a zajišťují nám kompletní historii změn dimenzí (pomocí atributů valid_from… Čtěte více »

Fabric – Workspace a Task Flow – Organizace procesů a artefaktů (itemů), domény

V rámci série článků o platformě Microsoft Fabric se věnujeme různým funkcím a artefaktům tohoto prostředí pro práci s daty, které pokrývá oblasti datové akvizice (ingest), transformace, analytiky a správy datových produktů pro efektivní a bezpečný vývoj, orchestraci a provoz datových řešení v rámci jednoho integrovaného ekosystému. Základními artefakty, se kterými bychom se určitě měli… Čtěte více »

Fabric | dbt – Slowly changing dimension (SCD 2) – Snapshots a Check Strategie v dbt s příkladem

Slowly Changing Dimensions (SCD) představují způsob, jak v datovém skladu uchovávat a spravovat historické změny dimenzí v čase. Pro zopakování teorie co jsou to fakta a dimenze doporučuju před dalším pokračováním prolítnout článek – Fakta a dimenze – Tabulky v datovém skladu. V kontextu medailonové architektury, ve které pracujeme ve Fabricu, spadá generování SCD do… Čtěte více »