Delta Lake – co to je a k čemu se používá

Delta Lake je open-source formát rozšiřující Parquet soubory (columnar format – sloupcové uložení dat) o transakční log, který zajišťuje ACID transakce nad datovými soubory. Umožňuje time-travel dotazy (přes SCD 2 – Slowly changing dimension), verzování, merge operace a spolehlivé dávkové i streamové zpracování. Díky tomu je vhodný jako základ pro data lakehouse architekturu v Databricks nebo Microsoft Fabric.

Rubrika:

O Ing. Jan Zedníček - Data Engineer & Controlling

Jmenuji se Honza Zedníček a působím jako freelancer. Pracoval jsem dříve také jako BI developer, finanční controller a analytik. Vše pro společnosti z oblasti IT, bankovnictví, consultingu a výroby. Po práci si rád zahraju tenis, volejbal, šachy, zajdu do posilovny a občas neúspěšně odpálím pár balónků v golfu 🏌️ Již cca 10 let zapisuji na tento web různé návody určené zejména odborné veřejnosti, studentům a zájemcům o informace z oblastí Business intelligence, korporátních financí a reportingu. 🔥 Přihlašte se do naší Excel facebook skupiny (2.4k+ členů), kde si pomáháme Excel CZ/SK diskuse »