Data lakehouse – vysvětlení

Data lakehouse speciální typ úložistě, které kombinuje flexibilitu data lake a formální správu datového skladu. Nad datovými soubory přidává transakční vrstvu, schémata, ACID vlastnosti a podporu pro analytické i operativní dotazy. Lakehouse umožňuje ukládat strukturovaná, polostrukturovaná i nestrukturovaná data v jednom úložišti. Typickými technologiemi jsou Delta Lake, Apache Hudi nebo Iceberg. Na blogu se poměrně detailně věnuji MS Fabric (kategorie), kde Lakehouse tvoří jeden ze základních pilířů datových řešení.

Rubrika:

O Ing. Jan Zedníček - Data Engineer & Controlling

Jmenuji se Honza Zedníček a působím jako data engineer freelancer. Během cca 10 let jsem zde shromáždil přes 600 IT case studies, průvodců, návodů a tipů určených zejména odborné veřejnosti, studentům a zájemcům o informace z oblastí Data Engineeringu, korporátních financí a reportingu. Zaměřuji se především na Microsoft technologie (on-prem i cloud) a různé synergické efekty v rámci jejich produktového portfolia pro dataře a finanční profesionály. Věnuji se také dalším platformám a významným hráčům z oblasti open source technologií. 🔥 Pokud vám tento článek pomohl, ocením referenci na vašem webu nebo zmínku v komunitě. A mám pro vás ještě tip: řešíte-li nějaký zapeklitý Excel problém, přihlašte se do naší Excel Facebook skupiny (2.4k+ členů), kde si pomáháme Excel CZ/SK diskuse ».