Columnar storage – sloupcové ukládání dat

Columnar storage je způsob uložení dat. Ukládá hodnoty po sloupcích, nikoli po řádcích jak je zvykem v tradičním relačních databázích jako například SQL Server. Díky tomu umožňuje extrémně rychlé čtení (jen potřebných sloupců) v analytických dotazech, zlepšuje kompresi a minimalizuje I/O operace. Používá se v moderních analytických databázích, jako jsou Vertica, Redshift nebo ClickHouse, i v souborových formátech jako třeba Parquet, který je využíván převážně jako formát pro datovou akvizici (ingestion) v moderních datových platformách jako třeba Microsoft Fabric.

Rubrika:

O Ing. Jan Zedníček - Data Engineer & Controlling

Jmenuji se Honza Zedníček a působím jako data engineer freelancer. Během cca 10 let jsem zde shromáždil přes 600 IT case studies, průvodců, návodů a tipů určených zejména odborné veřejnosti, studentům a zájemcům o informace z oblastí Data Engineeringu, korporátních financí a reportingu. Zaměřuji se především na Microsoft technologie (on-prem i cloud) a různé synergické efekty v rámci jejich produktového portfolia pro dataře a finanční profesionály. Věnuji se také dalším platformám a významným hráčům z oblasti open source technologií. 🔥 Pokud vám tento článek pomohl, ocením referenci na vašem webu nebo zmínku v komunitě. A mám pro vás ještě tip: řešíte-li nějaký zapeklitý Excel problém, přihlašte se do naší Excel Facebook skupiny (2.4k+ členů), kde si pomáháme Excel CZ/SK diskuse ».