DDL – Data Definition Language
DDL v překladu data definition language je soubor SQL příkazů, který slouží k manipulaci s daty v tabulce. Patří sem CREATE, ALTER a DROP příkaz
DDL v překladu data definition language je soubor SQL příkazů, který slouží k manipulaci s daty v tabulce. Patří sem CREATE, ALTER a DROP příkaz
Degenerovaná dimenze je pojem, který poprvé použil guru datových skladů Ralph Kimball. Pokud se ve faktové tabulce nachází atribut, který by měl být umístěn v dimenzní tabulce, označuje se tento atribut jako degenerovaná dimenze.
Delta Lake je open-source formát rozšiřující Parquet soubory (columnar format – sloupcové uložení dat) o transakční log, který zajišťuje ACID transakce nad datovými soubory. Umožňuje time-travel dotazy (přes SCD 2 – Slowly changing dimension), verzování, merge operace a spolehlivé dávkové i streamové zpracování. Díky tomu je vhodný jako základ pro data lakehouse architekturu v Databricks… Čtěte více »
Interní formát využívaný v MS Fabricu kombinující Parquet soubory s transakčním logem Delta Lake. Umožňuje verzování dat, ACID transakce a efektivní time-travel nad lakehouse daty.
Dimenze je pojem, který se používá zejména v souvislosti s datovými sklady. Je to soubor dat, které pomáhají popsat události, které se nazývaji Fakta. Fakta a Dimenze tvoří základní káměn datových skladů a spolu usnadňují vyhledávání informací. Jejich architektura se tvoří v rámci datového modelu. Faktové a dimenzní tabulky by spolu měly tvořit určité schéma,… Čtěte více »
DML je zkratko pro data manipulation language. Je to soubor SQL příkazů, které slouží k práci s daty. Patří sem INSERT, UPDATE a DELETE . Slouží k vkládání, úpravám a mazání záznamů.
Provrtat je funkce dolování dat software. Na rozdíl od vrtat a vrtat dolů, které se pohybují přes databázi vertikálně, rozšiřování a zaměřit se na úroveň detailů k prohlížení dat na různých úrovních, provrtat se pohybuje horizontálně prostřednictvím databáze. S provrtat schopnostmi, dolování dat software poskytuje pohled na související soubory a datové prvky.
ER diagram je zjednodušeně řečeno vizuální reprezentace objektů v databázi a vztahů mezi nimi. ER diagramy se nejčastěji používají při analýze informačních systémů a u návrhů systémů při jejich budování.
ETL je proces získávání dat ze zdrojů (Extract), jejich úpravy a transformace (Transform) a následného nahrání do datového skladu (Load). Slouží k čištění, agregaci a sjednocení dat pro analytické a reportingové účely.
ETL (Extract–Transform–Load) provádí transformace ještě před uložením do cílového systému, což je typické pro tradiční on-premise datové sklady. ELT (Extract–Load–Transform) napřed data uloží do úložiště a až poté je transformuje pomocí výkonu databáze či lakehouse. Cloudové platformy (Snowflake, Fabric, aj) preferují ELT pro lepší škálování a rychlost.