ETL | Dbt core a Snowflake – Nastavení a dbt debug

Jde dohromady Dbt a Snowflake? Jasně na pohodu a pokud to ještě zabalíte do nějakého ETL/orchestračního nástroje jako například Keboola (cloud) nebo Mage.ai (onprem) tak máte slušnou data mlátičku. Dnes už většina ETL frameworků (alespoň těch lepších) s dbt počítá.

Lokální konfigurace Dbt a Snowflake

V tomto tutoriálu počítáme s tím, že dbt máme lokálně a konfigurujeme ho na Snowflake databázi. Postup se skládá s několika kroků

Krok 1 – Instalace dbt-core a snowflake adaptéru – příkazem “pip install dbt-snowflake“. Tím dojde k instalaci dbt-core a snowflake adaptéru, který je potřebný pro komunikaci s databází.

Krok 2 – Vytvoření dbt projektu – máme 2 možnosti, bud vytvoříme prázdný projekt nebo už nějaký máme v gitu

  • Prázdného – vlezu si v terminálu do umístění kde chci mít projekt a spustím příkaz “dbt init”.
  • Existujícího – provedete git clone vašeho projektu z existujícího git Dbt repozitáře

dbt snowflake installation

V případě vytvoření nového projeku se nás to poté zeptá na název projektu a adaptér (vybereme snowflake). Vytvoří se nám nový dbt projekt.

Krok 3 – Konfigurace profiles.yml a dbt_project.yml souboru – dokumentaci k tomu, jak má vypadat konfigurace v profiles.yml najdete zde. Nebo si upravte template níže (vyplňte vaše údaje).

type: snowflake
account: vxmpcpy-XXXXXXX
# User/password auth
user: DBT_USER
password: XXXXXXXXX
role: DBT_ROLE
database: DBT_DATABASE
warehouse: DBT_WAREHOUSE
schema: DBT

profiles.yml dbt snowflake

Krok 4 – test konfigurace přes “dbt debug” dopadl okej a vidíme, že byly splněny všechny testy.

dbt debug snowflake

Krok 5 – spuštění dbt přes “dbt run” a kontrola dat přímo ve Snowflake. Zpracují se 2 defaultní objekty (my_first_dbt_model.sql a my_second_dbt_model.sql)

Data byla úspěšně doručena do Snowflake databáze DBT_DATABASE

5/5 - (1 vote)
Rubrika: Dbt (data build tool)

O Ing. Jan Zedníček - Data Engineer & Controlling

Jmenuji se Honza Zedníček a působím jako data engineer freelancer. Během cca 10 let jsem zde shromáždil přes 600 IT case studies, průvodců, návodů a tipů určených zejména odborné veřejnosti, studentům a zájemcům o informace z oblastí Data Engineeringu, korporátních financí a reportingu. Zaměřuji se především na Microsoft technologie (on-prem i cloud) a různé synergické efekty v rámci jejich produktového portfolia pro dataře a finanční profesionály. Věnuji se také dalším platformám a významným hráčům z oblasti open source technologií. 🔥 Pokud vám tento článek pomohl, ocením referenci na vašem webu nebo zmínku v komunitě. A mám pro vás ještě tip: řešíte-li nějaký zapeklitý Excel problém, přihlašte se do naší Excel Facebook skupiny (2.4k+ členů), kde si pomáháme Excel CZ/SK diskuse ».

Leave a Reply

Your email address will not be published. Required fields are marked *