Fabric | dbt – Shortcuts Propojení ADLS Gen2 s Fabric Lakehouse

V minulém článku – Fabric – ADLS Gen2 a Parquet – Nastavení Úložiště a Formát Bronze Dat jsem popisoval, jak vypadá Azure ADLS Gen2 pro ukládání a archivaci našich zdrojových parquet souborů. Abychom mohli naše zdrojová data nahrát do Fabric Bronze vrstvy a následně je pomocí dbt zpracovat, tak si musíme propojit Azure storage s Fabric Lakehousem.

Ve Fabricu je možné místo přímého přesunu dat využít funkci shortcut, která umožní Fabricu přistupovat k souborům přímo v ADLS Gen2 z prostředí Lakehousu, čímž se zjednodušuje integrace.

Co je shortcut ve Fabricu

Shortcut je něco jako odkaz v rámci Fabric Lakehouse, který ukazuje na externí umístění dat (v našem případě ADLS Gen2 storage). Data zůstávají fyzicky uložená v původním umístění, ale Fabric je dokáže číst a zpracovávat stejně jako lokální tabulky v Lakehouse – přes SQL nebo Python. Díky vhodné struktuře, kteoru jsme si ukázali v minulém článku se můžeme na data v ADLS Gen2 dotazovat rychle a přesně.

Pro zopakování  – jak data ukládáme

/data-lake/
   └── 01_bronze/
       └── <source_system>/
           └── <table_name>/
               └── year=<ingestion_year>/
                   └── month=<ingestion_month>/
                       └── day=<ingestion_day>/
                           └── <ingestion_timestamp>data.parquet

adls-gen2-bronze-medaillon

Postup propojení ADLS Gen2 s Fabric Lakehouse pomocí shortcutu

fabric-lakehouse-navigtion

  • Vytvoření shortcutu – v Lakehouse vyberte možnost New shortcut

fabric-how-to-create-shoortcut

  • Zadejte adresu složky v ADLS Gen2, kterou chcete propojit a následně vyberte root adresáře z ADLS, který chceme vytvořit.

  • Nastavení přístupových práv – zkontrolujeme, že Fabric má oprávnění číst složku v ADLS Gen2 (např. pomocí Managed Identity nebo Service Principal).
  • Ověření přístupu – po vytvoření shortcutu otevřeme složku v Lakehouse a otestujeme, že Fabric dokáže zobrazit soubory a jejich metadata.

fabric-lakehouse-shortcut-set

Další kroky po propojení

Jakmile je shortcut vytvořen, data z ADLS Gen2 lze zpracovávat. Typicky se provádí následující:

Rate this post
Rubrika: Fabric

O Ing. Jan Zedníček - Data Engineer & Controlling

Jmenuji se Honza Zedníček a působím jako data engineer freelancer. Během cca 10 let jsem zde shromáždil přes 600 IT case studies, průvodců, návodů a tipů určených zejména odborné veřejnosti, studentům a zájemcům o informace z oblastí Data Engineeringu, korporátních financí a reportingu. Zaměřuji se především na Microsoft technologie (on-prem i cloud) a různé synergické efekty v rámci jejich produktového portfolia pro dataře a finanční profesionály. Věnuji se také dalším platformám a významným hráčům z oblasti open source technologií. 🔥 Pokud vám tento článek pomohl, ocením referenci na vašem webu nebo zmínku v komunitě. A mám pro vás ještě tip: řešíte-li nějaký zapeklitý Excel problém, přihlašte se do naší Excel Facebook skupiny (2.4k+ členů), kde si pomáháme Excel CZ/SK diskuse ».

Leave a Reply

Your email address will not be published. Required fields are marked *