Školení je ideální pro datové profesionály, kteří chtějí posunout své dovednosti a plně ovládnout Data Engineering v prostředí Microsoft Fabric. Toto školení spolu se školením Data Analysis v Microsoft Fabric [GOC682] tvoří dohromady důkladnou [...]
  • GOC681
  • Délka 3 dny
  • 30 ITK bodů
  • 1 termin
  • ČR (29 600 Kč)

    SR (1 250 €)

  • Pokročilý

Školení je ideální pro datové profesionály, kteří chtějí posunout své dovednosti a plně ovládnout Data Engineering v prostředí Microsoft Fabric. Toto školení spolu se školením Data Analysis v Microsoft Fabric [GOC682] tvoří dohromady důkladnou přípravu na certifikační zkoušku DP-600: Fabric Analytics Engineer Associate. Naučíte se principy medaillon architektury, prozkoumáte metody získávání dat pomocí Dataflows Gen2, Pipelines a Notebooks. Kurz pokrývá ukládání dat, rozdíly mezi datovými sklady a Lakehouses, jejich dotazování a komponenty jako stored procedures, functions, data masking, atd. Automatizace procesů pomocí orchestračních pipelines vás naučí koordinovat data workflows a integrovat s medaillon architekturou. Z pohledu optimalizace výkonu se zaměříte na techniky jako partitioning a komprese. Naučíte se monitorovat kapacity a měřit efektivitu zpracování dat. Zkusíte si verzování a nasazování změn pomocí Git integrace a deployment pipelines.

»
  • Porozumíte principům a komponentům medallion architektury
  • Naučíte se, jak efektivně nastavit prostředí a konfigurovat nastavení tenantu
  • Prozkoumáte různé metody extrakce a načítání dat pomocí Dataflows Gen2, Pipelines a Notebooks
  • Zvládnete techniky kopírování a opětovného použití dat v OneLake
  • Ovládnete profilování, čištění a transformaci dat pomocí praktických příkladů
  • Ponoříte se do možností ukládání dat, včetně Data Warehouse a Data Lakes, a naučíte se, jak zabezpečit data
  • Objevíte, jak automatizovat Dataflows pomocí orchestračních pipelines
  • Naučíte se, jak monitorovat a optimalizovat výkon pomocí pokročilých technik
  • Pochopíte verzování a nasazování změn pomocí Git integrace a deployment pipelines

Kurz je zaměřen na datové inženýry a vývojáře, kteří se chtějí naučit efektivně pracovat v prostředí Microsoft Fabric. Dále je kurz vhodný pro business analytiky a datové architekty, kteří si chtějí zlepšit své dovednosti v oblasti správy a optimalizace dat.

  • Základní znalost relačních databází a jazyka SQL
  • Základní zkušenost s data warehouses nebo data lakes
  • Základní porozumění konceptům extrakce, načítání, profilování a transformace dat
  • Základní zkušenost s nástroji pro datovou analýzu a integraci dat (např. ETL procesy, data pipelines)
  • Znalost verzování a Git integrace výhodou
1. Nastavení prostředí a vysvětlení principů
  • Medaillon architecture - principy a komponenty:
    • Data Lakes, Data Warehouses, strukturovaná analytika, sémantické modely, analytické engines
    • nastavení tenantu, jak vybrat kapacitu, jak nad tím uvažovat
2. Data Ingestion a kopírování dat
  • Průzkum způsobů načtení dat
    • Dataflows Gen2
    • Pipelines
    • Notebooks
  • Kopírování a přepoužití dat v rámci OneLake
    • shortcuts
    • rozhodovací metodika přístupu
    • kdy jakou metodu zvolit, jak nad tím architektonicky přemýšlet + praktická aplikace, výroba
3. Data profiling, čištění a transformace
  • Data profiling
    • principy
    • implementace a možnosti v notebooks a dataflows gen2
  • Data cleaning and transforming
    • sestavení čistících mechanismů na základě výsledků datové profilace
    • implementace datových transformací
    • slowly changing dimensions, atd.
4. Uložení dat
  • Rozdíly mezi Data Warehousem a Lakehousem a jejich vytvoření
  • Dotazování na data v rámci DWH a Lakehouse
    • SQL dotazy a visual queries
    • vnitroitemové dotazy, meziitemové dotazy
  • Komponenty v rámci DWH a Lakehouse
    • store procedures, functions, roles, schemas, RLS, CLS, data masking, atd.
    • kdy použít warehouse, lakehouse, jak pracovat s jejich daty, jak vytvářet jejich podružné komponenty, jak zabezpečit data
5. Automatizace
  • Orchestrační pipeline
    • Koordinace – sekvencování data workflows
    • Závislosti - správa pořadí exekucí
    • Integrace - propojení s komponenty medallion architektury
  • Vnitřní orchestrace notebooků
    • jak využít data pipelines pro orchestraci návazných pipelines, notebooků, dataflows, store procedures
    • jak orchestrovat notebooky v rámci aktivní session
    • implementace fail-over scénářů
6. Monitoring & optimalizace
  • Optimalizace výkonu
  • Bližší pohled na techniky vylepšující výkon
    • Partitioning
    • komprese
    • V-order
    • vacuuming
  • Admin perspektiva
    • monitoring kapacit – sledování využití zdrojů
    • metriky efektivity – měření efektivity zpracování dat
7. Verzování a nasazování změn
  • Git integrace
  • Deployment pipelines
Aktuální nabídka
Školicí místo
Jazyk kurzu

Uvedené ceny jsou bez DPH.

Školení na míru

Nenašli jste vhodný termín, nebo chcete školení přizpůsobit specifickým potřebám vašeho týmu? Rádi pro vás připravíme školení na míru.