Kód kurzu: MOC 20773« Krok zpět

Analýza velkých dat pomocí Microsoft R

Kurz je určen pro datové analytiky a specialisty zodpovědné za zpracování a analýzu dat se zájmem o strojové učení, kteří se chtějí seznámit s pokročilými možnostmi analýzy a vizualizace dat pomocí jazyka R s využitím nástrojů Microsoft R. V rámci kurzu se seznámíte s prostředím Microsoft R Serveru a Microsoft R klienta a naučíte se je použít pro načtení, transformaci, analýzu a vizualizaci dat. Dozvíte se také, jak optimalizovat výkon vašich výpočtů a jak vytvořit vlastní prediktivní model s použitím vhodných knihoven v jazyce R.

 DatumDnůCena kurzuCena materiálůJazyk výukyLokalita 
10.7.2019 3 22 450 CZK v ceně kurzu Český jazyk GOPAS Praha
 
18.11.2019 3 22 450 CZK v ceně kurzu Český jazyk GOPAS Praha
 
28.10.2019 3 630,00 EUR 185,00 EUR Slovenský jazyk GOPAS Bratislava
 

PobočkaDnůCena kurzuCena materiálůITB
Praha3 22 450 CZK v ceně kurzu 30
Brno3 22 450 CZK v ceně kurzu 30
Bratislava3 630,00 EUR 185,00 EUR 30

Komu je kurz určen

  • Kurz je cílen na datové analytiky a specialisty zodpovědné za zpracování a analýzu dat

Co Vás naučíme

  • Používat prostředí Microsoft R Server a Microsoft R Client
  • Načítat a analyzovat velká data z různých zdrojů s pomocí jazyka R
  • Transformovat a čistit uložená data
  • Vizualizovat data s pomocí grafů
  • Zvýšit výkon analytických úloh jejích paralelizací
  • Vytvářet regresní modely a používat je k výpočtu predikcí
  • Používat jazyk R v prostředí Microsoft SQL Serveru

Požadované vstupní znalosti

  • Základní znalost jazyka R
  • Základní znalost běžně používaných balíčků v jazyce R
  • Základní znalost statistických metod

Metody výuky

Odborný výklad s praktickými ukázkami, cvičení na počítačích

Studijní materiály

Doporučena je originální příručka firmy Microsoft, která není zahrnuta v ceně kurzu. Příručka je v anglickém jazyce.

Osnova kurzu

Modul 1: Microsoft R Server a Microsoft R Client
  • Seznámení s Microsoft R serverem
  • Použití Microsoft R klienta
  • Představení funkcí ScaleR
Modul 2: Průzkum velkých dat
  • Naučíte se prozkoumat velká data uložená v různých úložištích vaší organizace
  • Seznámení s datovými zdroji ScaleR
  • Načítání dat do XDF objektů
  • Sumarizace dat v XDF objektech
Modul 3: Vizualizace velkých dat
  • Seznámení s vizualizací dat s pomocí grafů
  • Představení příkazů ggplot, rxlinePlot a rxHistogram
  • Vizualizace dat v paměti
  • Vizualizace velkých dat
Modul 4: Zpracování velkých dat
  • Seznámení s transformací velkých dat
  • Spojení a řazení velkých datových kolekcí
  • Správa datových kolekcí
  • Připojení se ke vzdáleným zdrojům dat
  • Ukázka transformace dat s pomocí rxDataStep
Modul 5: Paralelizace analytických operací
  • Vysvětlení, jak pro urychlení výpočetní úlohu rozdělit do více paralelních operací
  • Použití výpočetního kontextu RxLocalParallel ve funkci rxExec
  • Seznámení s balíčkem revoPemaR
Modul 6: Vytváření a použití regresních modelů
  • Seznámení se shlukovou analýzou velkých dat
  • Tvorba regresních modelů
  • Použití regresních modelů pro výpočet predikcí
Modul 7: Vytváření a použití partitioning modelů
  • Vytváření partitioning modelů založených na rozhodovacích stromech
  • Ověřování a testování modelů s pomocí porovnávání výsledných predikcí
  • Seznámení s algoritmy rxDTree, rxDForest a rxBTree
Modul 8: Zpracování velkých dat v Microsoft SQL Serveru a Hadoop
  • Seznámení s použitím jazyka R v Microsoft SQL Serveru
  • Ukázka použití Hadoop a přístupu Map/Reduce
  • Úvod do použití Hadoop Spark

Předchozí kurzy

Navazující kurzy

žádný navazující kurz
Tištěná příručka MOC20773

Cena:
6150 CZK
Elektronická příručka MOC20773

Cena:
5350 CZK
Tištěná příručka MOC20773

Cena:
240 EUR
Elektronická příručka MOC20773

Cena:
185 EUR
Možnost volby materiálu v tištěné, nebo elektronické podobě.
Uvedené ceny jsou bez DPH.