Kód kurzu: MOC 20773« Krok zpět

Analýza velkých dat pomocí Microsoft R

Kurz je určen pro datové analytiky a specialisty zodpovědné za zpracování a analýzu dat se zájmem o strojové učení, kteří se chtějí seznámit s pokročilými možnostmi analýzy a vizualizace dat pomocí jazyka R s využitím nástrojů Microsoft R. V rámci kurzu se seznámíte s prostředím Microsoft R Serveru a Microsoft R klienta a naučíte se je použít pro načtení, transformaci, analýzu a vizualizaci dat. Dozvíte se také, jak optimalizovat výkon vašich výpočtů a jak vytvořit vlastní prediktivní model s použitím vhodných knihoven v jazyce R.

Nebyly nalezeny žádné termíny, kontaktujte náš klientský servis.

PobočkaDnůCena kurzuCena materiálůITB
Nebyly nalezeny žádné záznamy.

*Cena kurzu je uvedena včetně ceny originálních studijních materiálů.

Komu je kurz určen

 • Kurz je cílen na datové analytiky a specialisty zodpovědné za zpracování a analýzu dat

Co Vás naučíme

 • Používat prostředí Microsoft R Server a Microsoft R Client
 • Načítat a analyzovat velká data z různých zdrojů s pomocí jazyka R
 • Transformovat a čistit uložená data
 • Vizualizovat data s pomocí grafů
 • Zvýšit výkon analytických úloh jejích paralelizací
 • Vytvářet regresní modely a používat je k výpočtu predikcí
 • Používat jazyk R v prostředí Microsoft SQL Serveru

Požadované vstupní znalosti

 • Základní znalost jazyka R
 • Základní znalost běžně používaných balíčků v jazyce R
 • Základní znalost statistických metod

Metody výuky

Odborný výklad s praktickými ukázkami, cvičení na počítačích

Studijní materiály

Doporučena je originální příručka firmy Microsoft, která není zahrnuta v ceně kurzu. Příručka je v anglickém jazyce.

Osnova kurzu

Modul 1: Microsoft R Server a Microsoft R Client
 • Seznámení s Microsoft R serverem
 • Použití Microsoft R klienta
 • Představení funkcí ScaleR
Modul 2: Průzkum velkých dat
 • Naučíte se prozkoumat velká data uložená v různých úložištích vaší organizace
 • Seznámení s datovými zdroji ScaleR
 • Načítání dat do XDF objektů
 • Sumarizace dat v XDF objektech
Modul 3: Vizualizace velkých dat
 • Seznámení s vizualizací dat s pomocí grafů
 • Představení příkazů ggplot, rxlinePlot a rxHistogram
 • Vizualizace dat v paměti
 • Vizualizace velkých dat
Modul 4: Zpracování velkých dat
 • Seznámení s transformací velkých dat
 • Spojení a řazení velkých datových kolekcí
 • Správa datových kolekcí
 • Připojení se ke vzdáleným zdrojům dat
 • Ukázka transformace dat s pomocí rxDataStep
Modul 5: Paralelizace analytických operací
 • Vysvětlení, jak pro urychlení výpočetní úlohu rozdělit do více paralelních operací
 • Použití výpočetního kontextu RxLocalParallel ve funkci rxExec
 • Seznámení s balíčkem revoPemaR
Modul 6: Vytváření a použití regresních modelů
 • Seznámení se shlukovou analýzou velkých dat
 • Tvorba regresních modelů
 • Použití regresních modelů pro výpočet predikcí
Modul 7: Vytváření a použití partitioning modelů
 • Vytváření partitioning modelů založených na rozhodovacích stromech
 • Ověřování a testování modelů s pomocí porovnávání výsledných predikcí
 • Seznámení s algoritmy rxDTree, rxDForest a rxBTree
Modul 8: Zpracování velkých dat v Microsoft SQL Serveru a Hadoop
 • Seznámení s použitím jazyka R v Microsoft SQL Serveru
 • Ukázka použití Hadoop a přístupu Map/Reduce
 • Úvod do použití Hadoop Spark

Předchozí kurzy

Navazující kurzy

žádný navazující kurz
Elektronická příručka MOC20773

Cena:
5650 CZK
Elektronická příručka MOC20773

Cena:
178 EUR
Uvedené ceny jsou bez DPH.