9600-1020/02 – Knihovny pro paralelní zpracování dat (KPZD)
Garantující katedra | IT4Innovations | Kredity | 4 |
Garant předmětu | Ing. Jan Martinovič, Ph.D. | Garant verze předmětu | Ing. Jan Martinovič, Ph.D. |
Úroveň studia | pregraduální nebo graduální | Povinnost | povinný |
Ročník | 1 | Semestr | zimní |
| | Jazyk výuky | angličtina |
Rok zavedení | 2019/2020 | Rok zrušení | |
Určeno pro fakulty | FEI | Určeno pro typy studia | navazující magisterské |
Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi
Student po absolvování předmětu získá přehled o knihovnách pro paralelní zpracování velkých dat a získá základní zkušenost s použitím nejznámějších knihoven. Budou představeny základní koncepty jak s velkými daty minipulovat a základní paradigmata a programové modely pro jejich zpracování. Cvičení budou probíhat v jazyce Python, ve kterém existují knihovny pro všechný známé frameworky.
Vyučovací metody
Přednášky
Cvičení (v učebně)
Projekt
Anotace
Povinná literatura:
• Pandas dokumentace: http://pandas.pydata.org/
• Spark dokumentace: https://spark.apache.org/docs/latest/
• Tensorflow dokumentace: https://www.tensorflow.org/
• Keras dokumentace: https://keras.io/
Doporučená literatura:
Forma způsobu ověření studijních výsledků a další požadavky na studenta
vypracovaní projektu
E-learning
Další požadavky na studenta
Žádné další požadavky.
Prerekvizity
Předmět nemá žádné prerekvizity.
Korekvizity
Předmět nemá žádné korekvizity.
Osnova předmětu
Student po absolvování předmětu získá přehled o knihovnách pro paralelní zpracování velkých dat a získá základní zkušenost s použitím nejznámějších knihoven. Budou představeny základní koncepty jak s velkými daty minipulovat a základní paradigmata a programové modely pro jejich zpracování. Cvičení budou probíhat v jazyce Python, ve kterém existují knhovny pro všechný známé frameworky.
Osnova předmětu:
1. Úvod do zpracování velkých dat
2. Základní manipulace s daty (Pandas, Numpy)
3. Map & Reduce model (Hadoop, Spark, Flink)
4. Paralelní zpracovaní numerických dat v Pythonu (Dask)
5. Knihovny pro neuronové sítě I (Tensorflow, Theano)
6. Knihovny pro neuronové sítě II (Keras)
7. Paralelizace obecných úloh (HyperLoom)
8. Workflow systémy (Luigi, Airflow)
Podmínky absolvování předmětu
Výskyt ve studijních plánech
Výskyt ve speciálních blocích
Hodnocení Výuky
Předmět neobsahuje žádné hodnocení.