460-4126/01 – Metody analýzy vektorových dat (MAVD)
Garantující katedra | Katedra informatiky | Kredity | 4 |
Garant předmětu | prof. Ing. Jan Platoš, Ph.D. | Garant verze předmětu | prof. Ing. Jan Platoš, Ph.D. |
Úroveň studia | pregraduální nebo graduální | Povinnost | povinný |
Ročník | 1 | Semestr | zimní |
| | Jazyk výuky | čeština |
Rok zavedení | 2019/2020 | Rok zrušení | 2021/2022 |
Určeno pro fakulty | FEI | Určeno pro typy studia | navazující magisterské |
Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi
Cílem předmětu je prohloubit a upřesnit znalosti metod pro analýzu dat získané v předchozích semestrech. Hlavními
znalostmi, které budou studentům předány, jsou pokročilé algoritmy pro klasifikaci dat, zpracování streamových
dat, pokročilých datových struktur a technik machine learningu. Studenti budou schopni tyto metody využít, budou
schopni správně interpretovat dosažené výsledky a také data a výsledky vhodnými metodami prezentovat a vizualizovat.
Vyučovací metody
Přednášky
Cvičení (v učebně)
Anotace
V předmětu se studenti obeznámí s metodami pro analýzu vektorových dat. V první části předmětu se budou zabývat
analýzou dat bez učitele. Jedná se zejména o hledání pravidel a shlukování dat. Ve druhé části pak bude hlavní
náplní klasifikace dat. Výklad bude veden o jednodušších metod lineární klasifikace k metodám založeným na SVM
a neuronových sítí. V rámci posledních přednášek pak budou vysvětleny pokročilé metody klasifikace dat, analýzu
streamových dat a vizualizaci. Na cvičeních pak studenti získají znalosti o jednotlivých metodách díky jejich implementaci
a/nebo ověření jejich funkčnosti ve zvoleném nástroji.
Povinná literatura:
Doporučená literatura:
Forma způsobu ověření studijních výsledků a další požadavky na studenta
Znalosti studentů jsou ověřovány prostřednictví realizace bodovaných úkolů na cvičeních, vypracování analýzy dat a implementace některé z probíraných metod v rámci samostatné práce.
E-learning
Další požadavky na studenta
Další požadavky na studenta nejsou kladeny.
Prerekvizity
Předmět nemá žádné prerekvizity.
Korekvizity
Předmět nemá žádné korekvizity.
Osnova předmětu
Přednášky:
Explorativní analýza dat
1. Hledání pravidel v datech, Hledání vzorů v datech
2. Shlukování pomocí reprezentantů, Hierarchické shlukování
3. Shlukování založené na hustotě dat, Validace shluků
4. Samo organizující se mapy
5. Detekce Anomálií
Klasifikace dat
6. Lineární klasifikátory (Lineární diskriminační analýza, Naive Bayes, Logistická regrese)
7. Rozhodovací stromy, Náhodné lesy
8. Support Vector Machine, Kernelové metody
9. Neuronové sítě (Perceptron, Feed forward NN+Back propagation)
10. Regresní metody
11. Pokročilé metody v klasifikaci dat
12. Validace klasifikačních algoritmů
Pokročilé metody
13. Analýza streamových dat
14. Vizualizace vektorových dat
Cvičení na počítačové učebně:
Explorativní analýza dat a učení bez učitele
1. Implementace metody APRIORI pro hledání pravidel v datech.
2. Dokončení implementace metody APRIORI nad daty.
3. Implementace hierarchického shlukování – Aglomerátivní shlukování.
4. Implementace algoritmu DBSCAN.
5. Validace shluků vytvořených implementovanými algoritmy.
6. Ukázka metody Samoorganizujích map
Klasifikace dat
7. Implementace metod pro výběr atributů.
8. Implementace rozhodovacího
9. Implementace metody Naive Bayes.
10. Otestování metody Support Vector Machine v programu.
11. Implementace jednoduchého perceptronu
12. Hodnocení klasifikátorů
13. Implementace Regresního stromu
14. Vizualizace dat
Podmínky absolvování předmětu
Výskyt ve studijních plánech
Výskyt ve speciálních blocích
Hodnocení Výuky