460-4126/01 – Metody analýzy vektorových dat (MAVD)

Garantující katedraKatedra informatikyKredity4
Garant předmětuprof. Ing. Jan Platoš, Ph.D.Garant verze předmětuprof. Ing. Jan Platoš, Ph.D.
Úroveň studiapregraduální nebo graduálníPovinnostpovinný
Ročník1Semestrzimní
Jazyk výukyčeština
Rok zavedení2019/2020Rok zrušení2021/2022
Určeno pro fakultyFEIUrčeno pro typy studianavazující magisterské
Výuku zajišťuje
Os. čís.JménoCvičícíPřednášející
PLA06 prof. Ing. Jan Platoš, Ph.D.
PRO0199 Ing. Petr Prokop
Rozsah výuky pro formy studia
Forma studiaZp.zak.Rozsah
prezenční Klasifikovaný zápočet 2+2

Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi

Cílem předmětu je prohloubit a upřesnit znalosti metod pro analýzu dat získané v předchozích semestrech. Hlavními znalostmi, které budou studentům předány, jsou pokročilé algoritmy pro klasifikaci dat, zpracování streamových dat, pokročilých datových struktur a technik machine learningu. Studenti budou schopni tyto metody využít, budou schopni správně interpretovat dosažené výsledky a také data a výsledky vhodnými metodami prezentovat a vizualizovat.

Vyučovací metody

Přednášky
Cvičení (v učebně)

Anotace

V předmětu se studenti obeznámí s metodami pro analýzu vektorových dat. V první části předmětu se budou zabývat analýzou dat bez učitele. Jedná se zejména o hledání pravidel a shlukování dat. Ve druhé části pak bude hlavní náplní klasifikace dat. Výklad bude veden o jednodušších metod lineární klasifikace k metodám založeným na SVM a neuronových sítí. V rámci posledních přednášek pak budou vysvětleny pokročilé metody klasifikace dat, analýzu streamových dat a vizualizaci. Na cvičeních pak studenti získají znalosti o jednotlivých metodách díky jejich implementaci a/nebo ověření jejich funkčnosti ve zvoleném nástroji.

Povinná literatura:

Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Third Edition, Morgan Kaufmann, 2011, ISBN: 978-0123748560 Charu C. Aggarwal, Data Mining - The Textbook, Springer, 2015, ISBN: 978-3-319-14141-1.

Doporučená literatura:

Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, May 2014. ISBN: 9780521766333. Jure Leskovec, Anand Rajaraman, David Ullman, Mining of Massive Datasets, 2nd editions, Cambridge University Press, Novemeber 2014, ISBN: 9781107077232, On-line http://infolab.stanford.edu/~ullman/mmds/book.pdf [2014-09-12]

Forma způsobu ověření studijních výsledků a další požadavky na studenta

Znalosti studentů jsou ověřovány prostřednictví realizace bodovaných úkolů na cvičeních, vypracování analýzy dat a implementace některé z probíraných metod v rámci samostatné práce.

E-learning

Další požadavky na studenta

Další požadavky na studenta nejsou kladeny.

Prerekvizity

Předmět nemá žádné prerekvizity.

Korekvizity

Předmět nemá žádné korekvizity.

Osnova předmětu

Přednášky: Explorativní analýza dat 1. Hledání pravidel v datech, Hledání vzorů v datech 2. Shlukování pomocí reprezentantů, Hierarchické shlukování 3. Shlukování založené na hustotě dat, Validace shluků 4. Samo organizující se mapy 5. Detekce Anomálií Klasifikace dat 6. Lineární klasifikátory (Lineární diskriminační analýza, Naive Bayes, Logistická regrese) 7. Rozhodovací stromy, Náhodné lesy 8. Support Vector Machine, Kernelové metody 9. Neuronové sítě (Perceptron, Feed forward NN+Back propagation) 10. Regresní metody 11. Pokročilé metody v klasifikaci dat 12. Validace klasifikačních algoritmů Pokročilé metody 13. Analýza streamových dat 14. Vizualizace vektorových dat Cvičení na počítačové učebně: Explorativní analýza dat a učení bez učitele 1. Implementace metody APRIORI pro hledání pravidel v datech. 2. Dokončení implementace metody APRIORI nad daty. 3. Implementace hierarchického shlukování – Aglomerátivní shlukování. 4. Implementace algoritmu DBSCAN. 5. Validace shluků vytvořených implementovanými algoritmy. 6. Ukázka metody Samoorganizujích map Klasifikace dat 7. Implementace metod pro výběr atributů. 8. Implementace rozhodovacího 9. Implementace metody Naive Bayes. 10. Otestování metody Support Vector Machine v programu. 11. Implementace jednoduchého perceptronu 12. Hodnocení klasifikátorů 13. Implementace Regresního stromu 14. Vizualizace dat

Podmínky absolvování předmětu

Prezenční forma (platnost od: 2019/2020 zimní semestr, platnost do: 2021/2022 letní semestr)
Název úlohyTyp úlohyMax. počet bodů
(akt. za podúlohy)
Min. počet bodůMax. počet pokusů
Klasifikovaný zápočet Klasifikovaný zápočet 100  51 3
Rozsah povinné účasti: Splnění úkolů zadaných cvičícím.

Zobrazit historii

Podmínky absolvování předmětu a účast na cvičeních v rámci ISP:

Zobrazit historii

Výskyt ve studijních plánech

Akademický rokProgramObor/spec.Spec.ZaměřeníFormaJazyk výuky Konz. stř.RočníkZLTyp povinnosti
2021/2022 (N0688A140014) Průmysl 4.0 AZD P čeština Ostrava 1 povinný stu. plán
2020/2021 (N0688A140014) Průmysl 4.0 AZD P čeština Ostrava 1 povinný stu. plán
2019/2020 (N0688A140014) Průmysl 4.0 AZD P čeština Ostrava 1 povinný stu. plán

Výskyt ve speciálních blocích

Název blokuAkademický rokForma studiaJazyk výuky RočníkZLTyp blokuVlastník bloku

Hodnocení Výuky



2021/2022 zimní
2020/2021 zimní