460-4099/01 – Metody analýzy dat III (MAD III)

Garantující katedraKatedra informatikyKredity4
Garant předmětuprof. Ing. Jan Platoš, Ph.D.Garant verze předmětuprof. Ing. Jan Platoš, Ph.D.
Úroveň studiapregraduální nebo graduálníPovinnostvolitelný odborný
Ročník2Semestrzimní
Jazyk výukyčeština
Rok zavedení2015/2016Rok zrušení2022/2023
Určeno pro fakultyFEI, USPUrčeno pro typy studianavazující magisterské
Výuku zajišťuje
Os. čís.JménoCvičícíPřednášející
PLA06 prof. Ing. Jan Platoš, Ph.D.
PRO0199 Ing. Petr Prokop
Rozsah výuky pro formy studia
Forma studiaZp.zak.Rozsah
prezenční Klasifikovaný zápočet 2+2
kombinovaná Klasifikovaný zápočet 10+0

Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi

Cílem předmětu je prohloubit a upřesnit znalosti metod pro analýzu dat získané v předchozích semestrech. Hlavními znalostmi, které budou studentům předány, jsou pokročilé algoritmy pro klasifikaci dat, zpracování streamových dat, pokročilých datových struktur a technik machine learningu. Studenti budou schopni tyto metody využít, budou schopni správně interpretovat dosažené výsledky a také data a výsledky vhodnými metodami prezentovat a vizualizovat.

Vyučovací metody

Přednášky
Cvičení (v učebně)

Anotace

V předmětu se studenti obeznámí s metodami pro analýzu vektorových dat. V první části předmětu se budou zabývat analýzou dat bez učitele. Jedná se zejména o hledání pravidel a shlukování dat. Ve druhé části pak bude hlavní náplní klasifikace dat. Výklad bude veden o jednodušších metod lineární klasifikace k metodám založeným na SVM a neuronových sítí. V rámci posledních přednášek pak budou vysvětleny pokročilé metody klasifikace dat, analýzu streamových dat a vizualizaci. Na cvičeních pak studenti získají znalosti o jednotlivých metodách díky jejich implementaci a/nebo ověření jejich funkčnosti ve zvoleném nástroji.

Povinná literatura:

1. Prezentace k přednáškám 2. Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Third Edition, Morgan Kaufmann, 2011, ISBN: 978-0123748560

Doporučená literatura:

1. Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, May 2014. ISBN: 9780521766333. 2. Jure Leskovec, Anand Rajaraman, David Ullman, Mining of Massive Datasets, 2nd editions, Cambridge University Press, Novemeber 2014, ISBN: 9781107077232, On-line http://infolab.stanford.edu/~ullman/mmds/book.pdf [2014-09-12]

Další studijní materiály

Forma způsobu ověření studijních výsledků a další požadavky na studenta

Znalosti studentů jsou ověřovány prostřednictví realizace bodovaných úkolů na cvičeních, vypracování analýzy dat a implementace některé z probíraných metod v rámci samostatné práce.

E-learning

Další požadavky na studenta

Další požadavky na studenta nejsou kladeny.

Prerekvizity

Předmět nemá žádné prerekvizity.

Korekvizity

Předmět nemá žádné korekvizity.

Osnova předmětu

Explorativní analýza dat 1. Hledání pravidel v datech, Hledání vzorů v datech 2. Shlukování pomocí reprezentantů, Hierarchické shlukování 3. Shlukování založené na hustotě dat, Validace shluků 4. Samo organizující se mapy 5. Detekce Anomálií Klasifikace dat 6. Lineární klasifikátory (Lineární diskriminační analýza, Naive Bayes, Logistická regrese) 7. Rozhodovací stromy, Náhodné lesy 8. Support Vector Machine, Kernelové metody 9. Neuronové sítě (Perceptron, Feed forward NN+Back propagation) 10. Regresní metody 11. Pokročilé metody v klasifikaci dat 12. Validace klasifikačních algoritmů Pokročilé metody 13. Analýza streamových dat 14. Vizualizace vektorových dat Cvičení na počítačové učebně: Explorativní analýza dat a učení bez učitele 1. Implementace metody APRIORI pro hledání pravidel v datech. 2. Dokončení implementace metody APRIORI nad daty. 3. Implementace hierarchického shlukování – Aglomerátivní shlukování. 4. Implementace algoritmu DBSCAN. 5. Validace shluků vytvořených implementovanými algoritmy. 6. Ukázka metody Samoorganizujích map Klasifikace dat 7. Implementace metod pro výběr atributů. 8. Implementace rozhodovacího 9. Implementace metody Naive Bayes. 10. Otestování metody Support Vector Machine v programu. 11. Implementace jednoduchého perceptronu 12. Hodnocení klasifikátorů 13. Implementace Regresního stromu 14. Vizualizace dat

Podmínky absolvování předmětu

Prezenční forma (platnost od: 2020/2021 zimní semestr, platnost do: 2022/2023 letní semestr)
Název úlohyTyp úlohyMax. počet bodů
(akt. za podúlohy)
Min. počet bodůMax. počet pokusů
Klasifikovaný zápočet Klasifikovaný zápočet 100 (100) 51 3
        Realizace úloh na cvičení Projekt 10  5
        Explorativní analýza Projekt 30  15
        Klasifikace dat Projekt 30  15
        Implementace algoritmu Projekt 30  15
Rozsah povinné účasti: Účast na cvičeních je povinná a je kontrolována. S rozsahem povinné účastí seznámí studenty garant předmětu na začátku semestru.

Zobrazit historii

Podmínky absolvování předmětu a účast na cvičeních v rámci ISP: Splnění všech povinných úkolů v individuálně dohodnutých termínech. Rozsah účasti na cvičeních si student na začátku semestru dohodne s garantem předmětu.

Zobrazit historii

Výskyt ve studijních plánech

Akademický rokProgramObor/spec.Spec.ZaměřeníFormaJazyk výuky Konz. stř.RočníkZLTyp povinnosti
2021/2022 (N0612A140004) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2021/2022 (N0541A170007) Výpočetní a aplikovaná matematika (S01) Aplikovaná matematika P čeština Ostrava 2 volitelný odborný stu. plán
2021/2022 (N0541A170007) Výpočetní a aplikovaná matematika (S02) Výpočetní metody a HPC K čeština Ostrava 2 volitelný odborný stu. plán
2021/2022 (N0541A170007) Výpočetní a aplikovaná matematika (S02) Výpočetní metody a HPC P čeština Ostrava 2 volitelný odborný stu. plán
2021/2022 (N0541A170007) Výpočetní a aplikovaná matematika (S01) Aplikovaná matematika K čeština Ostrava 2 volitelný odborný stu. plán
2021/2022 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2021/2022 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2020/2021 (N0612A140004) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N2647) Informační a komunikační technologie (1801T064) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2020/2021 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2020/2021 (N0541A170007) Výpočetní a aplikovaná matematika (S01) Aplikovaná matematika K čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N0541A170007) Výpočetní a aplikovaná matematika (S02) Výpočetní metody a HPC P čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N0541A170007) Výpočetní a aplikovaná matematika (S01) Aplikovaná matematika P čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N0541A170007) Výpočetní a aplikovaná matematika (S02) Výpočetní metody a HPC K čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N2647) Informační a komunikační technologie (1801T064) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2019/2020 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2019/2020 (N0541A170007) Výpočetní a aplikovaná matematika (S01) Aplikovaná matematika P čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N0541A170007) Výpočetní a aplikovaná matematika (S02) Výpočetní metody a HPC P čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N0541A170007) Výpočetní a aplikovaná matematika (S01) Aplikovaná matematika K čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N0541A170007) Výpočetní a aplikovaná matematika (S02) Výpočetní metody a HPC K čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N0612A140004) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (1801T064) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2018/2019 (N2658) Výpočetní vědy (2612T078) Výpočetní vědy P čeština Ostrava 2 povinně volitelný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (1801T064) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2017/2018 (N2658) Výpočetní vědy (2612T078) Výpočetní vědy P čeština Ostrava 2 povinně volitelný stu. plán
2016/2017 (N2658) Výpočetní vědy (2612T078) Výpočetní vědy P čeština Ostrava 2 povinně volitelný stu. plán
2016/2017 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2016/2017 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2016/2017 (N2647) Informační a komunikační technologie (1801T064) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2015/2016 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2015/2016 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán

Výskyt ve speciálních blocích

Název blokuAkademický rokForma studiaJazyk výuky RočníkZLTyp blokuVlastník bloku

Hodnocení Výuky



2021/2022 zimní
2020/2021 zimní
2019/2020 zimní
2018/2019 zimní
2017/2018 zimní
2016/2017 zimní
2015/2016 zimní