460-4099/01 – Metody analýzy dat III (MAD III)

Garantující katedraKatedra informatikyKredity4
Garant předmětudoc. Ing. Jan Platoš, Ph.D.Garant verze předmětudoc. Ing. Jan Platoš, Ph.D.
Úroveň studiapregraduální nebo graduálníPovinnostpovinně volitelný
Ročník2Semestrzimní
Odkaz na webJazyk výukyčeština
Rok zavedení2015/2016Rok zrušení
Určeno pro fakultyUSP, FEIUrčeno pro typy studianavazující magisterské
Výuku zajišťuje
Os. čís.JménoCvičícíPřednášející
PLA06 doc. Ing. Jan Platoš, Ph.D.
Rozsah výuky pro formy studia
Forma studiaZp.zak.Rozsah
prezenční Klasifikovaný zápočet 2+2
kombinovaná Klasifikovaný zápočet 10+0

Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi

Cílem předmětu je prohloubit a upřesnit znalosti metod pro analýzu dat získané v předchozích semestrech. Hlavními znalostmi, které budou studentům předány, jsou pokročilé algoritmy pro klasifikaci dat, zpracování streamových dat, pokročilých datových struktur a technik machine learningu. Studenti budou schopni tyto metody využít, budou schopni správně interpretovat dosažené výsledky a také data a výsledky vhodnými metodami prezentovat a vizualizovat.

Vyučovací metody

Přednášky
Cvičení (v učebně)

Anotace

V předmětu se studenti obeznámí s metodami pro analýzu vektorových dat. V první části předmětu se budou zabývat analýzou dat bez učitele. Jedná se zejména o hledání pravidel a shlukování dat. Ve druhé části pak bude hlavní náplní klasifikace dat. Výklad bude veden o jednodušších metod lineární klasifikace k metodám založeným na SVM a neuronových sítí. V rámci posledních přednášek pak budou vysvětleny pokročilé metody klasifikace dat, analýzu streamových dat a vizualizaci. Na cvičeních pak studenti získají znalosti o jednotlivých metodách díky jejich implementaci a/nebo ověření jejich funkčnosti ve zvoleném nástroji.

Povinná literatura:

Prezentace k přednáškám Ian H. Witten, Eibe Frank, Mark A. Hall, Data Mining: Practical Machine Learning Tools and Techniques, Third Edition, Morgan Kaufmann, 2011, ISBN: 978-0123748560

Doporučená literatura:

Mohammed J. Zaki, Wagner Meira, Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, May 2014. ISBN: 9780521766333. Jure Leskovec, Anand Rajaraman, David Ullman, Mining of Massive Datasets, 2nd editions, Cambridge University Press, Novemeber 2014, ISBN: 9781107077232, On-line http://infolab.stanford.edu/~ullman/mmds/book.pdf [2014-09-12]

Způsob průběžné kontroly znalostí během semestru

E-learning

Další požadavky na studenta

Další požadavky na studenta nejsou kladeny.

Minimální znalostní požadavky

Prerekvizity

Předmět nemá žádné prerekvizity.

Korekvizity

Předmět nemá žádné korekvizity.

Osnova předmětu

Explorativní analýza dat 1. Hledání pravidel v datech, Hledání vzorů v datech 2. Shlukování pomocí reprezentantů, Hierarchické shlukování 3. Shlukování založené na hustotě dat, Validace shluků 4. Samo organizující se mapy 5. Detekce Anomálií Klasifikace dat 6. Lineární klasifikátory (Lineární diskriminační analýza, Naive Bayes, Logistická regrese) 7. Rozhodovací stromy, Náhodné lesy 8. Support Vector Machine, Kernelové metody 9. Neuronové sítě (Perceptron, Feed forward NN+Back propagation) 10. Regresní metody 11. Pokročilé metody v klasifikaci dat 12. Validace klasifikačních algoritmů Pokročilé metody 13. Analýza streamových dat 14. Vizualizace vektorových dat Cvičení na počítačové učebně: Explorativní analýza dat a učení bez učitele 1. Implementace metody APRIORI pro hledání pravidel v datech. 2. Dokončení implementace metody APRIORI nad daty. 3. Implementace hierarchického shlukování – Aglomerátivní shlukování. 4. Implementace algoritmu DBSCAN. 5. Validace shluků vytvořených implementovanými algoritmy. 6. Ukázka metody Samoorganizujích map Klasifikace dat 7. Implementace metod pro výběr atributů. 8. Implementace rozhodovacího 9. Implementace metody Naive Bayes. 10. Otestování metody Support Vector Machine v programu. 11. Implementace jednoduchého perceptronu 12. Hodnocení klasifikátorů 13. Implementace Regresního stromu 14. Vizualizace dat

Podmínky absolvování předmětu

Prezenční forma (platnost od: 2015/2016 zimní semestr, platnost do: 2017/2018 zimní semestr)
Název úlohyTyp úlohyMax. počet bodů
(akt. za podúlohy)
Min. počet bodů
Klasifikovaný zápočet Klasifikovaný zápočet 100  51
Rozsah povinné účasti: Splnění úkolů zadaných cvičícím.

Zobrazit historii

Výskyt ve studijních plánech

Akademický rokProgramOborSpec.FormaJazyk výuky Konz. stř.RočníkZLTyp povinnosti
2018/2019 (N2647) Informační a komunikační technologie (1801T064) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2018/2019 (N2658) Výpočetní vědy (2612T078) Výpočetní vědy P čeština Ostrava 2 povinně volitelný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (1801T064) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2017/2018 (N2658) Výpočetní vědy (2612T078) Výpočetní vědy P čeština Ostrava 2 povinně volitelný stu. plán
2016/2017 (N2658) Výpočetní vědy (2612T078) Výpočetní vědy P čeština Ostrava 2 povinně volitelný stu. plán
2016/2017 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2016/2017 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán
2016/2017 (N2647) Informační a komunikační technologie (1801T064) Informační a komunikační bezpečnost P čeština Ostrava 2 volitelný odborný stu. plán
2015/2016 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 2 povinně volitelný stu. plán
2015/2016 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 2 povinně volitelný stu. plán

Výskyt ve speciálních blocích

Název blokuAkademický rokForma studiaJazyk výuky RočníkZLTyp blokuVlastník bloku