460-4025/01 – Metody analýzy dat (MAD)
Garantující katedra | Katedra informatiky | Kredity | 5 |
Garant předmětu | prof. RNDr. Václav Snášel, CSc. | Garant verze předmětu | prof. RNDr. Václav Snášel, CSc. |
Úroveň studia | pregraduální nebo graduální | Povinnost | volitelný odborný |
Ročník | 1 | Semestr | letní |
| | Jazyk výuky | čeština |
Rok zavedení | 2010/2011 | Rok zrušení | 2014/2015 |
Určeno pro fakulty | FEI | Určeno pro typy studia | navazující magisterské |
Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi
Absolvent předmětu získá následující znalosti a dovednosti:
teoretické základy metod pro analýzu dat,
implementace a aplikace vybraných metod,
praktické použití metod analýzy dat na reálných problémech,
aplikace vybraných softwarových balíků pro analýzu dat,
vizualizaci a analýzy výsledků
Vyučovací metody
Přednášky
Individuální konzultace
Cvičení (v učebně)
Projekt
Anotace
Při řešení výzkumných i praktických úloh vzniká často problém s vyhodnocením a interpretací informací, které poskytují naměřená či evidovaná data z praxe. Metody analýzy dat, zvané též metody dolování znalostí z dat, seznamují studenty s řadou matematických, statistických a logických metod pro řešení této třídy výzkumných i praktických problémů. Jsou probrány metody hledající několik typů asociací, metody shlukovací, metody klasifikační a některé další metody.
Studenti jsou dále informováni je o některých programových balících pro řešení těchto úloh. V posledních letech se tyto metody výrazně uplatňují při dolování znalostí z informací uložených v rozsáhlých databázích.
Povinná literatura:
H. Řezanková, D. Húsek, V. Snášel, Shluková analýza dat Druhé rozšířené vydání, Professional Publishing, 2009.
D. Skillicorn, Understanding Complex datasets: data mining with matrix decompositions, Chapman & Hall/CRC, 2007.
Han Jiawei; Kamber Micheline; Pei Jian, Data Mining, The Morgan Kaufmann Series in Data Management Systems, 3rd edition, 2011.
Doporučená literatura:
Eldén, L., Matrix Methods in Data Mining and Pattern Recognition, SIAM 2007.
T. Hastie, R. Tibshirani and J. Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer; Corr. 3rd edition, 2009.
Forma způsobu ověření studijních výsledků a další požadavky na studenta
Průběžná kontrola studia:
Zpracování tématu dolování znalostí z vlastních dat.
Podmínky udělení zápočtu:
Splnění všech tří bodů průběžné kontroly studia, každý minimálně na 10 bodů.
E-learning
Další požadavky na studenta
Další požadavky na studenta nejsou kladeny.
Prerekvizity
Předmět nemá žádné prerekvizity.
Korekvizity
Předmět nemá žádné korekvizity.
Osnova předmětu
Přednášky:
Vymezení problémů analýzy mnohorozměrných dat.
Metody analýzy dat: matematická statistika a explorační analýza dat. Vstupní data, typy dat z hlediska formálního a významového. Filtrace,
chybějící údaje, dichotomizace, kategorizace
Předzpracování dat, transformace. Normalizace, standardizace. Metoda hlavních komponent.
Shluková analýza, metody nehierarchické, metody hierarchické, prezentace a interpretace výsledků.
Hledání asociací, automatická tvorba hypotéz, prezentace a interpretace výsledků.
Konstrukce rozhodovacího stromu, prezentace a interpretace.
Cvičení:
Procvičování metod z přednášek na příkladech konkrétních dat.
Referáty o nových metodách dolování z dat.
Referáty o výsledcích vlastní analýzy.
Projekty:
Analýza konkrétních dat z vlastní praxe nebo z databáze.
Předzpracování, výběr vhodných metod.
Vlastní výpočty, interpretace.
Prezentace výsledků, dokumentace.
Počítačové laboratoře:
Programový systém pro analýzu dat, ovládání, metody, prezentace výsledků, využití.
Podmínky absolvování předmětu
Výskyt ve studijních plánech
Výskyt ve speciálních blocích
Hodnocení Výuky