546-0182/02 – Metody zpracování a analýzy dat (MAD)

Garantující katedraKatedra environmentálního inženýrstvíKredity6
Garant předmětuMgr. Oldřich Motyka, Ph.D.Garant verze předmětuMgr. Oldřich Motyka, Ph.D.
Úroveň studiapregraduální nebo graduálníPovinnostpovinný
Ročník1Semestrzimní
Jazyk výukyangličtina
Rok zavedení2022/2023Rok zrušení
Určeno pro fakultyHGFUrčeno pro typy studianavazující magisterské, bakalářské
Výuku zajišťuje
Os. čís.JménoCvičícíPřednášející
MOT127 Mgr. Oldřich Motyka, Ph.D.
Rozsah výuky pro formy studia
Forma studiaZp.zak.Rozsah
prezenční Zápočet a zkouška 3+3
kombinovaná Zápočet a zkouška 12+12

Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi

Studenti se naučí analyzovat a hodnotit kvantitativní, semikvantitativní i kvalitativní data. Budou schopni tato data správně popsat a vizualizovat s využitím deskriptivní statistiky, identifikovat a ověřit chybné a odlehlé hodnoty a rozdělení, z něhož data pocházejí. Rovněž budou schopni formulovat statistickou hypotézu, použít vhodné testové statistiky a správně interpretovat výsledky. Získají rovněž dovednosti v rámci korelační a regresní analýzy dat, mnohorozměrné analýzy a prostorové analýzy dat.

Vyučovací metody

Přednášky
Cvičení (v učebně)

Anotace

Studenti budou seznámeni se způsoby přípravy vzorkovacího plánu, sběru, úpravy a hodnocení dat. Naučí se správně používat a interpretovat statistické metody s ohledem na specifika konkrétních typů dat. Práce s daty bude probíhat pomocí programu R a jeho knihoven.

Povinná literatura:

DROZD, Pavel, 2007. Cvičení z biostatistiky: Základy práce se softwarem R. Ostrava: Ostravská univerzita v Ostravě. Dostupné z WWW: cran.r-project.org/doc/contrib/CviceniR1.pdf SPIWOK, Vojtěch, 2015. Statistická analysa dat v R. Praha: VŠCHT Dostupné z WWW: https://web.vscht.cz/~spiwokv/statistika/skripta.pdf LEPŠ, Jan a Petr ŠMILAUER, 2016. Biostatistika: Základy práce se softwarem R. České Budějovice: Nakladatelství Jihočeské univerzity v Českých Budějovicích. ISBN 978-80-7394-587-9 HOTHORN, Torsten a Brian EVERITT, c2014. A handbook of statistical analyses using R. 3rd ed. Boca Raton: CRC Press. Spatial analytics and GIS (Sage). ISBN 978-148-2204-582

Doporučená literatura:

PUNCH, Keith, 2008. Základy kvantitativního šetření. Praha: Portál. Biomedicínská statistika. ISBN 978-80-7367-381-9 ZVÁRA, Karel, 2013. Biomedicínská statistika IV: Základy statistiky v prostředí R. Praha: Karolinum. Biomedicínská statistika. ISBN 978-80-2462-245-3 HENDL, Jan a Petr ŠMILAUER, 2014. Statistika v aplikacích. Praha: Portál. Biomedicínská statistika. ISBN ISBN978-80-262-0700-9 ZELTERMAN, Daniel, 2015. Applied multivariate statistics with R. Cham: Springer. Statistics for biology and health (Springer). ISBN 978-3-319-14093-3

Forma způsobu ověření studijních výsledků a další požadavky na studenta

Student zajistí svá vlastní data, součástí zkoušky je diskuse o jejich možné analýze. Předmět je ukončen kombinovanou zkouškou.

E-learning

Další požadavky na studenta

Aktivní účast na cvičení.

Prerekvizity

Předmět nemá žádné prerekvizity.

Korekvizity

Předmět nemá žádné korekvizity.

Osnova předmětu

1. Příprava vzorkovacího plánu, uchovávání a ukládání dat. 2. Typy dat – kvantitativní a kvalitativní data, popis, charakteristiky polohy a variability, vizualizace, identifikace odlehlých hodnot. 3. Testování hypotéz – nulová a alternativní hypotéza, chyby I. a II. druhu, statistický test a jeho síla, p – hodnota. 4. Úvod do práce v programu R a v rozhraní R Studio. Vytváření projektů, vkládání dat, grafické výstupy. 5. Jednovýběrové a dvouvýběrové testy – parametrické a neparametrické metody. Analýza kategoriálních dat – chí-kvadrát a Fisherův test. 6. Analýza rozptylu (ANOVA)- hodnocení rozptylu, hodnocení normality, Kruskal-Wallisův test – neparametrická alternativa analýzy rozptylu. 7. Korelační analýza – Pearsonův a Spearmanův korelační koeficient, míry podobnosti dat (koeficienty podobnosti, koeficienty korelace, kovariance). 8. Regresní analýza – lineární regrese, předpoklady lineárního modelu, odhad parametrů regresního modelu, koeficient determinace, statistické testy. 9. Regresní analýza – polynomiální regrese, statistické testy, analýza reziduí regresních analýz. 10. Vícenásobná lineární regrese – typy interakcí proměnných, multikolinearita, problém chybějících dat, aplikace. 11. Problematika prostorových dat, autokorelace, vzorkování, analýza, lokální a globální statistiky. 12. Mnohorozměrná analýza dat – principy, předpoklady a úprava dat před analýzou. 13. Explorativní analýzy, analýza hlavních komponent (PCA), mnohonásobná korespondenční analýza (MCA), analýza smíšených dat (FAMD), shluková analýza

Podmínky absolvování předmětu

Prezenční forma (platnost od: 2022/2023 zimní semestr)
Název úlohyTyp úlohyMax. počet bodů
(akt. za podúlohy)
Min. počet bodůMax. počet pokusů
Zápočet a zkouška Zápočet a zkouška 100 (100) 51
        Zápočet Zápočet  
        Zkouška Zkouška 100  51 3
Rozsah povinné účasti: - povinná účast na cvičeních - prokázání schopnosti analyzovat data na příkladu vlastních dat - s komentářem - prezenční zkouška - písemná a ústní část

Zobrazit historii

Podmínky absolvování předmětu a účast na cvičeních v rámci ISP: - vypracování seminární práce na zadané téma - po konzultaci se studentem - prokázání schopnosti analyzovat data na příkladu vlastních dat - s komentářem - prezenční zkouška - písemná a ústní část

Zobrazit historii

Výskyt ve studijních plánech

Akademický rokProgramObor/spec.Spec.ZaměřeníFormaJazyk výuky Konz. stř.RočníkZLTyp povinnosti
2024/2025 (N0532A330044) Geoinformatika P angličtina Ostrava 1 povinný stu. plán
2023/2024 (N0532A330044) Geoinformatika P angličtina Ostrava 1 povinný stu. plán

Výskyt ve speciálních blocích

Název blokuAkademický rokForma studiaJazyk výuky RočníkZLTyp blokuVlastník bloku

Hodnocení Výuky

Předmět neobsahuje žádné hodnocení.