460-4070/01 – Business Intelligence and Data Warehouses I (BI I)

Garantující katedraKatedra informatikyKredity4
Garant předmětudoc. Ing. Michal Krátký, Ph.D.Garant verze předmětudoc. Ing. Michal Krátký, Ph.D.
Úroveň studiapregraduální nebo graduálníPovinnostvolitelný odborný
Ročník1Semestrletní
Odkaz na webJazyk výukyčeština
Rok zavedení2015/2016Rok zrušení
Určeno pro fakultyFEIUrčeno pro typy studianavazující magisterské
Výuku zajišťuje
Os. čís.JménoCvičícíPřednášející
KRA28 doc. Ing. Michal Krátký, Ph.D.
POS073 Michal Pospíšek
Rozsah výuky pro formy studia
Forma studiaZp.zak.Rozsah
prezenční Klasifikovaný zápočet 2+2
kombinovaná Klasifikovaný zápočet 14+0

Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi

Absolvent je schopen orientace v oblasti Business Intelligence a datových skladů, získá zejména praktické znalosti metod datového modelování datových skladů, ETL procesů datové integrace do datových skladů. Dále pak absolvent umí vytvořit a zná metodiku tvorby reportingových vrstev - data martů pro analytiku a reporting nad daty. Absolvent se orientuje ve výběru operací v databázi datových skladů.

Vyučovací metody

Přednášky
Cvičení (v učebně)

Anotace

Předmět tématicky navazuje na předmět Databázové a informační systémy 2 se zaměřením na jejich využití v oblasti datových skladů a následně Business Intelligence. Obsahem přednášek je objasnění principů datových skladů, specifika datového modelování, návrh jednotlivých datových vrstev datového skladu, datová integrace pomocí skriptování či specifických ETL nástrojů, transformace dat do vrstev datového skladu a následně finální agregace dat pro prezentaci informací v grafické podobě či exportů pro další zpracování, kde navazuje druhá část předmětu v následujícím semestru. Dalším obsahem je metodika návrhu řešení projektů datových skladů a datové integrace. Na cvičeních budou studenti metodiku uvádět do praxe na praktickém příkladu budování datového skladu v prostředí SQL databáze v rámci závěrečné práce.

Povinná literatura:

1. D. Slánský, J. Pour, O. Novotný: Business Intelligence: Jak využít bohatství ve vašich datech. Grada, 256s, 2004.

Doporučená literatura:

1. R. Kimball, M. Ross: The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. 600p, Wiley, 2013. 2. R. Kimball, J. Caserta: The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data. 528p, Wiley, 2004. 3. C. Batini, M. Scannapieco: Data Quality: Concepts, Methodologies and Techniques (Data-Centric Systems and Applications). Springer, 2010.

Způsob průběžné kontroly znalostí během semestru

Kontrola implementovaných úkolů na cvičeních.

E-learning

Další požadavky na studenta

Požadované znalosti: konceptuální a datové modelování, SQL, procedurální rozšíření SQL, fyzický návrh databáze, zotavení, transakce, souběh, distribuované a NoSQL databáze.

Minimální znalostní požadavky

Prerekvizity

Předmět nemá žádné prerekvizity.

Korekvizity

Předmět nemá žádné korekvizity.

Osnova předmětu

1. Představení BI a datových skladů 2. Datové sklady - datové modelování databáze 3. Datové sklady - multidimenzionální modelování, datové vrstvy - staging, hlavní model, prezentační vrstva (view, indexy) 4. Datové sklady - historizace a SCD, využití operačních klíčů 5. Datamart - Datové tržiště 6. Operační datové sklady 7. Datová integrace – ETL (úvod do problematiky) 8. ETL Framework 9. Datová integrace – ETL, transformační předpisy – tvorba ETL 10. Nástroje ETL a datové integrace 11. Business slovníky a transformační pravidla 12. Datová kvalita 13. Analytika nad DWH Cvičení na počítačové učebně: 1. Plán cvičení + zápočet, představení platformy, ukázkové DB. 2. Modelování tabulek a pohledů v DS. 3. Tvorba vrstev DWH. 4. Historizace dat, indexace dat, tvorba operačních klíčů. 5. Fine tuning – dotazování (tvorba dotazu pro agregace), analytické funkce. 6. Jednoduché datové pumpy. 7. Návrh prostředí ETL frameworku. 8. Definice map + definice data workflow. 9. ETL mapping - kódování. 10. ETL tool - Informatica. 11. ETL tool – IBM DataStage/MS SSIS. 12. Profilování dat, čištění dat, nastavení business pravidel. 13. Zápočtový příklad.

Podmínky absolvování předmětu

Prezenční forma (platnost od: 2015/2016 zimní semestr)
Název úlohyTyp úlohyMax. počet bodů
(akt. za podúlohy)
Min. počet bodů
Klasifikovaný zápočet Klasifikovaný zápočet 100  51
Rozsah povinné účasti:

Zobrazit historii

Výskyt ve studijních plánech

Akademický rokProgramOborSpec.FormaJazyk výuky Konz. stř.RočníkZLTyp povinnosti
2017/2018 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 1 volitelný odborný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 1 volitelný odborný stu. plán
2016/2017 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 1 volitelný odborný stu. plán
2016/2017 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 1 volitelný odborný stu. plán
2015/2016 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika P čeština Ostrava 1 volitelný odborný stu. plán
2015/2016 (N2647) Informační a komunikační technologie (2612T025) Informatika a výpočetní technika K čeština Ostrava 1 volitelný odborný stu. plán

Výskyt ve speciálních blocích

Název blokuAkademický rokForma studiaJazyk výuky RočníkZLTyp blokuVlastník bloku