460-4070/02 – Business Intelligence and Data Warehouses I (BI I)
Garantující katedra | Katedra informatiky | Kredity | 4 |
Garant předmětu | prof. Ing. Michal Krátký, Ph.D. | Garant verze předmětu | prof. Ing. Michal Krátký, Ph.D. |
Úroveň studia | pregraduální nebo graduální | Povinnost | volitelný odborný |
Ročník | 1 | Semestr | letní |
| | Jazyk výuky | angličtina |
Rok zavedení | 2015/2016 | Rok zrušení | 2022/2023 |
Určeno pro fakulty | FEI | Určeno pro typy studia | navazující magisterské |
Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi
Absolvent je schopen orientace v oblasti Business Intelligence a datových skladů, získá zejména praktické znalosti metod datového modelování datových skladů, ETL procesů datové integrace do datových skladů. Dále pak absolvent umí vytvořit a zná metodiku tvorby reportingových vrstev - data martů pro analytiku a reporting nad daty. Absolvent se orientuje ve výběru operací v databázi datových skladů.
Vyučovací metody
Přednášky
Cvičení (v učebně)
Anotace
Předmět tématicky navazuje na předmět Databázové a informační systémy 2 se zaměřením na jejich využití v oblasti datových skladů a následně Business Intelligence. Obsahem přednášek je objasnění principů datových skladů, specifika datového modelování, návrh jednotlivých datových vrstev datového skladu, datová integrace pomocí skriptování či specifických ETL nástrojů, transformace dat do vrstev datového skladu a následně finální agregace dat pro prezentaci informací v grafické podobě či exportů pro další zpracování, kde navazuje druhá část předmětu v následujícím semestru. Dalším obsahem je metodika návrhu řešení projektů datových skladů a datové integrace. Na cvičeních budou studenti metodiku uvádět do praxe na praktickém příkladu budování datového skladu v prostředí SQL databáze v rámci závěrečné práce.
Povinná literatura:
1. D. Slánský, J. Pour, O. Novotný: Business Intelligence: Jak využít bohatství ve vašich datech. Grada, 256s, 2004.
Doporučená literatura:
1. R. Kimball, M. Ross: The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. 600p, Wiley, 2013.
2. R. Kimball, J. Caserta: The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data. 528p, Wiley, 2004.
3. C. Batini, M. Scannapieco: Data Quality: Concepts, Methodologies and Techniques (Data-Centric Systems and Applications). Springer, 2010.
Forma způsobu ověření studijních výsledků a další požadavky na studenta
Kontrola implementovaných úkolů na cvičeních.
E-learning
Další požadavky na studenta
Požadované znalosti: konceptuální a datové modelování, SQL, procedurální rozšíření SQL, fyzický návrh databáze, zotavení, transakce, souběh, distribuované a NoSQL databáze.
Prerekvizity
Předmět nemá žádné prerekvizity.
Korekvizity
Předmět nemá žádné korekvizity.
Osnova předmětu
1. Představení BI a datových skladů
2. Datové sklady - datové modelování databáze
3. Datové sklady - multidimenzionální modelování, datové vrstvy - staging, hlavní model, prezentační vrstva (view, indexy)
4. Datové sklady - historizace a SCD, využití operačních klíčů
5. Datamart - Datové tržiště
6. Operační datové sklady
7. Datová integrace – ETL (úvod do problematiky)
8. ETL Framework
9. Datová integrace – ETL, transformační předpisy – tvorba ETL
10. Nástroje ETL a datové integrace
11. Business slovníky a transformační pravidla
12. Datová kvalita
13. Analytika nad DWH
Cvičení na počítačové učebně:
1. Plán cvičení + zápočet, představení platformy, ukázkové DB.
2. Modelování tabulek a pohledů v DS.
3. Tvorba vrstev DWH.
4. Historizace dat, indexace dat, tvorba operačních klíčů.
5. Fine tuning – dotazování (tvorba dotazu pro agregace), analytické funkce.
6. Jednoduché datové pumpy.
7. Návrh prostředí ETL frameworku.
8. Definice map + definice data workflow.
9. ETL mapping - kódování.
10. ETL tool - Informatica.
11. ETL tool – IBM DataStage/MS SSIS.
12. Profilování dat, čištění dat, nastavení business pravidel.
13. Zápočtový příklad.
Podmínky absolvování předmětu
Výskyt ve studijních plánech
Výskyt ve speciálních blocích
Hodnocení Výuky
Předmět neobsahuje žádné hodnocení.