460-4107/01 – Analýza obrazu II (ANO II)
Garantující katedra | Katedra informatiky | Kredity | 4 |
Garant předmětu | Ing. Radovan Fusek, Ph.D. | Garant verze předmětu | Ing. Radovan Fusek, Ph.D. |
Úroveň studia | pregraduální nebo graduální | Povinnost | povinně volitelný typu B |
Ročník | 2 | Semestr | zimní |
| | Jazyk výuky | čeština |
Rok zavedení | 2015/2016 | Rok zrušení | |
Určeno pro fakulty | FEI | Určeno pro typy studia | navazující magisterské |
Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi
Cílem předmětu je seznámit posluchače s moderními metodami analýzy obrazu, které mohou být využity zejména pro detekci a rozpoznání objektů. Nedílnou součástí je také aplikace těchto technik do reálného prostředí (například detekce lidských tváří, lokalizace chodců nebo detekce automobilů v obrazech).
Vyučovací metody
Přednášky
Cvičení (v učebně)
Anotace
Jsou probírána následující témata: Moderní metody detekce a rozpoznání objektů v obrazech. Typicky se jedná o postupy založené na obrazových příznacích v kombinaci s metodami strojového učení. Probírány budou také principy hlubokého učení a konvolučních neuronových sítí a jejich aplikace v problémech obrazové detekce automobilů, chodců, lidských tváří.
Povinná literatura:
1. Chollet, F.: Deep Learning with Python. Manning, ISBN-13: 978-1617294433, 2017
2. Gonzalez, R. C., Woods, R. E.: Digital image processing, New York, NY: Pearson, ISBN-13: 978-0133356724, 2018
3. Zhang, A., Lipton, Z.C., Li, M., Smola, A.J.: Dive into Deep Learning, https://d2l.ai, 2020
Doporučená literatura:
1. E. Sojka, J. Gaura, and M. Krumnikl, Matematické základy digitálního zpracování obrazu. Ostrava, Plzeň: VŠB-TU Ostrava (Fakulta elektrotechniky a informatiky), Západočeská univerzita v Plzni, 2. vydání ed., 2011.
2. Burger, W., Burge, M., J.: Principles of Digital Image Processing: Fundamental Techniques, Springer, ISBN-10: 1848001908, ISBN-13: 978-1848001909, 2011
3. Brahmbhatt, S.: Practical OpenCV (Technology in Action), Apress, ISBN-10: 1430260793, ISBN-13: 978-1430260790, 2013
4. Gary Bradski, Adrian Kaehler: Learning OpenCV 3: Computer Vision in C++ with the OpenCV Library, O'Reilly Media, 2017
Forma způsobu ověření studijních výsledků a další požadavky na studenta
Podmínky udělení zápočtu:
Vypracování úloh, které jsou součástí programu cvičení.
Zkouška - písemný test.
E-learning
Další požadavky na studenta
Další požadavky na studenta nejsou kladeny.
Prerekvizity
Korekvizity
Předmět nemá žádné korekvizity.
Osnova předmětu
Přednášky:
* Základní pojmy z oblasti detekce objektů v obrazech, metoda posuvného okna.
* Metody detekce tváří v obrazech. Příznaky typu Haar. Lokální binární vzory, histogramy orientovaných gradientů a jejich využití pro analýzu objektů. Metody detekce chodců v obrazech.
* Konvoluční neuronové sítě (základní principy, popis vrstev). Moderní varianty konvolučních neuronových sítí (například VGGNet, GoogLeNet, ResNet).
* Lokalizační metody založené na konvolučních sítí (například R-CNN, Faster R-CNN, YOLO, SSD).
* Popis generativních sítí (DCGAN), sítě typu encoder-decoder, sítě typu transformer.
* Obrazové deskriptory, detektory zájmových bodů v obrazech (metoda SIFT).
* Optické systémy v oblasti samořiditelných vozidel, zpracování obrazů v IR spektru, zpracování lidarových obrazů, analýza hloubkových obrazů, využití hloubkových senzorů (RealSense, Kinect).
Cvičení (PC učebna):
* Vytvoření základní kostry detektoru pro zvolený zájmový objekt, implementace metody posuvného okna, příprava dat pro trénovací a testovací fázi detektoru.
* Detekce založená na příznacích typu Haar, detekce pomocí lokálních binárních vzorů, analýza objektů pomocí gradientů (metoda HOG), využití obrazových deskriptorů (metoda SIFT).
* Základní použití konvolučních neuronových sítí, experimentování s parametry konvolučních sítí.
* Využití různých typů konvolučních sítí v rozpoznání (například VGGNet, GoogLeNet, ResNet), experimentování s vytvořenými detektory, porovnání detektorů.
* Praktické využití lokalizačních metod založených na konvolučních sítí (například R-CNN, Faster R-CNN, YOLO).
* Praktické využití generativních sítí (DCGAN), sítě typu encoder-decoder, sítě typu transformer.
* Analýza objektů v IR a v hloubkových obrazech (RealSense, Kinect).
Podmínky absolvování předmětu
Výskyt ve studijních plánech
Výskyt ve speciálních blocích
Hodnocení Výuky