440-4224/01 – Zpracování řečového signálu (ZŘS)

Garantující katedraKatedra telekomunikační technikyKredity4
Garant předmětuIng. Jaromír Továrek, Ph.D.Garant verze předmětuIng. Jaromír Továrek, Ph.D.
Úroveň studiapregraduální nebo graduálníPovinnostvolitelný odborný
Ročník2Semestrzimní
Jazyk výukyčeština
Rok zavedení2016/2017Rok zrušení
Určeno pro fakultyFEIUrčeno pro typy studianavazující magisterské
Výuku zajišťuje
Os. čís.JménoCvičícíPřednášející
PAR0038 Ing. Pavol Partila, Ph.D.
SKA109 Ing. Jan Skapa, Ph.D.
TOV020 Ing. Jaromír Továrek, Ph.D.
Rozsah výuky pro formy studia
Forma studiaZp.zak.Rozsah
prezenční Zápočet a zkouška 2+2
kombinovaná Zápočet a zkouška 2+8

Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi

Po absolvování předmětu budou studenti schopni samostatně řešit úlohy z oblasti zpracování řečových signálů. Získají přehled o základních přístupech a metodách zpracování řečových signálů, jako jsou extrakce příznaků a jejich zpracování pomocí neuronových sítí či skrytých Markovových modelů. Zvládnou implementovat jednoduchý systém pro identifikaci řečníka či rozpoznání emocí z řečového signálu.

Vyučovací metody

Přednášky
Cvičení (v učebně)
Experimentální práce v laboratoři

Anotace

Oblast zpracování řečových signálů patří k důležitým oblastem informačních a komunikačních technologií a kurz si klade za cíl připravit studenta na praktické zvládnutí úloh, kterými jsou SI (Speaker Identification), ASR (Automatic Speech Recognition), TTS (Text to Speech) a SER (Speaker Emotion Recognition). Získané dovednosti najdou uplatnění při návrhu a implementaci komplexních systémů, kde se zpracování řečových signálů využívá.

Povinná literatura:

PSUTKA, Josef. Mluvíme s počítačem česky. Praha: Academia, 2006. ISBN 80-200-1309-1.

Doporučená literatura:

PSUTKA, Josef. Komunikace s počítačem mluvenou řečí. Praha: Academia, 1995. ISBN 80-200-0203-0.

Forma způsobu ověření studijních výsledků a další požadavky na studenta

Test (0-15) bodů Projekt (0-25) bodů

E-learning

http://lms.vsb.cz/

Další požadavky na studenta

Žádné další požadavky na studenta nejsou kladeny.

Prerekvizity

Předmět nemá žádné prerekvizity.

Korekvizity

Předmět nemá žádné korekvizity.

Osnova předmětu

Osnova přednášek 1. Úvod do předmětu a oblasti zpracování řečových signálů, základní úlohy a praktická aplikace jejich použití. 2. Tvorba řeči, základní pojmy, reprezentace a předzpracování signálu (DC Offset, preemfáze, segmentace, váhování). 3. Základní parametry - Energie, průchody nulou (ZCR), Jitter, Shimmer, teorie autokorelace. 4. Analýza řečového signálu - způsoby určování základního tónu řeči F0 a rozpoznání souhlásek znělých od neznělých a další využítí F0. 5. Spektrum, spektrogram, spektrální analýza samohlásek a souhlásek. 6. Kepstrum, kepstrální analýza, Mel-frekvenční kepstrální koeficienty a další parametry řeči. 7. Úvod do klasifikace a využití SOM, k-NN, GMM, ANN a fúze klasifikátorů. 8. Rozpoznávání řečníka (SI) a možné přístupy k řešení. 9. Rozpoznávání emočního stavu řečníka (SER), projevy emocí v posuvu F0, rozpoznání stresu. 10. Rozpoznávání řeči (ASR) a možné přístupy k řešení 11. Skryté Markovovy modely (HMM), struktura, trénování a jejich využití pro rozpoznávání řeči (Viterbiho algoritmus a token-passing). 12. Metody syntézy řeči a vokodéry. 13. Převod textu do řeči (TTS), aplikace s využitím řečových korpusů a open-source projektů. 14. Současné trendy a poslední poznatky v oblasti zpracování řečových signálů, diskuze. Osnova cvičení 1. Úvod, bezpečnost, podmínky absolvování předmětu 2. Praktické procvičení - předzpracování řečového signálu v prostředí – odstranění stejnosměrné složky, preemfáze, segmentace, váhování oknem 3. Praktické procvičení - Extrakce základních (skalárních) řečových parametrů – energie, počet průchodů nulou, základní frekvence 4. Praktické procvičení - Spektrální analýza řečového signálu 5. Praktické procvičení - Extrakce vektorových příznaků – MFCC, LPC 6. Test a zadání semestrálních projektů 7. Návrh systému pro rozpoznávání řečníka - GMM, ANN 8. Ukázka vypracování projektu 9. Návrh systému pro rozpoznávání emočního stavu - GMM, ANN 10. Návrh systému pro rozpoznávání řeči - DTW, HMM 11. Syntéza řeči 12. Fúze klasifikátorů 13. Prezentace projektů

Podmínky absolvování předmětu

Kombinovaná forma (platnost od: 2017/2018 zimní semestr)
Název úlohyTyp úlohyMax. počet bodů
(akt. za podúlohy)
Min. počet bodů
Zápočet a zkouška Zápočet a zkouška 100 (100) 51
        Zápočet Zápočet 36  20
        Zkouška Zkouška 64  15
Rozsah povinné účasti:

Zobrazit historii

Výskyt ve studijních plánech

Akademický rokProgramObor/spec.Spec.ZaměřeníFormaJazyk výuky Konz. stř.RočníkZLTyp povinnosti
2021/2022 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika P čeština Ostrava 2 volitelný odborný stu. plán
2021/2022 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika K čeština Ostrava 2 volitelný odborný stu. plán
2021/2022 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie P čeština Ostrava 2 volitelný odborný stu. plán
2021/2022 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie K čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika P čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie P čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika K čeština Ostrava 2 volitelný odborný stu. plán
2020/2021 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie K čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika P čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie P čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika K čeština Ostrava 2 volitelný odborný stu. plán
2019/2020 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie K čeština Ostrava 2 volitelný odborný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika P čeština Ostrava 2 volitelný odborný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie P čeština Ostrava 2 volitelný odborný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika K čeština Ostrava 2 volitelný odborný stu. plán
2018/2019 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie K čeština Ostrava 2 volitelný odborný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika P čeština Ostrava 2 volitelný odborný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2601T013) Telekomunikační technika K čeština Ostrava 2 volitelný odborný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie P čeština Ostrava 2 volitelný odborný stu. plán
2017/2018 (N2647) Informační a komunikační technologie (2612T059) Mobilní technologie K čeština Ostrava 2 volitelný odborný stu. plán

Výskyt ve speciálních blocích

Název blokuAkademický rokForma studiaJazyk výuky RočníkZLTyp blokuVlastník bloku