440-4224/02 – Zpracování řečového signálu (ZŘS)
Garantující katedra | Katedra telekomunikační techniky | Kredity | 4 |
Garant předmětu | Ing. Jaromír Továrek, Ph.D. | Garant verze předmětu | Ing. Jaromír Továrek, Ph.D. |
Úroveň studia | pregraduální nebo graduální | Povinnost | volitelný odborný |
Ročník | 2 | Semestr | zimní |
| | Jazyk výuky | angličtina |
Rok zavedení | 2016/2017 | Rok zrušení | |
Určeno pro fakulty | FEI | Určeno pro typy studia | navazující magisterské |
Cíle předmětu vyjádřené dosaženými dovednostmi a kompetencemi
Po absolvování předmětu budou studenti schopni samostatně řešit úlohy z oblasti zpracování řečových signálů. Získají přehled o základních přístupech a metodách zpracování řečových signálů, jako jsou extrakce příznaků a jejich zpracování pomocí neuronových sítí či skrytých Markovových modelů. Zvládnou implementovat jednoduchý systém pro identifikaci řečníka či rozpoznání emocí z řečového signálu.
Vyučovací metody
Přednášky
Cvičení (v učebně)
Experimentální práce v laboratoři
Anotace
Oblast zpracování řečových signálů patří k důležitým oblastem informačních a komunikačních technologií a kurz si klade za cíl připravit studenta na praktické zvládnutí úloh, kterými jsou SI (Speaker Identification), ASR (Automatic Speech Recognition), TTS (Text to Speech) a SER (Speaker Emotion Recognition). Získané dovednosti najdou uplatnění při návrhu a implementaci komplexních systémů, kde se zpracování řečových signálů využívá.
Povinná literatura:
Doporučená literatura:
Další studijní materiály
Forma způsobu ověření studijních výsledků a další požadavky na studenta
Test (0-15) bodů
Projekt (0-25) bodů
E-learning
http://lms.vsb.cz/
Další požadavky na studenta
Žádné další požadavky na studenta nejsou kladeny.
Prerekvizity
Předmět nemá žádné prerekvizity.
Korekvizity
Předmět nemá žádné korekvizity.
Osnova předmětu
Osnova přednášek
● Úvod do předmětu a oblasti zpracování řečových signálů, základní úlohy a praktická aplikace jejich použití.
● Tvorba řeči, základní pojmy, reprezentace a předzpracování signálu (DC Offset, preemfáze, segmentace, váhování).
● Základní parametry - Energie, průchody nulou (ZCR), Jitter, Shimmer, teorie autokorelace, F0.
● Spektrum, spektrogram, spektrální analýza samohlásek a souhlásek.
● Kepstrum, kepstrální analýza, Mel-frekvenční kepstrální koeficienty a další parametry řeči.
● Úvod do klasifikace a využití SOM, k-NN, GMM, ANN a fúze klasifikátorů.
● Rozpoznávání řečníka (SI) a možné přístupy k řešení.
● Rozpoznávání emočního stavu řečníka (SER), projevy emocí v posuvu F0, rozpoznání stresu.
● Rozpoznávání řeči (ASR) a možné přístupy k řešení.
● Převod textu do řeči (TTS), aplikace s využitím řečových korpusů a open-source projektů
Osnova cvičení
1. ● Úvod, bezpečnost, podmínky absolvování předmětu.
● Praktické procvičení - předzpracování řečového signálu v prostředí – odstranění stejnosměrné složky, preemfáze, segmentace, váhování oknem.
● Praktické procvičení - Extrakce základních (skalárních) řečových parametrů – energie, počet průchodů nulou, základní frekvence.
● Praktické procvičení - Spektrální analýza řečového signálu.
● Praktické procvičení - Extrakce vektorových příznaků – MFCC, LPC
● Test a zadání semestrálních projektů.
● Návrh systému pro rozpoznávání řečníka - GMM, ANN.
● Ukázka vypracování projektu.
● Syntéza řeči.
● Prezentace projektů.
Podmínky absolvování předmětu
Výskyt ve studijních plánech
Výskyt ve speciálních blocích
Hodnocení Výuky
Předmět neobsahuje žádné hodnocení.