Parametrizace řečového signálu

Parametrizace řečového signálu představuje výběr vhodných příznaků pro následnou klasifikaci v dalších stupních rozpoznávacího systému. V této oblasti podrobně studujeme

  • vlastnosti základních technik (MFCC resp. PLP kepstrální koeficienty) v různých podmínkách s drobnými modifikacemi
  • techniky pracujícím s delším kontextem v příznakovém vektoru (TRAP, RASTA, MULTI-RASTA)
  • v rámci posledních aktivit i vlastnosti tzv. artikulačních příznaků
  • ve výše uvedených speciálních technikách jsou využívány neuronové sítě resp. v poslední době stále více se uplatňující hluboké sítě s větším množstvím skrytých vrstev

Výzkumné skupiny

Laboratoř zpracování řeči

Výzkumné téma

Zpracování signálů

Tým se zabývá analýzou a zpracováním řečového signálu se zaměřením na systémy rozpoznávání řeči a zvýrazňování řeči pro komunikační účely. Jeho aktuální aktivity směřují především k rozpoznávání spojité řeči s velkým slovníkem s užším zaměřením na zpracování narušené řeči z hlučného prostředí nebo spontánních promluv. Zvýrazňování řeči používá při komunikaci z hlučného prostředí nebo při extrakci příznaků pro robustní rozpoznávání šumem narušené řeči.

Za stránku zodpovídá: Ing. Mgr. Radovan Suk