Robustní rozpoznávání řeči

Spolehlivé rozpoznávání běžné řeči obsahující i různé typy rušení je důležitým předpokladem aplikace rozpoznávačů v běžných podmínkách. V našich aktivitách pro zvýšení této spolehlivosti se věnujeme řešení následujících problémů:

  • studiu vlivu a možnosti potlačení aditivního rušení v průběhu parametrizace řeči
  • významným produktem je nástroj CtuCopy, který implementuje různé metody parametrizace (zahrnující i potlačení šumu) a je kompatibilní s celosvětově používanými nástroji HTK a KALDI
  • možnosti eliminace rušení na úrovni akustického modelování, zejména pak na bázi aplikací vhodně zvolené trénovací resp. adaptační techniky
  • jsou také zkoumány vlastnosti speciálních architektur rozpoznávačů řeči jako ANN/HMM, DNN/HMM resp. TANDEM 

Výzkumné skupiny

Laboratoř zpracování řeči

Výzkumné téma

Zpracování signálů

Tým se zabývá analýzou a zpracováním řečového signálu se zaměřením na systémy rozpoznávání řeči a zvýrazňování řeči pro komunikační účely. Jeho aktuální aktivity směřují především k rozpoznávání spojité řeči s velkým slovníkem s užším zaměřením na zpracování narušené řeči z hlučného prostředí nebo spontánních promluv. Zvýrazňování řeči používá při komunikaci z hlučného prostředí nebo při extrakci příznaků pro robustní rozpoznávání šumem narušené řeči.

Za stránku zodpovídá: Ing. Mgr. Radovan Suk