: Difference between revisions
From HLT@INESC-ID
No edit summary |
No edit summary |
||
Line 16: | Line 16: | ||
[[category:Seminars]] | [[category:Seminars]] | ||
[[category:Seminars 2000]] |
Latest revision as of 15:26, 7 July 2006
Date
- July 6, 2000
Speaker
Abstract (in Portuguese)
A metodologia mais utilizada em reconhecimento de fala consiste em modelos de Markov não observáveis (hidden markov models HMMs). Apesar de a teoria subjacente a essa metodologia ser bem conhecida e permitir a utilização de algoritmos simples para reconhecer a locução, os sistemas de reconhecimento para fala contínua e vocabulário extenso são extremamente complexos, necessitando de integrar informação a diversos níveis, tais como: estados do HMM, fones, fones dependentes do contexto, léxico de pronuncia, modelos de linguagem, etc.
Nesta apresentação será apresentado um reconhecedor que utiliza a algebra dos transdutores de estado finito (FST) para integrar múltiplas fontes de informação num única passagem. O reconhecedor é baseado na propagação de conjuntos de hipóteses de reconhecimento, podendo funcionar quer de modo síncrono no tempo quer de modo assíncrono.
A apresentação será constituída por duas partes: inicialmente será descrito o problema do reconhecimento e serão focados os principais algoritmos utilizados tradicionalmente, na segunda parte será apresentado o reconhecedor e o trabalho realizado nesta área no grupo de processamento da fala do INESC.