From HLT@INESC-ID

Revision as of 02:38, 16 February 2006 by Root (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Date

  • July 6, 2000

Speaker

Abstract (in Portuguese)

A metodologia mais utilizada em reconhecimento de fala consiste em modelos de Markov não observáveis (hidden markov models HMMs). Apesar de a teoria subjacente a essa metodologia ser bem conhecida e permitir a utilização de algoritmos simples para reconhecer a locução, os sistemas de reconhecimento para fala contínua e vocabulário extenso são extremamente complexos, necessitando de integrar informação a diversos níveis, tais como: estados do HMM, fones, fones dependentes do contexto, léxico de pronuncia, modelos de linguagem, etc.

Nesta apresentação será apresentado um reconhecedor que utiliza a algebra dos transdutores de estado finito (FST) para integrar múltiplas fontes de informação num única passagem. O reconhecedor é baseado na propagação de conjuntos de hipóteses de reconhecimento, podendo funcionar quer de modo síncrono no tempo quer de modo assíncrono.

A apresentação será constituída por duas partes: inicialmente será descrito o problema do reconhecimento e serão focados os principais algoritmos utilizados tradicionalmente, na segunda parte será apresentado o reconhecedor e o trabalho realizado nesta área no grupo de processamento da fala do INESC.

Retrieved from ""