Identificação de sotaques Portugueses

From HLT@INESC-ID

Revision as of 18:53, 6 October 2006 by David (Talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Orientação

Objectivo

Descrição

A aplicação de um sistema de reconhecimento automático treinado para o Português Europeu a um noticiário televisivo falha drasticamente sempre que a língua de origem é diferente, e, embora não tão dPrasticamente, sempre que o sotaque (ou melhor, a "variante") da língua é diferente.

O objectivo deste trabalho é o desenvolvimento de um sistema de identificação de língua/variante que funcione como pré-processamento para um sistema de reconhecimento automático de fala aplicado a noticiários televisivos, de forma a identificar as locuções que necessitem de um reconhecedor diferente.

Muitos sistemas de identificação da língua exploram características fonotácticas (sequência de fones típicas nas diferentes línguas), frequentemente combinadas com pistas prosódicas (ritmo, entoação). Este será o tipo de abordagem estatística desenvolvida neste trabalho.

A primeira parte do trabalho terá como objectivo a identificação da língua. Posteriormente, desenvolver-se-ão técnicas de identificação do sotaque (Europeu, Brasileiro e, caso esteja já disponível, oriundo de vários países africanos de língua oficial Portuguesa).

Outros Dados

  • Ano lectivo: 2006/2007
  • Unidades curriculares: