From HLT@INESC-ID
Proposta de Trabalho Final de Curso 2006/2007
Orientação
- Isabel Trancoso (orientador)
- (co-orientador)
Objectivo
Descrição
A saída de um sistema de reconhecimento automático de fala é uma sequência de palavras sem qualquer tipo de pontuação. A marcação das fronteiras de frase e de outros tipos de pontuação é útil para:
- melhorar o desempenho do sistema de reconhecimento propriamente dito;
- permitir diferentes tipos de processamento da dita sequência de palavras (incluindo extracção de informação, sumarização, tradução, identificação de tomadas de palavra em diálogos, etc.);
- aumentar a legibilidade da sequência por um leitor humano.
Por exemplo, num sistema de diálogo falado, há que distinguir quando é que uma pausa sinaliza que o utilizador acabou a frase que pretende comunicar ao sistema, ou quando essa pausa corresponde a uma hesitação ou pausa gramatical.
Outro exemplo da importância da pontuação diz respeito a interrogativas. Numa frase terminada por uma interrogativa-tag como "não é?", tão frequente em fala espontânea, a não inserção do "?" pode distorcer completamente o sentido dessa frase e da seguinte.
Os métodos computacionais para recuperar a pontuação escondida em fala envolvem tipicamente uma combinação de modelos de língua do tipo n-grama e de classificadores prosódicos probabilísticos. Neste trabalho testar-se-ão vários tipos de características, classificadores e métodos de combinação de diferentes fontes de informação. Estudar-se-ão também estratégias para lidar com múltiplas hipóteses de sequências de palavras fornecidas pelo reconhecedor. O tratamento de pausas preenchidas, sobretudo quando delimitadas por longos silêncios, será também objecto de estudo, dado que não devem ser tratadas como separadores de frase.
Outros Dados
- Áreas Científicas:
- Local de trabalho: L²F (INESC-ID Lisboa).