Pontuação e capitalização em transcrições de fala

From HLT@INESC-ID

Fernando Batista

Date

  • September 29, 2006

Speaker

Abstract (in Portuguese)

Serão apresentadas algumas experiências realizadas ao longo dos últimos dois meses, no sentido de inserir a pontuação e fazer a correcta grafia a maiúscula (capitalização) em textos provenientes de um reconhecedor de fala. O objectivo do trabalho consiste em avaliar o desempenho dos métodos automáticos na execução destas tarefas e perceber de que forma se podem optimizar.

Até ao momento foram feitas experiências utilizando o toolkit SRILM e transdutores. O trabalho ainda não se encontra concluído, pelo que a apresentação se centrará em descrever a metodologia que está a ser empregue, em que condições e os diversos obstáculos que têm surgido.