Audio Pre-processing and Speech Recognition for Broadcast News

From HLT@INESC-ID

Hugo Meinedo

Date

  • 15:00, February 15, 2008
  • Room 336

Speaker

Abstract

This thesis presents part of the work done in the development of a fully functional prototype system for the selective dissemination of multimedia information. Our media monitoring prototype was developed for Broadcast News (BN) data, specifically for TV news shows. This thesis had four different main tasks: 1. definition and collection of appropriate BN speech resources, 2. development of Automatic Speech Recognition (ASR) acoustic models appropriate for the BN task, 3. development of Audio Pre-Processing (APP) algorithms for partitioning and classifying the audio stream and 4. development of a media monitoring prototype joining the core technologies developed.

Resumo

Pré-processamento do Audio e Reconhecimento de Fala para Transmissões Noticiosas

Nesta tese é apresentado parte do trabalho de desenvolvimento de um protótipo 100% funcional para a disseminação selectiva de informação multimédia. O nosso sistema de monitorização de media foi desenvolvido para transmissões noticiosas, mais especificamente para programas noticiosos televisivos. Esta tese é composta por quatro grandes tarefas distintas: 1. definição e recolha de recursos de fala de transmissões noticiosas televisivas apropriados, 2. desenvolvimento de modelos acústicos para o reconhecimento de fala contínua apropriados para esta tarefa, 3. desenvolvimento de algoritmos para o pré processamento do áudio que permitem particionar e classificar adequadamente o sinal áudio complexo e 4. implementação de um protótipo para monitorização de dados multimédia que juntou com sucesso as tecnologias desenvolvidas.