: Difference between revisions

From HLT@INESC-ID

 
Line 21: Line 21:
[[Category:Seminars]]
[[Category:Seminars]]
[[Category:Seminars 2007]]
[[Category:Seminars 2007]]
O objectivo principal deste projecto é criar um sistema de tradução automática de notícias televisivas de Espanhol para Português. A realização deste sistema requer a combinação de duas operações: o reconhecimento da fala das notícias em Espanhol seguida da tradução desse reconhecimento para Português. Começa-se pelo estudo do reconhecedor, com base no sistema de reconhecimento AUDIMUS, desenvolvido no centro de investigação INESC-ID (Instituto de Engenharia de Sistemas de Computadores Investigação e Desenvolvimento) de Lisboa (Portugal), adquirindo e processando material de áudio e texto, construindo um léxico e criando novos modelos acústicos e de linguagem para o reconhecedor de Espanhol. Obteve-se um resultado de avaliação similar a outros sistemas de reconhecimento internacionais e que representam o estado da arte. Para o tradutor baseado na tradução automática estatística, utilizam-se textos paralelos normalizados, para os dois idiomas em estudo, Espanhol e Português, estimam-se os modelos estatísticos, e faz-se uma avaliação humana não exaustiva, devido aos prazos de execução do projecto, e falta de suficiente pessoal para um estudo mais profundo, ficando para trabalho futuro uma avaliação mas detalhada e conjunta do sistema global.
Palavras-chave: Reconhecimento automático de fala, transcrição de notícias televisivas, modelo acústico, modelo de linguagem e tradução automática estatística.

Latest revision as of 12:42, 10 November 2007

Raquel Sánchez
Raquel Sánchez

Date

  • 14:30, November 02, 2007
  • Room 336

Speaker

Abstract

Resumo

O objectivo principal deste projecto é criar um sistema de tradução automática de notícias televisivas de Espanhol para Português. A realização deste sistema requer a combinação de duas operações: o reconhecimento da fala das notícias em Espanhol seguida da tradução desse reconhecimento para Português. Começa-se pelo estudo do reconhecedor, com base no sistema de reconhecimento AUDIMUS, desenvolvido no centro de investigação INESC-ID (Instituto de Engenharia de Sistemas de Computadores Investigação e Desenvolvimento) de Lisboa (Portugal), adquirindo e processando material de áudio e texto, construindo um léxico e criando novos modelos acústicos e de linguagem para o reconhecedor de Espanhol. Obteve-se um resultado de avaliação similar a outros sistemas de reconhecimento internacionais e que representam o estado da arte. Para o tradutor baseado na tradução automática estatística, utilizam-se textos paralelos normalizados, para os dois idiomas em estudo, Espanhol e Português, estimam-se os modelos estatísticos, e faz-se uma avaliação humana não exaustiva, devido aos prazos de execução do projecto, e falta de suficiente pessoal para um estudo mais profundo, ficando para trabalho futuro uma avaliação mas detalhada e conjunta do sistema global.

Palavras-chave: Reconhecimento automático de fala, transcrição de notícias televisivas, modelo acústico, modelo de linguagem e tradução automática estatística.

Retrieved from ""