: Difference between revisions
From HLT@INESC-ID
(→Resumo) |
|||
Line 21: | Line 21: | ||
[[Category:Seminars]] | [[Category:Seminars]] | ||
[[Category:Seminars 2007]] | [[Category:Seminars 2007]] | ||
O objectivo principal deste projecto é criar um sistema de tradução automática de notícias televisivas de Espanhol para Português. A realização deste sistema requer a combinação de duas operações: o reconhecimento da fala das notícias em Espanhol seguida da tradução desse reconhecimento para Português. Começa-se pelo estudo do reconhecedor, com base no sistema de reconhecimento AUDIMUS, desenvolvido no centro de investigação INESC-ID (Instituto de Engenharia de Sistemas de Computadores Investigação e Desenvolvimento) de Lisboa (Portugal), adquirindo e processando material de áudio e texto, construindo um léxico e criando novos modelos acústicos e de linguagem para o reconhecedor de Espanhol. Obteve-se um resultado de avaliação similar a outros sistemas de reconhecimento internacionais e que representam o estado da arte. Para o tradutor baseado na tradução automática estatística, utilizam-se textos paralelos normalizados, para os dois idiomas em estudo, Espanhol e Português, estimam-se os modelos estatísticos, e faz-se uma avaliação humana não exaustiva, devido aos prazos de execução do projecto, e falta de suficiente pessoal para um estudo mais profundo, ficando para trabalho futuro uma avaliação mas detalhada e conjunta do sistema global. | |||
Palavras-chave: Reconhecimento automático de fala, transcrição de notícias televisivas, modelo acústico, modelo de linguagem e tradução automática estatística. |
Latest revision as of 12:42, 10 November 2007
Date
- 14:30, November 02, 2007
- Room 336
Speaker
Abstract
Resumo
O objectivo principal deste projecto é criar um sistema de tradução automática de notícias televisivas de Espanhol para Português. A realização deste sistema requer a combinação de duas operações: o reconhecimento da fala das notícias em Espanhol seguida da tradução desse reconhecimento para Português. Começa-se pelo estudo do reconhecedor, com base no sistema de reconhecimento AUDIMUS, desenvolvido no centro de investigação INESC-ID (Instituto de Engenharia de Sistemas de Computadores Investigação e Desenvolvimento) de Lisboa (Portugal), adquirindo e processando material de áudio e texto, construindo um léxico e criando novos modelos acústicos e de linguagem para o reconhecedor de Espanhol. Obteve-se um resultado de avaliação similar a outros sistemas de reconhecimento internacionais e que representam o estado da arte. Para o tradutor baseado na tradução automática estatística, utilizam-se textos paralelos normalizados, para os dois idiomas em estudo, Espanhol e Português, estimam-se os modelos estatísticos, e faz-se uma avaliação humana não exaustiva, devido aos prazos de execução do projecto, e falta de suficiente pessoal para um estudo mais profundo, ficando para trabalho futuro uma avaliação mas detalhada e conjunta do sistema global.
Palavras-chave: Reconhecimento automático de fala, transcrição de notícias televisivas, modelo acústico, modelo de linguagem e tradução automática estatística.