Recent improvements in the PT-STAR Project

From HLT@INESC-ID

Wang Lin
Wang Lin

Date

  • 15:00, Friday, March 26th, 2010
  • Room 336

Speakers


Abstract

This seminar is divided into two parts. The first part will focus on the recent enhancements in the translation system. Among the experiments are the evaluation of the improvements in the translation quality with the introduction of a named entity recognizer, the study of the impact of language models in translation, and the initial results of the use of confusion networks as input in translator. In the second part we present the system that is collecting articles from news websites, and how this information will be used to improve the language models of the speech recognizer.


Tiago Luís
Tiago Luís

Resumo

Este seminário encontra-se dividido em duas partes. A primeira parte irá focar-se nos recentes melhoramentos no sistema de tradução. Entre as experiências realizadas, encontram-se a avaliação das melhorias na qualidade da tradução com a introdução de um detector de entidades mencionadas, o estudo do impacto dos modelos de linguagem na tradução, e os resultados iniciais da utilização de redes de confusão como input no tradutor. Na segunda parte iremos apresentar o sistema de recolha de notícias de websites, e como esta informação irá ser utilizada para melhorar os modelos de linguagem do reconhecedor de fala.