From HLT@INESC-ID
Proposta de Tese de Mestrado 2007/2008
Orientação
- Orientador: Nuno Mamede
- Co-orientador: Luísa Coheur
Objectivos
Desenvolvimento de um serviço web de apoio à aquisição semi-automática de termos compostos e expressões fixas tendo em vista a construção de uma base de dados.
Descrição
Os termos compostos (e.g., cabo de alta tensão, cadeira de rodas, sistema solar) apresentam características particulares com base nas quais é possível identificar potenciais candidatos a termo composto. As expressões fixas correspondem à utilização de frases onde alguns dos seus elementos não podem sofrer alterações para o significado se mantenha (e.g, bater as botas, dar à sola). Com este trabalho pretende-se desenhar uma interface web com três componentes: 1) aquisição de potenciais termos em jornais electrónicos nacionais, com base em padrões pré-estabelecidos; 2) validação dos candidatos na web, através da utilização de motores de busca; 3) integração dos termos na base de dados.
Resultado Esperado
Um sistema que identifique termos compostos (cada termo composto deve ter associado um grau de confiança).
Observações
Os alunos que concorram a este trabalho devem estar dispostos a trabalhar assiduamente. Serão utilizados os recursos do L2F, onde os alunos serão integrados num ambiente de investigação multidisciplinar.