From HLT@INESC-ID

Revision as of 09:38, 17 April 2007 by Njm (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Proposta de Tese de Mestrado 2007/2008

Orientação

Objectivos

Desenvolvimento de um serviço web de apoio à aquisição semi-automática de termos compostos e expressões fixas tendo em vista a construção de uma base de dados.

Descrição

Os termos compostos (e.g., cabo de alta tensão, cadeira de rodas, sistema solar) apresentam características particulares com base nas quais é possível identificar potenciais candidatos a termo composto. As expressões fixas correspondem à utilização de frases onde alguns dos seus elementos não podem sofrer alterações para o significado se mantenha (e.g, bater as botas, dar à sola). Com este trabalho pretende-se desenhar uma interface web com três componentes: 1) aquisição de potenciais termos em jornais electrónicos nacionais, com base em padrões pré-estabelecidos; 2) validação dos candidatos na web, através da utilização de motores de busca; 3) integração dos termos na base de dados.

Resultado Esperado

Um sistema que identifique termos compostos (cada termo composto deve ter associado um grau de confiança).

Observações

Os alunos que concorram a este trabalho devem estar dispostos a trabalhar assiduamente. Serão utilizados os recursos do L2F, onde os alunos serão integrados num ambiente de investigação multidisciplinar.

Retrieved from ""