Difference between revisions of "Aquisição semi-automática de termos compostos e expressões fixas (proposal)"

From HLT@INESC-ID

 
Line 24: Line 24:
 
== Observações ==
 
== Observações ==
  
Os alunos que concorram a este trabalho devem estar dispostos a trabalhar assiduamente. Serão utilizados os recursos do L2F, onde os alunos serão integrados num ambiente de investigação multidisciplinar.
+
Trabalho proposto pelo aluno Nº 52414, Ricardo Jorge Rosa Portela
  
 
[[category:Research]]
 
[[category:Research]]
 
[[category:Masters Theses Proposals 2007/2008]]
 
[[category:Masters Theses Proposals 2007/2008]]

Revision as of 17:23, 17 April 2007

Proposta de Tese de Mestrado 2007/2008

Orientação

Objectivos

Desenvolvimento de um serviço web de apoio à aquisição semi-automática de termos compostos e expressões fixas tendo em vista a construção de uma base de dados.

Descrição

Os termos compostos (e.g., cabo de alta tensão, cadeira de rodas, sistema solar) apresentam características particulares com base nas quais é possível identificar potenciais candidatos a termo composto. As expressões fixas correspondem à utilização de frases onde alguns dos seus elementos não podem sofrer alterações para o significado se mantenha (e.g, bater as botas, dar à sola). Com este trabalho pretende-se desenhar uma interface web com três componentes: 1) aquisição de potenciais termos em jornais electrónicos nacionais, com base em padrões pré-estabelecidos; 2) validação dos candidatos na web, através da utilização de motores de busca; 3) integração dos termos na base de dados.

Resultado Esperado

Um sistema que identifique termos compostos (cada termo composto deve ter associado um grau de confiança).

Observações

Trabalho proposto pelo aluno Nº 52414, Ricardo Jorge Rosa Portela