From HLT@INESC-ID

Revision as of 16:06, 23 December 2010 by Acbm (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)


Date

  • 15:00, Friday, November 5th, 2010
  • Room 336

Speaker

Abstract

Actualmente, existe uma necessidade crescente em retirar informação a partir de um texto de forma automática. Existem várias investigações nesta área como a identificação e classificação de entidades mencionadas, detecção de expressões temporais, extracção de relações entre entidades, entre outras, que tentam satisfazer essa necessidade. Os sistemas podem retirar informação a partir da extracção de relações entre entidades, utilizando-a para diversas aplicações. Nesta dissertação apresenta-se um sistema que tenta maximizar a informação retirada. Definiram-se as directivas com base nos trabalhos já desenvolvidos não só na língua portuguesa, como na língua inglesa. Analisam-se alguns sistemas, as metodologias utilizadas pelos investigadores e os resultados obtidos. O sistema desenvolvido utiliza uma abordagem baseada em regras, e está integrado na cadeia de processamento do L2F, no INESC-ID em Lisboa. Os pormenores mais relevantes em cada categoria são detalhados com o objectivo de explicar o racional utilizado para cada relação. Para avaliar este trabalho usou-se um corpus de avaliação. Este foi anotado por uma linguista que não participou na fase de desenvolvimento do sistema. O objectivo consiste em obter resultados mais credíveis, permitindo assim, uma melhor análise de resultados.

Note: This seminar will be held in Portuguese.

Retrieved from ""