: Difference between revisions

From HLT@INESC-ID

No edit summary
 
No edit summary
 
Line 20: Line 20:


[[category:Seminars]]
[[category:Seminars]]
[[category:Seminars 2009]]
[[category:Seminars 2010]]

Latest revision as of 16:06, 23 December 2010


Date

  • 15:00, Friday, November 5th, 2010
  • Room 336

Speaker

Abstract

Actualmente, existe uma necessidade crescente em retirar informação a partir de um texto de forma automática. Existem várias investigações nesta área como a identificação e classificação de entidades mencionadas, detecção de expressões temporais, extracção de relações entre entidades, entre outras, que tentam satisfazer essa necessidade. Os sistemas podem retirar informação a partir da extracção de relações entre entidades, utilizando-a para diversas aplicações. Nesta dissertação apresenta-se um sistema que tenta maximizar a informação retirada. Definiram-se as directivas com base nos trabalhos já desenvolvidos não só na língua portuguesa, como na língua inglesa. Analisam-se alguns sistemas, as metodologias utilizadas pelos investigadores e os resultados obtidos. O sistema desenvolvido utiliza uma abordagem baseada em regras, e está integrado na cadeia de processamento do L2F, no INESC-ID em Lisboa. Os pormenores mais relevantes em cada categoria são detalhados com o objectivo de explicar o racional utilizado para cada relação. Para avaliar este trabalho usou-se um corpus de avaliação. Este foi anotado por uma linguista que não participou na fase de desenvolvimento do sistema. O objectivo consiste em obter resultados mais credíveis, permitindo assim, uma melhor análise de resultados.

Note: This seminar will be held in Portuguese.

Retrieved from ""