Name entity recognition (seminar)

From HLT@INESC-ID

Revision as of 15:33, 17 October 2007 by Joana (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Luís Romão
Luís Romão

Date

  • 16:00, October 19, 2007
  • 3rd floor meeting room

Speaker

Resumo (PT)

A tarefa de reconhecimento de entidades mencionadas (REM) é uma subtarefa da área de extracção da informação que tem como objectivo a localização em textos de língua natural de elementos atómicos referentes a entidades específicas e sua posterior classificação em categorias predefinidas.

Serão analisas e comparadas várias estratégias adoptadas para a realização desta tarefa e descrito um sistema de reconhecimento de entidades mencionadas para a língua portuguesa que identifica entidades que são locais, pessoas, organizações e acontecimentos e as classifica de acordo com uma hierarquia de classificação, utilizando uma abordagem orientada à língua portuguesa, manual, e baseada exclusivamente em listas de palavras e regras, quer contextuais, quer baseadas na estrutura das entidades.

O sistema que será apresentado foi avaliado segundo os critérios de avaliação da edição do fórum de avaliação HAREM de 2005, apresentando, em relação aos sistemas concorrentes, resultados no geral acima da média e obtendo o melhor resultado na tarefa de identificação de organizações e na classificação global em alguns cenários de avaliação.