Name entity recognition and time normalization (seminar)

From HLT@INESC-ID

Revision as of 10:47, 1 November 2007 by David (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
João Loureiro
João Loureiro

Date

  • 15:30, October 19, 2007
  • 3rd floor meeting room

Speaker

Abstract

This presentation is about Named Entity Recognition under the categories "Obra", "Valor", "Relações de Parentesco" and "Tempo", for Portuguese language.

Named Entity Recognition is a Natural Language processing task. It can help Question-Answering, Information Extraction and Sumarization systems development by providing useful and structured linguistic information.

We attempt to normalize time expressions such as "24 de Novembro de 2005" (November 24th, 2005) and "próximo dia" (next day). Time normalization is about converting time expressions’ values to a standard format allowing this information to be shared between different systems.

Will present the adopted proceedings for Named Entity Recognition, as well for time normalization.

Resumo

Este trabalho trata do Reconhecimento de Entidades Mencionadas para a língua portuguesa, relativamente às categorias Obra, Valor, Relações de Parentesco e Tempo.

O Reconhecimento de Entidades Mencionadas é uma tarefa da área do processamento de língua natural que pode ser útil no desenvolvimento de sistemas de Pergunta-Resposta, Extracção de Informação e de Resumo (ou Sumarização), disponibilizando informação linguística e de forma estruturada.

Este documento aborda também a normalização de expressões temporais, tais como 24 de Novembro de 2005 ou próximo dia.

A normalização do tempo tem como objectivo a conversão dos valores referentes a expressões temporais, para um formato padrão, facilitando a partilha desta mesma informação entre diferentes sistemas.

São assim apresentados neste documento os procedimentos adoptados, tanto para o Reconhecimento de Entidades Mencionadas, como para a normalização do tempo.