NER - Reconhecimento de Locais e Eventos

From HLT@INESC-ID

Revision as of 09:01, 9 May 2006 by David (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

Proposta de Trabalho Final de Curso 2006/2007


Orientação

Objectivo

Identificar e classificar entidades mensionadas. São exemplos de entidades mensionadas: nomes de pessoas, cargos, organizações, acontecimentos, datas, entre outros.

Descrição

A identificação e classificação de entidades mencionadas é uma sub-tarefa da área de extracção de informação que visa localizar e classificar as palavras de um texto escrito que referem nomes de pessoas, organizações, localidades, expressões temporais, quantidades, valores monetários, percentagens, etc. Por exemplo, a frase "O Pedro comprou 300 acções da EDP em 2006" contém as seguintes entidades: (i) "Pedro" é um nome de pessoa; (ii) "300" é uma quantidade; (iii) "EDP" é uma organização; (iv) "2006" é uma data. A definição das regras (autómatos) e o acesso à informação que está disponível (lema, categoria gramatical, contexto à direita (palavra, lema, categoria) e à esquerda) faz-se através do ambiente XIP, desenvolvido pela Zerox e licenciado ao INESC-ID.

Outros Dados

  • Proposto por Luís Romão (#51035) e João Loureiro (#51015)
  • Áreas Científicas:
  • Local de trabalho: L²F (INESC-ID Lisboa).