Difference between revisions of "NER - Reconhecimento de Locais e Eventos"

From HLT@INESC-ID

m
m
Line 16: Line 16:
 
== Descrição ==
 
== Descrição ==
  
A identificação e classificação de entidades mencionadas é uma sub-tarefa da área de extracção de informação que visa localizar e classificar as palavras de um texto escrito que referem nomes de pessoas, organizações, localidades, expressões temporais, quantidades, valores monetários, percentagens, etc. Por exemplo, a frase "O Pedro comprou 300 acções da EDP em 2006" contém as seguintes entidades: (i) "Pedro" é um nome de pessoa; (ii) "300" é uma quantidade; (iii) "EDP" é uma organização; (iv) "2006" é uma data. A definição das regras (autómatos) e o acesso à informação que está disponível (lema, categoria gramatical, contexto à direita (palavra, lema, categoria) e à esquerda) faz-se através do ambiente XIP, desenvolvido pela Xerox e licenciado ao INESC-ID. Também se pretende desenvolver uma ferramenta que permita a procura, em corpora, de padrões morfo-sintácticos. A categoria Local inclui: estradas, trajectórias, regiões (bairros, freguesias, vilas, aldeias, cidades, províncias, países, continentes, dioceses), estruturas (pontes, portos, barragens), locais naturais (montanhas, cadeias montanhosas, florestas, rios, poços, campos, vales, jardins, reservas naturais, praias, parques naturais), espaços públicos (praças, ópera, museus, escolas, mercados, aeroportos, estações, piscina, hospitais, instalações desportivas, centros de juventude, parques, câmara municipais, teatros, cinemas, galerias, parques campismo, universidades, bibliotecas, igrejas, centros médicos, parques de estacionamento, parques infantis, cemitérios, ...), espaços comerciais (farmácias, bares, restaurantes, hotéis, discotecas, pousadas, ...), outros edifícios (casas, mosteiros, creches, moinhos, aquartelamentos, castelos, lares, torres, pátios), locais abstractos feitos pelo homem. A categoria Evento inclui: conferências, festivais, eventos desportivos, foruns, festas, concertos, guerras, batalhas, ... A categoria Miscelânea inclui: religiões, ideologias políticas, nacionalidades, línguas.
+
A identificação e classificação de entidades mencionadas é uma sub-tarefa da área de extracção de informação que visa localizar e classificar as palavras de um texto escrito que referem nomes de pessoas, organizações, localidades, expressões temporais, quantidades, valores monetários, percentagens, etc. Por exemplo, a frase "O Pedro comprou 300 acções da EDP em 2006" contém as seguintes entidades: (i) "Pedro" é um nome de pessoa; (ii) "300" é uma quantidade; (iii) "EDP" é uma organização; (iv) "2006" é uma data. A definição das regras (autómatos) e o acesso à informação que está disponível (lema, categoria gramatical, contexto à direita (palavra, lema, categoria) e à esquerda) faz-se através do ambiente XIP, desenvolvido pela Xerox e licenciado ao INESC-ID. Também se pretende desenvolver uma ferramenta que permita a procura, em corpora, de padrões morfo-sintácticos. A categoria Local inclui: estradas, trajectórias, regiões (bairros, freguesias, vilas, aldeias, cidades, províncias, países, continentes, dioceses), estruturas (pontes, portos, barragens), locais naturais (montanhas, cadeias montanhosas, florestas, rios, poços, campos, vales, jardins, reservas naturais, praias, parques naturais), espaços públicos (praças, ópera, museus, escolas, mercados, aeroportos, estações, piscina, hospitais, instalações desportivas, centros de juventude, parques, câmara municipais, teatros, cinemas, galerias, parques campismo, universidades, bibliotecas, igrejas, centros médicos, parques de estacionamento, parques infantis, cemitérios, ...), espaços comerciais (farmácias, bares, restaurantes, hotéis, discotecas, pousadas, ...), outros edifícios (casas, mosteiros, creches, moinhos, aquartelamentos, castelos, lares, torres, pátios), locais abstractos feitos pelo homem. A categoria Evento inclui: conferências, festivais, eventos desportivos, fóruns, festas, concertos, guerras, batalhas, ... A categoria Miscelânea inclui: religiões, ideologias políticas, nacionalidades, línguas.
  
 
== Outros Dados ==
 
== Outros Dados ==

Revision as of 09:32, 29 May 2006

Proposta de Trabalho Final de Curso 2006/2007


Orientação

Objectivo

Identificar e classificar entidades mencionadas das seguintes categorias: Local, Evento e Miscelânea.

Descrição

A identificação e classificação de entidades mencionadas é uma sub-tarefa da área de extracção de informação que visa localizar e classificar as palavras de um texto escrito que referem nomes de pessoas, organizações, localidades, expressões temporais, quantidades, valores monetários, percentagens, etc. Por exemplo, a frase "O Pedro comprou 300 acções da EDP em 2006" contém as seguintes entidades: (i) "Pedro" é um nome de pessoa; (ii) "300" é uma quantidade; (iii) "EDP" é uma organização; (iv) "2006" é uma data. A definição das regras (autómatos) e o acesso à informação que está disponível (lema, categoria gramatical, contexto à direita (palavra, lema, categoria) e à esquerda) faz-se através do ambiente XIP, desenvolvido pela Xerox e licenciado ao INESC-ID. Também se pretende desenvolver uma ferramenta que permita a procura, em corpora, de padrões morfo-sintácticos. A categoria Local inclui: estradas, trajectórias, regiões (bairros, freguesias, vilas, aldeias, cidades, províncias, países, continentes, dioceses), estruturas (pontes, portos, barragens), locais naturais (montanhas, cadeias montanhosas, florestas, rios, poços, campos, vales, jardins, reservas naturais, praias, parques naturais), espaços públicos (praças, ópera, museus, escolas, mercados, aeroportos, estações, piscina, hospitais, instalações desportivas, centros de juventude, parques, câmara municipais, teatros, cinemas, galerias, parques campismo, universidades, bibliotecas, igrejas, centros médicos, parques de estacionamento, parques infantis, cemitérios, ...), espaços comerciais (farmácias, bares, restaurantes, hotéis, discotecas, pousadas, ...), outros edifícios (casas, mosteiros, creches, moinhos, aquartelamentos, castelos, lares, torres, pátios), locais abstractos feitos pelo homem. A categoria Evento inclui: conferências, festivais, eventos desportivos, fóruns, festas, concertos, guerras, batalhas, ... A categoria Miscelânea inclui: religiões, ideologias políticas, nacionalidades, línguas.

Outros Dados

  • Proposto por Luís Romão (#51035)
  • Áreas Científicas:
  • Local de trabalho: L²F (INESC-ID Lisboa).