Difference between revisions of "Extraction and Classification of Named Entities"

From HLT@INESC-ID

 
Line 12: Line 12:
 
== Abstract ==
 
== Abstract ==
  
Num mundo dominado pela variedade de povos, culturas e línguas, cada vez mais surge a necessidade de ferramentas tecnológicas que ajudem a lidar com tanta diversidade. O Processamento de Língua Natural é uma área da Ciência da Computação e Linguística na qual é difícil trabalhar, pela ambiguidade que é inerente às línguas faladas por todo o mundo. Melhorias nesta área trazem desde logo vantagens óbvias:
+
Num mundo dominado pela variedade de povos, culturas e línguas, cada vez mais surge a necessidade de ferramentas tecnológicas que ajudem a lidar com tanta diversidade. O Processamento de Língua Natural é uma área da Ciência da Computação e Linguística na qual é difícil trabalhar, pela ambiguidade que é inerente às línguas faladas por todo o mundo. Melhorias nesta área trazem desde logo vantagens óbvias:<br/>
 
+
- Tradução automática de textos ou de páginas de Internet, que aproxima as pessoas de informação (à partida) desconhecida;<br/>
- Tradução automática de textos ou de páginas de Internet, que aproxima as pessoas de informação (à partida) desconhecida;
+
- Sumarização automática de longos documentos, que poupa tempo precioso;<br/>
 
+
- Reconhecimento da fala, que cada vez mais torna a dicção de textos uma realidade;<br/>
- Sumarização automática de longos documentos, que poupa tempo precioso;
+
- Entre muitas outras aplicações no mundo real.<br/>
 
+
- Reconhecimento da fala, que cada vez mais torna a dicção de textos uma realidade;
+
 
+
- Entre muitas outras aplicações no mundo real.
+
 
+
 
Sem dúvida, esta é uma área a apostar para o futuro.
 
Sem dúvida, esta é uma área a apostar para o futuro.
  
Esta dissertação trata de uma das muitas tarefas presentes na área do Processamento de Língua Natural: o Reconhecimento de Entidades Mencionadas, neste caso em textos portugueses. Actualmente, o INESC-ID Lisboa possui uma cadeia de processamento de língua natural na qual está inserido o sistema que foi usado nesta dissertação. Em particular, os principais objectivos deste trabalho foram:
+
Esta dissertação trata de uma das muitas tarefas presentes na área do Processamento de Língua Natural: o Reconhecimento de Entidades Mencionadas, neste caso em textos portugueses. Actualmente, o INESC-ID Lisboa possui uma cadeia de processamento de língua natural na qual está inserido o sistema que foi usado nesta dissertação. Em particular, os principais objectivos deste trabalho foram: <br/>
 
+
- Fazer um estudo comparativo dos sistemas que, hoje em dia, fazem Reconhecimento de Entidades Mencionadas em português;<br/>
- Fazer um estudo comparativo dos sistemas que, hoje em dia, fazem Reconhecimento de Entidades Mencionadas em português;
+
- Propor um novo conjunto de Directivas de Classificação para textos em português, substituindo assim as Directivas de 2007 e 2008;<br/>
 
+
- Melhorar o sistema usado no INESC-ID Lisboa;<br/>
- Propor um novo conjunto de Directivas de Classificação para textos em português, substituindo assim as Directivas de 2007 e 2008;
+
 
+
- Melhorar o sistema usado no INESC-ID Lisboa;
+
 
+
 
- Avaliar o trabalho efectuado, usando métricas de avaliação como a precisão e a abrangência.
 
- Avaliar o trabalho efectuado, usando métricas de avaliação como a precisão e a abrangência.
  

Revision as of 10:40, 4 November 2010


Date

  • 15:30, Friday, November 5th, 2010
  • Room 336

Speaker

Abstract

Num mundo dominado pela variedade de povos, culturas e línguas, cada vez mais surge a necessidade de ferramentas tecnológicas que ajudem a lidar com tanta diversidade. O Processamento de Língua Natural é uma área da Ciência da Computação e Linguística na qual é difícil trabalhar, pela ambiguidade que é inerente às línguas faladas por todo o mundo. Melhorias nesta área trazem desde logo vantagens óbvias:
- Tradução automática de textos ou de páginas de Internet, que aproxima as pessoas de informação (à partida) desconhecida;
- Sumarização automática de longos documentos, que poupa tempo precioso;
- Reconhecimento da fala, que cada vez mais torna a dicção de textos uma realidade;
- Entre muitas outras aplicações no mundo real.
Sem dúvida, esta é uma área a apostar para o futuro.

Esta dissertação trata de uma das muitas tarefas presentes na área do Processamento de Língua Natural: o Reconhecimento de Entidades Mencionadas, neste caso em textos portugueses. Actualmente, o INESC-ID Lisboa possui uma cadeia de processamento de língua natural na qual está inserido o sistema que foi usado nesta dissertação. Em particular, os principais objectivos deste trabalho foram:
- Fazer um estudo comparativo dos sistemas que, hoje em dia, fazem Reconhecimento de Entidades Mencionadas em português;
- Propor um novo conjunto de Directivas de Classificação para textos em português, substituindo assim as Directivas de 2007 e 2008;
- Melhorar o sistema usado no INESC-ID Lisboa;
- Avaliar o trabalho efectuado, usando métricas de avaliação como a precisão e a abrangência.


Note: This seminar will be held in Portuguese.