Recuperação de Informação com Base no Contexto Geográfico dos Documentos

From HLT@INESC-ID

Bruno Martins
Bruno Martins
Bruno Martins received a degree in Computer Science from the Faculty of Sciences of the University of Lisbon (FCUL). In 2004 he received an MSc degree, also in Computer Science, from the same institution. He is now working on his PhD thesis, which will focus on the problem of Geographically Aware Information Retrieval.

He is currently a teaching assistant at the Superior Technical Institute of the Technical University of Lisbon (IST), and a researcher at LaSIGE/FCUL, the Large-Scale Informatics Systems Laboratory from the University of Lisbon. His research interests include information retrieval and Web information systems.

Addresses: www mail

Date

  • 15:00, Friday, January 18, 2008
  • 3rd floor meeting room, INESC-ID

Speaker

  • Bruno Martins, LaSIGE/FCUL

Abstract

Humans's information needs often relate to a specific geographic domain, and a large amount of Web information is also geographically referenced, in the sense that it refers to specific locations. However, conventional digital libraries and retrieval tools consider geographical text expressions no differently. Documents will only be retrieved if they contain exact matches with the geographic terminology used in the queries. Moreover, although geographic information technologies have achieved considerable development, they are mostly based on highly structured and map-based representations. Relatively little effort has been spent on developing the facilities required to access unstructured textual information. This talk focuses on this new area, showing how geographical context information can be effectively handled. Topics include the handling geographic references in text, the assignement of geographic scopes to documents, and the usage of geographic scopes for retrieval applications.

Resumo

As necessidades de informação relacionam-se muitas vezes com um dado domínio geográfico, e uma vasta quantidade de informação na Web encontra-se geograficamente referenciada, no sentido em que se refere a locais específicos. Contudo, as biliotecas digitais e as ferramentas de pesquisa tradicionais tratam as expressões geográficas de forma igual às restantes. Ainda que as tecnologias de acesso a informação geográfica tenham conhecido avanços consideráveis, estas assentam sobretudo em representações fortemente estruturadas e baseadas em mapas. Relativamente pouco esforço tem sido dedicado à criação dos mecanismos necessários ao acesso de informação não estruturada. Esta apresentação centra-se nesta nova área, mostrando como o contexto geográfico pode ser considerado em aplicações de recuperação de informação. Tópicos incluem o tratamento de referências geográficas em texto, a atribuição de âmbitos geográficos a documentos, e a construção de aplicações de pesquisa suportando âmbitos geográficos.