Uma evolução do sistema ShRep (seminar)

From HLT@INESC-ID

David Rodrigues

Date

  • 16:00, November 09, 2007
  • Room 336

Speaker

Abstract

Resumo

Esta tese tem como ponto de partida o sistema ShRep desenvolvido por João Graça. Nesse sistema, João Graça apresenta uma solução para resolver alguns dos problemas existentes nas arquitecturas pipes-and-filters, normalmente usada em processamento de língua natural. O sistema apresentado por João Graça substitui a arquitectura pipes-and-filters por uma arquitectura cliente-servidor.

Nesta arquitectura o servidor equipara-se a um repositório tendo a finalidade de conter os dados produzidos por todas as ferramentas e efectuar o processamento necessário para a gestão desses dados, enquanto o cliente é composto pelas ferramentas de processamento de língua natural que pedem dados ao repositório, efectuam o seu processamento, e deixam o seu resultado no repositório. Foram também desenvolvidas bibliotecas clientes que abstraem o protocolo de comunicação existente entre os clientes e o servidor.

A primeira fase desta tese foi o desenvolvimento de uma interface gráfica que permite a visualização da informação existente no repositório.

De seguida, dado o sistems ShRep apenas ter utilidade caso existam ferramentas integradas que possam ser utilizadas, foram adicionadas duas ferramentas àquelas que já existiam no sistema ShRep. A primeira ferramenta integrada foi a ferramenta MARv que é usada na desambiguação morfosintáctica e a segunda ferramenta integrada foi o Palavroso que atribui classes gramaticais a palavras. Havendo a necessidade de efectuar modificações ao código fonte da ferramenta MARv, foram também efectuadas alterações de forma a melhorar o desempenho da ferramenta, quer em termos de tempo de processamento, quer em termos de memória utilizada, bem como na taxa de erro que a ferramenta apresenta ao efectuar a desambiguação.

Após a integração da ferramenta MARv verificou-se que o sistema ShRep apresentava um elevado tempo de processamento. Desta forma, foram efectuadas alterações que permitiram a optimização do sistema, nomeadamente alterações de forma a diminuir os impactos que o protocolo de comunicação apresentava entre o servidor e o cliente.

Foram ainda alargados os elementos do modelo de domínio em que é possível a execução em paralelo possibilitando às novas ferramentas integradas funcionarem desta forma com o repositório.

Por fim, foi desenvolvido um módulo de código que permite a utilização dos sistema ShRep numa versão StandAlone, isto é, substituindo a utilização do servidor por ficheiros, sendo os dados carregados no início da aplicação, e descarregados no final do processamento da ferramenta.