From HLT@INESC-ID

Revision as of 09:42, 31 October 2007 by David (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
David Rodrigues
David Rodrigues

Date

  • 14:00, November 12, 2007
  • Room V1.33 (IST)

Speaker

Abstract

Resumo

Esta tese tem como ponto de partida o sistema ShRep desenvolvido por João Graça. Nesse sistema, João Graça apresenta uma solução para resolver alguns dos problemas existentes nas arquitecturas pipes-and-filters, normalmente usada em processamento de língua natural. O sistema apresentado por João Graça substitui a arquitectura pipes-and-filters por uma arquitectura cliente-servidor.

Nesta arquitectura o servidor equipara-se a um repositório tendo a finalidade de conter os dados produzidos por todas as ferramentas e efectuar o processamento necessário para a gestão desses dados, enquanto o cliente é composto pelas ferramentas de processamento de língua natural que pedem dados ao repositório, efectuam o seu processamento, e deixam o seu resultado no repositório. Foram também desenvolvidas bibliotecas clientes que abstraem o protocolo de comunicação existente entre os clientes e o servidor.

A primeira fase desta tese foi o desenvolvimento de uma interface gráfica que permite a visualização da informação existente no repositório.

De seguida, dado o sistems ShRep apenas ter utilidade caso existam ferramentas integradas que possam ser utilizadas, foram adicionadas duas ferramentas àquelas que já existiam no sistema ShRep. A primeira ferramenta integrada foi a ferramenta MARv que é usada na desambiguação morfosintáctica e a segunda ferramenta integrada foi o Palavroso que atribui classes gramaticais a palavras. Havendo a necessidade de efectuar modificações ao código fonte da ferramenta MARv, foram também efectuadas alterações de forma a melhorar o desempenho da ferramenta, quer em termos de tempo de processamento, quer em termos de memória utilizada, bem como na taxa de erro que a ferramenta apresenta ao efectuar a desambiguação.

Após a integração da ferramenta MARv verificou-se que o sistema ShRep apresentava um elevado tempo de processamento. Desta forma, foram efectuadas alterações que permitiram a optimização do sistema, nomeadamente alterações de forma a diminuir os impactos que o protocolo de comunicação apresentava entre o servidor e o cliente.

Foram ainda alargados os elementos do modelo de domínio em que é possível a execução em paralelo possibilitando às novas ferramentas integradas funcionarem desta forma com o repositório.

Por fim, foi desenvolvido um módulo de código que permite a utilização dos sistema ShRep numa versão StandAlone, isto é, substituindo a utilização do servidor por ficheiros, sendo os dados carregados no início da aplicação, e descarregados no final do processamento da ferramenta.

Retrieved from ""