From HLT@INESC-ID

Revision as of 17:26, 17 April 2007 by Njm (talk | contribs)

Proposta de Tese de Mestrado 2007/2008

Orientação

Objectivos

Este trabalho enquadra-se numa das principais linhas de actividade do Laboratório de Sistemas de Língua Falada (L2F do INESC-ID). Integra sobretudo tecnologias que facilitem o desenvolvimento de aplicações de processamento de Língua Natural.

Descrição

A informação lexical é um dos elementos fundamentais para o processamento computacional de língua natural, já que o comportamento das expressões linguísticas é em grande medida determinado pelo material lexical envolvido. Para certos fragmentos da gramática da língua é já possível dispor de descrições de vários tipos de propriedades (morfológicas, sintácticas, distribucionais, transformacionais e semânticas) mas que são geralmente construídas com recurso exclusivo (ou quase) à introspecção. Apesar do seu inegável interesse, essas descrições carecem de uma validação empírica, baseada em empregos reais, observados em corpora. A associação de informação de frequência permitiria, além disso, desenvolver ou tornar mais eficientes diversos tipos de aplicações. O objectivo principal do estudo consiste, pois, na construção/adaptação das ferramentas necessárias para o processamento desse tipo de descrições e o desenvolvimento de estratégias para a sua validação (semi-)automática a partir de corpora textuais.

Resultado Esperado

Espera-se que no final esteja construído um conjunto de ferramentas [para o processamento de descrições formalizadas de vários tipos de propriedades (morfológicas, sintácticas, transformacionais e semânticas) associadas a unidades lexicais] e desenvolvidas estratégias de validação (semi-)automática, a partir de corpora textuais, de descrições formalizadas de vários tipos de propriedades linguísticas.

Observações

Trabalho proposto pelo aluno Nº 52341, Fernando Miguel Filipe Gomes

Retrieved from ""