Extracção de Unidades multi-palavra

From HLT@INESC-ID

Date

  • February 08, 2000

Speaker

  • Joaquim Ferreira da Silva

Abstract (in Portuguese)

A extracção de unidades multi-palavra (Multi-Word Units) a partir de corpora de texto tem importantes aplicações: enriquecimento do léxico de PLN, melhor precisão no parsing de frases em Língua Natural, maior correcção no attachment entre sintagmas, etc.. Além do mais, estas unidades multi-palavra permitem uma interacção mais natural entre os utilizadores não-especialistas com os motores de extracção de informação. Apresentaremos um método estatístico para extracção de unidades multi-palavra, baseado num novo algoritmo (LocalMaxs), uma nova medida de associação.