From HLT@INESC-ID

Revision as of 15:19, 7 July 2006 by David (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Date

  • February 08, 2000

Speaker

  • Joaquim Ferreira da Silva

Abstract (in Portuguese)

A extracção de unidades multi-palavra (Multi-Word Units) a partir de corpora de texto tem importantes aplicações: enriquecimento do léxico de PLN, melhor precisão no parsing de frases em Língua Natural, maior correcção no attachment entre sintagmas, etc.. Além do mais, estas unidades multi-palavra permitem uma interacção mais natural entre os utilizadores não-especialistas com os motores de extracção de informação. Apresentaremos um método estatístico para extracção de unidades multi-palavra, baseado num novo algoritmo (LocalMaxs), uma nova medida de associação.

Retrieved from ""