: Difference between revisions
From HLT@INESC-ID
mNo edit summary |
|||
(2 intermediate revisions by the same user not shown) | |||
Line 1: | Line 1: | ||
__NOTOC__ | |||
== Date == | == Date == | ||
Line 4: | Line 5: | ||
== Speaker == | == Speaker == | ||
* | |||
* Joaquim Ferreira da Silva | |||
== Abstract (in Portuguese) == | == Abstract (in Portuguese) == | ||
Line 11: | Line 13: | ||
[[category:Seminars]] | [[category:Seminars]] | ||
[[category:Seminars 2000]] | |||
[[category:Invited Presentations]] | [[category:Invited Presentations]] |
Latest revision as of 15:19, 7 July 2006
Date
- February 08, 2000
Speaker
- Joaquim Ferreira da Silva
Abstract (in Portuguese)
A extracção de unidades multi-palavra (Multi-Word Units) a partir de corpora de texto tem importantes aplicações: enriquecimento do léxico de PLN, melhor precisão no parsing de frases em Língua Natural, maior correcção no attachment entre sintagmas, etc.. Além do mais, estas unidades multi-palavra permitem uma interacção mais natural entre os utilizadores não-especialistas com os motores de extracção de informação. Apresentaremos um método estatístico para extracção de unidades multi-palavra, baseado num novo algoritmo (LocalMaxs), uma nova medida de associação.