From HLT@INESC-ID

Revision as of 19:45, 16 February 2006 by Root (talk | contribs)

Date

  • October 24, 2000

Speaker

Abstract (in Portuguese)

Apresentarei uma nova medida probabilística para a extracção de unidades polilexicais contíguas e não contíguas. Dando um corpus não tratado, o sistema SENTA elege, sem definição de valores limites, nomes e verbos compostos assim como locuções. Os resultados, embora interessantes, mostram os limites dos estudos baseados unicamente nas palavras. No âmbito de melhorar a precisão dos resultados, mostro uma experiência que integra o conhecimento de padrões sintácticos no sistema SENTA.

Retrieved from ""