Analyse syntaxique automatique du portugais

From HLT@INESC-ID

Revision as of 20:41, 3 July 2006 by David (talk | contribs)

Résumé

Le thème central de cette thèse est le traitement automatique du portugais.

Plusieurs préocupations ont guidé ce travail.

  • Pouvoir traiter des textes effectivement produits.
  • Laisser une large place aux descriptions linguistiques dans la mesure où nous pensons que mieux on connaît l'objet que l'on veut traiter (la langue) meilleur sera le traitement.
  • Tenter de dissocier toujours très nettement les données linguistiques déclaratives des programmes qui vont effectuer le traitement des textes.

Nous nous sommes donné un objectif précis qui est de, à partir d'un texte brut réellement produit contenant ou non un léger balisage HTML, extraire de ce texte les syntagmes nominaux.

L'objectif que nous nous somme fixé se réalise dans le cadre d'une nouvelle méthodologie pour l'étude et le traitement des langues naturelles: 5P. C'est dans ce cadre que les descriptions linguistiques formalisées seront faites et dans ce cadre également que l'on a envisagé les programmes qui, exploitant ces descriptions linguistiques, permettent de traiter les textes.