Le thème central de cette thèse est le traitement automatique du portugais.
Plusieurs préocupations ont guidé ce travail.
Nous nous sommes donné un objectif précis qui est de, à partir d'un texte brut réellement produit contenant ou non un léger balisage HTML, extraire de ce texte les syntagmes nominaux.
L'objectif que nous nous somme fixé se réalise dans le cadre d'une nouvelle méthodologie pour l'étude et le traitement des langues naturelles: 5P. C'est dans ce cadre que les descriptions linguistiques formalisées seront faites et dans ce cadre également que l'on a envisagé les programmes qui, exploitant ces descriptions linguistiques, permettent de traiter les textes.