Conversão de equações MathML para Texto

From HLT@INESC-ID

Carlos Rolo

Date

  • 15:30, November 30, 2007
  • INESC-ID's Room 336 (Alves Redol)

Speaker

Resumo (PT)

O objectivo deste trabalho é, no âmbito do projecto RICOBA, criar um programa que converta equações em MathML para /texto/. O texto traduzido deve corresponder o máximo possível com a leitura da equação usando linguagem natural. O programa desenvolvido recebe como argumento de entrada um ficheiro XML com a norma MathML e devolve dois ficheiros, um em HTML e o outro em TXT.

Adicionalmente, pode o ficheiro de configuração destina-se a adaptar o texto de saída a condições que não se podem extrair directamente do ficheiro MathML.

O programa foi desenvolvido em JAVA para garantir maior portabilidade do código. O trabalho dispõe de documentação numa WIKI, com informação relativa aos desenvolvimentos do projecto e discussões acerca dos formatos dos ficheiros e da arquitectura do programa. Existe também um JAVADoc com toda a documentação do código do programa, e um repositório SVN com todas as versões do programa existentes. Este apresentação encontra-se dividido em sete capítulos: introdução, arquitectura do programa desenvolvido, heurísticas, formatos dos ficheiros, portabilidade do código e por último, as conclusões. Serão apresentados vários exemplos que permitem atestar a eficácia do sistema de conversão de equações para texto.